В отрасли и науке ИИ есть страшная тайна, которая настолько секретна и болезненна, что её не только скрывают, но даже отгоняют и не замечают. Как Вы помните, Махатма Ганди говаривал перед тем, как бомбить Пакистан: "Первым делом над тобой смеются, потом тебя игнорируют, только потом с тобой борются, и только потом ты побеждаешь". Так же и здесь.
Истина эта гласит:
💥💥💥 ДАННЫЕ ВАЖНЕЕ МОДЕЛИ.
Вы, конечно, об этом слышали и раньше: до вас долетало крылатое выражение: "Данные — это новая нефть". Многие досужие блогеры уже сравнивают индустрию ИИ с автомобилестроением, где напыщенные сталелитейные магнаты строили двигатели внутреннего сгорания и считали, что поставят весь мир на колени. Но потом они все дружно обанкротились, а мир на колени поставили те люди, которые сначала навесили на эти двигатели всяческие колёса, стёкла и стеклоомыватели, а потом те люди, которые стали на этом всём ездить и возить других людей за большие деньги. Так же произойдёт и с ИИ.
Казус с DeepSeek, про который я подробно рассказывал в начале года, доказал, что тренировка серьёзной базовой LLM-модели — это гораздо менее затратное и длительное дело, чем хочет всем доказать Nvidia. Десятки стартапов, которые берут одну и ту же модель и применяют ко многим разным задачам, зарабатывая на этом деньги и забирая основную маржу, тоже доказывают тот же тезис.
При этом все эти стартапы бесятся, пытаясь ответить на простой вопрос:
как выиграть у конкурентов, которые имеют доступ к тем же моделям, что и ты?Ответ ужасно прост:
все имеют разный доступ к разным данным. А данные же важнее модели!ИИ, анализируя и обобщая информацию, становится всего лишь инструментом, с помощью которого пользователи потребляют и употребляют данные данные. Что забавно, прежде всего такой подход угрожает не их конкурентам, а традиционным издателям и создателям контента вплоть до поисковиков. Трафик у таких падает, поскольку ИИ просто выдает готовый продукт. Остаётся один вопрос:
какой же продукт нужен людям?Оставляя в стороне судьбу Nvidia, которая явно незавидна и за которую тревожно, остаётся только дать основной тезис: дорогие предприниматели, не огорчайтесь, что у вас нет ресурсов и знаний, чтобы построить большую LLM. Модель больше не важна. Модели создадут гиганты, вцепляясь друг другу в глотки.
Вдохновляйтесь тем, что основные деньги заработает не тот, кто эту LLM построил, а тот, кто найдёт нишу, где эта LLM принесёт существенную пользу людям.
Именно поэтому мы в нашем скромном бложике постоянно обсуждаем эти самые применения.Ищите источник ваших собственных данных, которые никто, кроме вас, не может получить, понимайте, как эти данные принесут пользу людям, и стройте надстройку над LLM-движками, которая будет приносить пользу и забирать всю прибыль!
Эффективные ИИ-фичи строятся из трёх элементов:
1️⃣ AI-возможности (доступны всем через API)
2️⃣ Ваши уникальные данные
3️⃣ Функциональность вашего продукта
Типы ценных данных: 📌 риал-тайм (состояние пациента, цены, наличие товаров и тд и тп)
📌 история пользователя
📌 специализированная информация о предметной области
📌 рейтинги, отзывы
📌 мэппинг и реинфорсмент (лайки/дизлайки для улучшения).
Кстати, когда ИИ генерирует результаты, они тоже становятся частью вашего датасета.
Не начинайте с технологий, начинайте с клиентов. То, что ИИ может что-то делать, не значит, что он должен.
Задавайте себе только 2 вопроса перед подключением ИИ:- Какие неудовлетворённые проблемы клиентов нужно решить?
- Какие уникальные данные могут усилить решения?
ИИ-победа не требует сотен миллионов на тренировку моделей. Она требует глубокого понимания проблем клиентов и превращения того, что уникально ваше, в конкурентные преимущества.
"Централизованный ИИ" никогда не вырастет выше исполнителя без узкоспециального обучения и кратного повышения надежности логики выводов. А это экономически нецелесообразно.
ИИ-движок - это лишь одно из звеньев вэлью-чейн, за которым следует кастомизированный таргетированный RAG-интерфейс. Маржа, как всегда, осядет в конце вэлью чейн! Лехаим! Так победим!