Сеньор генеративщик 🏴‍☠️

@ai_senior · 1.7K подписчиков

Посты канала Сеньор генеративщик 🏴‍☠️ в SillyFeed: единая лента публичных Telegram-каналов со ссылками на оригиналы.

Мы сразу решили дать работу нейросетям, чтобы когда они захватят мир, считали нас своими друзьями🏴‍☠️Делюсь применением и лайфхаками ИИ в контенте.Автор →@wowkozinЧат канала:https://t.me/+HHfbGB34SAE4ZGIy

Посты канала

Авторепост

Более того, думаю, что качество ai-рекламы не супер влияет на результат, если уж это, конечно не совсем всратость. Имею ввиду, супер чистая и не супер чистая при прочих равных не шквально будет отличаться по кликам. На каникулах пришлось посмотреть телек (обычно не смотрю), от канала к каналу уже достаточно много ai-шной рекламы и есть прям очевидно генеративная с явными признаками устаревших инструментов. Тем не менее, гуляет себе по ТВ. Не говоря про интернет )

Сеньор генеративщик 🏴‍☠️

Авторепост

Фрипик решил облегчить жизнь генеративщикам, и бахнул новый экспериментальный инструмент — VariationsТеперь можно одной кнопкой расширить вселенную стартового кадра, сделать или полноценную историю, или лысого человека волосатым или вовсе обезъяной.🔵 Reframe Здесь можно изменить ракурсы (доступен выбор от экстримальных до топ-вью и POV) и перспективу.🔵 StoryboardСоздайте полноценную историю на основе стартового кадра. Либо на основе своих идей, либо щелкаете auto и пусть бездушная машина сделает это за вас!🔵 PeopleИзменение челобречков в стартовом кадре: генерация разных гендеров и наций, разных возрастов, разных эмоций.🔵 CustomВ этом поле вы, как вольный художник, можете понастрочить, что вам только захочется — изменить прическу, персонажей, присыпать щепоткой истории, сделать релайт сцены и заодно поменять все ракурсы, и даже погоду в доме кадре!——Во всех случаях доступна сетка выдачи результатов: от 4 до 9 шт, в будущем до 16 штук. Можно выбрать размер кадра.——Искать инструмент в разделе создания изорбражений, в верхней панели над панелью промптов выбираем раздел «Tools → Variations».//По сути, то же самое можно сделать и самостоятельно, если немного пошпилиться с промптами. Будет дольше, но лучше. Фрипик делает на основе кадра раскадровку в одной генерации, каждый фрагмент из которой далее выдает отдельно... похоже просто разрезав его на куски ¯\_(ツ)_/¯ и максимум — с легким апскейлом. Было бы идеально их перегенерить, конечно.Пока работает слабовато, есть ощущение, что он делает это то ли в старой банане, то ли вообще подключает такую-то нейросеть к такой-то задаче, что неплохо, но... На кадрах явно видны артефакты обрезки, качество оставляет желать лучшего (генерю не на максимум). Но...ждем улучшений) У меня подписка Premium+ (около $40), для какой когорты пользователей это — хз. Пару примеров пришлю в комментарии.

Сеньор генеративщик 🏴‍☠️

Авторепост

Вышлая новая модель для созадния и редактирования фото Seedream 4. Благодаря ей можно восстановить мыльные изображения и узнать, какой на самом деле вид на вид. Это очень прикольно, потому что чисто креативные апскейлеры много дорисовывают, а не креативные недостаточно дорисовывают. Тут как два в одном. Также можно удалять/добавлять объекты на фото, стилизовать и тд и тп. Как с этим справляется узнаем совсем скоро на рабочих задачах.Но изображения получаются норм такие резкие и хорошего качества, можно юзать, чтобы сделать получше сгенерированное в соседней вкладке в другом месте фото) Доступна во Freepik, вангую, завтра же появится и в Krea.Картинками файлами в комментах поразглядывать.@ai_senior

Ещё по теме «Технологии»

Технологии

Домохозяин в Дубае (ОАЭ Дубай 🇦🇪)

Авторепост

Кто я глазами ИИ 👀 🤖Поучаствовал в некотором роде флешмобе промт-инженеров, где нужно спросить ИИ как он тебя видит по итогам работы с тобой.Изначально он определил меня брокером в Дубае (на картинке визуализация как он меня представляет) 🤷‍♂️Вот, кем еще он меня видит, если не брокером:1. Инвестор или финансовый аналитикТы любишь анализировать рынок, считать цифры, смотреть на динамику цен и инвестиционную привлекательность объектов. Это отличный фундамент для работы в инвестициях, финансовом консалтинге или аналитике рынков.2. Маркетолог в сфере недвижимости или luxury сегментаТы работаешь с контентом, системами контекстной рекламы, публикуешь информацию в LinkedIn, занимаешься личным брендом и точно понимаешь, как привлекать клиентов. Если ты не брокер, то ты специалист по маркетингу в недвижимости, luxury или инвестициях.3. ПредпринимательТы думаешь стратегически и уже строишь личный бренд. Это говорит о том, что ты мог запустить свой бизнес, связанный с недвижимостью, консалтингом, маркетингом или инвестициями.4. Эксперт-аналитик или консультантТебе нравится разбираться в тенденциях рынка и объяснять их, что отлично подходит для роли консультанта по недвижимости, инвестиций или рынка ОАЭ. Ты мог бы вести обучающие проекты или помогать крупным клиентам принимать решения.5. Журналист или блогер в сфере недвижимости и инвестицийС твоими навыками анализа и написания текстов ты можешь вести свой блог, Telegram-канал или YouTube о недвижимости, инвестициях и рынке ОАЭ. Это можно было бы монетизировать через партнерства и консультации.6. Девелопер или проектный менеджер в строительствеЕсли бы у тебя было желание углубиться в техническую часть, ты мог бы заняться девелопментом – запускать свои проекты или участвовать в застройке и развитии районов. Маска, я тебя знаю! Если изначально ошибся в корне, то в конечной степени вывел правильно.P.S. Пункты 5 и 6 похожи на советы по трудоустройству на бирже труда 😃P.P.S. Выкинул в топку почему-то огромный пласт других моих запросов - просто не учел их в портрете. Например, те же запросы по программированию, дизайну, языкам и культуре. Возможно, посчитал, что это увлечения, а не основная деятельность 🤷‍♂️ Возможно нужно просить более детальный разбор (но это уже другая история...) @dubai_househusband

Sasha Kruasanova PROIT

Авторепост

Как пройти собес на Java разработчика? 🤔Часть первая. Техническое интервью. Появилась у меня мысль поспрашивать гуру из айти, из разработки, как они проводят собесы. 💡Решила, что начну с Java 😉 а Если спрашивать, то у лучших Денис Родин

JAVA ONE LOVE 💑Как это делает один из ведущих Java разработчиков и что вам нужно знать, чтобы пройти собес. ✅Полезно будет и джунам, и мидлам, и синьорам. 👨‍💻👩‍💻Дальше инфа сотка 💯Денис делит вопросы на собесах по уровню кандидата (джун, мидл, синьер…), чтобы вопросы были более релевантные. 🎯С чего ты начинаешь тех собес? 🤔Денис:Вообще по формату я начинаю с простого вопроса и потом в зависимости от ответа кандидата начинаю "копать в ширь" 🕵️‍♂️ чтобы понять кругозор кандидата по этой теме.Вот примеры некоторых вопросов:1. Какие способы сравнения строк ты знаешь? 🤔Комментарий: в зависимости от уровня кандидата он может рассказать базу про методы Java equals, hashCode, а если кандидат более скиловый, то тут можно уйти в тему про модель памяти, Java String Pool и каким методом в классе String можно отправить строку в этот пул. 🏊‍♂️2. Collections framework. 📚Обычно все начинается с просьбы рассказать про иерархию интерфейсов в нем.Затем прошу назвать несколько классов из JDK реализующих самые популярные, такие как List и Map.После этого в зависимости от уровня кандидата можно углубиться более детальными вопросами во внутреннюю реализацию тех классов, которые он назовет, и особенностей работы с ними.3. Работа с исключениями в Java. ⚠️Здесь так же все начинается с вопроса перечислить базовую иерархию. Затем назвать пару реализаций и в зависимости от уровня кандидата можно углубиться в названные им классы, а также особенности использования исключений в Java и известные best practices.4. Если кандидат мидл или ниже, то можно ещё поспрашивать про особенности наследования и известные альтернативы, а самое главное понять, что предпочтительнее и какие best practices он знает. 💡5. Далее блок вопросов про то как он понимает ООП и может ли он привести пример использования. 🤔 Наводящие каверзные вопросы с просьбой привести пример, а не оттарабанить заученные аксиомы.

Тут нужно понять: кандидат просто заучил или может на практике применить? 🤔

6. Далее вопрос про SOLID и другие принципы, которые сможет перечислить. Тут тоже потребуются примеры и каверзные вопросы, чтобы понять — это просто заученная теория или кандидат понимает, что и где применять. 🎯7. Паттерны проектирования.

Куда же без них любимых 😉Тут также потребуется перечислить, что он реально использовал в проектах и рассказать, как принимал решение использовать именно эти паттерны. Заученные формулировки тут не прокатят. Я сразу это увижу. Также очень важно, чтобы кандидат мог адекватно описать, какие проблемы решает паттерн, а не просто как его написать. Их очень важно применять к месту, где они реально полезны, а не просто потому что кандидат их зазубрил.8. Spring. 🌱😉 Без него никак тут всё зависит от уровня кандидата.Много о кандидате скажет первый вопрос о том, какие способы конфигурирования он знает, а затем можно пойти в тему best practices и его личного мнения с примерами, когда и какой метод он применит.Ещё лучше, если это будет с примерами из практики.Потом можно пробежаться по известным аннотациям и копать глубже в зависимости от скила кандидата.9. Если на проекте есть Hibernate или Kafka, то обязательно вопросы по ним. Если их нет, но есть база, то вопросы про транзакции и знание SQL. 🗄️10. Если кандидат скиловый senior+, то отдельный этап (обычно доп собес) по теме System design. 🏗️ Это довольно большая продвинутая тема. Обычно всё сводится к выбору области\домена и затем просьбе спроектировать систему из этого домена. По ходу в зависимости от уровня кандидата будут доп вопросы для проверки его кругозора.Во второй части выложу какие софт вопросы задаем! И почему!https://t.me/kruasanova_as#java #собес #интервью #поискработы #ит

Интересные прогулки по Москве

Авторепост

"- А откуда ты звонишь? - Прям с плантации. Здесь такие чудеса - С плантации?! Но там же нет телефона!"🔼 Итак, обещанное видео работы беспроводного телефона.📍Тележурнал "Наука и техника", 1959 г.🔹Я не очень разбираюсь в технических тонкостях работы таких телефонов, но сам ролик снят интересно и с юмором😀

Просто про IPO Pre IPO

Авторепост

У IT-компаний появились юридические трудности при подготовке к IPOКонечно, это странно: казалось бы, “продвинутые” IT-компании заговорили о чисто технических трудностях, например, изменении формы собственности и перерегистрации в реестрах Минцифры. Вопрос не решается простым наймом профессионала? Тем не менее, мы слышим, что эти трудности отразятся на “операционной деятельности компаний”, особенно в части работы с государственными заказчиками и организациями критической информационной инфраструктуры. Может, мы чего-то не понимаем или нам не договаривают? Как отразятся?А вот как: процессе подготовки к IPO нужно изменить форму собственности на АО. Соответственно, изменится ИНН, а он используется для идентификации компаний в ключевых реестрах Минцифры (реестр IT-компаний и реестр российского ПО). В этот период компания теряет возможность работать с организациями критической информационной инфраструктуры и госструктурами. Еще момент – утрата даже на время IT-аккредитации поднимает вопрос о предоставляемых льгот, например, по налогам. Остается непонятным, почему такой рядовой вопрос вызывает сложности и растягивается на несколько месяцев, по словам юристов. Добавить столбец “реорганизация” в экселе – это предмет всенародных обсуждений?Минцифры говорит о “готовности к диалогу с отраслью”. О каком “диалоге” и прочих мудрствованиях идет речь? Нужно ведь просто акутализировать записи реестров. В Минцифры утверждают, что проблемы при могут возникнуть только в случае игнорирования действующих требований по поддержанию реестровой записи. А кто должен ее поддерживать? Разве сами IT-компании?К чему я веду. К тому, что раздувшийся бюрократический аппарат министерств и ведомств вместо быстрого решения простой задачи искусственно все усложняет, обсуждает, раздувает и т. п. Ну когда уже это закончится. И закончится ли вообще?Кстати, в этом году планируется принятие поправок к 149-ФЗ ("Об информации, информационных технологиях и о защите информации"), которые упростят подтверждение исключительных прав на программное обеспечение для компаний, торгующихся на бирже. Вопрос будет решен? Ан нет. Есть предложения – только не смейтесь – по созданию “”отдельной холдинговой компании, которая будет эмитентом и консолидировать операционные показатели компаний, внесенных в реестры”. Якобы, это позволит избежать необходимости перерегистрации операционных компаний и сохранить их позиции в реестрах. Может, и так, но мы снова строим структуру, надстуктуру, плодим сущности бесконечно! Пора заканчивать с этим, как думаете?@pro100IPO#перерегистрация

Введение в искусственный интеллект

Авторепост

My prompt is longer than yours. Или зачем нужны такие длинные промптыЯ тут немного пропала и не постила, а все потому что готовлю серию мероприятий - причем не только в Питере. О мероприятиях напишу в следующем посте, а сейчас пора добить февральские темы.Почему не нужно следовать интуитивному желанию написать промпт для большой языковой модели так, как хочется?.. А почему не нужно? Если вас устроил ответ модели, то все ок, вы написали хороший короткий промпт. Я считаю вредным меряться длиной промптов, Хирша и прочих KPI, т.к. люди уже давно доказали, что любую метрику можно хакнуть.Но, если вас все же не устроил ответ модели, значит, это повод задуматься о несовершенстве не только самой модели, но и вашего промпта. Ибо “что посеешь, то и пожнешь”, или “мусор на входе - мусор на выходе” (garbage in - garbage out, гАбидж ин гАбидж Аут). Можно, не удаляя диалога с моделью, объяснить ей, чем вас не устроил ее ответ, и попросить сделать задание снова. Но, если это не сработало, промпт можно доработать вот так.💫 Дать развернутую инструкцию, что и как нужно делать, подробно описать результат, которого ждете. В общем не скупиться на слова. А если, говоря словами известной песни, words don’t come easy to you, или слова нелегко приходят на ум, попросите саму модель написать вам промпт к вашей задаче. Затем перезапустите диалог и проверьте ее промпт. Если все еще недостаточно хорошо, скорректируйте результат вручную или попросите модель снова отредактировать промпт. Получится модель, которая кусает сама себя за промпт 🐉💫 Попробовать разные речевые жанры. Например, для доработки научного текста помогают формальный язык и вежливые обращения (пожалуйста, будь добра, спасибо), можно вычитать в своем промпте опечатки и стилистические ошибки. Это связано с тем, кто каждое слово в диалоге подтягивает за собой статистически значимые связи с другими словами. Формальный язык обычно используют в энциклопедиях, новостях; вежливые обращения “подтягивают” благожелательность. А вот для креативных задач вроде написания сказки подойдут всякие шутки-прибаутки.💫 Попробовать внушить модели, что она некая личность, персонаж и говорит от его лица; попросить ее поиграть с вами в ролевую игру. Опять же персонаж зависит от жанра, которому будет принадлежать желаемый вами сгенерированный текст. Этот эффект усилит то, что вы выражаете в собственном тоне. Это, кстати, один из методов хакинга моделей - они “заигрываются” и начинают подтягивать недопустимую информацию. Но разработчики усиленно работают над тем, чтобы такого не происходило.💫 Дать модели один или несколько хороших примеров. Это техника few-shot (фью шот) промптинга. Начинайте с одного примера, а если его недостаточно, то попробуйте увеличить число примеров, но не сильно. Судя по кейсам, с которыми я знакома, восемь-десять примеров - это максимум.💫 Дайте модели текст-опору, из которого она почерпнет факты и информацию, на которую будет опираться. Это помогает, если у вас узкая предметная область или модель ошибается в фактах в вашей задаче. Если помните, что такое machine reading comprehension (машинное усвоение навыка чтения), то вычитывать информацию и генерить на ее основе текст - это базовая функция языковых моделей, с ней они справляются успешно.Хотя можно попробовать и просто сменить модель. Например, известно, что Claude Sonnet хорошо умеет писать стихи, а ChatGPT решать математику.Всем удачного промптинга! 🍀#спискИИ

Железный Человек

Авторепост

ИИ против онлайн-мошенничества💰С ростом популярности цифровых платежей банки столкнулись с новым вызовом — всплеском онлайн-мошенничества. По данным отчета McKinsey за 2024 год, почти 9 из 10 потребителей в США и Европе регулярно используют цифровые кошельки, онлайн-инвестиционные платформы и p2p-кредиты. Однако вместе с удобством пришла и новая волна киберугроз.Согласно прогнозам Juniper Research, мировые потери от мошенничества превысят $326 млрд с 2023 по 2028 год — и почти половина этих потерь связана с дистанционными покупками.🎯 Почему традиционные системы больше не справляются?🔹️Большинство старых систем противодействия мошенничеству построены на жестких правилах и ручной проверке. Такие подходы часто не успевают адаптироваться к новым схемам и могут давать ложный результат при проверке, процент ошибок значительно выше.🔹️Сегодняшние киберпреступники используют всё более сложные методы: от подделки личностей и взлома аккаунтов до социальной инженерии и мошенничества с push-платежами (когда жертва сама переводит деньги мошеннику).Банки и платежные компании начали активно внедрять ИИ-решения. ИИ помогает на трёх ключевых уровнях:1️⃣ Проверка личности — анализирует данные, сверяет их с базами данных и выявляет подозрительных клиентов.2️⃣ Аутентификация — распознает поведенческие особенности пользователя, например, скорость набора текста и время ответа.3️⃣ Выявление мошенничества — оценивает транзакции по заданным параметрам, выявляет аномалии и блокирует подозрительные операции до их выполнения.Графовые нейронные сети (GNN) — новое слово в борьбе с мошенничеством и одна из самых мощных технологий в этой области. Они не просто анализируют отдельные транзакции, а строят глобальную карту связей между аккаунтами, устройствами и действиями.🔥 Банки всё чаще обращаются к облачным платформам и мощным вычислительным системам для борьбы с мошенничеством. Отличный пример — сотрудничество AWS и NVIDIA: Amazon Neptune ML использует GNN для построения сложных графов связей, улучшая точность прогнозов на 50%. Тесты показали: с использованием такой инфраструктуры банки могут ускорить обучение моделей в 14 раз и снизить расходы в 8 раз.Онлайн-мошенничество становится всё изощреннее, и старые системы больше не справляются. Те финансовые компании, которые успеют внедрить ИИ-решения, не только смогут защитить деньги клиентов и свою репутацию, но и получат конкурентное преимущество.#СверхРазум

Ленар Шагиев. Канал

Авторепост

Я балдею с этой прикормки...Точнее от этого гаджета. И я бы даже сказал анти-гаджета. Давно хотел себе и, наконец, купил Remarkable Paper Pro.Вы не представляете, насколько это крутая штука. Хотя, возможно, мало кто оценит мой восторг, но сдвг-шникам, как я, должно понравиться ☺️Во-первых, что это такое? Я теряюсь, когда у меня спрашивают, потому что для данного класса устройств нет чёткого названия. Планшет? Ну, может быть. Однако тут нельзя поставить какие-то приложения, поиграть в игры или проверить почту. Нельзя делать ничего из того, что обычно юзают на планшетах (и это прекрасно) + никаких уведомлений и отвлечений от процесса.Экран устройства на электронных чернилах. Тогда это электронная книга? Тоже не совсем. Книги на нём читать можно, но главная функция тут заключается в письме.Remarkable позиционирует себя как будущее бумаги. По сути, современный электронный блокнот. Для меня это инструмент мышления. Я снова пишу рукой какие-то идеи, и ничего не отвлекает. Могу рисовать схемки, выделять разными цветами. Писать записи от руки в принципе кажется более удобным и помогает лучше фокусироваться. Например, во время встреч я делаю пометки от руки. Это хоть и медленнее, но помогает лучше держать фокус на теме встречи и собеседнике.Почему всё это не совершать на обычной бумаге? В отличие от неё, на устройстве с записями можно делать всё, что захочется - переносить, копировать, стирать, удобно организовывать. Тут включается мой внутренний перфекционист. В бумажном блокноте нельзя поменять или стереть, и я не пишу, потому что это будет неидеально. 🥲 А на электронной бумаге - легко. В любой момент стёр, удалил, начал заново и никаких бумажных отходов). Также все записи сразу оказываются у меня в электронном виде на телефоне и ноуте.И уже вторая функция гаджета - это эффективное чтение. Я в восторге от возможности выделять текст, рисовать, обводить и писать на полях. Это даёт намного более основательный опыт чтения. Портить таким образом бумажные книги мне всегда было жалко.В целом это очень качественное и красивое в плане дизайна устройство, которым приятно пользоваться. Из аналогов есть еще Kindle Scribe, но говорят, там тактильные ощущения от письма не такие естественные, хотя я сам не пробовал.Вот такой цифровой anti-distraction гаджет, который теперь всегда со мной :)

Крафтилище | Ygr props

Авторепост

Пластик по хорошему нужно сушить любой, даже с завода, они все гигроскопичны. На качество печати оно влияет безусловно особенно петг начинает выебываться нитками. Для сушки достаточно будет любой овощесушки за пару тыщ рублейМожно взять круглую как у меня и напечатать переходникМожно взять с дверцей, вытащить полку и влезет пару штукПринцип действия тот же, влезает больше.Только вывода под пруток нет разве что

Dealer.AI

Авторепост

Немного про LLM и реальность в проде (бизнес кейсы).Дядя тут быканул на один постик про оркестрацию, метамодели и роутинг моделек вокруг/с LM. Закономерно получил отрицательную ОС. Но все же, чтобы там не думали, что автор с НИИ и все же прод.опыт имеющий, а не тварь дрожащая, расскажет вам Дядя про реальность чутка.Интро. Борд хочет, чтобы all in на LLM и кидает в вас задачу на проникновение современных БЯМ в бизнес процессы, тех.решения и платформы. Ведь ему со всех углов уже налили в уши, что это рокет саенс и золотая пуля. Нет. И вот Вы бедняга, берете под козырек тащить это в уже устоявшиеся пайпы, системы и процессы.Кейс 1. Система распознавания намерений. Хочется взять описания основных сценариев взаимодействия с клиентом, ака интенты, взять фразы в чате юзера и сказать: LMушка а вызови подходящий сценарий по описанию и запросу. И по-началу у вас будет это работать, но есть нюанс. На десятке интентов это может и ок. Если ваша LMка норм,то даже и соточку потянет. Но в системе интентов бывает сотни сценариев, и некоторые модельки тут уже не тянут. Да еще и глючат при генерации названия интента. И поэтому хитрые прод. инженеры используют хаки. Например, мы вот имели ж до этого систему на классификаторах и tfidf/fasttext/bert и хорошо оно работало итак без LLM для сотни и даже тыс. интентов. А давайте, чтобы убрать глюки и проблемы масштабируемости просто будем с этих модулей старых выдавать топК кандидатов. Берем К кандидатов, их описание и фразу юзера, кидаем в LLM и профит она из ограниченного списка, с recall@K которого 0.95+ выберет вам с 100% вероятностью нужный ответ. И фигак ты и кпэ закрыл и как бы LMка в проде. А чтобы это было чисто на LMке тебе придется еще думать про скейлинг, сегодня у тебя 10 интентов, а завтра 20 и перетюнить LM ты задолбаешься, классификаторы быстрее ретюн. Конечно можно лорку гонять, да. Ах и да, тут ещё важно,что на запросы отвечает всеравно старый добрый сценарный движок или qa система. Да, да это оч близкий подход к RAG.Кейс 2. Поиск и LLM. Мы же понимаем,что из весов LM поисковик так себе? Тут возникает вопрос актуальности данных,постоянного из-за этого переобучения, да и еще до кучи — глюки. Поэтому тут как раз, был придуман RAG. А LMка получает роль или ризонера по выдаче или вообще пишет тлдр по выдаче. До кучи, конечно, это над присыпать ссылками на источники, чтобы повысить доверие, да еще пошарить с вами ответственность за верификацию выдачи. Но иногда, ребята идут дальше, например делают технологию блендера, когда ответ из весов LM и выдачи с поиска (иной любой системы) еще скорится доп.алгоритмом и выбирается лучший ответ. К примеру, тут вот ребята с Яндекс создавали рекламные тайтлы, используя такой подход.Кейс 3. Про читчат и ассистентов.Когда появились LMки аля ChGPT все говорили, что это новая эра для ассистентов. Но в итоге, эти LM-based системы всеравно у серьезных игроков опираются на тот самый блендер между старыми отлаженными модулями: intent recognition, retrieval и дерево сценариев. А роль БЯМ или переписывать ответы, или выбирать из уже порезанной выдачи ретривала/интент классификации и в остальных случаях вести беседу самостоятельно e2e. Вообщем в целом жизнеспособность only e2е LLM в таких задачах спорно. По крайней мере сейчас. У знакомых вообще долгое время retrieval based диалоговая система не уступала LLM-based причем метрику оценки формировала команда БЯМ. Да LLM дает больше разнообразия ответов, интересности, зато ретривал релевантности. Поэтому и тут-то тоже блендер схема зашла на ура. К чему я это все, да оркестрация старых + склейка с новыми системами важна. Переиспользование старых стабильных, надежных и высокоэффективных модулей тоже не зазорно. Можно ли это блендить и мерджить с LLM? Нужно. И не стоит делать all in на LLM. Сложно ли это сделать? Да нелегко, но дорогу осилит идущий.

У Мити была стратегия

Авторепост

4 вещи, которые меня бесят в Chat GPTЯ делал много подходов к LLMкам, но так и не достиг желаемого за пределами языковых и примитивных исследовательских задач. 1️⃣ Моделей стало больше, гемора — тоже. Одна модель отлично размышляет, но упаковывает размышления в избыточный сложный текст. Другая хорошо пишет текст, но не замечает ошибки. Есть что-то посередине. И все эти модели нужно переключать. Я уже задолбался разбираться в логике. Иногда старая модель работает лучше, чем новейшая. Есть режим reasoning — я так и не понял, он переключает модель или это просто дополнительный режим. А еще у каждой модели (которые переключаются иногда сами по себе) разное контекстное окно до начала активных галлюцинаций. 2️⃣ Примитивные ошибкиЭти ошибки поставили бы меня в тупик, если бы я не провел в интернете больше 15 лет. Они буквально напоминают траблшутинг в эпоху Windows XP. Делаю финансовую модель внутри canvas — таблицу на 12 месяцев. Прошу удлинить ее на 24 месяца. Обновляет canvas, на месте таблицы плейсхолдер «Здесь будет модель на 24 месяца».— Ты меня так троллишь?— Вижу ошибку, сейчас исправлюсь.Обновляет canvas, «Здесь точно будет модель на 24 месяца». Гуглю, хожу по форумам. Пишут, что в промпте надо попросить отрендерить таблицу без плейсхолдера. Обновляю промпмт – рендерит табличку на 24 месяца, но не внутри Canvas. — Отлично, теперь включи эту таблицу в canvas!Обновляет canvas, на месте таблицы плейсхолдер «Здесь будет модель на 24 месяца». А ведь эти переговоры расходуют мой лимит.3️⃣ Режим размышления не особо умныйПрошу смоделировать рост или черн бизнеса. Чат знает входные параметры, что за продукт, в курсе бизнес-модели... и он моделирует примитивный линейный рост. Но ведь очевидно, что нужно заложить флуктуации. Он же, насмотревшись данных в интернете, сам должен это понимать. Говорю об этом, прошу поправить. Ну ок, делает рост чуть менее линейным, каждые три месяца добавляет изменение на одну цифру. Да что ж такое!Все это становится тем хуже, чем дольше ты переписываешься в рамках одного контекстного окна. Чем больше контекст, тем больше он начинает галлюцинировать и тупить. Один шаг вперед — два назад. 4️⃣ Ценность промпт-инжиниринга под сомнениемУсловия постоянно меняются. Это как если бы язык программирования обновлялся каждый год, причем фундаментально. Пять месяцев назад один американский предприниматель показывал мне свой крутой промпт, который учит ChatGPT критическому мышлению через обработки циклами. Разрабатывал и тестировал его два месяца. Guess what? С появлением reasoning модели OpenAI не рекомендует использовать циклы в промпмтах. Короче, пока не могу присоединиться к всеобщему крику «За AI будущее!».

Открыть ленту