Почему LLM ощущаются такими тупыми? Каждый раз, когда выходит новая модель, мы все радуемся тому, какие новые возможности она нам открывает. Мы кидаем в нее промпты из разряда «сделай красиво» и получаем действительно красивый результат.🤔 Но, уже через пару недель, накатывает ощущение, что модель сильно «отупела» с момента релиза. Она уже не так хорошо тебя понимает, результат ее работы уже не такой красивый и вообще это все злые OpenAI/Anthropic/Google крутят там крутилку «интеллекта»🤷♂️ А реальность на самом деле сильно проще. Дело не в моделях — дело в нас.С каждой новой моделью наш внутренний ползунок минимальных ожиданий сдвигается. Если раньше мы ожидали что модель должна как минимум посто написать связанный текст, то сегодня мы ждем от нее рабочий код, готовые эссе, и картинки уровня мировых фотографов.Когда появляется новая модель, наш ползунок все еще настроен на предыдущую. И любой результат который превосходит наши ожидания становится для нас чем-то «вау». Но спустя пару недель, мы адаптируем внутреннее ощущение под новые реалии. Наши базовые запросы становятся выше. И вот тут мы начинаем замечать «косяки» и неточности новой модели.Но это не модель стала тупее, это у нас выросли требования к ней.Это кстати не только с моделями работает. С людьми мы ведем себя точно так же. Тот самый цветочно-букетный период в отношениях ровно про это же.Но модели, в отличие от людей, можно объективно протестировать и сравнить сухие цифры. Для этого можно использовать мой PRISM и прогнать один и тот же промпт через разные модели, чтобы можно было наглядно сравнить их результат. 👌Как закончить этот пост я не понимаю, поэтому просто призову вас кидать ваши любимые мемы в коменты 😅Свята место | 10МДК | ВЕБМастер | YHub
Свята место пусто не бывает
@svyatamesto · 2.2K подписчиков
Посты канала Свята место пусто не бывает в SillyFeed: единая лента публичных Telegram-каналов со ссылками на оригиналы.
Пишу код за деньги и тебя научуНаучу делать проекты с нуля до деплоя -https://svyat404.com/webmaster-early-bird/Все полезности тут -https://links.svyat404.com/CTO, Software Engineer, YouTuber
Посты канала
😱 OpenAI купили OpenClaw. По крайней мере, такие заголовки сейчас везде. По факту же OpenAI просто захантили к себе одного из основных разрабов проекта. И что самое приятное — чувак согласился. 🥳Там уже вовсю задвигают про «общую миссию», про то, как они сделают агентов доступными для обычных людей, а не только для технарей. И тут за ситуацией интересно наблюдать с двух сторон. 👀Первое. В OpenAI слова «Open» всегда было, мягко говоря, маловато. Моделей с открытыми весами у них дай бог штук пять найдется. Всё закрыто. При этом OpenClaw — это реально трушный Open Source проект, который тащило огромное комьюнити. Сейчас OpenAI обещают оставить его открытым и не душить, но как будет на самом деле? Ну, посмотрим-посмотрим.Второе, это контраст с Anthropic. Помните эту позорную эпопею? Когда Антропик тупо забоялись и пришли к разработчику с требованием менять название, из-за схожести с Claude. Вместо того чтобы предложить нормальную работу или коллаборацию, они включили режим корпоративных душнил. 🤷♂️В итоге OpenAI просто вовремя подхватили эту палочку. Пока одни трясутся над названиями, другие подчеркивают, что их нейронки доступны всем бесплатно (хоть и с ограничениями) и забирают к себе таланты. Мув максимально правильный. 👌 Посмотрим, что из этого выйдет.Свята место | 10МДК | Бот | YHub
👌 Редко делюсь чем-то не про код/IT, но тут реально годнота. Посмотрите этот TED Talk, он всего на 5 минут, но там база про то, как нами сейчас вертят алгоритмы и чат-боты.https://www.youtube.com/watch?v=ZkXrTHpnQrQДальше будут спойлеры 😅В этом видео такая мощная жиза. 🫠 Я это на своей шкуре вижу как контент-криэйтор. Делаешь какой-то полезный и нейтральный гайд «как научиться X» — всем плевать, просмотров ноль. Но стоит выкатить заголовок в духе «99% резюме мусор» — всё, сразу взрыв, комменты, охваты. Потому что это engagement. 🤷♂️ Алгоритмам срать на пользу, им нужно, чтобы вы кликали.🤔 И тут главный вопрос, на который у меня нет ответа: это алгоритм просто нащупал наши слабости и на них играет, или он нас уже ТАК выдрессировал, что мы физически не можем воспринимать ничего, кроме яркого трэша и ярости? Раньше же в топах были всякие мемы с котиками, смешные кубы, милые видосы с детьми. Сейчас ощущение что алгоритм развернулся на 180 градусов.Хочется верить, что люди всё-таки не такие конченые, и это просто внешнее влияние. Потому что я уже ловлю себя на том, что в обычной речи использую обороты из ChatGPT. 🫠 Но когда я ловлю себя на этом, я инстинктивно задаю себе тот самый вопрос из концовки видео. Короче, однозначный рекомендасьён. 👌Свята место | 10МДК | Бот | YHub
Ещё по теме «Технологии»
ТехнологииВ НИИ прикладной химии разработали патрон, который способен противостоять дронам. Он может поражать БПЛА на дальности до 100 метров.По словам авторов разработки, соотношение массы тяжелой дроби к массе всего патрона дает возможность получить нужную энергию отдельных дробин, позволяющую разрушать элементы конструкции беспилотников на расстоянии от 70 до 100 метров. В более ранних разработках попадание связанной дроби не всегда заканчивалось сбитием дронов на дальностях более 80 метров.Особенность устройства патрона позволяет раскрыться осыпи дроби на оптимальном расстоянии «для эффективного поражения БПЛА».
Слева новый первый день. А справа мой первый Macbook Pro 13" Late 2013 который взял в феврале 2014 года. Прошло 12 лет, 3 замены батарейки и он всё ещё работает, правда уже на Linux :) Самое удивтельное у него всё ещё отличный на сегодня экран, клавиатура, тачпад. Пережил падения, удары и всё равно не выглядит уставшим, а яблочко всё ещё светится сздади) А когда я на нём на парах, записывая лекцию, в Parallels играл в винде в ArcheAge притом писал скрипты по посадке урожая xDИстория однако
Плотная линия - изменение импорта в США связанных с ИИ отраслей, прерывистая - импорта не связанных с ИИ отраслей.Когда вся твоя экономика сделала ставку на продвинутую форму автокорректа.
OpenAI Codex vs Claude Code vs Amp Code vs OpenCode + DS4 ProЯ сегодня закончил сложный рефактор проекта ядра BitGN. И состояние кода теперь просит генеральной уборки.Из интереса я задал один и тот же вопрос разным агентам:Scan through the repository on a high level (ignore code under /modules). I want you to suggest ways, how we can make it more simple and straightforward, refactor away traces of growing pains. Focus on small changes that allow to drop code, or reduce cognitive complexity with a small LOC change cost.OpenAI Codex с GPT-5.5 High потратил 3 минуты и 132k tokens из подписки и предложил:(1) удалить папку /dbg с начинкой - давно пора(2) переименовать пакет stor в store - можно(3) упростить ULID генератор - да, можно(4) убрать AddVMCreateds - можно(5) зарефакторить run finalization/push - надо посмотреть(6) удалить public-release backfill - да, это прямо точно можно(7) почистить Makefile - мелочь, но можно(8) почистить раутинг до виртуальных машин- да, теперь можно(9) утащить виртуальную FS в PAC1 - имеет смыслAmp Code в deep thinking потратил 4 минуты и 90 центов, выдал список первоочередных изменений, которые пересекаются с кодексом:(1) Удалить папку /dbg с начинкой - ok(2) упростить раутинг до виртуальных машин - да, можно(3) зарефакторить run finalization/push - надо посмотреть(4) убрать public-release backfill - ok(5) убрать fx.VM интерфейс и поправить доки - да, действительноClaude Code + Opus 4.7 XHigh потратил 8 минут (говорит, что 2$ из подписки) и предложил прежде всего:(1) убрать fx.VM интерфейс - ок(2) убрать helper err(), который код сильно упрощает - нет(3) оптимизировать ненужные конструкторы storage - надо смотреть(4) переместить файлы с интерфейсами айдишников в файл с интерфейсами IO, ибо “используются вместе и сэкономят одну строчку кода” - нет, спасибо(5) удалить пустую папку /cmd - она даже не в git, но ок(6) удалить proto_api/bitgn/vm/ecom.proto - и оставить вас без интерфейса к соревнованию. Нет, спасибо.OpenCode + DeepSeek V4 Pro потратил 1.15$ + 6 минут и предложил:(1) слить файлы с конфигами - и так нормально(2) переместить файлы с интерфейсами айдишников в файл с интерфейсами IO - как и Claude. Нет, спасибо.(3) удалить папку dbg с начинкой - ok(4) удалить пустую папку с /cmd - ну ок(5) заменить lib/set.go на inline map[string]struct{} - ни в коем случае, это код упрощает(6) удалить systemd socket activation logic, ибо “the most complex code”, что сразу уронило бы все сервера.OpenCode +DS4 Pro пока совсем сыроват. Ответы Claude Opus немного лучше. Codex идет в работу. Amp тоже нашел толковое без шума, но меньше Кодекса.Ваш, @llm_under_hood 🤗
Плох тот AI, который не мечтает уничтожить Человечество создать нечто, до чего не догадалась Жизнь...две новейшие научные работы под это утверждение 🧐➡️ Вот тут, с помощью AI собирают ферменты, осуществляющие одну из самых распространенных реакций в природе - разрыв фосфатных связей (таковые наполняют ДНК, РНК, сигнальные и прочие молекулы). Без белков-ферментов некоторые из этих связей будут "ждать" распада годами. Главное, что показали авторы - такой фермент, AI может спроектировать очень НЕ похожим на природные аналоги. Их белок как бы “эволюционировал” внутри AI-алгоритма, который шаг за шагом отбирал варианты, и результат крайне отличается от "натуральных" ферментов.➡️ А здесь, тоже в AI-пайплайне, конструируют "под заказ" белки, способные специфически связать определённые участки ДНК. Опять-таки, важно что AI не варьировал природные байндеры ДНК (цинковые пальцы, TALE или CRISPR) - а сгенерировал "с нуля" небольшие белки, которые распознают заданные последовательности ДНК. Обе статьи - препринты. И, кстати, второй проект - детище Дэвида Бейкера великого и ужасного пожалуй главного эксперта по собиранию белковых молекул из шариков и палок под любую биохимическую задачу... ах, да - он ещё и лауреат сами-понимаете-какой Премии ⬅️. Уверен, что оба обсуждаемых инструмента вскоре опубликуются в ведущих научных журналах - и обретут интереснейшие прикладные применения.#ии #люди
Мне нравится как боты теперь не предлагают скачать уникальные записи лекций по трейдингу или пройти курсы по психологии, а просто наваливают реакции клоунов в комментариях.
"Диана и Актеон" 1886Художник: Генрих Ипполитович Семирадский@ROMeNIKA
Я прошла интенсив по ИИ boost у Вани ЗамесинаПри всей моей любви к оптимизации, я думала что вайбкодинг продуктов не для меня. Ну потому что даже несмотря на то, что всё сейчас можно сделать быстрее, это все равно трата времени. Проще же отдать кому-то и самой этим не заниматься.Второе — я не до конца понимала, какие процессы мне надо оптимизировать. Потому что в основном я сейчас работаю в одного, и в купе с ребенком, у меня не так-то много «процессов» с компом. Такая была моя точка А.Пока я это переваривала и осознавала, попала на boost к Ване Замесину. Это очень интенсивная неделя, по выходным по 2 воркшопа в день. Я сначала испугалась, а потом очень оценила. Еще скажу, что интенсив подойдет тем, кто с нуля и хочет очень быстро вкатиться в тему, потому что за тобой буквально закреплен куратор, который ведет за руку и даже помогает купить аккаунт клода)))В первый же день воркшопа мы сделали лендос продукта, я делала наброски для онлайн-клуба для Марса. Не просто придумывали сами, Ваня собрал на основе своих методик документы для клода, чтобы очень быстро валидировать идею, получить сегменты аудиторий и под них сделать лендинг. Типа ты вчера еще не умел пользоваться Клодом, а сегодня у тебя готовый лендинг, выложенный на сервер, который может продавать. Это реально был aha moment. Еще из очень классных бонусов было немного токенов в специальный продукт для продактов aura и доступ в чат сообщества. Это как бы нифига себе. Теперь я пользуюсь этими промптами, чтобы поразгонять новые идеи, в том числе образовательные. Честно, я просто даже не ожидала, что с интенсива по ии я выйду с куда большим, чем «а как еще юзать Клод». Фактически я вышла с Ваниной методикой + кучей обвесов-примеров от экспертов. То есть теперь вышло так, что я ни одну задачу не решаю без нейронки: свожу таблицы, ищу ошибки, прошу инструкции, собрала себе трекер баланса кбжу и моей активности, сейчас вот делаю бота для трекера задач… это просто к тому, что процессов на самом деле оказалось в итоге много. Просто все они не в компе, а между кучей разных приложений и моей головой. Кажется, такими темпами, я откажусь от всех сторонних приложений. Например, так отпала уже надобность заходить в тик-тик для ведения задач, ставить самой задачи в календарь. Все встречи я записываю, а потом разгоняю с Клодом, как это использовать.Мне с одной стороны немножко страшно от такой скорости. С другой, опять же, я снова и снова понимаю, почему нейронки зашли в первую очередь предпринимателям. Потому что мы обычно безрукие. Креативщики, способные видеть далеко, ощущать «как надо», а как сделать — хз. С нейронкой этот барьер совсем исчез.
✔️ Ехал в этот раз на поезде в отпуск. Это чуть больше суток в дороге. И стало прям больно. Опять. Мы так боремся за передовые позиции в технологическом секторе и я вижу сколько усилий и государства и бизнеса на это направлены. Тут очевидно, что без этого вообще глобально просто не что претендовать. Но мы не можем ничего сделать с доступом интернет в поездках на поездах. Причем это касается абсолютно всех маршрутов. Как и в этот раз покрытие интернетом было не более 7% от всей протяженности. Друзья, ну реально, это как так?) Сейчас не возможно представить современного успешного человека, который работает и то что ему не нужно решать вопросы или отвечать оперативно коллегам, доделывать проекты даже пока он едет в поезда или отпуск. Такого не бывает. И вот 24 часа без доступа в интернет. Можно посчитать сколько это человек-часов потерь. В вагоне 34 места, 21 вагон, 12 часов рабочего времени и 10 таких поездов в день (прям минимум) = 85 680 часов в день. Только в день. Это в то время когда для нашей страны важны каждые 0,1% ВВП. Я не понимаю, извините. Отдайте концессию предпринимателям и они найдут решение как обеспечить безопасный доступ в интернет, а еще и денег на этом в бюджет заработать. Уверен. Как думаете, есть решения?)
Первомайские layoffs (увольнения в tech)Вчера многие компании подвели итоги Q1, которая завершилась 31 марта, и сделали реструктуризацию компаний за апрель (посчитали, кого увольняют и выплатили garden leave — пособие с увольнением).В моей конторе не выжили два отдела: QA (quality assurance) и sales outreach (SDR и BDR). Уволили всех. Несколько разработчиков тоже коснулось. Раньше (2019-22) разрабов не трогали, всегда сокращали маркетинг, бэкофис, а сейчас с девелоперами тоже не считаются. Куда не нужно идти учиться и работать?Точно не quality assurance — тестировщики, разработчики. Вижу, что в-основном работают хорошие миддлы и сеньоры с ко-пилотами на разработку. Кого нанимают? AI Operations и Forward deployed Engineers FDE — разрабы/технари, которые могут подсоединить новые Ии системы к существующему техническому стеку предприятия. Если вы в разработке, посмотрите в сторону FDE. Вообще, сезон layoffs это всегда так грустно, итак живешь в моменте постоянных потерь, а тут еще коллег, к которым прикипаешь, сокращают. А то ли еще будет в этот век ИИ. Работаем, товарищи, и в Первомай!