🔥 Идея из paper: перестать “тренировать наугад” - и сначала предсказывать, какой код выиграетОбычно ML-агенты работают так:написал код -> запустил обучение -> посмотрел результат -> исправил -> снова запустил…Проблема в том, что каждая попытка может занимать часы, и получается дорогой trial-and-error.Авторы предлагают другой подход:✅ вместо того чтобы проверять все варианты агент сначала рассуждением выбирает, какой из 2 решений лучше, и запускает обучение только для лучшего кандидата.То есть:сначала прогноз -> потом одна проверка, а не десятки запусков.Они оформляют это как задачу:“выбор лучшего решения по данным” (data-centric preference)На вход дают:- описание задачи- *подтверждённый отчёт о датасете* (data report)- два варианта кодаЧтобы отчёту можно было доверять, они:1) прогоняют отдельный профайлинг-скрипт по данным 2) проверяют логи 3) переписывают статистику в простой текст, понятный LLMРезультат на реальных данных:- 18,438 пар решений- 26 задач- точность лучшей модели: 61.5%- и ещё важно: уверенность модели реально совпадает с тем, права она или нетВ их системе FOREAGENT это даёт:⚡ поиск в 6 раз быстрее📈 примерно на 6% лучше качествоВывод простой:мы можем ускорить обучение агентов не за счёт железа, а за счёт “умного отбора” - тренировать только то, что с высокой вероятностью сработает.Paper: arxiv.org/abs/2601.05930
Artificial Intelligence
@ArtificialIntelligencedl · 16.7K подписчиков
Посты канала Artificial Intelligence в SillyFeed: единая лента публичных Telegram-каналов со ссылками на оригиналы.
Artificial Intelligenceadmin -@haarrp@itchannels_telegram-🔥best it channels@ai_machinelearning_big_data- Machine learning channel@pythonl- Our Python channel@pythonlbooks- python книги📚@datascienceiot- ml📚РКН:clck.ru/3FmwZw
Посты канала
ML полностью изменил рекламные алгоритмыВышел большой разбор от Ивана Ремень (AI VK) о том, как современные рекламные платформы работают под капотом.Что внутри:— Аукцион, обрабатывающий миллионы запросов в секунду— ML-модели, которые прогнозируют бюджет и эффективность — Anti-fraud ML, выявляющий ботов по паттернам поведения— Сквозная ML-инфраструктура на единой Discovery-платформеОтличный материал, чтобы понять, как индустрия движется к ML управлению рекламой.
📊 MIT показал, как экономить при обучении больших LLM MIT и MIT-IBM Watson AI Lab выпустили плейбук о том, как правильно строить законы масштабирования — правила, по которым можно предсказывать, какой будет точность большой модели, не тратя миллионы на полный прогон. Что выяснили: - Достаточно обучить 5 моделей разных размеров, чтобы построить рабочий прогноз. - Первые 10 миллиардов токенов обучения можно смело пропускать — данные там слишком шумные и бесполезные. - Большую модель можно обучить всего на 30%, и по этой частичной кривой уже предсказать финальные результаты. Что интересного в плейбуке: Сильно сокращает расходы на тесты. Позволяет исследователям заранее понимать, какой результат даст масштабирование. - Делает разработку больших LLM быстрее и эффективнее. Подробнее здесь: https://news.mit.edu/2025/how-build-ai-scaling-laws-efficient-llm-training-budget-maximization-0916@ArtificialIntelligencedl
Ещё по теме «Технологии»
Технологии🚀 Fine-tuning LLM теперь можно делать даже на ноутбукеС помощью ноутбука от Unsloth AI можно дообучать Gemma 4 с 8GB VRAM.Это уровень обычной GPU или даже бесплатного Colab T4.🔗 Ссылка на ноутбук📍 Навигация: Вакансии • Задачи • СобесыБиблиотека дата-сайентиста#буст

Новые версии продукта - типа, новые ощущения !?Расскажите это админам новомодного S/4HANA.Тут вот на значительном ряде современных ядер от 753 по 919 включительно в утилите tp обнаружили баг, которому наверное "отчень много лет". Ну или мне так показалось..🤓История такая:1) Запрос транспортный успешно отрелизили в разработке.2) Далее мы импортируем его в систему качества для "QA Approval/Rejection"3) Открываем очередь STMS_QA , а там йок(‼), нету нужного запроса.Решение стандартное: качаем свежую версию tp и обновляем в системах.Далее список из версий tp в которых безобразие это - вылечено:KERNEL919: tp 381.733.04KERNEL918: tp 381.715.04KERNEL917: tp 381.709.04KERNEL916: tp 381.700.04KERNEL793: tp 381.588.04KERNEL789: tp 381.577.04KERNEL754: tp 381.40.04KERNEL753: tp 381.30.04(imho) про ядро 777, как обычно успешно забыли...!?#STMS_QA_BUG#TP#KERNEL919#KERNEL753
В НИИ прикладной химии разработали патрон, который способен противостоять дронам. Он может поражать БПЛА на дальности до 100 метров.По словам авторов разработки, соотношение массы тяжелой дроби к массе всего патрона дает возможность получить нужную энергию отдельных дробин, позволяющую разрушать элементы конструкции беспилотников на расстоянии от 70 до 100 метров. В более ранних разработках попадание связанной дроби не всегда заканчивалось сбитием дронов на дальностях более 80 метров.Особенность устройства патрона позволяет раскрыться осыпи дроби на оптимальном расстоянии «для эффективного поражения БПЛА».
Слева новый первый день. А справа мой первый Macbook Pro 13" Late 2013 который взял в феврале 2014 года. Прошло 12 лет, 3 замены батарейки и он всё ещё работает, правда уже на Linux :) Самое удивтельное у него всё ещё отличный на сегодня экран, клавиатура, тачпад. Пережил падения, удары и всё равно не выглядит уставшим, а яблочко всё ещё светится сздади) А когда я на нём на парах, записывая лекцию, в Parallels играл в винде в ArcheAge притом писал скрипты по посадке урожая xDИстория однако
Плотная линия - изменение импорта в США связанных с ИИ отраслей, прерывистая - импорта не связанных с ИИ отраслей.Когда вся твоя экономика сделала ставку на продвинутую форму автокорректа.
OpenAI Codex vs Claude Code vs Amp Code vs OpenCode + DS4 ProЯ сегодня закончил сложный рефактор проекта ядра BitGN. И состояние кода теперь просит генеральной уборки.Из интереса я задал один и тот же вопрос разным агентам:Scan through the repository on a high level (ignore code under /modules). I want you to suggest ways, how we can make it more simple and straightforward, refactor away traces of growing pains. Focus on small changes that allow to drop code, or reduce cognitive complexity with a small LOC change cost.OpenAI Codex с GPT-5.5 High потратил 3 минуты и 132k tokens из подписки и предложил:(1) удалить папку /dbg с начинкой - давно пора(2) переименовать пакет stor в store - можно(3) упростить ULID генератор - да, можно(4) убрать AddVMCreateds - можно(5) зарефакторить run finalization/push - надо посмотреть(6) удалить public-release backfill - да, это прямо точно можно(7) почистить Makefile - мелочь, но можно(8) почистить раутинг до виртуальных машин- да, теперь можно(9) утащить виртуальную FS в PAC1 - имеет смыслAmp Code в deep thinking потратил 4 минуты и 90 центов, выдал список первоочередных изменений, которые пересекаются с кодексом:(1) Удалить папку /dbg с начинкой - ok(2) упростить раутинг до виртуальных машин - да, можно(3) зарефакторить run finalization/push - надо посмотреть(4) убрать public-release backfill - ok(5) убрать fx.VM интерфейс и поправить доки - да, действительноClaude Code + Opus 4.7 XHigh потратил 8 минут (говорит, что 2$ из подписки) и предложил прежде всего:(1) убрать fx.VM интерфейс - ок(2) убрать helper err(), который код сильно упрощает - нет(3) оптимизировать ненужные конструкторы storage - надо смотреть(4) переместить файлы с интерфейсами айдишников в файл с интерфейсами IO, ибо “используются вместе и сэкономят одну строчку кода” - нет, спасибо(5) удалить пустую папку /cmd - она даже не в git, но ок(6) удалить proto_api/bitgn/vm/ecom.proto - и оставить вас без интерфейса к соревнованию. Нет, спасибо.OpenCode + DeepSeek V4 Pro потратил 1.15$ + 6 минут и предложил:(1) слить файлы с конфигами - и так нормально(2) переместить файлы с интерфейсами айдишников в файл с интерфейсами IO - как и Claude. Нет, спасибо.(3) удалить папку dbg с начинкой - ok(4) удалить пустую папку с /cmd - ну ок(5) заменить lib/set.go на inline map[string]struct{} - ни в коем случае, это код упрощает(6) удалить systemd socket activation logic, ибо “the most complex code”, что сразу уронило бы все сервера.OpenCode +DS4 Pro пока совсем сыроват. Ответы Claude Opus немного лучше. Codex идет в работу. Amp тоже нашел толковое без шума, но меньше Кодекса.Ваш, @llm_under_hood 🤗
Плох тот AI, который не мечтает уничтожить Человечество создать нечто, до чего не догадалась Жизнь...две новейшие научные работы под это утверждение 🧐➡️ Вот тут, с помощью AI собирают ферменты, осуществляющие одну из самых распространенных реакций в природе - разрыв фосфатных связей (таковые наполняют ДНК, РНК, сигнальные и прочие молекулы). Без белков-ферментов некоторые из этих связей будут "ждать" распада годами. Главное, что показали авторы - такой фермент, AI может спроектировать очень НЕ похожим на природные аналоги. Их белок как бы “эволюционировал” внутри AI-алгоритма, который шаг за шагом отбирал варианты, и результат крайне отличается от "натуральных" ферментов.➡️ А здесь, тоже в AI-пайплайне, конструируют "под заказ" белки, способные специфически связать определённые участки ДНК. Опять-таки, важно что AI не варьировал природные байндеры ДНК (цинковые пальцы, TALE или CRISPR) - а сгенерировал "с нуля" небольшие белки, которые распознают заданные последовательности ДНК. Обе статьи - препринты. И, кстати, второй проект - детище Дэвида Бейкера великого и ужасного пожалуй главного эксперта по собиранию белковых молекул из шариков и палок под любую биохимическую задачу... ах, да - он ещё и лауреат сами-понимаете-какой Премии ⬅️. Уверен, что оба обсуждаемых инструмента вскоре опубликуются в ведущих научных журналах - и обретут интереснейшие прикладные применения.#ии #люди
Мне нравится как боты теперь не предлагают скачать уникальные записи лекций по трейдингу или пройти курсы по психологии, а просто наваливают реакции клоунов в комментариях.
"Диана и Актеон" 1886Художник: Генрих Ипполитович Семирадский@ROMeNIKA
Я прошла интенсив по ИИ boost у Вани ЗамесинаПри всей моей любви к оптимизации, я думала что вайбкодинг продуктов не для меня. Ну потому что даже несмотря на то, что всё сейчас можно сделать быстрее, это все равно трата времени. Проще же отдать кому-то и самой этим не заниматься.Второе — я не до конца понимала, какие процессы мне надо оптимизировать. Потому что в основном я сейчас работаю в одного, и в купе с ребенком, у меня не так-то много «процессов» с компом. Такая была моя точка А.Пока я это переваривала и осознавала, попала на boost к Ване Замесину. Это очень интенсивная неделя, по выходным по 2 воркшопа в день. Я сначала испугалась, а потом очень оценила. Еще скажу, что интенсив подойдет тем, кто с нуля и хочет очень быстро вкатиться в тему, потому что за тобой буквально закреплен куратор, который ведет за руку и даже помогает купить аккаунт клода)))В первый же день воркшопа мы сделали лендос продукта, я делала наброски для онлайн-клуба для Марса. Не просто придумывали сами, Ваня собрал на основе своих методик документы для клода, чтобы очень быстро валидировать идею, получить сегменты аудиторий и под них сделать лендинг. Типа ты вчера еще не умел пользоваться Клодом, а сегодня у тебя готовый лендинг, выложенный на сервер, который может продавать. Это реально был aha moment. Еще из очень классных бонусов было немного токенов в специальный продукт для продактов aura и доступ в чат сообщества. Это как бы нифига себе. Теперь я пользуюсь этими промптами, чтобы поразгонять новые идеи, в том числе образовательные. Честно, я просто даже не ожидала, что с интенсива по ии я выйду с куда большим, чем «а как еще юзать Клод». Фактически я вышла с Ваниной методикой + кучей обвесов-примеров от экспертов. То есть теперь вышло так, что я ни одну задачу не решаю без нейронки: свожу таблицы, ищу ошибки, прошу инструкции, собрала себе трекер баланса кбжу и моей активности, сейчас вот делаю бота для трекера задач… это просто к тому, что процессов на самом деле оказалось в итоге много. Просто все они не в компе, а между кучей разных приложений и моей головой. Кажется, такими темпами, я откажусь от всех сторонних приложений. Например, так отпала уже надобность заходить в тик-тик для ведения задач, ставить самой задачи в календарь. Все встречи я записываю, а потом разгоняю с Клодом, как это использовать.Мне с одной стороны немножко страшно от такой скорости. С другой, опять же, я снова и снова понимаю, почему нейронки зашли в первую очередь предпринимателям. Потому что мы обычно безрукие. Креативщики, способные видеть далеко, ощущать «как надо», а как сделать — хз. С нейронкой этот барьер совсем исчез.