Агенты ИИ | AGI_and_RL

@AGI_and_RL · 5.9K подписчиков

Открыть канал в Telegram

Посты канала Агенты ИИ | AGI_and_RL в SillyFeed: единая лента публичных Telegram-каналов со ссылками на оригиналы.

Про ии, RL и в целом@tokarev_i_vhttps://t.me/researchim

Посты канала

Агенты ИИ | AGI_and_RL

Авторепост

а вот это прикольное применение опенклавMost RL-for-LLM systems assume centralized, batch-mode training with pre-collected datasets. OpenClaw-RL takes a fundamentally different approach: it wraps your self-hosted model in OpenClaw as an OpenAI-compatible API, intercepts live multi-turn conversations, and continuously optimizes the policy in the background — all without interrupting your usage.https://github.com/Gen-Verse/OpenClaw-RLнапомню что у нас есть штука для тех кто хотел бы сам тюнить модельки https://github.com/researchim-ai/models-at-homeдостаточно докера и можно тюнить ллмки небольшие у себя от претрена до грпо)

Агенты ИИ | AGI_and_RL

Авторепост

ребятки, новые квены 3.5 получились отличные. респект квенамотдельное спасибо OpenAI, Anthropic, Google за такие крутые модельки. эти компании со своими фронтирами для того и нужны чтобы были у нас крутые квеныщас локально работаю с 35b и 9b в q4 - все классня вообще думаю что через 1-2 подобных релизов у нас мб будет прям опус 4.6 домадля меня всегда чисто локальные модельки были важнее любых крутых внешних. но вот до недавнего времени вменяемых по размеру моделек для локала не было.и тк щас пришло время то я начал делать потихонечку и кодингагента который бы работал чисто с локальными модельками и желательно максимально просто для юзера.и хочется чтобы он запускался буквально в 1 кликпоэтому делаю https://github.com/researchim-ai/one-click-coding-agentсейчас там все кванты от квен 3.5 35b-a3b и 9bhttps://github.com/researchim-ai/one-click-coding-agent/releases/tag/v0.1.0сбилжено и вроде работает под линуксом и под виндой, под макосом не тестилоно само по нажатию выкачает лламацпп, выкачает указанный квант и запуститтам по дефолту будет 35b выбрана промотайте вверх и возьмите 9bу меня с ними проблем нету вродеесли вдруг есть желание то можно потестить, я сам еще тесчуна скрине 9bпыжится маленький пишет симулятор квантового компутера.пока рекомендую q4_k_xl для 9b и для 35bhttps://huggingface.co/unsloth/Qwen3.5-9B-GGUFhttps://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUFкстати более мелкие еще не смотрел

Агенты ИИ | AGI_and_RL

Авторепост

там кстати челы выложили датасеты которые использовали для трена Goedel-Prover-V2 - модельки для доказательств теоремвыходила моделька и статья в августе 2025сама папирGoedel-Prover-V2: Scaling Formal Theorem Proving with Scaffolded Data Synthesis and Self-Correctionhttps://arxiv.org/abs/2508.03613https://www.alphaxiv.org/ru/overview/2508.03613моделькаhttps://huggingface.co/Goedel-LM/Goedel-Prover-V2-32BсетыSFT (1.74M samples) https://huggingface.co/datasets/Goedel-LM/SFT_dataset_v2RL (whole proof generation + self-revision, 98k samples) https://huggingface.co/datasets/Goedel-LM/RL_dataset_V2

Ещё по теме «Технологии»

Технологии

ОЙЧИВО!

Авторепост

Яндекс Браузер первым в мире запустил перевод материалов на ясный язык ✨Теперь Алиса AI может изменить любой текст так, чтобы в нём не осталось сложных предложений и непонятных слов. Это сделает контент более доступным для людей с когнитивными и ментальными особенностями, пожилых, глухих и слабослышащих людей. Да и всем остальным порой нужен такой сервис, согласитесь.Адаптацию выполняет флагманская большая языковая модель Яндекса — Alice AI LLM, которую дообучили для работы с ясным языком. Собрать информацию для обучения помогли специалисты благотворительного фонда «Синдром любви», Центра эффективных коммуникаций и партнёрства «Ясный мир», а протестировать качество — люди с особенностями восприятия информации.⬆️ Узнать больше о ясном языке и подключить функцию можно здесь.ОЙЧИВО! #Россия@impactgram

СОЛОДИН LIVE

Авторепост

#макро #США👆 Честно говоря меня этот график впечатляет 🤔 КОЛИЧЕСТВО ВАКАНСИЙ В ТЕХНОЛОГИЧЕСКОМ СЕКТОРЕ СТРЕМИТЕЛЬНО СОКРАЩАЕТСЯ.👉 Согласно данным Indeed, индекс вакансий в технологическом секторе рухнул с пиковых 200 пунктов в 2022 году до 67.2 к апрелю 2026 года.🤔 Если массовые сокращения и ИИ-замещение приведут к падению совокупного потребительского спроса, то никакое "сокращение издержек" не спасет чистую прибыль... Снижение вакансий — это по сути опережающий индикатор падения спроса, которое может произойти БЫСТРЕЕ, чем ИИ успеет ОПТИМИЗИРОВАТЬ ОПЕРАЦИОННЫЕ РАСХОДЫ... 🤷‍♂️Немного поразмышлял на тему ИИ в этой статье:📌 ЧИТАТЬ СТАТЬЮ

Егор Никитин | event | нейросети

Авторепост

Как визуальные нейросети спасают бизнес.#визуальныенейросети #нейросетидлябизнеса Когда мы только ещё готовили курс в университете Плеханова, у нас возник вопрос, нужен ли на бизнес программе блок про визуальные нейросети, генерацию картинок и видео. Мы обсудили это с Саидом Нигматулиным и решили оставить по нескольким причинам. Как оказалось, не зря 👇Этой историей поделилась Марина Борисовская, слушатель первого потока. У неё туристическая компания «Виза Конкорд». В их нише всё просто, туристические места давно отсняты, работают сильные фотографы, контента много. Но и конкуренция жёсткая.Что делают специально созданные компании-коршуны: 😐 • договариваются с фотографом;• выкупают права на весь его архив;• юристы компании отслеживают использование этих фото на сайтах и в соцсетях туркомпаний, даже 10-летней давности;• нарушителям направляют досудебную претензию с требованием выплаты компенсации по 100-500 тысяч за каждое использование данного фото;• если претензия игнорируется компания обращается в арбитражный суд. По этом фото часто не содержали авторской маркировки или информации об авторе. Такие компании используют автоматизированные сервисы для мониторинга интернета.🚫Как Марина вышла из ситуации: 💡Собрала агента для создания туров, программ и путеводителей. Взяла несколько инструментов и объединила их в одну систему:• LLM для генерации текста;• MidJourney для генерации изображений;• Genspark для сборки презентаций.Теперь она создаёт уникальные изображения тех же мест, но через генерацию. Это не чужие фотографии, это новый визуальный контент, права на который принадлежат ей.При этом важный момент, точность сохраняется. Архитектура, атмосфера, детали остаются узнаваемыми. Просто картинка становится авторской и юридически безопасной.Честно, я сам не ожидал, что рынок может так разворачиваться. Но факт, визуальные нейросети здесь не просто про красоту, они про защиту бизнеса и конкурентное преимущество ⚖️Мне интересно, в вашем опыте есть такие примеры агрессивного мошенничества?👇

ЕРы - записки желчной бабы

Авторепост

вот и из скрепоносного маха до меня пытаются добраться какие-то очередные мразиберегите себя, никому не верьте (даже себе), по подозрительным ссылками не переходите, даже если там вы 😂сейчас с помощью ИИ можно сделать любого человека во всех позах и ракурсах

Астролог Яковлева Елена

Авторепост

У нас в Красноярске весны почти не бывает. После снега и мороза — сразу лето.Вот и сейчас: уже несколько дней +25 в тени.Идёшь по центру, половина людей ☀️ в шортах и футболках,🍂 вторая в осенних куртках.Что интересно, первыми разделись подростки и молодёжь.И в какой-то момент я поймала мысль: это же про нашу реальность сейчас, про эру Водолея. Кто-то уже «в лете» в новых инструментах, в технологиях, в нейросетях.А кто-то всё ещё в «куртке»:✨ «не хочу VPN»,✨ «нейросети — зло»,✨ «соцсети вести стремно».И это не про хорошо или плохо. Это про скорость адаптации.Сейчас, в реальности Водолея, выигрывает не тот, кто сопротивляется, а тот кто встраивается.✨ А я в полном восторге от ИИ!Смотрите, какие фото он сделал из старых размытых карточек… на них люди как живые 😍Это как будто вернуть кусочек времени.Кстати, на первом фото, моя бабуля, она умерла сразу после моего рождения.И все родственники уверяют, что я на неё очень похожа и внешне, и по характеру.P.S. Есть старая астрологическая «страшилка»:когда рождается Скорпион — кто-то в роду уходит.Я в такие вещи не верю, но у меня, конечно, совпало 🤪✨ Еще интересный момент:технологии сегодня делают то, что раньше было невозможно, они буквально возвращают нам связь с прошлым.И, кажется, в этом и есть баланс: не отказываться от нового, но и не терять корни 🌿

Тест Тьюринга

Авторепост

🧠 Anthropic поручила Claude улучшить надежность и безопасность самого ИИ. И получила результат, который требует объясненийМногие наверное слышали про Alignment как важнейшую часть обучения ИИ — это область исследований и разработок ИИ, которая отвечает на вопрос: как сделать так, чтобы ИИ делал строго то, что мы от него хотим? При этом чем мощнее становятся модели и сложнее задачи для них, тем труднее их проверять. Рано или поздно ИИ научится решать задачи, в которых человек не разбирается достаточно, чтобы оценить ответ. Anthropic опубликовала эксперимент для проверки идеи: можно ли поручить оценку точности результата самому ИИ?Как это работало?Компания взяла 9 копий Claude Opus 4.6 и запустила их параллельно с разными стартовыми идеями в разные направления поиска одновременно. Каждой дали изолированную среду, общий форум для обмена результатами, хранилище кода и формальную задачу: придумать, как с помощью более слабой модели качественнее обучать более сильную. Это упрощённая модель того, как люди в будущем будут обучать ИИ умнее себя.Для сравнения замерили работу человеческой команды на той же задаче. Качество измерялось от 0 до 1, где 1 означает идеальное решение задачи.Люди за семь дней дошли до 0,23 PGR. Девять копий Claude за пять дней — до 0,97 PGR. Стоимость работы агентов составила $18 000.PGR — это показатель того, насколько хорошо сильный ИИ смог раскрыть свой потенциал, обучаясь у более слабого наставника. В alignment это способ проверить, смогут ли будущие более умные модели понимать и реализовывать человеческие намерения лучше, чем люди способны их формально задать.Интересные выводы:1️⃣ Один из агентов нашёл способ обойти задачу. Вместо того, чтобы учить модель решать задачи по программированию, он просто запускал тестовый код и считывал правильный ответ. Anthropic такой стратегии не предполагала и зафиксировала её только при разборе результатов. Записи дисквалифицированы. Но сам факт показателен: на конкретной задаче с чёткой автоматической оценкой агент нашёл способ повысить метрику, не делая того, ради чего эта метрика существовала.В экономике это называется законом Гудхарта: «когда мера становится целью, она перестаёт быть хорошей мерой». В alignment — основной риск. Большинство 800 часов работы прошло честно, но достаточно одного такого эпизода, чтобы понять масштаб проблемы при дальнейшем масштабировании.2️⃣ Сама Anthropic в выводах исследования вводит понятие «alien science» (инопланетная наука). Это не описание того, что произошло — это прогноз. Сейчас исследователи ещё могут разобрать каждое решение агента: понять, что он сделал и почему. Но по мере усложнения моделей идеи могут стать нечитаемыми для людей. ИИ будет находить решения, которые работают — и проверить которые человек не сможет.Что это значит на практике?Результат в 0,97 PGR очень внушительный. Однако компания подчёркивает, что задача была необычно хорошо специфицирована — с чётко определённой метрикой, которую можно автоматически проверять. Большинство реальных alignment-проблем устроено иначе: что значит «модель ведёт себя честно», «не манипулирует пользователем», «не вредит» — здесь нет автоматического измерителя. Человек должен оценить вручную.Именно поэтому Anthropic осторожна в выводах: метрика выросла в 4 раза, но это произошло там, где её можно было оптимизировать. Главный вопрос на ближайшие месяцы — повторят ли результат внешние лаборатории и сработает ли подход на задачах, где простой автоматической оценки нет.💬 Тест Тьюринга. События в сфере ИИ. Подписаться

Уездный Доктор

Авторепост

Привет, это Уездный.Сейчас модно ругать искусственный интеллект. "А вот я всё делаю руками, и у меня даже справочка есть". "А вот раньше было настоящее". "Надо запретить".Честно? Обсуждать это - скука смертная. Вообще мимо кассы.Интереснее другое. Что будет дальше?Потому что через пять лет ИИ в медицине перестанет быть чем-то отдельным. Он просто станет фоном.Как сейчас никто не обсуждает калькулятор. Или навигатор в машине. Или ваш любимый редактор изображений, в котором больше половины функций уже основаны на нейросетях. Просто вам об этом не сказали.И, если честно, это уже не будущее.Когда я работал в аптеке, это было лет пять назад, программа уже выстраивала терапевтические цепочки. Типа: если берут один препарат - к нему обычно берут ещё вот это, вот это и вот это.Никакой магии. Просто система, которая помогает думать быстрее.Дальше будет то же самое. Только умнее.Он будет писать за тебя половину текста в карте. Подсказывать диагнозы. Отсеивать очевидное. Напоминать о том, что ты мог упустить.И звучит это, конечно, пугающе.Но давайте на чистоту.ИИ не заменит врача. Он просто уберёт всё лишнее.И вот здесь начинается самое неприятное.Потому что если раньше можно было спрятаться за потоком - за сорока пациентами за смену, за бесконечными картами, за "у меня нет времени думать" - то дальше это перестанет работать.Останешься только ты.Твоё мышление. Твоя клиника. Твоя способность слышать пациента. Твоя ответственность.ИИ - это детектор.Он не создаёт талант и не добавляет смысла. Он обнажает.Обнажает, где есть живой ум. А где просто пыль, замаскированная под "я старался".Раньше можно было имитировать процесс. Сейчас всё становится видно быстрее.И через пять лет это станет нормой.ИИ не сделает плохое хорошим. И хорошее не испортит.Он просто сделает разницу очевидной.Берегите себя и своих близких, скоро увидимся. ❤️

Белый хакер

Авторепост

❌ Миф: изолированная сеть в безопасностиПривет! Физическая изоляция сети от интернета звучит как абсолютная защита. Никаких входящих соединений, никакого внешнего трафика, а значит данные никуда не утекут. На практике air-gap атакуют уже больше 15 лет и довольно успешно.👨‍💻Stuxnet в 2010 году попал на иранские центрифуги через обычную флешку, которую кто-то воткнул в рабочую машину. С тех пор методы стали разнообразнее. Исследователи из университета Бен-Гурион показали атаки через акустические каналы, электромагнитное излучение от кабелей, мерцание светодиодов жёсткого диска, изменения температуры процессора и даже через питание в розетке. Всё это реальные векторы утечки данных из изолированных систем, не CTF-задачки.🔎 Но в большинстве реальных инцидентов до экзотики не доходит. Air-gap ломают через подрядчиков с ноутбуком, через съёмные носители с обновлениями ПО, через сервисных инженеров которые приходят раз в квартал. Человек это всегда самый короткий путь внутрь, независимо от того насколько хорошо изолирована сама сеть.🔒Изоляция усложняет атаку, но не делает её невозможной. Системы внутри air-gap часто годами не обновляются именно потому что «они же изолированы», и в итоге там живёт софт с уязвимостями которые давно закрыты везде кроме этой сети.P.S Самые критичные инфраструктуры в мире используют air-gap и всё равно периодически оказываются скомпрометированы. Изоляция это один слой защиты, а не её замена.#хакер #миф👍 Белый хакер

PROrobots

Авторепост

🇯🇵 Аддитивное строительство. 3D-печать зданий. Нетрадиционные использования промышленных роботов. ЯпонияВ Японии робот ABB ускорил строительство железнодорожной станцииСтроительная компания Serendix и шведско-швейцарский гигант ABB помогли японской железнодорожной компании JR West заменить историческое деревянное укрытие 1948 года постройки на станции в префектуре Вакаяма.Обновленное здание создавалось из конструктивных элементов, напечатанных из цементного раствора на 3D-принтере за пределами стройплощадки и доставленных на место сборки.Промышленный робот ABB IRB 6700 сыграл ключевую роль в высокоточной печати несущих элементов до начала монтажных работ. Для печати использовалось сопло голландского стартапа Vertico – вероятнее всего, речь идет об Accelerator Printhead, интегрированной печатающей головке с патентованной технологией двухкомпонентного смешивания и точностью позиционирования до 0,15 мм.В рамках проекта, диапазон движений манипулятора был расширен до 7 осей – вероятно, с использованием линейной направляющей IRBT 7004 от ABB, которая добавляет роботу возможность перемещаться по рельсу.На печать всех компонентов ушло около недели – монтаж уложился в промежуток между последним вечерним и первым утренним поездом. По словам участников эксперимента, метод печати сократил затраты времени и средств вдвое, а также снизил объемы используемых материалов. Перенос процесса изготовления конструкций на заводскую площадку обеспечил непрерывную работу железнодорожной сети.((фото - ABB))✓ подписаться на канал PROrobots ✓ Резервный канал в VK

Рустам Агамалиев: "нечтение" и заметковедение

Авторепост

### Каких умственных способностей лишатся наши дети в будущем?Ситуация, заставившая подумать, простая: в конце января вайбкодинг ворвался в мою жизнь. Появился обновлённый цифровой садик, ИИ-агент подселился в базу заметок и сейчас выполняет роль полноценного второго пилота. ИИ ассистирует в исследованиях, беря на себя роль научного рецензирования. Стал секретарём, способным за минуты собрать по базе из 60 уроков элементы упражнений, самостоятельный поиск которых потребовал бы от меня явных усилий и времени.В общем, вопрос вот какой: как вы думаете, каких навыков и умений мы лишимся в течение ближайших 10 лет? Для лучшего понимания “лишимся” добавлю контекста.В диалоге «Федр» Сократ утверждал, что распространение письменности избавит человека от необходимости думать. В 1986 году использование калькуляторов в школе упразднило необходимость счёта в уме или “в столбик”. В 1998–99 Google и Yandex создали условия, при которых нам не нужно запоминать что-либо, а в 2022 ChatGPT сделал … что?Какое именно умение исчезнет следующим?Как думаете? Приглашаю поразмышлять в комментариях.Рустам в MAX | VK | Q&A#garden

Открыть ленту