Машинное обучение RU

@machinelearning_ru · 18.2K подписчиков

Посты канала Машинное обучение RU в SillyFeed: единая лента публичных Telegram-каналов со ссылками на оригиналы.

Все о машинном обученииадмин -@workakkk@data_analysis_ml- анализ даннных@ai_machinelearning_big_data- Machine learning@itchannels_telegram-лучшие ит-каналы@pythonl- Python@pythonlbooks- python📚@datascienceiot-📚РКН:clck.ru/3FmrUw

Посты канала

Авторепост

⚡️ Wasserstein Learning Theory: когда ИИ учится сравнивать не точки, а целые распределенияВ машинном обучении всё чаще важен не один конкретный пример, а то, как устроены данные целиком.Например, модель обучали на одном распределении картинок, текстов или действий, а в реальности она получает немного другие данные. Обычная метрика может сказать: “распределения отличаются”. Wasserstein-подход показывает глубже: насколько далеко одно распределение нужно “перенести”, чтобы оно стало похоже на другое.Идея пришла из оптимального транспорта. Представьте две кучи песка: одна форма - это первое распределение, другая второе. Расстояние Вассерштейна считает минимальную работу, которую нужно сделать, чтобы переложить песок из первой формы во вторую.Почему это важно для ML:* помогает анализировать сдвиг данных* полезно для domain adaptation* даёт инструменты для устойчивого обучения* применяется в генеративных моделях* помогает изучать обобщение нейросетей* используется в reinforcement learningВ отличие от KL-дивергенции, Wasserstein distance учитывает геометрию пространства. Поэтому два распределения могут отличаться не просто “сильно” или “слабо”, а с учётом того, где именно находятся эти различия.На практике это важно там, где модель должна быть устойчивой: новые домены, шумные данные, генерация, перенос знаний, обучение агентов.Wasserstein Learning Theory даёт более точный язык для современной ML-задачи: не просто подогнать модель под датасет, а понять, как она ведёт себя при изменении распределения данных.

Машинное обучение RU

Авторепост

Rust теперь можно компилировать в JVM bytecode.rustc_codegen_jvm - экспериментальный backend для компилятора Rust, который берёт Rust MIR и превращает его в .class файлы, а затем собирает runnable .jar под JVM 8+.Что уже заявлено:- генерация исполняемого .jar- поддержка базового core- if/else, match, for, while, loop- structs, tuples, arrays, slices, enums- traits, closures, dynamic dispatch- function pointers, recursion, generics- часть unsafe, включая unions- оптимизации вроде constant folding, propagation и dead code eliminationПайплайн выглядит так:Rust frontend → MIR → OOMIR → JVM classfile → R8 → .jarhttps://github.com/IntegralPilot/rustc_codegen_jvm

Машинное обучение RU

Авторепост

VINS-120K - полезный датасет для следующего этапа image editing моделей: редактирование изображений в 4K+ без развала мелких деталей.Сейчас многие модели неплохо правят обычные картинки, но на сверхвысоком разрешении быстро всплывают проблемы: текстуры мажутся, локальные правки портят соседние области, а результат выглядит хорошо только после уменьшения. Для реального продакшена этого мало.VINS-120K закрывает именно этот разрыв. В датасете 120 тысяч троек: инструкция, исходное изображение и отредактированная версия. Все изображения выше 4K, данные собраны из реальных видео высокого разрешения и качественных открытых источников, затем отфильтрованы по визуальному качеству, соответствию инструкции и эстетике.Покрытие тоже широкое: 13 типов редактирования в 4 категориях - локальные правки, глобальные изменения, движение камеры и персонализированная генерация.Paper: https://modelscope.ai/papers/2605.23518Dataset: https://modelscope.cn/datasets/vivo/VINS-120K

Ещё по теме «Технологии»

Технологии

All I Know Is That I Don't Know Nothing

Авторепост

Кто как использует AI в 2026Посмотрел список TIME100 в образовании за 2026. Расклад получился такой.AI как репетитор/ассистент— Khan Academy → Khanmigo, AI-репетитор, 1,4 млн пользователей— Squirrel Ai Learning → система ищет дырки в понимании базы и подстраивает уроки, чтобы ученик мог идти дальше. 52 млн учеников— Efekta Education → 4 млн студентов учат английский через адаптивную платформуПомогают учителям с помощью AI— MagicSchool AI → автоматизирует учителям рутину: планы уроков, проверка работ, админка. 13000+ школ в 173 странах— Turnitin → раньше ловили списывание, теперь сделали платформу Clarity, где ученики пишут с разрешенными AI-инструментами, а учитель видит историю версий— Quizlet → старая флешкарточная платформа, запустили AI-генератор учебных материалов, купили AI-конспектировщик CoconoteУчат пользоваться AI— Coursera → каждые 4 секунды кто-то записывается на курс по generative AI, запустили практику собеседований с AI-коучами— Code org → запустили учебную программу по generative AI для 8–12 классов— Goodwill Industries → сеть благотворительных секонд-хендов, финансируют программы переподготовки, партнерство с Google обучит 200 000 человек AI-навыкамОстались только College Board, которые делают SAT и AP-экзамены, тут скорее цифровая трансформация, чем AI-история. Тоже честно — не все в образовании про AI.Но AI в образовании уже не про «использовать или нет», а как именно использовать: репетитор для ученика, ассистент для учителя или сам предмет изучения.Отдельно про Squirrel Ai — самая радикальная история в списке, про них я раньше не слышал.Если учебник по математике покрывает около 3000 учебных целей, то Squirrel разбивает предмет на 10000+ нанообъектов. Это другой порядок гранулярности, другая операционная единица обучения — система ищет не «ребенок не понимает дроби», а конкретный микрозазор в логике, из-за которого дроби не складываются. Когда ребенок не понимает теорему Пифагора, система находит, что он, например, не понимает квадратные корни, и работает именно с этим.В декабре 2025 они поставили рекорд Гиннеса по «крупнейшему сравнительному эксперименту AI vs традиционное обучение». 1600+ учеников 5–6 классов, пять школ, целый семестр, независимый аудит.У пятиклассников группа с AI: средний балл 87 против 78 у традиционной (+8,78). Доля отличников — 67% против 38%. Доля провалов — 3,5% против 11,1%. У шестиклассников средний балл выше на 13,84 пункта из 120. Доля провалов 18,8% против 39,6%, почти в два раза меньше.Выиграли все группы учеников: и сильные, и средние, и слабые. Причём слабые выиграли больше всех. Это аргумент про образовательное равенство — AI не «делает сильных сильнее», а вытягивает слабых.В Китае у них 24+ миллиона учеников, и в части случаев AI полностью заменяет живые уроки — заменяет, не дополняет. Ребенок приходит в офлайн-центр Squirrel, садится за планшет, проходит диагностику, и дальше с ним работает система: 2–3 минутные видео от мастер-учителей, адаптивный план, ассистенты на подхвате.Выводы такие:— С одной стороны, исследование показало значимый прирост в математике против традиционных классов— С другой стороны, мы не знаем наверняка, как AI-тьюторы влияют на способность учиться самостоятельно в долгосроке. Решает ли система проблему или создает зависимость от персонализированной подачи — пока непонятно— С третьей стороны, при остром дефиците хороших учителей вопрос скорее стоит не «AI или живой учитель», а «AI или никто». Это меняет рамку разговора целиком.Передача знаний? Тогда Squirrel это нормально, лишь бы передавалось. Процесс становления человека через отношения с другим человеком? Тогда AI-замена — потеря, даже если по тестам прирост. Но индивидуальный репетитор недоступен большинству, что как бы намекает на ответ→ The 10 Most Influential Education Companies of 2026

Поросёнок Пётр

Авторепост

Господа эксперты. Если сотрудникам компании похер на сообщения через LinkedIn. HR специалист компании вообще не заинтересован в том что у компании есть утечка кастомеров с именами, email и телефонами. Региональный CERT не смог так же уведомить их и принудить к исправлению системы. Что дальше? Gdpr репорт в региональное управления?

S.E.Book

Авторепост

⌚️Seiko UC-2000, умные часы из 1984 года.• Представьте себе умные часы, но из 1984 года. Звучит как что-то прямо из научно-фантастического фильма, ведь 80-е годы прошлого века не славятся большими достижениями в области персональных компьютеров. Но это реальность, и это именно то, что было создано компанией Seiko в те времена и было известно как UC-2000 — «персональный информационный процессор», который можно носить на запястье (на фото). Как и следовало ожидать, это было новое устройство, которое было выпущено по цене 300 долларов (это что-то около 900 долларов сегодня с учётом инфляции).• Часы выглядят как компьютер и работают почти как компьютер, хотя технически их нельзя назвать компьютером, пока вы не подключите к ним внешнюю клавиатуру, которая добавит им соответствующую функциональность.• Устройство состояло из двух частей: часов и клавиатурной док-станции. Циферблат Seiko UC-2000 представляет собой жидкокристаллический матричный дисплей с чёрным ободком, а корпус — серый металлик, сочетающийся с браслетом из нержавеющей стали. В нижней части расположены четыре кнопки, окрашенные в оранжевый цвет на внешних концах и серый в середине, которые заменяют заводную головку в качестве механизма настройки. Внешне он невероятно похож на современные смарт-часы.• Когда часы устанавливаются на док-станцию, они превращаются в совершенно гиковскую машину, которая стала бы настоящим украшением витрины коллекционера техники. Это QWERTY-клавиатура с дополнительными кнопками для переключения языка и доступа к различным функциям. С левой стороны находится квадратный вырез, в котором располагаются часы, взаимодействующие с клавиатурой посредством электромагнитов.• Клавиатура достаточно большая, чтобы поместиться в кармане, но не настолько, чтобы носить её на запястье вместе с часами. На самом деле она выглядит комично большой, если носить её в таком виде, но если бы клавиатура была меньше, на ней было бы очень трудно печатать.• Часы показывают время и дату, могут работать как секундомер, а также как будильник, как и большинство других цифровых часов того времени. Но в сочетании с клавиатурой UC-2100 они превращаются в «Информационную систему на запястье», которая может хранить заметки, вести расписание встреч и работать как калькулятор. Вы можете сохранить до 2 заметок по 1000 символов каждая, отсюда и название модели UC-2000. Представляете, какие ограничения были в то время? Целых 2 заметки!!!• А еще была док-станция UC-2200, которая поставляется с принтером (на фото) с катушечной подачей, на случай, если вам понадобится что-то напечатать в дороге. Как вам такие высокие технологии? Так то...➡️ https://www.namokimods.com/smartwatch-from-1984#Разное

max tors | ceo по жизни

Авторепост

Pinterest для AI-картинок. С готовыми промптами. БесплатноНашел meigen.ai.Листаешь как Pinterest. Под каждой картинкой – промпт и название модели. Хочешь такую же себе? Копируешь промпт, вставляешь в свою нейронку, получаешь похожую.Для каруселей, постов, мудбордов – норм находка!https://www.meigen.ai/max tors | контент-движок 🤖

ЯНА БАКИРОВА | стиль и любовь к себе

Авторепост

И вот что получилось с гардеробом Эмилии - закинула в чат вещи, которые есть и которые нравятся, попросила составить 20 образов и потом отдельно сделать коллаж и список вещей. Закидывала скрины с ценами, поэтому в конце еще попросила посчитать бюджет.На данный момент это самый быстрый и удобный способ планирования детского гардероба, который я попробовала. Раньше я все это делала руками в презентации, считала сама, планировала образы на разную погоду. Теперь это сделал чат, убрал лишнее, просчитал образы и еще нарисовал это все.До чего техника дошла!

Саша Фирсов

Авторепост

Готовые AI-решения для трейдинга и инвестирования🧑‍💻 1. Бесплатный nansen - OpenBB2. Замена bloomberg - TradingAgents3. Финансовый аналитик от Майкрософт - QLIBВ топ10 по звездам на гитхаб (кстати, их накручивают) в финансовой тематике также попали агенты ресерчеры, поисковики, агент по тех.анализу и тд.Чтобы поставить себе такого - отправляете ссылку на гитхаб репо своему codex/claudecode и просите запустить локально/на сервере.

Кейт о карьере

Авторепост

Нашла тут забавный промт для создания символической заставки на телефон в стиле карт таро. Вот что мне выдал GPT. Промт ⤵️Создай несуществующую карту таро на основе того, что ты знаешь обо мне, я х по гороскопу, мне х лет, в классическом стиле Райдера-Уэйта. Изобрази меня как нарисованную от руки фигуру смелыми, но несовершенными черными чернильными линиями с легкой дрожью и вариативностью, в плоских цветах без теней. Добавь вокруг фигуры тонкие визуальные элементы таро.Добавь текстуру бумаги и эффект печати.Внизу трактовка картыЧто означаетФормат 9:16Если у вас есть собаки или кошки - можно их включить в описание + добавить свое фото и фото животных 🐾Если вы с gpt плотно не общаетесь, то может написать кем работаете, хобби и интересы.Делитесь в комментах вашими картинками 😜

Java библиотека

Авторепост

👩‍💻 Spring совет: таймауты RestTemplate лучше настраивать централизованноЕсли в проекте много REST-запросов через RestTemplate, не разбрасывай таймауты по коду.✅ Правильнее сделать конфигурацию через RestTemplateBuilder:- один общий RestTemplate с дефолтными timeout- плюс отдельные клиенты под “медленные” сервисы (через @Qualifier)Так у тебя:- единая точка настройки- меньше багов в проде из-за “вечных” запросов- проще дебажить и менять параметры💡 Особенно полезно в микросервисах, где внешние сервисы могут подвисать.Подписывайся на наш канал в Mакс 🟪

Книжный куб

Авторепост

[1/3] System Design. Подготовка к сложному интервью по GenAI (Рубрика #SystemDesign)Изучил интересную книгу для подготовки к интервью по System Design, но уже в новой реальности, когда проектировать надо не только базы, очереди, кэши и микросервисы, но и системы вокруг LLM, diffusion models, RAG, мультимодальных моделей и AI-powered продуктов. Это русское издание книги "Generative AI System Design Interview" из экосистемы ByteByteGo. Авторы - Али Аминиан и Хао Шенг. Али Аминиан уже известен по книге про ML System Design Interview, а здесь фокус смещается с классических ML-систем вроде поиска и рекомендаций на генеративный AI: чатботы, генерацию текста, изображений, видео, RAG и персонализированные AI-сценарии.В обычном System Design Interview кандидат часто рисует распределенную систему: API, балансировщики, базы данных, очереди, кэши, фоновые джобы, мониторинг. В GenAI-интервью все это остается, но появляется еще один слой сложности:- Какие данные нужны;- Какую модель выбрать;- Нужен ли RAG или fine-tuning;- Как измерять качество генерации;- Как бороться с hallucinations;- Как учитывать latency и стоимость инференса;- Как встроить safety-фильтры;- Как собирать feedback loop;- Как мониторить деградацию системы после запуска.Именно поэтому книга полезна не только ML-инженерам. Она хорошо ложится и на backend engineers, и на архитекторов, и на технических руководителей, которым сейчас приходится проектировать AI-фичи не как демо на API, а как часть production-системы.Внутри книги заявлены три главные вещи:1️⃣ Фреймворк из 7 шагов для GenAI System DesignАвторы предлагают не начинать сразу с "берем LLM и векторную базу данных", а последовательно пройти путь от требований до деплоя и мониторинга в проде. Это сильно дисциплинирует мышление, потому что в GenAI-задачах легко перепрыгнуть к модной технологии и забыть про реальные ограничения продукта.2️⃣ 10 практических задач с подробными решениямиСреди кейсов есть следующие: Gmail Smart Compose, Google Translate, ChatGPT-like personal assistant, Image Captioning, Retrieval-Augmented Generation, Realistic Face Generation, High-Resolution Image Synthesis, Text-to-Image Generation, Personalized Headshot Generation и Text-to-Video Generation. Этот набор покрывает разные сценарии и сильно шире, чем просто прикрутить трансформер к чат-боту:)3️⃣ Много диаграмм и end-to-end разборовДля System Design это особенно важно. Хороший ответ на интервью - это не только "какую модель выбрать", но и то, как выглядит система вокруг модели: preprocessing, retrieval, prompt builder, inference service, post-processing, safety layer, logging, monitoring, feedback loop. Мне кажется, главная ценность книги в том, что она показывает: "GenAI-система - это не модель в вакууме".В общем, модель - это конечно ядро, но вокруг него есть данные, права доступа, индексы, промпты, ранжирование, guardrails, UX, стоимость, GPU-инфраструктура, A/B-тесты, метрики качества и эксплуатационные ограничения. И если все это не проектировать осознанно, то на выходе получается не production-система, а красивый прототип с непредсказуемым поведением.Книга полезна как способ обновить представление о System Design в эпоху AI, ведь раньше мы проектировали в основном детерминированный софт: запрос пришел, сервис обработал, база ответила, результат вернулся. Теперь все чаще приходится проектировать системы с вероятностным поведением: модель может ответить хорошо, средне, неверно, опасно, дорого или слишком медленно. Поэтому архитектура должна включать не только масштабирование и отказоустойчивость, но и evaluation, safety, feedback и постоянный контур улучшения.В продолжении более подробный разбор фреймворка в 7 шагов от авторов книги.#SystemDesign #AI #GenAI #Architecture #Engineering #ML #Interview #Software

Наталья Абабий

Авторепост

Все говорят про ИИ-агентов, но мало кто объясняет, что это значит для бизнеса конкретно. Попробую без терминов. А в конце еще расскажу про своих.ИИ-инструмент это когда вы пишете запрос, получаете ответ. Спросили, ответил, разошлись. ChatGPT прошлой версии, Алиса, Gemini когда вы заходите в чат и просите.ИИ-агент это когда вы ставите задачу, а он сам придумывает шаги, сам их делает и приносит вам готовый результат. Не отвечает, а выполняет. Сравните с разницей между "человек, у которого вы консультируетесь" и "сотрудник, которому вы поручаете".Чтобы было понятнее, на пальцах. Вот три задачи, которые агент делает без вас:1️⃣ - Поиск + анализ + документ. Я говорю: "найди три российских компании, которые внедрили ИИ-ассистента в продажах за последние полгода, выпиши их кейсы, оформи в одностраничник для моей команды". Через 10 минут у меня этот одностраничник в почте. 2️⃣ - Мониторинг + уведомление. Один раз настраиваю: следи за упоминаниями нашей компании в российских телеграм-каналах больше тысячи подписчиков, пиши мне в чат краткую сводку каждое утро. Дальше работает само.3️⃣ - Встреча + резюме + рассылка. Агент подключается к Zoom, слушает, делает протокол, отправляет всем участникам. Ничего не нажимаю, ничего не загружаю. Просто пришло письмо.И в этом, кажется, и есть та неуловимая разница, которую сложно объяснить, пока сам не попробовал. Когда часть задач уходит в фон и возвращается готовой, у вас высвобождается не "час в день", а другое мышление. Освобождается слой, на котором вы раньше тратили внимание на координацию, передачу, проверку.Что бы я предложила сделать с понедельника: возьмите свой типичный рабочий день и подсветите три задачи, которые ну точно не требуют вашего ума. Это и есть ваши кандидаты на агента.Из моих:1. синхрон с календарем и задачами (просто могу написать, что через месяц мне нужно на маникюр и он предложит свободный слот по моим правилам, сам поставит и напомнит)2. генерация контента (нет, ИИ за меня не пишет, НО - он шерстит топ 15 каналов в теме, новостные сводки и официальные соцсети инструментов, генерит мне 10-20 тем, из которых я уже выбираю о чем писать, готовит черновики, которые я дожимаю уже со своими идеями, кейсами) - также и по Youtube уже. 3. лиды для продаж (поиск контактов, формирование индвидуальных писем на стыке нас, человека и компании) - тут целый процесс, как нибудь поделюсь прям кейсом настройки. ... дальше можно приводить еще примеры, но даже это уже существенные задачи.А вы про ИИ-агентов уже думаете в практической плоскости или это пока ощущается как "слово из новостей"?

Открыть ленту