SILLYFEED

Записки MLEшника

@yet_another_mle · 775 подписчиков

Открыть канал в Telegram

Посты канала Записки MLEшника в SillyFeed: единая лента публичных Telegram-каналов со ссылками на оригиналы.

Yet another machine learning engineerАвтор@egshes, Yandex (ex. T-Bank, Celsus)

Посты канала

Записки MLEшника
Спустя долгое время отсутствия приношу пост 👀Наверняка вы когда-нибудь сталкивались с тем, что питонячий код/скрипт зависал во время выполнения. В такие моменты очень хочется знать, собственно, в каком месте это происходит...Так вот это довольно легко сделать (по крайней мере на Linux) с помощью дебагера gdbДелается так:0. Сохраняем локально файл libpython.py. Это нужно, чтобы в gdb стек и код вокруг отображался "по-питонячему" (иначе это будет малопонятный C++). - Для этого открываем CPython на гитхабе - Переключаемся с main ветки на tag с версией питона, которым запущен зависший код - Скачиваем файл libpython.py (например `wget https://raw.githubusercontent.com/python/cpython/refs/tags/v3.13.5/Tools/gdb/libpython.py`)1. Подключаемся к зависшему питонячему процессуsudo gdb -p 686532. Подключаем файлsource libpython.py3. Выбираем нужный поток, если их несколькоinfo threads - показать всеthread 1 - выбрать первый4. Смотрим стекpy-bt5. Смотрим код вокругpy-list6. Смотрим переменныеpy-locals7. Двигаемся по стеку выше/нижеpy-uppy-downВсе команды можно посмотреть как раз в файле libpython.py, который мы скачивали на шаге 0Один-два раз это упражнение делаешь - код болеть не будет! 💪
Записки MLEшника
Извините! Я почему вредный был? Потому что у меня cloudpathlib не было! А теперь я сразу добреть начну. И какую-нибудь папку на s3 заведу. Чтоб жить веселее. Ты домой приходишь, и удобно файлы на s3 кладешь… Э-эх!Вечно спотыкался об интерфейс boto3. Как-то там не по-питоновски всё. А я pathlib.Path люблю. Вот и попробовал cloudpathlib, который дает интерфейс Path для s3 (а также gs и azure). Понравилось. Теперь и Вам советуюЕще он хорошо комбинируется с тредингом, если надо много файликов загрузить или скачать. Сильно бодрее в моем случае грузил#tool
Записки MLEшника
Ни для кого не секрет, что лекции Карпатого - это концентрат знанийСегодня на обзоре Deep Dive into LLMs like ChatGPT (обзор на лекцию, реально?!)О чем?Из каких строительных блоков состоит LLM, и как ее учат, чтобы получит чат-асистентаЧто показалось мне интересным:1. Андрей разбирает, почему есть "глупые ошибки" - "Сколько r в strawberry?" - потому что токенизация по токенам, а не по буквам - "Что больше 9.11 или 9.9?" - что модель путают библейские тексты, в которых 9.11 идет позже 9.9 - "Кто тебя создал?" - в модели этого нет (если не заложить), потому что она умеет только продолжать тексты2. Откуда берутся галлюцинации, и как можно с ними бороться - Почему галлюцинации - потому что модели раньше не учили говорить "я не знаю". Тут на SFT этапе нужно найти вопросы, на которые модель не знает ответов, и сделать для них ответ - "я не знаю" - Можно научить модель гуглить в случаях, когда она не знает ответ3. Объяснил идею DeepSeek R14. Поделился, как следит за прогрессом в LLM - lmarena - ainews рассылка - X(twitter)Определенно будет вам полезно, если не супер погружены в LLM движуху

Ещё по теме «Технологии»

Технологии
Ничтожный креативный директор: телеграм-каналья
На самом деле не смешно. Приходится выдирать каждый раз эту крысу из розетки, когда что-то чувствительное по работе обсуждаю. Иногда забываю это сделать, потом параною. Никаких гарантий, что завтра все эти записи не будут выставлены на торги в даркнете.
Асланов PR
Как с помощью нейросети провести самоанализ для понимания на чем строить личный брендСамый важных момент на старте построения личного бренда – это не выбор площадки и не контент-план. Это честный ответ на вопрос: «В чём моя реальная ценность?»И нейросети (а я напоминаю, что это тема недели в моем канале) могут очен хорошо помочь в этом вопросе. Делюсь практической схемой и конкретными промптами.1. Беспристрастная оценка опыта Мы часто либо недооцениваем себя, либо превращаем описание опыта в склад фактов обо всём и ни о чём.Что делает нейросеть:Помогает структурировать факты без эмоций.Промпт:Я загружу описание своего опыта, проектов и ролей.Твоя задача:1. Выделить повторяющиеся типы задач2. Определить, в чём я был(а) наиболее полезен(на)3. Отметить, где моя роль выходила за рамки формальных обязанностейНе делай выводы о личном бренде — только анализ фактов.Результат:Вы видите чёткую картину, что вы реально делали и где ваш опыт может стать основой для построения персонального бренда.2. Поиск сквозной экспертизы, а не должностейЛичный бренд часто строят вокруг списка должностей. И должности эти меняются.Что делает нейросеть: находит сквозные компетенции и показывает, на чем сделать акцент.Промпт:На основе моего опыта определи:1. Навыки, которые проявлялись в разных проектах2. Тип проблем, которые я умею решать системно3. Какие результаты повторяются чаще всегоСформулируй это без привязки к должностям и компаниям.Результат:Основу вашего личного бренда надо строить не на должностях, а на том, какие проблемы вы решаете.3. Проверка уникальности относительно рынкаПроблема:Часто человек говорит о себе то же самое, что десятки других специалистов в его теме, не понимая, как подсветить свою уникальность.Что делает нейросеть:Беспристрастно сравнивает вас с рынком по смыслам и выдает вердикт.Промпт:Сравни мои ключевые компетенции и подходыс типичными представителями рынка в моей сфере.Определи:1. Где я совпадаю с большинством2. Где мои взгляды, подход или опыт отличаются3. Что из этого может стать точкой дифференциацииРезультат:Понимание, какой аспект развивать и что подсвечивать.5. Формулировка ядра личного брендаОпираясь на предыдущие анализы, просим нейросеть сформулировать несколько вариантов основы нашего ЛБ .Промпт:На основе предыдущего анализа:1. Сформулируй 2–3 возможных ядра личного бренда2. Для каждого определи: – ключевую тему – целевую аудиторию – в чём моя практическая ценность3. Укажи риски каждого вариантаРезультат: получаем варианты для выбора стратегии.#аслановнейро
АСПИРИН
ШЕДЕВРУМ И НЕЙРОРУСЬ:Как писателю помогают нейросети? Более 5 лет я сотрудничаю с самым крупным российским издательством Эксмо, работаю над историческим циклом «Женская сага» (тираж более 120 000), веду горницу в Telegram и ВК. Сегодня хочу поделиться, как визуальные нейросети становятся настоящим окном в прошлое — и рассказать о тонкостях их использования.За и противОбсуждение перспектив использования нейросетей в творчестве началось более 4 лет назад. На профессиональных встречах и вебинарах, в том числе от Эксмо, авторам настоятельно рекомендовали дружить с ИИ. Но значительная часть сообщества была настроена скептически: — бесполезно, не создать яркие образы— плагиат, воровство идей у художников— достаточно фотографий и графики в открытом доступе.Русский код Для визуализации мира «Женской саги» я использую Шедеврум (Шед) — отечественную нейросеть, сочетающую социальную сеть с активным общением пользователей и инструменты ИИ. Большая часть промтов открыты, что дает возможность обучаться и развиваться. Я начала пользоваться Шедом более двух лет назад, позвала туда многих коллег, близких, друзей. И тогда же начался квест: как объяснить нашей, русской нейросети, как выглядят избы, девицы, с косами, в венцах да сарафанах и молодцы в портах. Это было и забавно, и невыносимо. Казалось бы, наша, взращенная в России нейросеть должна быть откормлена на отечественных визуальных образах. Ан нет! Всё далось ой как непросто. Возможности ШедеврумаМногочасовые эксперименты с промтами, комбинация множества запросов помогли создавать качественные арты, которые, кстати, часто запускали волну копий в Шедевруме. В подборке работы моего нейродизайнера, More Im. Потихоньку нейросеть обучалась, стали выходить выразительные, достоверные арты. Возможность воплотить любой отрывок в иллюстрацию, показать героя, его эмоции и порыв, создать шикарный визуальный ряд многого стоит. Это настоящее чудо.Я делилась артами с подписчиками, выпускала открытки, главное, показывала, что наше, русское, исконное — эстетика, смыслы, история. Надо знать его, любить – и это было очень актуально на волне весны 2022, русской весны. НейрорусьВ январе 2024 года я вместе с коллегами и специалистами в области нейросетей запустила конкурс «Нейрорусь». Перед участниками была поставлена задача создать серию артов, которые бы воссоздавали облик Руси, где считывался бы наш культурный код – давалась свобода интерпретации. Конкурс получил размах, было прислано более 100 работ. Я и мои соратницы запустили флэшмоб в нейросетях, особенно в Шедевруме. Некоторые участники, кажется, впервые задумались о красоте нашего, российского прошлого. Появилось бесконечное количество артов по запросу «Нейрорусь», копии работ моих и моих сподвижниц. Творческие кейсы моих коллегЕвгения Преображенская, писатель (Эксмо, Феникс), автор цикла в жанре фэнтези, художница. Она владеет словом и кистью, но часто создает арты в нейросети Миджорни. Например, отрисовала там метафорические ассоциативные карты по своему циклу.Ника Рошед, тоже художница, творческая натура. Сначала создавала арты, потом графический роман, сейчас пришла к созданию масштабного цикла. Как работать с промтами — учитывать стиль и жанровые особенности (графика, масло, реалистичное фото, гравюра, стили разных художников)— уточнять период, локацию (Русь, XVI-XVI век, Урал. Порой работают самые странные термины – например, Гардарика выдавала шикарные результаты)— описывать внешность и иные характеристики героев арта конкретно – цвет волос и глаз, возраст, одежда (в старинном русском одеянии, льняной славянской рубахе с вышивкой)— прописывать эмоции и движенияВ промтинге множество тонкостей. Нейросети, тот же Шед, постоянно обновляются, тестируются новые модели, и каждая может дать новый интересный визуальный ряд.В подборке: 1-8 арты More Im; 9 - метафорические карты Евгении Преображенской; 10 — арт Ники Рошед. Продолжение поста ⤵
Березина TEPLO
Я тут в очередной раз учусь, теперь по нейросетям и пока вечерами делаю домашку, генерируя странные картинки, мне пришла мысль Домашка: напиши промт [задание]деревня зимой и сгенерируй картинку по плану Генерируешь, выходит открытка, мило, шаблонно, плоско и скучноА потом начинаешь копать вглубь…Не деревня, а заброшенная лесная деревня Уральского хребта, первые сумерки, синий снег поглощает следы, в одном окне бревенчатого дома дрожащий свет керосиновой лампы, чувство тишины, которая звенит в ушах…И нейросеть выдает не открытку, а уже настроение, историюИ тогда, чтобы делать более-менее качественную картинку, надо формулировать промтА значит не только обладать насмотренностью, но и понимать, и словами доносить мысли Чем ярче, глубже, небанальнее это сделать, тем картинка будет интереснее и уникальнее И тут я подумала: мы все сейчас учимся общаться не с людьми, а с искусственным интеллектомИ он еще тот собеседник, он возвращает нам наш же кривой, бедный, клишированный язык и говорит: это всё, что у тебя есть А что если один из навыков будущего не написание кода, а написание мысли?И тогда в школах необходимо развивать не только речь, но и мысльНапример, уроками литературы, не для галочки прошел “Преступление и наказание”, а как тренировку души и ясные формулировкиУрок как промт-лаборатория: Достоевский, как описать внутреннюю бурю, ад в душеЧехов, как показать трагедию в одной детали, в молчанииТолстой, как ухватить момент и описать его перенося в визуал Это же и есть тот самый промтинг, умение видеть нюансы, чувствовать оттенки, искать точные слова, строить миры в голове, чтобы потом воплотить их куда угодно: в текст, в картинку, в идею [ мотивация для учащихся]Получается, ИИ не отменяет гуманитарное знание, он делает его самым востребованным скиллом👌Потому что будущее скорее всего не за теми, кто умеет нажимать кнопку и генерить, а за теми, кто умеет договариваться с хаосом своего воображения и выдавать ему техзадание на шедеврЛитература, философия, искусство, это не про прошлое, друзья, это инструменты для сборки будущего, своими мыслями, словами, своим воображениемА то всё технари, технари - белая кость 😁
Стратегия, культура, продукт | Лена Тупикова
История игрушечного робота за $31.95 (На базе MIT Technology Review, 06 2025) В начале 80-х один мальчик ходил с папой в Radio Shack. Папа - инженер, выбирал резисторы и конденсаторы. Сын зависал в отделе игрушек и однажды залип на странной штуке – игрушечном роботизированном манипуляторе Armatron. У этой штуки был постамент, «плечо», «локоть», «кисть» и клешня.Её можно было крутить вокруг своей оси, поднимать, сгибать «локоть», вращать «запястье» и открывать-закрывать захват двумя джойстиками. Всё это – с жужжанием шестерён и фирменным «CLICK… CLICK… CLICK», если пытался продавить предел хода.Через много лет этот мальчик станет инженером в Boston Dynamics и будет работать над Petman, Atlas и Spot – теми самыми роботами из YouTube. Что же такого было в этой игрушке? Для компании Tomy это был просто крутой робот-игрушка за $31.95. Игрушка, которую хвалили журналы по робототехнике: «возможности, обычно доступные только дорогим экспериментальным манипуляторам».Но произошло странное:– Armatron начали покупать не только дети,– а инженеры и исследователи из лабораторий, производств и робототехнических компаний. Они писали создателю, обсуждали механику, делились, как используют эту штуку.То есть у вас вроде как B2C-игрушка, а по факту – доступный демо-стенд для будущих и нынешних инженеров. :)Самое смешное: у Armatron внутри почти ничего не было.– отсек для двух батареек D,– маленький мотор на 3V,– куча шестерён.Никакой электроники. Всё – чистая механика.Инженер Хироюки Ватанабэ, который придумал arm, вообще не учился как «классический инженер». Техническое училище, потом Komatsu, потому что он любил бульдозеры. Потом он увидел вакансию в Tomy, сел в ночной поезд и поехал в Токио просто потому, что это «игрушки и №1 компания».Первая версия робота у команды была так себе, говорят:– рука торчала сбоку, ход только на 90 градусов,– шесть движений через шесть отдельных переключателей.Ватанабэ посмотрел на это и сказал: «Мне не нравится». Он летал на радиоуправляемых вертолётах и однажды просто посмотрел на пульт:две стика – четыре движения.А если ещё и поворот добавить – получится шесть.Так родился интерфейс Armatron: двойные джойстики, каждый можно не только двигать, но и поворачивать. Плюс сложная коробка передач, которая перенаправляет силу одного мотора на разные оси.Посмотрите на ход Ватанабэ: его не устраивало не то, как устроены шестерёнки, его не устраивался опыт управления.Потом он придумал переключаемую коробку передач, 360-градусный поворот, форму корпуса, резиновые трубки, имитирующие промышленных роботов того времени (спойлер: трубки были чисто декоративные).Он на примере показал, что сильная продуктовая стратегия – это когда вы сначала решаете, чем должна быть мечта пользователя, а уже затем – как под эту мечту выглядит инженерная архитектура, интерфейс, себестоимость.
Иван Гринкевич - О dИИgital вслух
Нейросети становятся фабрикой фальшивокВы слышали про ИИ Nano Banana Pro? Пользователи выяснили, что эта модель способна генерировать поддельные документы: квитанции, формы KYC и даже изображения паспортов. Всего по одному запросу - и на выходе гиперреалистичный почерк или макеты документов, которые сложно отличить от настоящих.Возможность создавать официальные документы значительно увеличивает риски мошенничества и манипуляции с личными данными. И самое страшное - с развитием ИИ выявлять такие подделки будет все сложнее.Я уже писал про дипфейки и то, как они меняют наше доверие к видео и аудио. Но документы это следующий уровень. Если раньше для подделки нужны были навыки дизайнера и доступ к специальному оборудованию, то теперь достаточно запроса к нейросети.Представьте: мошенник может сгенерировать квитанцию об оплате, паспортные данные или даже медицинскую справку. Банки, государственные службы, работодатели - все они полагаются на документы как на доказательство. А что если эти доказательства можно создавать за пару минут?В бизнесе это вообще ад наступает. KYC-процедуры, проверка контрагентов, верификация сотрудников - все это строится на документах. Если их подлинность нельзя гарантировать, вся система рушится.И самое тревожное - нейросети учатся. Сегодня они генерируют документы с мелкими ошибками, которые можно заметить. Завтра эти ошибки исчезнут. Послезавтра они научатся имитировать конкретные бланки конкретных организаций.Что делать? Ждать, пока регуляторы придумают новые стандарты безопасности? Надеяться на блокчейн-идентификацию или цифровые подписи нового поколения? Или просто смириться с тем, что доверие к бумажным документам уходит в прошлое?Мне кажется, мы стоим на пороге фундаментального изменения. Скоро понятие "документ" придется переосмысливать. Возможно, будущее за биометрией, цифровыми следами и системами, которые проверяют не бумажку, а цепочку действий человека.А пока что каждый, кто работает с документами, должен понимать: то, что вы видите на бумаге или экране, уже не гарантия подлинности. Проверять нужно тщательнее, глубже и с помощью технологий, которые еще не научились обманывать.Как думаете, к чему приведет эта способность ИИ? И как бизнесу защищаться от фальшивок, которые не отличить от оригинала?
Терапия с Мариной Ра 🌺
Похоже ИИ "наступает" и "неотступает"Слушаю эту музыку которую неделю. Нравится!!! Очень! Но! Своё вокальное творчество затихо, ибо то, что хотелось спеть, спело ИИ....И песни поэтов у меня сейчас не поются. Я пою с ИИ. Живые, настоящие слова, полные смысла и мудрости. Сила! Но! Во мне присутствует легкая тревога. Откуда она и чего конкретно касается? Меня самой? Нет. Ведь я не певица знаменитая, которая живет вокалом. Однако.Треки живых музыкантов и исполнителей явно слушают меньше чем эту музыку созданную ИИ. Ведь живая музыка и вокал создается без учета высоких технологий, которые учитывают параметры самой прослушиваемой музыки.#музыка #тревожность
Юридические грабли
Завтра буду выступать в Культурном центре НИУ ВШЭКогда готовилась, читала эту подборку судебных решений, где затрагивались вопросы использования ИИСамое интересное дело на мой взгляд – это дело о защите деловой репутации, в котором суд указал, что статья, полностью созданная ИИ, должна иметь достоверные источники и не умалять чью-либо репутацию❗️На заметку тем, кто генерит тексты ❗️В общем, рекомендую подборку. Интересная
Грязный ноукодер
Обновление ноды OpenAI в n8nНедавно в n8n наконец-то обновили ноду OpenAI и добавили туда множество функций, ранее недоступных, но существовавших в API.1️⃣ Переход от Assistant API к Response API. Если раньше вы могли указывать thread_id и ассистент общался в рамках одного треда, то теперь каждый ответ имеет свой response_id, который нужно записывать и использовать при следующем вызове ассистента, чтобы он “помнил” ветку диалога. Это значит, что каждый раз нужно дополнительно сохранять response_id и вызывать его из БД для указания в агенте.2️⃣ Добавление Structured Output.Ранее для использования SO приходилось брать HTTP ноду, теперь же функционал встроили в агента. Советую ознакомиться с правилами SO для OpenAI - там много интересных фишек, к примеру опциональные значения и enum листы.3️⃣ Добавление нативных туловТеперь можно выбрать, какими нативными тулами будет располагать агент - поиск по вебу, код-интерпретер, поиск по файлам. К примеру, я использую в проекте встроенный поиск по вебу, чтобы найти информацию о ЛПР компании.___Если вы хочешь узнать больше про работу с ИИ в n8n - пройди наш курс в сообществе
GVEsher
⭐ Как настроить графику в новом клиенте, чтобы получить выше FPS и плавность?Для начала результаты моих тестов влияния настроек:• Если мерять фпс в пустой локе, то отключение всего в настройках (грубо говоря минималки) повышают фпс чуть ли не в 2 раза. • Если мерять в локе с людьми, например 150-1000 персонажей, то на моем компе разница в пределах 10%. Если более 1000 персонажей двигаются, то до 5% и меньше. • Все эти настройки графики напрягают именно видеокарту, а за высокий FPS в масс замесе отвечает проц и чем он лучше, тем выше будет FPS. Поэтому на сильном компе с хорошей видюхой - пох какие настройки, нужно просто отталкиваться от визуала. Как нравится, так и следует настраивать. Если же очень важны эти 10%, то следует побольше всего отключать в разделе графики и в совокупности будет этот прирост. Пытался выяснить что же там сильнее всего садит FPS и не преуспел в этом. Все понемногу отнимает. На одном уровне нагрузки одно, на другой уровне другое. Что касается среднего компа с видюхой 1050 ti, то тут та же история, просто видюха сильнее нагружена и FPS ниже. Для слабых компов уже речь может идти не о 10%, а о кратной разнице, поэтому обладателям слабых компов обязательно следует настраивать что-то близкое к минималкам.💯Теперь поговорим о том, что реально ощутимо бустит FPS в масс замесе на любом компе - оптимизация эффектов или отключение эффектов. Даже настройка "Иногда скрывать эффекты" уже заметно бустит FPS в моих тестах, а остальные варианты соответственно еще сильнее, цифры можно наблюдать во втором видео. Ну и сильнейший вариант по анимациям это команда .switch fx - дает сильнейший буст FPS в массовом замесе, так как анимации не показываются абсолютно и даже ручками никто не машет. 🔝Плавно подошли к сильнейшей опции производительности - снижение ренжа прорисовки персонажей. Тут уже каждый может настроить себе сам удобные дистанции. А вот выкручивать все в нулину - это актуально для самых мясных ситуаций, когда уже совсем много персонажей собирается в одном, относительно компактном месте. Тут уже между 10 FPS и полной видимостью всех персонажей и 30 FPS, но ограниченной видимостью - выбор очевиден. Вспомнил про еще одну фишку, которая может бустануть FPS хоть в 3 раза. Вдохните воздуха в грудь. Готовы? Это покупка или апгрейд компа 🤔PS. Чтобы комп не напрягался выше необходимого, рекомендуется включать Vsynk, тогда максимальный FPS будет равен частоте монитора, но только не включайте х3, так как он сильно садит FPS. Если же кому-то хочется еще сильнее снизить нагрузку на комп, то можно отключить Vsynk и настроить лимит FPS 60, в таком режиме комп будет работать тише.#гайд #НК