Data Science и аналитика — страница 10

Лента темы

Геоинформационные технологии, Геомаркетинг, пространственный анализ.

Много данных, мало толку?Есть мнение (к сожалению, подтверждающиеся исследованиями), что современный мир начал технологически (и взаимосвязано социально) деградировать и это несмотря на появление ИИ, огромного количества данных, смартфонов и т.п. И объяснение этому парадоксу находят в том, что виной всему бюрократия, как на государственном уровне (огосударствление экономик по миру это тренд), так и на корпоративном (по уровню бюрократии большие компании ещё фору дадут многим государствам). Медленное принятие решений о внедрении чего бы то ни было приводит к торможению всего и вся, а в целом, к потере смысла. Вот и пара примеров из нашей же отрасли. 1) Если вы посетили вебинар замечательной компании Самара-Информспутник, о том, как регионы могут больше получать налогов за счет использования современных методов работы с геоданными, то, наверное, задались вопросом: «а где же деньги то?». И действительно, из обнаруженных миллиардов недополученных земналогов, удалось собрать совсем немного. Почему так? Потому что мало собрать данные, смерджить базы данных, провести их очистку, мало обучить и запустить ИИ, надо менять законодательство, которое регулирует систему сбора налогов. 2) Вот опять очередной филиал Росреестра отчитался о своём незаконном использовании беспилотников и бодро отрапортовал, что обследовал аж 20 км2 за год территории и изучил целых 10 000 участков (что конечно повысило эффективность зем контроля!). Но если разобраться, то это действительно весь максимум использования «инновационных технологий». Ведь если принять, что на составление паспорта обследуемого участка надо потратить хотя бы полчаса, то одному специалисту надо будет 2 года на их составление. Вдесятером, конечно, справятся и за 2 месяца, да только где вы найдёте на такую зарплату специалистов. Вот поэтому и потолок использования – 20 км2 в год, и вряд ли выявленные нарушению покроют бюджетные затраты на этот коптер. Вот такая вот «экономика данных», где данных много, а толку, до тех пор, пока что-то щелкнет в бюрократических механизмах, мало.

Грустный Киберпанк

Авторепост

Мы чуть не пропустили любопытный материал, эксперты: «Газпромбанк» показал и рассказал, как был устроен переход на отечественные решения в условиях изменившейся реальности.Понятное дело, речь о модернизации расчетного центра, через который прогоняются транзакции клиентов. Вот что рассказал в интервью для РБК исполнительный вице-президент «Газпромбанка» Иван Варжавин. Суть в чем: ЦБ обязал значимые банки с госучастием перевести критическую инфраструктуру на российские решения. У расчетного центра ГПБ была зарубежная инфраструктура и система управления базами данных (СУБД). Задача нешуточная — как говорит Варжавин, расчетный центр развивался более 15 лет. Сроки короткие, и при этом надо было провернуть все так, чтобы банк не «встал». За дело взялись уже в 2023 году. «Нам важно было найти баланс между временем обработки транзакций и стабильностью при высоких нагрузках. <…> при высокой скорости обработки транзакций в базе данных и на системном уровне могут возникать непредвиденные блокировки/ошибки, которые напрямую влияют как на целостность данных, так и на стабильность всей системы. С другой стороны, из-за создания резервных механизмов и дополнительных проверок операции будут обрабатываться дольше», — пояснил Варжавин. Еще сложнее от того, что рынок отечественных СУБД не шибко богат на предложение. В банке решили работать с YDB (Yandex Database) и говорят, что она работает даже при выходе из строя оборудования не то что на одном, а на нескольких узлах. При этом структура такова, что систему можно неограниченно масштабировать: остается окно для роста. Еще перед стартом модернизации в ГПБ подсчитали, что новый расчетный центр должен переваривать 1 тысячу транзакций в секунду. По факту же в 2025 году она обрабатывает до 3 млн транзакций в час — среди прочего это налоги, штрафы за нарушение ПДД, и куча других платежей. «Производительность увеличилась минимум в десять раз. Например, операции по оплате налогов и штрафов, которые пользователи проводят через портал госуслуг, раньше занимали много часов и выполнялись в течение всего дня. Из-за этого обработка других транзакций замедлялась. С внедрением новой СУБД мы развели эти потоки, и теперь такие платежи обрабатываются за один-два часа», — говорит Варжавин. В «Газпромбанке» видят, что за счет использования ИИ в перспективе удастся расшириться — уже через 3–4 года он станет неотъемлемой частью банковских решений. Посмотрим, эксперты, удастся ли разработать какие-то удачные решения под это дело.

Евгений Ветер | Чистый бизнес

Авторепост

Каждый день, на протяжении двух месяцев, мы модернизируем CRM для стирки ковров, что сейчас мы можем:- каждая входящая заявка обрабатывается и заносится в базу. Заказы идут по этапу: забор-стирка-доставка. Отказы идут по этапу: обработка возражений- звонок- прогрев- заявка- ИИ бот принимает все входящие сообщения и идентифицирует их в заявки, практически без участия менеджера- Дашборд показывает эффективность каждого менеджера команды: время с клиентом, время в системе, количество и качество лида - Водители видят в ТГ чатах, актуальные на сегодняшний день, заявки на развоз и сборСейчас мы дорабатываем, чтобы подключить цех к этой системе, для добавления в карточку комментариев, фотографий, размеров и другой информации. 1.05.2024 годаЗа день100 заявок входящих23 оформленных в договора77 потерянных безвозвратно1.05.2025 годаЗа день100 заявок входящих41 оформлена в договор59 идентифицированы как «прогрев» из них 11 идентифицированы как заявка через 48 часов, 4 заявки через 96 часов, 15 заявок через 7 дней.Взяты в работу 12Отказ 17 заявок через 14 дней.

Качалка Волберга

Авторепост

Добрый день всем—Так как деятельность всё-таки связана с рынком, то хочу поделиться своим видением происходящего и планами—Сразу скажу, что это не заявка на какой-то предикт или что-то в это роде, а, скорее мои мысли и предположения. Заниматься прогнозированием - самая неблагодарная вещь, которая существует в этой среде, так как ты можешь быть хоть 1000 раз прав, но за один косяк тебя будут тыкать носом больше, чем за плюсы, поэтому воспринимайте данный текст просто как поток мыслей—Сезонно, весь маркет летом находится в очень размеренном состоянии, поэтому я не ожидаю каких-то больших движений вплоть до конца лета и вероятно лишь только осенью мы получим более агрессивное поведение цены—Последний дип по BTC лично для меня выглядит неплохо, но неубедительно, поэтому мой основной план это ожидание района $100к за биток, что будет стакаться с STH cost basis на отметке в $98к—Также ожидаю какой-либо большой FUD за период лета как это было в прошлом году с Ираном, но в другом формате. Условно, это будет что-то из серии "Binance потерял 30% своего обеспечения во время хака". Этот момент я буду считать отправной точкой перед ралли, которое будет до конца года—НФА, ДИОР и все остальные аббревиатуры

Андрей Абрамов | Горячий стаж

Авторепост

Как разгонять творческое мышление с помощью базы знанийЗнания — сырье для творчества, если они не превращаются в догмы. Подсобрал мысли о том, как собрать инфраструктуру для новых смыслов, а не бетонирования правил. ⚡️Преодолевать творческий ступорБаза знаний снижает барьер чистого листа — когда не знаешь, с чего начать. Перед стартом нового проекта команда может просмотреть раздел базы знаний с похожими задачами и кейсами, забрать удачные приемы, визуал или структуру, чтобы быстрее набросать основу.⚡️ Сочетать идеиКреативность часто рождается из неожиданных комбинаций старых знаний. Если у вас есть инфраструктура для идей (например, раздел с набросками, прототипами, несбывшимися концепциями), то в подходящий момент можно вернуться к ним и найти новое применение. В этом случае база знаний работает как своеобразная память команды: то, что вчера отложили «на потом», завтра может соединиться с другим кусочком и дать новое. В брейнштормах даже полезно делать «рейды» по базе знаний — выбирать случайную статью или заметку, чтобы связать с текущей задачей. Этот метод основан на серендипности: чем разнообразнее знания в базе, тем больше шансов получить творческую искру при их сочетании. ❗️Документировать ход мыслейКогда команда заносит в базу знаний промежуточные идеи и обоснования (например, почему отвергли тот или иной вариант), она структурирует мышление. Если вернуться к «истории мысли» спустя время, можно обнаружить нестандартные решения, которые упустили. Это особенно полезно в методических командах: сохраняя черновики и обсуждения, можно создавать производные материалы или рефлексировать свой креативный процесс. 🌸 Визуализировать связиВыгружая знания на экран в виде схем, вы ускоряете поиск инсайтов. Хороший пример — использование «доски знаний» (Miro, Mural) в паре с текстовой базой: факты и идеи из базы перетаскивают на доску и компонуют в новых сочетаниях (как я и предполагал). Так, база знаний дает содержимое, а визуальный мозговой штурм — форму для нового смысла.

epsilon correct

Авторепост

У High-Dimensional Probability Вершинина стал доступен драфт второго издания. Добавили больше 200 упражнений и сделали книгу более удобоваримой. 🥁Как по мне, лучшая книга по основам вероятностных методов в приложениях к нашему с вами любимому датасаенсу.pdf

Свой нутрициолог 💚

Авторепост

Мир погружается в цифровизацию, сфера ЗОЖ и well-being — не исключение. Появилось множество приложений и сервисов, которые могут упростить внедрение стратегий здоровья. Собрала несколько самых интересных и полезных:✔️ FatSecret – простое приложение, в котором есть удобный пищевой дневник, большой каталог продуктов с данными КБЖУ (достаточно выбрать нужное), калькулятор калорий и даже лента новостей, где можно делиться рецептами и общаться с другими пользователями. ✔️ Ecogolik – удобный сайт для проверки состава косметики и бытовой химии. Есть рейтинги брендов, подборки и интересные статьи. ✔️ Breathe: снятие стресса – простое приложение для дыхательных практик. Помимо известных схем дыхания вы можете создавать и свои шаблоны. ✔️ МедКарта – сервис для ведения медицинской карты онлайн. Помогает хранить данные о визитах к врачам, рецептах и результатах анализов, чтобы всегда иметь их под рукой.✔️ Relive: Бег, Заезд, Поход — социальное фитнес-приложение для спортсменов, особенно популярно среди велосипедистов и бегунов, подойдёт для любителей ходьбы. Записывает маршрут и монтирует видео, куда добавляет фото из путешествия. Также приложение фиксирует скорость, дистанцию, высоту подъема и т.д.✔️ Forest: будь сосредоточенным – как ни удивительно, но это приложение позволяет отказаться от привычки постоянно проверять телефон и учит концентрации. Вы не будете отвлекаться на другие приложения во время работы. ✔️ Медитация Down Dog – набор разных видов медитации для релакса и успокоения, есть индивидуальные настройки и возможность выбора голоса. Делитесь этим списком с близкими!

Маркетинг | Клуб директоров

Авторепост

ИИ убил трафик из гуглаМне пишут (спасибо, Дима) по поводу влияния ИИ на позиции в поисковой выдачи Гугла. Цитирую:"Есть пару проектов с инфо ключами, где трафик стал валиться вниз, при этом позиции нет. При изучении Search Console стало понятно, что очень сильно упал CTR (просто почти в 0), т.е. стоишь в топ5, но у тебя почти нет кликов, потому что AI блок даёт ответ (в духе на 1000 показов 1 клик)."Ну как-то так. На картинке факты и цифры. Получается, что наше будущее в низкочастотных запросах? :)Пишет Русский ИТ бизнес

Дизайн Образования

Авторепост

AI который "умеет в таблицы" - нейросетки для ExcelНа очередном тренинге мне хадали вопрос, какую нейросеть я рекомендовал бы дл работы с MS Excel. Что же вот вам подборочка, чтото из этого набора наверняка подойдет :) И поможет сэкономить время. 1️⃣ ChatCSV — личный дата-аналитик. В него можно закинуть CSV-файлы и задавать вопросы. Он проанализирует таблицы и шустро выкатит результат.2️⃣ SheetAI — генерит ЛЮБЫЕ таблицы по одному промпту. Работает очень точно, а готовый результат можно сразу редачить.3️⃣ Genius Sheets — запускает сложнейшую аналитику за один клик и подключается к данным с помощью текстовых запросов.4️⃣ Rows — ИИ-агент, который проанализирует, сделает саммари данных и ответит на любые вопросы по ним.5️⃣ Equals — таблица для связи и работы с данными в РЕАЛЬНОМ времени. Помогает для различных онлайн-демонстраций.6️⃣ Numerous AI — на изи интегрируем ChatGPT в Google Sheets и получаем ультимативного аналитика.7️⃣ Julius AI — «съедает» файлы всевозможных форматов и мгновенно вытаскивает из них экспертные данные.🔤🔤 . Пишите в комментах, которая из них показалась вам самой интересной. Или возможно какие-то забыл? про это тоже пишите ) 💢 ИИ и данные в образовании на канале Дизайн Образования

CryptoSugaring 🔞

Авторепост

Собрал жене бота, который следит за анализами и на их основе выдает советы по питанию, тренировкам, добавкам + вкорячил туда чатгпт куда загружены все пожелания и с ним можно прямо в боте попиздеть.И это сделал я. Я, который в кодинге = примерно -200)Нейронки конечно это совершенно новый лвл развития для человечества. Даже страшно представить, какие открытия эта сфера начнет сыпать через пару лет.

Ухо Гераклита

Авторепост

Очень люблю метафоры про добычу данных, как раньше добывали горные породы. Тоже нужна техника безопасности.

Время Валеры

Авторепост

Анонимусы (без шуток, так и написано в статье) из неуказанной компании (но дальше честно говорится, что это Яндекс) выпустили статью — Yambda-5B: A Large-Scale Multi-modal Dataset for Ranking and Retrieval.Собирать и раздавать датасеты — дело богоугодное. Помню, как Женя Макаров на Датафесте в 2018 году ходил и фотографировал эмоции людей, чтобы собрать уникальный датасет (Женя, где датасеты!). А тут сразу:1 миллион пользователей,9.39 миллиона треков,4.78 миллиарда взаимодействий из Яндекс Музыки.Для каждого трека прилагается эмбеддинг, полученный свёрточной сетью по спектрограмме. Почему не Vision Transformer — вопрос интересный, но идея понятна.По типу фидбэка:– Implicit — прослушивания– Explicit — лайки и прочие действияИз уникальных штук — флаг is_organic. У каждого события указано, было ли оно органическим или вызвано рекомендацией. Это редкость: можно отдельно изучать, как алгоритмы влияют на поведение и как выглядит "чистое" прослушивание.Датасет выдают в Parquet (но без Iceberg, увы) — что уже хорошо.И ещё одна редкость — реалистичная схема сплита (Где то радуется один Information Retrieval) :• Train — 300 дней• Gap — 30 минут• Test — 1 деньСначала делают Global Temporal Split по таймстемпам, но корректируют его, чтобы в тесте были только те пользователи, что есть в трейне — ближе к продакшену.В общем, выглядит мощно. Ждём, когда Саша Петров наложит на это свои руки.Перезалил, с ссылкой на датасет

Политфак на связи

Авторепост

Полностью разделяю боль коллеги по поводу исследования дистанционного электронного голосования (ДЭГ) в России — поделюсь об этом личной историей (триггер-ворнинг для гуманитариев: далее огромный текст о количественной методологии).Дело в том, что я убил на изучение этого вопроса последние несколько лет. Так, в прошлом году даже собирался писать магистерский диплом о влиянии ДЭГ на результаты президентских выборов 2024 года. Причем именно с помощью difference-in-differences method (разница в различиях) — я взял итоги выборов за 2018 и 2024 годы по регионам, где ввели э-голосование, где его не было, и сравнил их. Мои расчеты оказались ровно теми же — анализ показал, что эффект от внедрения ДЭГ не значим статистически. Гипотезы не подтвердились.Если обратиться к графикам из поста Political Sins, то вы увидите, что их автор решил пойти несколько дальше и дополнительно проверил значимость разницы между группами с помощью: 1) pre-trends (пре-трендов) — наблюдается ли разница в результатах голосования между регионами в более ранних случаях, то есть в прошлые выборы; 2) parallel trends (параллельных трендов) — есть ли между ними разница в других переменных. В свое время я решил не прибегать к этим инструментам по простой причине — на длинных временных отрезках на результаты будут влиять изменения границ регионов: присоединение Новой Москвы к столице и объединение «матрешечных» субъектов.Все, что мне удалось выяснить о влиянии ДЭГ на результаты выборов за эти годы с помощью того же difference-in-differences method, а также более простых регрессионных моделей, так это: 1) положительный эффект от внедрения московской системы э-голосования на результаты провластных кандидатов и ЕР, а также явку; 2) положительный эффект от внедрения федеральной системы ДЭГ на явку и смешанный на результаты партий и кандидатов (тут подробнее о системах э-голосования в России). Простыми словами, внедрение ДЭГ в Москве действительно повлияло на результаты выборов в пользу правящего режима — а вот с федеральным ДЭГ, вероятно, такого не было.Почему вообще так сложно исследовать эту тему? В основном, потому что мало данных. В 2019-2021 годах для организации ДЭГ в Москве на выборах в Мосгордуму и Госдуму на каждый избирательный округ создавали отдельный УИК — это позволяло выбрать в качестве единицы наблюдения при регрессионном анализе избирательные участки самого низкого уровня, которых тогда было ~3600 штук. При difference-in-differences — несколько десятков ОИК — окружных комиссий (в случае с Госдумой 2021 я сравнивал Москву с Мособластью). На федеральном уровне для ДЭГ создавали уже отдельный ТИК на округ — для регрессионного анализа это тоже дает несколько сотен наблюдений, а для difference-in-differences — несколько десятков (снова уже ОИК, а не ТИК). А вот уже в 2024 году на президентских выборах ЦИК РФ публиковал лишь обобщенные итоги голосования в ДЭГ по регионам.Как вы понимаете, для количественных исследований чем больше наблюдений — тем лучше. К сожалению, в следующие электоральные циклы ситуация станет только хуже — вместе с попытками тотального расширения ДЭГ с помощью введения терминалов электронного голосования (ТЭГ) на живых участках мы, исследователи, вероятно, вообще не сможем сравнивать итоги онлайн- и оффлайн-голосования — потому что в таком случае навряд ли данные по участкам будут публиковать раздельно по способам голосования.

CMD — полезные сервисы для жизни и работы

Авторепост

Data Formulator — стильные визуализации данныхИнструмент от Microsoft с открытым кодом, превращающий любые загруженные данные в наглядные диаграммы, схемы и графики. Работает прямо в браузере, без лишней возни с кодом и настройками. Главное — это полностью бесплатно!Особенно удобен для быстрой визуализации таблиц или CSV-файлов. Просто введите запрос (вроде «построй круговую диаграмму по столбцу категорий») — и готово. Мастхев для аналитиков, студентов и всех, кто работает с данными.#бесплатный #как_вы_без_этого_жили

Андрей Галаев | CRM Битрикс24+1C

Авторепост

Лайфхак: как проверить, сливаете ли вы деньги через Битрикс24🖥 Проверить эффективность работы платформы Битрикс24 и понять, не сливаете ли вы бюджеты, можно такими способами:· Откройте список сделок за последний месяц: сколько зависло без движения?· Посмотрите, заполнены ли поля «Источник», «Телефон», «E-mail» – пустые? Значит, аналитика не работает.· Проверьте, настроены ли роботы: уходят ли письма, создаются ли задачи?· Сравните количество лидов и количество доведённых до оплаты – каков процент потерь?· Посмотрите повторные обращения: клиенты возвращаются или теряются?❗️ Грамотная настройка Битрикс24 — залог успешного использования CRM-системы. Напоминаю, что осталось всего 4 дня до окончания акции -30% на все тарифы Битрикс!Получите выгоду до 200.000 рублей и дополнительные бонусы от меня. Оставьте заявку на моем сайте и я свяжусь с вами в ближайшее время! — https://andreygalaevb24.ru/Андрей Галаев | CRM

Барабанова | Главврач в полете

Авторепост

Цифровизация медицины выходит из-под контроля…Читаю новости: «Житель Санкт-Петербурга пришёл в банк из-за блокировки карты и узнал, что он мёртв. Мужчину случайно признали умершим в одном из медучреждений из-за технического сбоя. Теперь у него ноль прав: ему заблокировали все счета и карты, он не может получать зарплату, обратиться в больницу или уехать…»Вот тебе и единый цифровой контур… будет удобно, говорили они, все будет лежать в одном месте, говорили они….

Системный аналитик с нуля | Альбина Гараева

Авторепост

Что такое шардирование и как оно помогает масштабировать БД?Если партиционирование — это внутренняя организация одной таблицы, то шардирование — это про распределение данных по разным серверам. Когда один сервер уже не справляется, мы делим данные и храним их на нескольких узлах. Каждая часть — это шард.Зачем нужно шардирование?Когда нагрузка на базу растет, единственный сервер может «захлебнуться». Шардирование позволяет:• Распараллелить нагрузку• Уменьшить объем данных на каждом узле• Увеличить отказоустойчивостьПример:У вас 10 млн пользователей, и вы решили хранить их в отдельных шардах по первым буквам имени:A–F → шард 1G–L → шард 2M–Z → шард 3При входе пользователя Roman, система сразу знает — искать его нужно в третьем шарде.Ключевые отличия от партиционирования:Шардирование происходит на разных серверах (нодах) и управляется кодом/брокерами, в то время как партиционирование управляется СУБД. Основная цель - горизонтальное масштабирование.Шардирование требует особого внимания к маршрутизации, кэшированию и восстановлению данных. В следующем посте рассмотрим шардирование и партиционирование с точки зрения системного аналитика🔥

Пытаюсь посчитать

Авторепост

Еще хочу поделиться интересным кейсом по контролю перерасхода в течении дня в Директе. Проблема в том, что нам Директ по умолчанию не дает данные по времени, только по датам. Если нам очень нужно понять, что сейчас идет всплеск - то это проблема, нам же не с чем сравнивать. Отсюда появилось решение (не мое), что можно выгружать данные по аккаунту с периодом 5 минут, без удаления предыдущих. В итоге получается график накопленного итога, где разница между уровнем одной пятиминутки и второй — и есть всплески и уже можно на них как-то отреагировать. Сделать так можно с помощью регулярной выгрузки данных (например в приложении на моем курсе) и автоимплементации времени вставки — InsertedAtMsk на скриншоте.

Поисковая оптимизация сайта от Лазутина

Авторепост

🚀 Мой арсенал инструментов на Python продолжает расти! 🐍Эти скрипты позволяют автоматизировать и собирать важные данные для различных видов анализа:- Страниц - Запросов - Контента - Конкурентов - Сайтов в целомБлагодаря этому я могу:✅ Быстро получать подробную информацию о сайтах.✅ Обнаруживать скрытые проблемы и новые возможности.✅ Превращать разрозненные данные в полезные инсайты.✅ Эффективнее тратить своё время, отказавшись от рутины. У меня уже работает целая коллекция из 24 удобных маленьких скриптов. Но это лишь начало... 🔍 Теперь хочется поднять уровень игры: создать централизованную систему для запуска, мониторинга и координации операций с данными. Именно поэтому я решил попробовать Apache Airflow! Уже проделана большая работа: - Базовая структура готова. - Окружение настроено и подключены базы данных. - Веб-интерфейс запущен, задачи начинают выполняться автоматически.Впереди грандиозные планы: - Интеграция моделей машинного обучения к 2026- Оптимизация текущих процессов. - Полноценная реализация возможностей Airflow.Почему это важно?Каждый проект строится по чёткой схеме: оплата → аудит → выявление точек роста → подготовка плана действий → передача результатов заказчику. Моя главная задача — качественная аналитика и работа с данными.Представьте, насколько удобнее сразу видеть полную картину ошибок, слабых мест и перспектив развития проекта, когда садитесь за компьютер! Сейчас приходится тратить массу времени на подготовку данных вручную, а без этого нельзя... Хотя я прекрасно знаю что и для чего делать и какие данные нужны для работы. Airflow позволит решить эту проблему, предоставив возможность:- Регулярно автоматически запускать скрипты - Отслеживать статус выполнения задач - Управлять последовательностью операций - Получать уведомления о проблемах - Видеть весь процесс наглядно Впереди большие перспективы по дальнейшему улучшению рабочего процесса! 🚀

Математика Дата саентиста

Авторепост

📊 Математическая задача для Data Scientists: "Идеальная точка разбиения"**Условие** У тебя есть список чисел List[float], представляющий одномерное распределение (например, значения метрики или зарплаты). Нужно определить: существует ли индекс, на котором можно разделить массив на две части так, чтобы стандартное отклонение слева и справа отличалось не более чем на ε (например, 0.1).Формат:def has_balanced_std_split(data: list[float], epsilon: float = 0.1) -> bool: ...Пример:data = [1.0, 2.0, 3.0, 4.0, 5.0] # Разделение после 2 → [1.0, 2.0], [3.0, 4.0, 5.0] # std слева ≈ 0.5, справа ≈ 0.816 → разница = 0.316 > 0.1 → не подходит🔍 Подсказка Используй statistics.stdev() или numpy.std(ddof=1) (с выборочной коррекцией). Но не забывай, что длина подмассива должна быть как минимум 2.---✅ Пример реализации:```pythonimport statisticsdef has_balanced_std_split(data: list[float], epsilon: float = 0.1) -> bool: n = len(data) if n < 4: return False # Нужны хотя бы 2 элемента в каждой части for i in range(2, n - 1): left = data[:i] right = data[i:] if len(left) < 2 or len(right) < 2: continue std_left = statistics.stdev(left) std_right = statistics.stdev(right) if abs(std_left - std_right) <= epsilon: return True return False```📌 Пример использования:```pythondata = [10, 12, 11, 20, 21, 19]print(has_balanced_std_split(data, epsilon=0.5)) # True или False в зависимости от разбивки```🎯 Что проверяет задача:• понимание **дисперсии и стандартного отклонения** • знание **статистических библиотек Python** • работа с ограничениями на длину срезов • мышление в духе «разделяй и анализируй»

Марина с переменным успехом

Авторепост

⚡В Telegram Ads появился пиксель ретаргетинга и настройка событий в немКак спят девчонки? А никак, девчонки мониторят обновления рекламы в Телеграме.Тут в TG Ads появился Pixel Tag. Можно собирать посетителей сайта и настраивать события, например:• Добавление в корзину• Покупка• Лид• Регистрация• Начало триала• ПоискТо есть: видим и события для e-commerce и для взаимодействия контента.А что это значит, коллеги?Что оптимизация на конверсии не за горами! Ух, с учетом объема аудитории в Телеграме и нормальнымрекламным кабинетом есть надежда, что это будет хорошая оптимизация на конверсии. Вот как было в запрещенных соцсетях. Заживем!Перевожу на человеческий: можно будет запускать эффективную рекламу на сайт для лидогенерации или продаж в магазине.Опция появилась сегодня, 16 мая. В новостях особо не видела, поэтому спешу с вами поделяться, несмотря на поздний час. У себя в кабинете все уже потыкала, пиксель есть. Скорее бы потестить!

School of Education

Авторепост

Что такое образовательная аналитика?Образовательная аналитика — это процесс сбора, анализа и интерпретации данных об обучении студентов. Она помогает выявлять закономерности, прогнозировать результаты и адаптировать образовательные программы под реальные потребности учащихся.Основные виды аналитики:• Дескриптивная — анализ текущих данных для выявления тенденций и проблем;• Диагностическая — поиск причин успехов и сложностей в обучении;• Предиктивная — прогнозирование образовательных результатов;• Прескриптивная — выдача рекомендаций для улучшения процесса обучения.Как данные помогают улучшать обучение:1. Индивидуализация обучения: программы адаптируются под особенности студентов.2. Ранняя диагностика проблем: позволяет вовремя поддерживать тех, кто испытывает трудности.3. Оптимизация курсов: анализ данных показывает, какие части курса работают лучше, а какие требуют изменений.4. Оценка преподавания: помогает преподавателям корректировать методы и повышать эффективность.5. Управленческие решения: руководство использует аналитику для планирования и развития учебных программ.Инструменты аналитики:• Системы управления обучением (Moodle, Google Classroom),• Платформы для анализа данных (Tableau, Power BI),• Образовательные дашборды и системы с применением искусственного интеллекта.___Образовательная аналитика становится неотъемлемой частью современного образования: она помогает принимать обоснованные решения, строить персонализированные траектории обучения и повышать качество образовательного процесса на всех уровнях.Использование данных позволяет не только понимать, что происходит в обучении, но и почему, что будет дальше и как можно сделать лучше — а значит, делает образование более осознанным, гибким и результативным.

Записки CTO про код и карьеру

Авторепост

Как объяснить топам, что у нас всё хорошо с качеством?Качество можно описать кучей разных метрик. В Яндекс Картах мы смотрим на такие:- соблюдение SLA на исправление багов (aka zero bug policy);- надёжность ключевых пользовательских сценариев (aka «девятки», 99.99);- среднее время восстановления после сбоя (Mean Time to Recovery)- скорость работы интерфейса (например, Time to Interactive, Freeze Time);- и поскольку карты — это в первую очередь продукт, завязанный на данные, мы отдельно следим за качеством данных. Пока у нас есть только одна метрика — SLA по доставке данных от пользовательской правки до продакшна, но мы ещё работаем над полной моделью.Но, глядя на него, сложно ответить на вопрос: «А что у нас с качеством?» Непонятно, почему мы смотрим именно на эти метрики, и как по ним показать общий прогресс и приближение к идеальному состоянию.Здесь помогает подход с фитнес-функцией — объединяем метрики формулой и общей логикой.Для общей логики хорошо заходит идея: смотрим на то, насколько продукт кажется пользователю качественным. Её легко объяснить бизнесу.А чтобы получить составную метрику — я называю её quality score — используем взвешенную формулу. Берём каждую метрику, переводим её значение в шкалу от 0 до 1. Например, надёжность 99.95% при цели 99.99% может дать 0.5 балла. Если баги закрываются в срок — это 1, если нет — меньше. Всё зависит от приоритетов.Задаём каждой метрике вес в общем скоре, по умолчанию можно просто 1, и считаем итог:Quality Score = Σ (вес метрики × значение метрики в шкале)На выходе получаем один показатель, который отражает общую картину с качеством — и выглядит вполне понятным для бизнеса.Если хочется углубиться в детали, то можно прочитать статью про Quality Score от Саши Матвеева из Авито. Где мы с ним и командой качества внедряли аналогичную метрику https://habr.com/ru/companies/avito/articles/767728

ProductSense

Авторепост

📊 Как делать дашборды, которые реально помогают бизнесуЧасто дашборд делают «как-нибудь», без понимания цели, и получают панель с кучей метрик и неудобной визуализацией — увидеть достоверную картину и выцепить нужные данные во всём этом сложно. Разработать действительно полезный инструмент, который помогает справляться с задачами продукта и бизнеса, поможет фреймворк Dashboard Canvas — аллюзия на Business Model Canvas, только для дашбордов.Dashboard Canvas состоит из 9 компонентов — их можно заполнять в прикреплённом шаблоне или обычном текстовом документе, пункт за пунктом:1. Команда: кто участвует в решении задачи, кто за что отвечает и у кого какие ожидания. 2. Понимание задачи: как работает бизнес и конкретное подразделение, для которого мы будем создавать дашборд. Удобнее всего делать описание задачи на основе интервью: сначала аналитик общается с менеджером продуктов, а потом формирует понимание задачи.3. Пользователи: кто будет пользоваться дашбордом, какие у них потребности. Например, руководитель каждый день мониторит общую картину по продажам, а менеджеры следят за статусами сделок. 4. Вопросы и бизнес-решения: какие бизнес-решения пользователи будут принимать на основе визуализированных данных и на какие вопросы искать ответы. Например, если у нас проседает retention, то мы запустим новые рекламные кампании или заново отправим имейл-рассылку по определённым сегментам.5. Контекст и форматы: когда и в каких условиях пользователи смотрят дашборд — утром в спокойной обстановке с десктопа или «в полях» с мобильного.6. Данные: определяем структуры данных, выясняем, какие данные уже есть, а какие предстоит собрать.7. Форматы: будет ли мобильная версия, как визуализировать данные (в графиках, матрицах, бар-чартах, тайм-сериях и т. д.), какие показатели будут располагаться выше и правее, а какие займут менее приоритетные позиции.8. Макет: верхнеуровнево отрисовываем макет будущего дашборда, располагаем блоки и графики относительно друг друга, а потом завёрстываем.9. Тестирование и поддержка: собираем обратную связь от пользователей и дорабатываем дашборд. Это может быть демосессия и заполнение формы, тестирование и наблюдения в реальных условиях, сбор статистики по использованию дашборда.Подробнее о каждом этапе разработки дашборда и об инструментах, с помощью которых можно всё это визуализировать, читайте в статье, которую мы подготовили вместе с Романом Буниным — специалистом по визуализации данных и развитию BI-систем.Читать статью целиком →

ПОНЯТНЫЕ ЗАКУПКИ | 44-ФЗ | 223-ФЗ | Анатолий Амбросов

Авторепост

🛡 ГИС МТ Честный ЗНАКЕщё в январе 2023 г. в ЕИС реализован протокол обмена с ГИС МТ "Честный ЗНАК". С этого момента у заказчиков появилась допобязанность проверять и гасить идентификационные номера маркируемых товаров с целью их изъятия из оборота и проверки товара на контрафактностьШло время ... многие заказчики и сегодня не до конца понимают зачем и как проверять маркуруемые товары в ДоП ЕИС, а на днях и вообще промелькнула новость, что нелегальная торговля маркировками "Честного ЗНАКА" обрела такие масштабы, что зампредседателя правительства России Дмитрий Григоренко поручил Минпромторгу срочно принять меры, а отдельные предприниматели уже просто скачивают маркировку из интернета и наклеивают ее на товары без посредников 🤷‍♂Незадолго до этого был вопрос от коллеги в чате 💬:🗣️ Обязан ли поставщик в ДоП ЕИС указать коды идентификации товаров, подлежащих маркировке (перчатки медицинские)? И будет ли нарушением если заказчик подпишет ДоП, если коды там не указаны? Коды направлены поставщиком в СБИС⭐️ сошлись и пожалуй пришло время сделать нормальный разбор, поехали Пунктом 33 Правил маркировки отдельных видов медизделий средствами идентификации, утв. ППрРФ от 31.05.2023 N 894, установлено, что обязанность по представлению информации в информационную систему при поставке маркированных товаров в рамках исполнения контрактов, заключенных в соответствии с Законом 44-ФЗ, может быть исполнена участниками товарооборота путем представления документов о приемке, предусмотренных ч. 13 ст. 94 Закона 44-ФЗ (ДоП ЕИС)При этом сама обязанность передавать в информационную систему мониторинга сведения о кодах идентификации перчаток медицинских установлена п. 28 Правил N 894: с 1 марта 2025 г. участники товарооборота представляют в информационную систему мониторинга сведения о кодах идентификации, и (или) кодах идентификации групповых упаковок, и (или) кодах идентификации наборов, и (или) кодах идентификации транспортных упаковок при осуществлении ввода в оборот и при выводе из оборота перчаток медицинских‼️ Продавцы обязаны передавать соответствующие сведения об их выводе из оборота (см. пп. "ж" п. 3 ППрРФ N 894)Получается, участники оборота, осуществляющие в рамках госконтрактов поставки маркированных медизделий, вправе исполнить обязанность по передаче сведений в "Честный ЗНАК" путем направления ДоП в ЕИС. При этом требуется сообщить сведения о кодах идентификации товаров, т.е. сведения о кодах идентификации товаров, подлежащих обязательной маркировке, указываются в документе о приемке, а документ о приемке (ДоП) в случае с электронной конкурентной процедурой закупки формируется в структурированном виде посредством ЕИС, т.е. круг замкнулсяТак в ЕИС реализована возможность указания сведений о средствах идентификации товаров, подлежащих обязательной маркировке, в ДоП (исправлениях к нему), а также автоматическая отправка подписанного ДоП в ГИС МТ "Честный ЗНАК" с целью регистрации факта выбытия кодов идентификации из оборота✅ В ДоП ЕИС коды идентификации товаров, можно указать одним из следующих способов:1) загрузить файл с кодами идентификации, зарегистрированными в ГИС МТ "Честный ЗНАК", для всех товаров, указанных в ДоП2) загрузить файл с кодами идентификации, зарегистрированными в ГИС МТ "Честный ЗНАК", для конкретного товара, указанного в ДоП3) указать коды идентификации по конкретной позиции товара с использованием 2D сканера4) указать коды идентификации, зарегистрированные в ГИС МТ "Честный ЗНАК", вручную по конкретной позиции товара🟡 На основании вышеизложенного подписание заказчиком ДоП с неуказанными кодами идентификации является нарушением, однако специальная административная ответственность за это не предусмотренаТак, если в ДоП не указаны или указаны некорректные коды, то на этапе рассмотрения ДоП следует сформировать исправление и отразить полные/корректные данные через титул поставщика. При необходимости направить претензию поставщику и привлечь к ответственности за неисполнение нестоимостных обязательств контракта, начислив штраф в соответствии с ППрРФ от 30.08.2017 N 1042#Ликбез

Славгородский!

Авторепост

РКН: Объясняю, что случится 30 мая простыми словами.Представьте такую ситуацию. Делаете вы свой бесплатный вебинар по вышиванию крестиком. Рекламку закупили, промаркировали ее. Оферту подготовили, эквайринг настроили, все как положено. Налоги заплатите. Вы весь такой честный, правильный, красивый, что аж тошно.И тут по весне одному зрителю напекло голову от вашей рассылки с напоминанием, и он отправляет жалобу в РКН. Мол, следят за мной — меня догоняет реклама, а потом еще и рассылку мне смской прислали, еще и по имени обратились.Впервые их вообще вижу, помогите. Да, он сам пришел от блогера на ваш сайт. Да, он сам заполнил свои данные. А завтра — забыл. Ну, бывает такое. В итоге — у вас до 1 000 000 руб штраф. Надзор начинает разбираться:01. Согласие на обработку данных шаблонное и старое. Настолько старое, что там еще про западные соц.сети.02. Ваша CRM-система действительно находит такого пользователя, но доказать, когда, как и с какого IP оставил регистрацию этот чудак, и сам ли он это сделал — сервис не дает. И вообще вы могли сами его туда вписать. 03. Ваш конструктор и системы аналитики типа Метрики собирают cookie-файлы, а значит, этого чудака начинают догонять похожие рекламы, а по его мнению — вы продали его данные незнакомым компаниям.Как итог — вы вообще не правы. Украли его драгоценные персональные данные, продали их другим, а потом еще нагло рекламу ему в what's app шлете, куда ему бабушка открытки отправляет. А должен быть чёткий, прозрачный и доказуемый процесс сбора, обработки и хранения данных этого чудака. → Во-первых, он должен видеть, куда и зачем он регистрируется;→ Во-вторых, он должен сам нажать чекбокс на согласие;→ В-третьих, он должен понимать, что такое cookie, и что будет, если он согласится;→ В-четвертых, он должен в любой момент попросить удалить данные, и вы это сделаете. Раньше смотрели на это сквозь пальцы. Сейчас обещают за счет нарушений пополнять казну нещадно. Достаточно пары жалоб. Сначала будет предупредительный выстрел в голову, потом выговор с занесением в грудную клетку. Короче, мы тут по всем аффилированным и клиентским проектам носимся, все проверяем.Честно — сложно, везде свой контекст, где софт для этого не предусмотрен, а где — собственник не верит, что волки идут.Но держите от меня нерекламную рекомендацию — мои друзья-юристы из юридического бюро написали хорошую инструкцию, что сделать и куда.→ В карточках в смузи-формате — вот тут.→ Нормальная статья лонгрид — вот тут. На самом деле это и правда не реклама, мне этот пост не оплачивали, делюсь потому, что мне это помогло.Эта интеграция нерекламная, но я здесь подсвечиваю наработку конкретного бюро, поэтому ФАС может посчитать это рекламой. Так что я обязан произнести Заклинание от РКН:Реклама. АБ "Гриц и партнеры" г. Москвы. ИНН 9705139311Кстати, вот тут четко и ясно, почему такое надо маркировать, даже если это по зову сердца все, я побёг.

Право в сети с Маргаритой Ледовских

Авторепост

👩‍💻Чуть больше двух недель остаётся до вступления в силу новых штрафов. Настоятельно рекомендую проверить всё ли у вас в порядке касаемо сбора, обработки и хранения персональных данных. В очередной раз напомню: Уведомление в Роскомнадзор должны отправлять все, кто собирает базы клиентов (обрабатывает персональные данные): юридические и физические лица, индивидуальные предприниматели. Размер вашей базы и систематичность сбора ПД не играют роли, как и способ их сбора (форма на сайте, чат-бот, бумажные формы и т.д.), уведомление в РКН отправлять всё равно нужно!❗️5 основных обязанностей оператора персональных данных, о которых нельзя забывать❗️1️⃣ До начала обработки персональных данных вы обязаны уведомить Роскомнадзор о своих действиях. Именно ДО, а не в процессе либо после, т.к. отсутствие подачи уведомления как и его несвоевременная подача чреваты штрафами:С 30 мая 2025 года размер штрафа за отсутствие уведомления в Роскомнадзор о намерении осуществлять обработку персональных данных составит: 🔸для физических лиц - до 10 тысяч руб. 🔸для должностных лиц - до 50 тысяч руб. 🔸для юридических лиц - до 300 тысяч руб.2️⃣ Также вы обязаны опубликовать (либо другим способом) обеспечить неограниченный доступ к Политике в отношении обработки персональных данных. Проверьте, чтобы она была составлена и размещена правильно. Вы можете делегировать аудит/составление документов для вашего сайта юристам "Право в сети" https://forms.amocrm.ru/xdmvmc 3️⃣ Вы должны своевременно принимать меры, необходимые и достаточные для выполнения обязанностей, установленных Федеральным законом от 27.07.2006 г. № 152-ФЗ «О персональных данных»4️⃣ При сборе персональных данных, в том числе в сети Интернет, вы обязаны обрабатывать персональные данные с использованием баз данных, находящихся на территории Российской Федерации. 5️⃣ Также вы должны предоставлять информацию об обработке его персональных данных по запросу субъекта персональных данных.Полезные ссылки: ✅ Форма для создания уведомления по обработке персональных данных https://pd.rkn.gov.ru/operators-registry/notification/form/ ✅ Рекомендации по заполнению уведомления на обработку персональных данных https://lawinweb.ru/obyazatelnoe-uvedomlenie-roskomnadzora-ob-obrabotke-personalnykh-dannykhkak-i-kogda-eto-sdelat/ ✅ Нет ни времени, ни желания на то, чтобы самостоятельно разбираться во всём этом? Специалисты “Право в сети” готовы взять эти задачи на себя! Оставьте заявку @ledovskikhm и получите бесплатную 15-минутную консультацию по обработке персональных данных и подаче уведомления в Роскомнадзор! Заказать услугу "под ключ" у нас тоже можно, для этого напишите мне в личные сообщения @ledovskikhm

Системный Аналитик

Авторепост

🔍Фильтр БлумаФильтр Блума — структура данных, которая помогает быстро проверить, может ли элемент находится в наборе данных или точно его там нет🟢Используется, когда проверка наличия элемента должна быть быстрой, а использование памяти минимальнымРаботает как "чек-лист", отвечает: -Может быть, элемент есть (иногда может ошибится) -Точно элемента нет Как работает?🟢создается битовый массив длины m 🟢он состоит из 0 и 1🟢изначально массив выглядит так: [0, 0, 0, 0, 0, 0, 0, 0]🟢каждая позиция (индекс) в этом массиве и значения (0, 1) — всё, что фильтр "запоминает"🍃Добавляется элементНапример, id со значением 123451⃣Фильтр пропускает id через несколько хэш-функцийХэш-функция — математический алгоритм, который превращает строку ("12345") в числа (индексы массива), например:- hash_1("12345") → 2- hash_2("12345") → 5- hash_3("12345") → 72⃣ Фильтр "ставит галочки" на этих позициях, т.е. устанавливает биты на этих индексах = 1:[0, 0, 1, 0, 0, 1, 0, 1]Фильтр запоминает, что на позициях [2, 5, 7] что-то есть🍃Проверка элементаЧтобы узнать есть ли id = 54321 в фильтре Блумаid снова пропускается его через те же хэш-функции:- hash_1("54321") → 1- hash_2("54321") → 3- hash_3("54321") → 6Фильтр смотрит на эти индексы в массиве: [0, 0, 1, 0, 0, 1, 0, 1] Позиция 1 = 0 → id = "54321" точно не добавлялсяЕсли бы добавлялся, то позиция 1 была бы = 1🍃 Если все проверенные индексы равны 1, то фильтр говорит → может быть, элемент есть🍃 Если хотя бы один бит на позициях, которые вычислили хэш-функции, равен 0 → элемент точно отсутствуетЧего нет в фильтре Блума❌ не хранит сами данные (например, список id). Хранит информацию в битовом массиве ( создаётся в оперативной памяти RAM). Это компактное представление множества❌ не знает ничего напрямую о добавленных элементах❗️У него есть только массив битов (позиции, которые связаны с добавленными элементами) и хэш-функции (для поиска индексов)Примеры применения🍃в БД - для ускорения поиска записей без полного сканирования таблиц- в индексах для предварительной проверки наличия ключа🍃в веб-приложениях для быстрой проверки, есть ли объект в кэше, без полного перебора🍃в блокировке спама для проверки, был ли email уже отправлен🍃для уменьшения сетевых запросов (в Cassandra или Redis). Для предварительной проверки наличия данных на узле. Если фильтр говорит "данных нет", система нре делает запрос к этому узлу🍃в CDN (Content Delivery Network) для проверки, есть ли контент на edge-сервереНедостатки🔸стандартный фильтр Блума не поддерживает удаление элементов (есть модификации, например, Counting Bloom Filter)🔸может ошибаться из-за коллизий хэш-функций: некоторые индексы в массиве могут пересекаться (это коллизии). Пример: "12345" ставит 1 на позициях [2, 5, 7]"67890" ставит 1 на позициях [5, 7, 8]Фильтр может ошибочно считать, что элемент есть, хотя его нет🔸не подходит, если нужна точность 100%🔸если фильтр переполняется, ложноположительные срабатывания становятся слишком частыми📎 Материалы1. Что такое фильтр Блума? 2. Фильтр Блума: зачем нужен и как работает3. Что такое фильтр Блума и как он работает на практике (с примерами)4. Что такое фильтр Блума в Blockchain? 5. Вероятностные структуры данных и где они обитают 6. Фильтр Блума – вероятностная структура данных для проверки принадлежности элемента множеству 7. Просто о сложном: что фильтрует фильтр Блума? 8. Фильтр Блума 9. Когда фильтр Блума не подходит #инфраструктура ➿➿➿➿➿➿➿➿🧑‍🎓 Больше полезного в базе знаний по системному анализу

Освой AI | Рост продуктов

Авторепост

“Если в моем опыте нет реальных A/B тестов, а хочется в бигтех, что делать?”Вопрос, который мне задали под постом о навыках продакт-менеджера. На самом деле, свое собеседование в бигтех-компанию я тоже прошла, не имея реального опыта запуска A/B тестов и их анализа. Да, действительно, при приеме на работу в бигтех-корпорации это может стать блокером. Но не всегда и не везде. К тому же остается шанс, что вы покажете блестящее знание теории и понимание, зачем вообще нужны A/B тесты и в том числе, зачем они НЕ НУЖНЫ.Первое, что нужно уложить в голове: делать А/В тесты ради А/В тестов это как забивать гвозди микроскопом – дорого и неоптимально.Взгляните на свой текущий продукт и задайте себе вопросы:1. Зачем и для чего мне был бы нужен в текущем продукте А/В тест?2. Если бы я решил запускать его здесь, как бы я это сделал?3. Сколько стоило бы запустить 1 А/В тест? Сколько времени на разработку понадобится?4. Сколько стоило бы создать целую платформу для А/В тестов, и оправдано ли это в моем текущем продукте?Ответив на эти вопросы вы вероятнее всего сможете аргументированно на собеседовании рассказать, почему А/В для вашего продукта были не нужны и избыточны. А избыточность – это затраты и вред для бизнеса. Такое понимание очень важно показывать нанимающим менеджерам.Далее, если все-таки видите, что в текущем проекте можно было бы сделать эксперимент, то подумайте, как его наименьшими усилиями организовать и потренироваться. Например, когда я работала в SberDevices до ухода в ВК, у нас не было никакой инфраструктуры под А/В тесты. Мы делали продукт – приложение для просмотра Эфирное ТВ на телевизорах Салют. Аудитория всего Салют ТВ тогда была около 200 000 пользователей, а конкретно моего приложения – примерно 170 000. Некоторое подобие А/Б было в моем послужном списке такое: мы взяли два вида рекламных баннеров и запустили их на 2000 пользователей (по 1000 в каждый вариант). Для подготовки теста и анализа результатов я использовала просто калькулятор https://mindbox.ru. Нужно понимать, что он считает только конверсии, но мне в том кейсе этого было достаточно. Как итог я реально приняла решение на основе этого эксперимента и запустила один из баннеров, который лучше конвертил. Такой кейс сделал меня более опытным продактом в глазах нанимающих.Если у вас есть интернет-сайт, то сделать простенький А/Б должно быть совсем просто. Поразмышляйте на эту тему и попробуйте что-то запустить. Ну и, конечно, теория. Она должна быть на высоте, особенно, если практики было не так много. Какие вопросы обычно задают:Что такое статистическая значимость? Что показывает p-value?Как определить размер выборки?Что такое MDE?Как я описываю дизайн-эксперимента, в этом посте писала, можно подготовиться по нему.Ну и не беспокоиться! А/Б тесты это не серебряная пуля, а всего лишь один из методов проверки гипотез. Не самый дешевый.Не люблю грузить материалами по А/Б, тк их даже слишком много, но вот этот ролик посоветовала бы посмотреть, чтобы перестать идеализировать значимость АБ-тестов.

Твой ГИД по КАДРАМ

Авторепост

🚩HR-анализ и принятие решений на основе данных: как большие данные меняют управление персоналом В эпоху цифровых технологий HR уже не ограничивается только подбором кандидатов и проведением собеседований. Сегодня управление персоналом всё чаще опирается на большие данные и аналитику — инструменты, которые помогают компаниям принимать более взвешенные решения и создавать комфортную и продуктивную рабочую среду.💡 Что такое HR-аналитика? Это процесс сбора и анализа множества данных о сотрудниках и процессах на работе — от посещаемости и вовлечённости до эффективности работы и карьерного развития. На основании этих данных HR-специалисты получают ценную информацию, которая помогает решать сложные задачи.⚙️ Как это работает? 1⃣ Оптимизация подбора персонала: Анализируя резюме, поведение кандидатов и эффективность новых сотрудников, можно улучшить критерии отбора и сократить время найма. 2⃣ Прогнозирование потребностей: На основе исторических данных и текущих тенденций аналитика помогает предугадать, сколько сотрудников и каких компетенций потребуется компании в будущем. 3⃣ Повышение эффективности работы: Анализ производительности и вовлечённости позволяет выявить «узкие места», повысить мотивацию и вовремя предложить обучение или поддержку. 4⃣ Снижение текучести кадров: Исследуя причины увольнений и настроения сотрудников, HR может создать программы удержания и улучшить внутренний климат. ❓Почему это важно? - Экономия времени и ресурсов — меньше ошибок при найме и управлении персоналом. - Принятие обоснованных решений — уход от интуитивных догадок к фактам и цифрам. - Повышение счастья и продуктивности сотрудников — благодаря лучшему пониманию их потребностей и настроений. 📈 В конечном счёте, грамотное использование HR-аналитики помогает создавать не просто рабочие места, а комфортные команды и успешные компании. Именно поэтому инвестиции в аналитику становятся одним из ключевых трендов в HR на ближайшие годы.---Если Вы используете данные аналитики в управлении персоналом, то ставьте 👍#hrстатистика

Открыть ленту