
Data Science и аналитика — страница 7
Лента темы

9 постов про табличкиИскала в своем канале пост для коллеги про трансформацию кросс- таблицы в плоскую. Хорошо когда есть такой канал)Напомню и вам. А заодно и еще несколько постов про таблички1. Power Query. Трансформация таблицhttps://t.me/whrdata/2822. Таблица рулитhttps://t.me/whrdata/3673. Форматирование таблицыhttps://t.me/whrdata/3814. Аккуратная табличкаhttps://t.me/whrdata/4715. Лайфхак визуализацииhttps://t.me/whrdata/8236. Таблица консультанта и таблица аналитикаhttps://t.me/whrdata/10267. Интерактивные таблицыhttps://t.me/whrdata/14078. Редактирование таблицhttps://t.me/whrdata/15769. Шапка в табличкеhttps://t.me/whrdata/1767

Как проверить контрагента, найти цифровой след или отслеживать упоминания?Это пост не для агентств, у которых есть платные мониторинговые системы (о них, наверное, не нужен пост? Это все же знают?).Мониторинг поисковой выдачи:
Google Alerts (Бесплатно)
Babkee (Бесплатно)
Kribrum (Бесплатно)Мониторинг Telegram:
TGStat Alerts Бесплатная и платная версия Универсальный трекер:
Any Tracker (Android) Бесплатно (следит за ценами, курсами валют, текстом на сайтах и YouTube)Поиск и анализ людейПрофсети и отзывы:
LinkedIn Бесплатно (это база)
HeadHunter Бесплатно
Профи.ру Бесплатно
Kwork Бесплатно
Авито (раздел Работа) БесплатноПоиск по юзернейму и номеру:
Snoop Бесплатно (5200+ сервисов)
Phoneinfoga Бесплатно (сканирование номеров)
UnamePRO (ТГ-бот) ~10 руб./ запрос
Insight От 50 руб./запрос (трекинг по юзернейму) ВКонтакте:
Sosial Graph Bot Бесплатно
220vk Бесплатно (Трекер активности: лайки, комментарии, друзья)Инст:
IMGINN Бесплатно (просмотр без регистрации)
ListM (набор расширений)Беслпатно (до 500 подписчиков)
Обсудили подробности запуска Entry/ Exit System при въезде в страны Европы. Система будет собирать в электронном виде всю информацию о поездке иностранного гражданина, в том числе его биометрические данные.Запуск состоялся 12 октября, и обновленные пункты погранперехода уже заработали в нескольких крупных аэропортах, а в ближайшие полгода под апгрейд попадут все внешние границы ЕС. В полную силу EES заработает 10 апреля 2026 года.Конечно, это не отменяет взаимодействия с офицерами пограничной службы, но после сдачи биометрии при первом визите, туристы с биометрическими паспортами смогут проходить границу “в режиме самообслуживания”, так что человеческий фактор хоть немного, но сократится.Словом, каких-то особых трудностей, особенно на фоне ситуации с получением Шенгенских виз, у российских туристов не возникнет. Однако это еще один повод вместо обычного загранпаспорта оформить биометрический. Ряд стран ЕС и так уже не ставит визы в не биометрические документы, а так у обладателей паспортов нового образце появится еще и возможность сэкономить время при прохождении границы.#АртурМурадян #КВС_в_туризме

🤖 ИИ-помощники для анализа Excel / CSVПодборка сервисов, которые позволяют загружать Excel / CSV файлы, делать аналитику и получать результаты. Все поддерживают русский язык и имеют бесплатные опции.Но помните про Семинар Введение в HR-аналитику, 30-31 октября 2025 года, офлайн, Москва🔧 Специализированные инструменты1️⃣ Sourcetable - самый мощный инструмент из списка; специально заточен на HR-аналитику, позволяет загружать и выгружать Excel и CSV файлы, строит диаграммы, результаты можно выгружать обратно. Есть бесплатный тариф, русский язык поддерживается.2️⃣ ChatCSV - поддерживает загрузку Excel, выгрузка только CSV. Есть бесплатная версия, русский язык работает.3️⃣ AskCSV - работает только с CSV-файлами. Есть бесплатный доступ, поддержка русского.4️⃣ Aspose Cells AI - умеет работать с Excel, но лучше с CSV. Бесплатные опции есть, интерфейс на русском.⚙️ Универсальные ИИ-ассистенты▪️ChatGPT- можно загружать файлы, анализировать и выгружать обратно с рассчитанными данными. Бесплатная версия есть.▪️Google Gemini (бывший Bard) - работает с Google Sheets, но выгрузка менее удобна. Бесплатный доступ есть.▪️YandexGPT (через Яндекс 360) - умеет работать с таблицами в Яндекс Таблицах, есть бесплатный тариф.▪️СберGPT / GigaChat - в корпоративных решениях Сбера умеет интеграцию с Excel, ближе к BI. Бесплатный доступ ограничен, но есть.▪️Microsoft Copilot - интегрирован в Excel и другие продукты Microsoft 365. Бесплатная версия доступна, но с ограничениями.▪️DeepSeek - новая модель, поддерживает загрузку CSV, работает на русском, есть бесплатный тариф. Обещают мощный прорыв, пока ничего не могу сказать 📌 Вывод:🔹Если нужна глубокая HR-аналитика и выгрузка файлов → Sourcetable.🔹Для быстрых задач подойдут → ChatCSV и Aspose.🔹Для универсальной работы с таблицами → ChatGPT, Gemini, YandexGPT, Copilot, DeepSeek.Понравился пост? Порекомендуй Телеграм канал HR-аналитика коллегам и друзьям
Что такое категориальные данные и как они представлены в Pandas?Категориальные данные — это набор предопределенных значений данных в некоторых категориях. Обычно они имеют ограниченный и фиксированный диапазон возможных значений и могут быть как числовыми, так и текстовыми по своей природе. Несколько примеров категориальных данных — пол, образовательная квалификация, группа крови, принадлежность к стране, время наблюдения и т. д. В Pandas категориальные данные часто представлены типом данных Object.Библиотека собеса по Python
Окей, в стандартных отчетах Метрики данные с Директом не сходятся. Но в отчёте «Директ, Расходы» всё сходиться с «Мастером отчётов» должно? Давайте разбираться. Действительно, логика группы отчётов по Директу в Метрике отличается (в группу входят «Директ, Сводка», «Директ, Площадки», «Директ, Расходы» и «Директ, эксперименты» — скриншот №1).Здесь статистика основана на учтенных кликах — кликах, которые прошли проверку системой защиты от фрода в Директе. Визиты, вызванные кликами, не прошедшими проверку, не попадают в эту группу отчётов.Это значит, что:— В этих отчётах визитов будет меньше, чем в других отчетах Метрики (вычитаем те, что были вызваны аннулированными кликами)— Но количество визитов всё равно может отличаться от количества кликов в Директе (некоторые клики могли не вызвать визит, либо вызвать несколько визитов).Почему клик в Директе может не вызвать визит в Метрике:• Посетитель закрыл страницу сайта до того, как загрузился счетчик• Номер счетчика не указан в настройках кампании Директа • В браузере или ОС пользователя работает блокировщик рекламы, плагин или антивирус, запрещающий загрузку счетчиков• На сайте установлен циклический редирект• Иные технические проблемыКакие еще могут быть расхождения между группой отчётов по Директу в Метрике и самим Директом:✔️В Метрике отображаются кампании Директа, которые есть на логине, под которым вы просматриваете отчет, и кампании, к которым у логина есть представительский доступ.✔️В Метрике содержится информация о расходах на кампании Директа с оплатой за клики или конверсии. Расходы рекламных кампаний с оплатой за показы не отображаются.✔️В Метрике отображаются данные по кампаниям, объявления которых ведут на сайт (не в мобильное приложение).✔️В Метрике расходы отображаются без учета НДС. В Директе — в зависимости от заданных вами настроек.✔️Данные о расходах Метрика привязывает к дате клика. Директ в «Мастере отчётов» тоже. Но в «Отчёте о конверсиях» (что это такое — смотрите на скриншоте №2) расход для кампаний с оплатой за конверсии считается на дату совершения конверсии.✔️Метрика получает данные о кликах и расходах и сопоставляет их с данными о визитах за выбранный период. Поэтому часть данных может не войти в заданный период. Это зависит от модели атрибуции, которая используется в отчёте. Например:
1 октября Вася перешел на сайт по объявлению Директа.10 октября Вася вернулся из закладок и оставил заявку.Смотрим отчет «Директ, расходы», период — 1-9 октября. Атрибуция «Последний переход из Директа» → Мы не увидим визит с конверсией, поскольку он состоялся позже рассматриваемого периода.Смотрим тот же отчет и той же атрибуцией, период — 1-10 октября → Наш визит с конверсией уже попадает в рассматриваемый период. Источник у него будет определен, как «Переход из Директа». Несмотря на то, что посетитель попал на сайт «Прямым заходом».Надеюсь, удалось понятно разложить. Еще подробнее — на грядущем курсе по Метрике👌🏻


Пока я отчаянно пытаюсь найти время на продолжение цикла постов про Concurrency & Consistency хочу поделиться классной методичкой по потоковой обработке данных от признанного специалиста в этой области. Считаю что она незаслуженно обделена вниманием, поэтому исправляю это.Making Sense of Stream Processing. The Philosophy Behind Apache Kafka and Scalable Stream Data PlatformsВ далеком 2016м, Мартин Клепманн (да, это автор того самого кабанчика) написал методичку на 180 страниц в которой очень понятно и доступно рассказывает про:- События, потоки данных.- DDD, CQRS.- Change Data Capture паттерн и при чем тут Kafka.- Как тюнить базы данных под разные сценарии, особенно аналитические.Чем хороша книга - в ней много понятных примеров и иллюстраций. Именно её я советую сейчас и советовал ранее своим менти, когда получал запрос на материалы про потоки данных "понятным языком".Скачать книгу можно бесплатно с сайта автора: https://martin.kleppmann.com/papers/stream-processing.pdfДелитесь в комментариях отзывами если читали, буду рад если посоветуете материалы которые помогли вам быстро вникнуть в тему Stream Processing.P.S. Материал для постов по Concurrency почти готов, скоро будут посты. Будем велосипедить примитивы синхронизации с нуля и сравнивать с эталонными реализациями заодно щупая на практике все проблемы конкурентного программирования.

📐 Измерить площадь на картеОбнаружил функцию измерения площади в Яндекс картах две недели назад и всё это время тестировал точность. Оказалось довольно удобно быстро измерять все реализованные и будущие объекты! Точность для такого инструмента - ок. Не всегда удобно ставить точки у сложных форм.Решил для наглядности замерить разные геометрические формы в Москве. #landscape_X_IT




Обезличивание: как теперь правильно и зачем «ГосОзеро»
С 1 сентября 2025 года правила игры изменились. ППРФ от 1.08.2025 № 1154 закрепил конкретные методы обезличивания персональных данных.Простые замены ФИО на «Иванов И.И.» → «ФИО1» больше не работают. Теперь компании должны документально подтвердить, что обезличивание сделано по утвержденным методам — декомпозиция, введение идентификаторов, перемешивание, преобразование и т.д.ЭТО ВАЖНО, ПОТОМУ ЧТО:Обезличивание стало способом выполнить требование Минцифры о передаче в «ГосОзеро» обезличенных ПДн. И главное — насколько уверенно сможете доказать проверяющим, что вы обезличили персональные данные корректно
Где появляется «ГосОзеро»:
Оператор должен передать обезличенные ПДн по запросу через предоставляемое минцифры ПО.
Для передачи данных в «ГосОзеро» мало убрать паспортные данные, нужно применять один из утвержденных методов.Что делать бизнесу уже сейчас:
#Глоссарий
Министерство цифрового развития и РКН запускают механизм централизованного сбора обезличенных данных — так называемое «ГосОзеро». Смысл в том, что компании должны передавать туда данные только в обезличенном виде, причем по методам, указанным в постановлении правительства. Цель государства проста: собрать большие массивы информации для аналитики и ИИ, но без риска раскрытия личности + повысить защищенность обрабатываемых данных.На практике это значит:
Обезличивание по требованию Минцифры теперь не факультативная практика, а обязательный навык компании, которая работает с данными и подпадает под критерии операторов, которые обязаны передавать ПДн в «ГосОзеро». И чем раньше вы встроите правильные методы в процессы, тем меньше вопросов возникнет при первой же проверке.Нужно разобраться, какие методы подойдут именно для ваших ИСПДн и как подготовить регламенты под новые требования? Мы поможем выстроить процесс без лишних экспериментовПроверить локальные нормативные акты: если регламенты обезличивания уже есть, сверить их с требованиями п. 2 Постановления Правительства РФ от 01.08.2025 № 1154. «Ручная подмена» или удаление одного поля больше не выглядят как надёжная мера.
Проверить, что данные действительно обезличены корректно и реально готовятся к передаче в государственные системы.
Задуматься о методах обезличивания: декомпозиция, введение идентификаторов, перемешивание, преобразование, которые закреплены в ППРФ.

🧬 В России запущена уникальная платформа для мониторинга микробиома при муковисцидозеСмоленский и Самарский медуниверситеты создали платформу AMRcf, объединившую данные микробиологических исследований более чем 200 пациентов с муковисцидозом из 16 регионов страны за 2018-2025 годы. Сервис поможет врачам отслеживать динамику микробиома дыхательных путей и корректировать антибактериальную терапию. По словам разработчиков, аналогов платформы в мире пока нет.
Муковисцидоз – редкое генетическое заболевание, при котором в лёгких скапливается вязкий секрет, создающий условия для хронических инфекций. Пациенты нуждаются в постоянной антибиотикотерапии, однако до сих пор врачи часто назначали препараты эмпирически из-за разрозненности данных. AMRcf позволяет видеть, какие микроорганизмы преобладают у конкретного пациента, их чувствительность к антибиотикам и тенденции к формированию резистентности по регионам. Это открывает возможность персонализировать лечение и снижать риск неэффективной терапии.
Создатели планируют расширять базу: к платформе смогут подключаться специализированные лаборатории. В перспективе AMRcf интегрируют с национальным регистром пациентов с муковисцидозом, что позволит объединить микробиологические и клинические данные и создать комплексный инструмент для врачей.
Профессия – педиатр
🔁 Забудьте о ручном транспонировании! — ТРАНСПЗнаете, как быстро поменять строки и столбцы местами? Многие используют «Специальную вставку», но есть ещё способ!Функция
=ТРАНСП() не просто копирует данные, а создаёт их динамическую версию. Если в исходной таблице что-то меняется — ваша транспонированная версия автоматически обновится!👉 Как использовать?1️⃣ Выделяем левый верхний край для новой таблицы2️⃣ Вводим =ТРАНСП(A1:D10)3️⃣ Жмём Enter✨ Ключевое преимущество:Не нужно обновлять данные вручную — всё происходит автоматически.😎 Продолжаем!@formulalabproЯ много говорю о метриках и об их важности. Но ещё и о том, что с метриками надо быть осторожными. Уже был отдельный пост про последствия возведения в культ только одного из показателей. Теперь давайте поговорим в целом о метриках, которые убивают продукт.Цифры любят все: инвесторы, топ-менеджеры, команды. Но иногда именно метрики становятся оружием массового самообмана (а порой и краха всего бизнеса).Vanity metricsКрасивые графики без пользы. Скачивания приложения, общее количество регистраций, охват в соцсетях. Легко показать инвесторам, приятно размещать в отчёте. Но если эти люди не становятся пользователями, если эти метрики не приносят денег, то это не метрики, а декорации, за которыми всё не так радужно.
В 2017 руководство Medium уволило 50 сотрудников (треть штата), отказавшись от ad-driven модели на основе просмотров и кликов, потому что она вредила качеству контента. Они закрыли офисы в NY и DC, перейдя к подписной модели.Локальная оптимизацияКоманда выжимает CTR кнопки на лендинге, но при этом стоимость привлечения клиента растёт. Продукт псевдооптимизируется кусками, а бизнес в целом — деградирует. Тактическая победа вместо стратегического роста.
В 2010x YouTube отказался от ранжирования по просмотрам/CTR и перешёл к watch time, потому что оптимизация под клики порождала кликбейт и плохой долгосрочный опыт. Отказ от старого ранжирования привёл к постоянному улучшению retention в течение следующих лет.Игнорирование лаговЕсть метрики, которые показывают результат с задержкой. Например, churn по-настоящему проявляется лишь через месяцы. Если реагировать только на «живые» цифры — можно проспать момент, когда продукт уже пошёл ко дну.
Microsoft/Bing описывает парадоксальные результаты в онлайн‑экспериментах: изменения, дающие краткосрочный прирост запросов/дохода, ухудшали долгосрочную ценность. Вывод — нужен OEC и длинные эксперименты.Слепота к качествуВ отчёте всё хорошо: конверсии стабильные, retention не падает. А внутри — тысячи жалоб в поддержку и негатив в соцсетях. Качественные сигналы не вошли в дашборд — значит, их как будто не существует. Но именно они убивают доверие пользователей.
В 2017 Star Wars Battlefront II (EA): монетизационные метрики «сходились», но токсичный опыт вызвал грандиозный публичный скандал. Electronic Arts в спешке отключила микротранзакции в игре.Культ одной метрикиПовторюсь, но любой, кто верит в «сакральную метрику» (будь то DAU, NPS или LTV), подписывает себе приговор. Продукт живёт системой показателей, а не одной цифрой. Ваша драгоценная NSM без сторожевых подружек — просто карго-культ.
MoviePass гнался за числом подписчиков и «ростом», игнорируя юнит‑экономику. Итог — кассовый разрыв, обвалы, массовый отток (с 3 млн до ~225 тыс).Средняя температура по больницеКлассическая ловушка: средний чек растёт, но на деле это два богатых клиента перекрыли отток сотен мелких. Средние значения скрывают дисбаланс. Используйте хотя бы медиану.
Blue Apron: в публичных отчётах были приличные средние показатели и выручка на пользователя, но они не спасли от болезненного IPO и провала — высокий churn съедал экономику.Оптимизация ради отчётаКогда команда работает не на продукт, а на красивую презентацию. Сократили cost per lead? Красавцы. И плевать, что лиды оказались дохлыми. Метрика должна быть инструментом обратной связи, а не фейерверком в презентации. Она обязана показывать реальность, даже если реальность неприятна.
Wells Fargo гналась за KPI по числу открытых счетов: миллионы фейковых аккаунтов, рекордные штрафы и многолетние регуляторные санкции — отличный пример токсичной метрики.Чтобы метрики работали на продукт, а не против него, используйте комплексный подход: 1. Создайте сбалансированную систему метрик (DAU, LTV, churn) для полной картины бизнеса.2. Регулярно проверяйте качественные сигналы и интегрируйте их в дашборды. 3. Проводите длинные эксперименты с OEC, чтобы уловить отложенные эффекты. 4. Используйте метрики для честной обратной связи, а не для красивых отчётов.
Как мы (не) смогли посчитать вакантность жилья в МосквеВ прошлом году мы небольшой командой с помощью методов data-science оценивали вакантность жилого фонда в Москве.Задача была непростая, креативная, и по итогу, сомнительно успешная.Но отрицательный результат - тоже результат, я в этом убеждена.Павел, наш дорогой (во всех смыслах) ИИ из г. Нижний Тагил, взял на себя инициативу и подробно описал весь наш путь - от поискового исследования до статьи в сборник Интеракто-Интергис. Там про все - про анализ космоснимков на засвеченность, анализ фотографий окон домов, наша методология на основании открытых данных. Читайте наше путешествие по данным на Хабреhttps://habr.com/ru/articles/943002/

Что для OLTP хорошо, то для OLAP — смерть: ликбез и выбор серверов📎 Читать статью
Выступал на PML. Мы привезли машину и делали около нее разные активности. Например, в багажнике был экран с примерами фрода и надо было угадать по картинке в чём именно таксисты нафродили. В какой-то момент к машине пришли чуваки брать у меня интервью. Мы с ними договорились что ведущий заставит всех кто в машине пристегнуться. Потому что так безопаснее. А мы топим за то, чтобы люди пристегивались. Пристегивайтесь плиз даже на заднем сидении!!!В итоге челы сидели в машине 15 минут пока я пиздел на камеру. Ну и в качестве вишенки на торте выяснилось что это мои бывшие студенты 🙄
🗺 Causal inference и пространственный treatmentНа Substack Скотта Каннингема вышла заметка Кайла Баттса (доцент экономики в University of Arkansas). Она посвящена исследованию Майкла Поллманна (доцент экономики в Duke University), «Causal Inference with Spatial Treatments».Поллманн рассматривает ситуацию, когда treatment «привязан» не к индивиду, а к месту (location). Тогда ключевой вызов - корректно оценить его влияние на соседние объекты. Он предлагает дизайн-базированный подход (design-based inference), где treatment случайно назначается из множества возможных точек-кандидатов, а контрольные единицы (control units) формируются на основе тех локаций, где treatment мог быть реализован, но не был.Автор критикует стандартную стратегию «внутренний контур vs. внешний контур» (inner vs. outer ring): подход базируется на утверждении, что если бы не treatment, то объекты во внутреннем контуре (близком к объектам «лечения») и внешнем контуре были бы похожи - значит, внешний контур можно использовать как контрольную группу для внутреннего. Поллманн пишет, что «внешние» объекты могут систематически отличаться по пространственным характеристикам. В качестве решения он предлагает учёт пространственной корреляции и использование методов машинного обучения для балансировки по пространственным ковариатам, иными словами - моделирование пространственного распределения.Эмпирический пример - влияние расположения продуктовых магазинов на трафик к ресторанам в период COVID-19: положительный эффект treatment'а заметен лишь в непосредственной близости и быстро исчезает с расстоянием.Работа Поллманна предлагает новую методологию анализа пространственных treatment-эффектов.@evidencespace
Ладно, вспоминаем мем про стадии принятия и едем дальше.У нас на повестке мошенники и идеи на тему того, как можно было понять, что с сайтом для прохождения теста на уровень английского что-то не то (кроме телефона психбольницы в контактах):🌸 Сайт на русском языке и на домене ru. Немного странно для проекта, сертификаты которого ценятся среди американских работодателей больше, чем сертификаты известных тестов и школ.🌸 Дизайн сайта. Выглядит примерно так, как будто его лично я верстала. В ворде.🌸 На сайте нет информации о поставщике услуг (названии компании). Ни в футере, ни в документах.🌸 Домен сайта принадлежит частному лицу и куплен он всего месяц назад.🌸 Политика возврата товаров и услуг на сайте есть (отсутствие галочек опустим), но там написана фигня, ничего общего не имеющая с реальным содержанием сайта. Типа как отказаться от заказанного товара и поменять его на товар аналогичной марки.🌸 Способы оплаты – множество криптокошельков. 🌸 Платить картой можно, но платеж выглядит так: вам дают номер карты физического лица, по нему нужно сделать перевод из своего банковского приложения, и ни в коем случае не писать никакие комментарии при этом. А на сайте потом поставить отметку «я сделаль». Админы проверят и разрешат вам пройти тест. Есть еще запасные варианты – по СБП, например. Там почему-то стоимость меняется, ну да ладно. Кажется, уже более чем достаточно. В следующий раз обсудим еще одну схему, где платить было не надо.
Как автоматизация усиливает безопасность с точки зрения реагирования и профилактики инцидентов?Автоматизированная система ВКК и БМД — это не просто «журнал в облаке». Это центр управления безопасностью.Что она даёт для охраны и контроля:1️⃣ Реестр инцидентов и нарушений в охранном режиме- фиксируются случаи прохода в закрытые зоны, конфликты, сбои видеонаблюдения- категория, место происшествия, дата, действия охраны2️⃣ Автоматическая постановка корректирующих задач- система сама предложит: «обновить инструкцию», «провести внеплановый инструктаж», «заменить нерабочую кнопку вызова»3️⃣ Получение аналитики- Какие зоны «пробиваются» чаще? Где слабое освещение? В какие часы регистрируются инциденты?- Так принимаются управленческие решения в охране на основе фактов, а не ощущений4️⃣ Моментальная коммуникация- Персонал видит инструкции, памятки, маршруты эвакуации - в электронной базе и по QR-кодам- Охрана получает чек-листы и действует по сценарию Автоматизация = системность, своевременное реагирование и контроль исполнения.Это «второй мозг» вашей системы охраны. Без лишних бумаг — но с полной безопасностью.Медицина - это искусство, а рутину мы берем на себя#автоматизацияВКК
Блага человечества Я уже давно хочу написать вам пост про CRM-систему. И как и зачем мы ее внедрили. Я супер обожаю всякие задачники, планеры и тд. И я всегда веду ежедневники. После ухода Notion, я переехала на две платформы: Ynote и Weeek. Ynote служил базой знаний для клиентов. Там мы собираем рабочие области, ведем календари проектов и прочее. А WEEEK был задачником. Там удобный интерфейс и меня это полностью устраивало. Но! Я не могла оценить загрузку команды, как ведутся проекты, кто на каком этапе и прочее. И я начала изучать рынок и что он мне может предложить. И вспомнила про Аспро, о которой рассказывали на дизайн-выходных. Сходили на экскурсию, и теперь за 3000 рубликов в месяц мы имеем: удобный календарь/ базы знаний/ карточки проектов/ CRM с воронкой продаж/ карточки сотрудников и даже финансы в одном месте. Мой тариф самый простой и много функций отрезано, но они мне и не горят пока что. У каждого сотрудника свой собственный лк! Как у больших CRMок!! Я этого не ожидала. Ну и теперь я вижу на каком этапе находится клиент, почему он долго думает, или по какой причине месяц назад ушел от нас. Теперь у меня общий календарь с Тимофеем, благодаря удобной синхронизации, а также мой личный календарь и рабочий разделены. У меня есть удобные таблицы, базы данных и регламенты. И это все в одном месте. Всем участникам проекта приходят автоматически из задачи по этому проекту в выставленные мною сроки. В общем — сказка 🤌🏻Честно, я не знаю как мы работали до этого. Кажется, что левой пяткой.P.S. сколько слов «удобный» насчитали?))))
Как искать данные о судебных делах?Многие наверняка в курсе про медленные и неудобные сайты судов системы ГАС «Правосудие». Если вы когда-либо пытались найти там информацию о конкретных делах, то вы знаете, как это может быть больно.Но теперь данные судебных дел можно искать эффективнее и проще — благодаря парсеру «Судмонстр». ОВД-Инфо разработали его для сбора статистики по политическим делам. Теперь им могут воспользоваться все. Что может «Судмонстр»:• искать по статьям УК и КоАП• выбирать регион и город• фильтровать по ключевым словам• указывать временной период• находить по фамилиям участников дела, включая судей и прокуроров• сортировать по инстанциям и статусам.Парсер работает прямо в браузере, а результаты приходят в Telegram в виде csv-файла.Чтобы начать пользоваться «Судмонстром», заполните эту анкету.Если вы тоже не можете думать о сайтах ГАС «Правосудие» без содрогания, поставьте реакцию 😱

Электронная медкарта 🏥Собрал ультимативный архив медицинских документов за всю жизнь — от детских карт до последних анализов. Теперь всё в одном месте.Что внутри🗂 Чёткая иерархия: по врачам/специалистам, типам исследований и анализов.🔄 Синхронизация между всеми устройствами.🔍 Поиск за секунды: по дате, врачу, типу исследования.📥 Легко поддерживать: закинул скан в нужную папку — и он всегда под рукой.Зачем это нужно- Быстро собрать пак документов для военкомата, вуза и других госструктур.- Не делать одни и те же анализы повторно из-за отсутствия прошлых результатов.- Если у тебя ДМС или ты просто ходишь в богатые клиники, которые не связаны с государственными (у врачей нет доступа к ЕМИАС)- Видеть динамику: сравнивать анализы за годы, снимки МРТ по периодам.- В экстренной ситуации правильное лечение зависит от доступа к вашей истории.🪖Посетил 110+ врачей за последние 4 года в Москве.. Не сказать, что я прям больной, более половины этих визитов было обусловлено желанием найти непризывное заболевание, с чем я успешно справился. Гипопроконвертинемия (дефицит VII фактора свёртываемости крови) мой лучший бронежилет 🪖, другого не надо. Завтра пойду в военкомат, все необходимые бумажки собрал за 10 минут - раньше потратил бы несколько часов.🏥 Про здоровьеНе откладывайте поход к врачу, не растягивайте страдание. Отложенная проблема затратит куда больше ресурсов в будущем. Если накопите несколько, субъективное чувство напряжения возрастет в разы. Решайте все последовательно и по мере поступления.Делается просто: (скрины в комментариях)1. Папки с врачами — туда складывайте осмотры и заключения (скрин 1)2. Анализы разложите по типам: общие (например, биохимия) и профильные под конкретные направления (скрин 2).3. Именуйте файлы так: yyyy-mm-dd_врач, удобно сортировать в любой системе (3 скрин)4. Бумажные документы отсканируйте (на iPhone это удобно делать в Apple Notes — есть встроенный сканер)Испытываю особый кайф от выстраивания подобных систем. Снижается хаос, экономится время на дистанции, в критический момент может сильно выручить. Чем раньше собрать, тем проще жить в будущем. Если нужен мой шаблон структуры/имён файлов — напишите, скину
Друзья, сегодня поговорим о текстовых функция в SQL. 🖥Как и большинство языков программирования, SQL имеет множество встроенных функций, которые позволяют выполнять различные манипуляции с данными. ✅ Одними из самых важных являются текстовые функции, так как таблицы баз данных зачастую содержат немало текстовой информации. К текстовым функциям относятся:⏺CHAR_LENGTH() — для вычисления длины строки⏺LOWER() — для перевода строки в нижний регистр⏺UPPER() — для перевода строки в верхний регистр⏺LTRIM() — для отсечения ведущих пробелов⏺RTRIM() — для отсечения пробелов справа⏺REVERSE() — для переворота строки⏺REPEAT() — для повторения строки⏺LPAD() — для увеличения длины строки до определенного значения путем добавления в ее начало другой строки⏺RPAD() — для увеличения длины строки до определенного значения путем добавления в ее конец другой строки⏺LEFT() — для извлечения определенного количества символов из начала строки⏺RIGHT() — для извлечения определенного количества символов из конца строки⏺LOCATE() — для определения местоположения подстроки в строке⏺REPLACE() — для замены подстроки в строке⏺SUBSTRING() — для извлечения подстроки из строки⏺SUBSTRING_INDEX() — для извлечения подстроки из строки с помощью разделителя⏺TRIM() — для удаления всех вхождений подстроки из начала и/или конца строки🩵 Функции могут применяться как в блоке оператора SELECT, так и в блоках операторов WHERE и ORDER BY.🩵 Все текстовые функции при вызове с аргументом NULL возвращают значение NULL.🩵 Почитать подробнее о текстовых функциях можно по ссылке.Ставьте реакцию:🔥 — если знали все перечисленные текстовые функции👀 — если некоторые увидели впервые#SQL #полезныйматериал #поколениеpython

🚀 Индустрия находится в стадии стагнации, джунов все меньше. Исследование про IT от devby Devby провел большой ресерч опросив 1138 айтишников про всякое и получилась довольно любопытная картина белорусского IT в цифрах. Главное:🔹 Снизилась доля айтишников работающих зарубежом — до 55,3%❌ Волны миграции айтишников прошли, а доля айтишников в Беларуси растет 🏬 72% айтишников в Беларуси работают в Минске 🙍🏼♀️ Каждый четвертый специалист - женщина👨🏼🦱 Средний возраст белорусского айтишника 33,5 лет 💍 Почти треть айтишников в свободном статусе, не состоят в отношениях 👨💻44% айтишников - это разработчики, далее идут тестировщики (11,5%), лиды (7,7%), аналитики (5,5%) и все остальные👶🏻 Доля джунов упала всего до 5% 👉🏻 Исследование целиком #исследования
Борис Пасхавер, «Pandas в действии», глава 3:С помощью параметра 𝚞𝚜𝚎𝚌𝚘𝚕𝚜 функции 𝚛𝚎𝚊𝚍_𝚌𝚜𝚟 можно указать список импортируемых библиотекой 𝚙𝚊𝚗𝚍𝚊𝚜 столбцов.
🍕 Были в офисе DODO Brands (ДоДо пицца и Дринкит) на экскурсии — кайф С одной стороны, удивительная корпоративная культура дерзаний и приверженности продукту. Много свободы и ответственности, нет KPI, штрафов и премий. Гибкий гибридный график, но высокая нагрузка при высокой вовлеченности. С другой — цифровизация и потрясная IT экосистема. Только сейчас поняла, насколько мощной движущей силой бизнеса является именно дилжитальная часть. В цифрах буквально все. Каждый процесс, операция, метрики. Просто космос. А на фото — коробки пиццы из разных, серий, коллабораций, которые команда заботливо собирает. Очень круто.

Как масштабировать компанию?Прежде чем масштабировать бизнес и расти, нужны ресурсы - деньги, люди, сильное желание, цель и план. Но только когда входишь в этот процесс, становится очевидным что все вышеперечисленное бессмысленно без системы, разумной бюрократии и автоматизации.Ибо все дыры людьми не заткнешь и чем больше людей, тем больше вероятность ошибки, а значит неустойчивее система.Мы взяли курс на рост Holy Cow Phuket с простой, но амбициозной целью - стать самой дорогой и самой крупной, а по пути, надеюсь, самой богатой управляющей компанией на острове Пхукет. Расти можно было качественно или количественно. Мы решили расти в обоих направлениях сразу, ибо «поркуа бы и не па».Начать решили с документов и процедур. Но не волнуйтесь, я не буду грузить вас про наши должностные инструкции и протоколы, которые мы создаем и дорабатываем уже несколько месяцев. Лишь поделюсь c вами открытием: Мы боялись, что после внедрения многобуквенных должностных инструкций наши тайские менеджеры если не разбегутся, то могут взгрустнуть и начать саботировать процесс. А вышло все ровно наоборот. Когда мы выдали им понятные, полноценные инструкции и протоколы, они начали трудиться четче, быстрее и стало существенно меньше вопросов. Они начали проявлять инициативу, стремиться к бонусам. И даже система KPI со штрафами их не напугала. Они отнеслись к ней с пониманием и уважением. Вот так поворот!Дальше интересней. Бумажки и инструкции это лишь первый этап оцифровывания бизнеса. Второй этап - автоматизация.Ведь несмотря на синхронизированную центральную систему резервации, бота с искусственным интеллектом и мощный сайт, уровень автоматизации, аналитики и учета в компании оставлял желать лучшего. Как говорится Excel - наше всё! Однако, если покумекать, то можно создать собственную кастомную систему аналитики (читай динамического ценообразования) и учета, на которую можно навесить и кабинеты владельцев и управленческий учет и в перспективе даже приложения для менеджеров по заселению с клиентами, а то и, чем черт не шутит - работу с подрядчиками.К сожалению, ни одно из имеющихся на рынке решений полностью или частично не отвечало нашим требованиям. Одни были слишком громоздкими, другие недостаточно гибкими, третьи слишком дорогими. И 100% из них хотели получить существенную абонентскую плату за не устраивающий нас продукт.В итоге мы решили, что пора писать свою базу. Плюс у меня есть опыт в создании кастомных систем учета. Разбил на 5 блоков, написал под каждый техническое задание и запустил процесс. Первые же результаты вызвали у нас преждевременный мозговой оргазм. Иметь все данные по статистике заполняемости и окнам бронирования на любые даты в пределах от -5 лет до +1 год, это дорогого стоит, спросите любого управляющего! На базе этого можно как анализировать эффективность текущего периода и тренд, так и принимать осмысленные решения о ценообразовании.А то ли еще будет! Расскажу позже, когда появятся еще результаты. Продолжение следует ;)

Довелось принять участие в крайне любопытным проекте по вопросам цифровизации, Китай ожидаемо оказался наиболее репрезентативным и сложным кейсом. К сожалению, многие важные детали пока остаются не для разглашения, статью пришлось делать очень обтекаемой и общей. Но возможно, даже она сможет показать, какие сложные и насыщенные процессы разворачиваются в Китае, важные как для китаистов, так и исследователей в области судопроизводства.
📎Автоматизируем подготовку промтов для GPT: Python-функция для детального описания DataFrame🕵♂️Следствие установило, что для получения качественного ответа (без загрузки базы в чат) часто приходится потратить довольно много времени на описание таблицы, где какой тип данных, примеры, формат, количество nan значений, диапазон дат и прочие нюансы.Будто при допросе вместо описания преступника, следователь внимательно изучает все родинки у допрашиваемого лица. И у адвоката.⏰В качестве жертвы у нас рабочее время, которое можно потратить на описание задачи.В какой то момент я подумал, а почему бы не сделать универсальную функцию которая будет собирать эту информацию за меня, и до кучи сразу писать какой-нибудь усредненный промт (обычно писать мне его лень, и вы можете его подкорректировать под себя)⬇️ В общем вашему вниманию представляю эту функцию.Всё что нужно, это вставить код в ячейку, и в следующей команде указать ваш датафрейм. Принт выведет вам готовый промт с описанием вашей таблицы, расскажет тип данных каждого столбца, покажет примеры значений, диапазоны и количество пропусков, а заодно проверит датафрейм на дубликаты.Простой пример на основе календаря, но в функции учитываются и числа с точкой.prompt = generate_df_prompt(calend, "calend") # Второй аргумент имя таблицыprint(prompt)Сама функция в первом комментарии к посту✏️ А как вы готовите промты для анализа данных? Делитесь вашими лайфхаками в комментариях. И ставьте 🐳 если используете ИИ.