Дашбордец


Channel's geo and language: Russia, Russian


Привет, котятки) Я Даша, и это мой уютный канал про дашборды - от бизнес-анализа до реализации на BI. Темы канала: data viz, BI, dashboards, DWH. Рекламы на канале нет.
По вопросам писать: @Dddv_2705

Related channels

Channel's geo and language
Russia, Russian
Statistics
Posts filter


Forward from: Данные на стероидах
Привет!

Когда у компании много источников, и нет адекватной инфраструктуры хранения, обработки и доставки данных — это всегда боль для аналитика. Проблема не только в рутинных операциях а-ля «выгрузи кучу данных в разных форматах из разных источников и попробуй с ними поработать». Самое неприятное, что после всего этого приходится долго и нудно доказывать бизнесу, что твоим отчетам можно верить.

Ситуация распространенная, и встречается не только в небольших компаниях, но и во вполне крупных, если работа с данными для них не основной бизнес. Что с этим делать?

Об этом мы поговорим на вебинаре 28 февраля в 17:00.

Алексей Белозерский, архитектор VK Cloud, расскажет и покажет:

🔹 Почему не стоит называть BI+Excel+Data Sources аналитической инфраструктурой (даже если очень хочется).

🔹На каких принципах строится DWH, ETL, BI, какие инструменты можно задействовать и в чем их плюсы/минусы. Можно ли собрать полноценную инфраструктуру своими руками или с небольшой командой.

🔹Live demo: эксплуатация системы.

🔹Ответы на вопросы, конечно, тоже будут — в конце вебинара QA-сессия.

Присоединяйтесь вот по этой ссылке.


Котятки🐱,
Когда мне говорят слова push и pull, я вспоминаю что-то, связанное с паттернами API или, в крайнем случае, etl- стратегии (хороший обзор тут).
Вчера пыталась развернуть себе Metabase, и внезапно нашла удивительную статью, как концепцию "push vs pull" применять в контексте формирования data- культуры и глобальной стратегии поставки аналитики пользователю, - фактически, как кусок BI-стратегии в аспекте бизнес-процесса деливери:
https://www.metabase.com/learn/analytics/push-and-pull

P. S. Кажется, этот приём называется методом переноса, вот тут на Хабре интересно написано:
https://habr.com/ru/companies/ruvds/articles/751328/


Котятки🐱,
Мои друзья коллекционируют классные идеи и классные места, я же, увы, коллекционирую только лайфхаки, как делать работу быстро (и максимально чилить) и красивые дашики.
Сегодня делюсь:
1) фишкой, как сделать диаграмму санкей с метками в PBI (чтобы больше не рисовать её вручную на слайдах каждый раз) :
https://www.youtube.com/watch?v=W8xjjdzLqmI
2) сайтиком с интересной инфографикой, которым я тренировала насмотренность последнюю неделю:
https://coolinfographics.com/

Пусть ваши выходные закончатся чудесно)


Котятки🐱,
любой инструмент можно украсить бантиками, поэтому в Postgresql полно extentions, а к крупным BI-инструментам делают платные плагины.
Нашла неплохой плагин фильтрации для Power BI.
Пользоваться им я, конечно, не буду, денег на мои эксперименты мне никто сверху не отсыпает, но вот порекомендовать хорошую статью в их блоге про проектирование фильтров и срезов - с объяснениями, примерами и правильными вопросами, которые надо задать самому себе - это легко.
Читать тут: https://okviz.com/blog/design-guide-for-power-bi-slicers-and-filters/

P.S. Ставьте лайк если нужно нормально оформить, обогатить и перевести на русский. Я тут думаю завести бложик, так как статья про тарантул никуда не ложится, нужно ваше авторитетное мнение.


Котятки🐱,
мой инсайт сегодняшней недели - это слайсер для оси времени, который может работать как ползунок (он же - полоса прокрутки, он же timeline slider).
Это по факту наш любимый календарик с альтернативным выбором способа фильтрации.
Я его люблю в Qlik и искренне никогда не могла пользоваться решением в power bi, неудобно
Вспомнила я о нем потому, что нашла совмещенный слайдер времени с диаграммой.
Помнится, я смогла его однажды нарисовать в формате макета, но вот с механикой было тяжко - мне не хватило фантазии додумать, как он должен работать.
И вот он, маленький:
https://codesandbox.io/p/sandbox/timeline-slider-with-bar-chart-f2381e?file=%2Fsrc%2Findex.js


Котятки🐱, я держу в бэклоге набросок статьи с кодовым названием "Мой домашний тарантул", всё никак руки не доходят доделать из неё полноценный пост) Поэтому давайте поддержим моих любимых коллег, у них там есть на что посмотреть👆


Forward from: Базы данных & SQL
Вебинар Tarantool «Анализируем данные в real-time»

Когда: 21 февраля, 16:00 МСК
Где: онлайн

Расскажем, как организовать анализ большого объема данных в реальном времени с помощью in-memory колоночной СУБД. На вебинаре поговорим о том:

• Как объединить транзакционные и аналитические (OLAP и OLTP) системы и сократить затраты на дублирование данных.
• Как ускорить аналитические запросы и формировать отчетность в real-time.
• Как организовать хранение и управление данными (Feature Store) для ML-задач.

Также мы рассмотрим практические кейсы применения продукта Tarantool Column Store: формирование финансовой отчетности с минимальными задержками, ускорение и повышение точности антифрод-систем, повышение производительности системы выдачи кредитов.

Спикеры:

• Николай Карлов, директор инновационных проектов VK Tech,
• Руслан Галиев, продуктовый менеджер Tarantool Column Store.

Вебинар будет полезен архитекторам, дата-инженерам, инженерам DevOps и разработчикам аналитических систем.

Регистрация


Котятки🐱,
Бывает, что даже при построении операционной отчётности, возникает вопрос: а с чем сравнивать значение метрики? Что есть норма и в какой форме её "подавать" на графике?
Простой план-факт анализ часто упирается в проблему: то, с чем хочет сравнивать пользователь, сильно определяет форму визуализации.
Простые случаи, которые мы наиболее часто визуализируем:
-норма - это простое плановое значение (=сравнение с эталоном, заданным параметром)
-норма - это значение предыдущего периода (и у нас динамика). Хорошая статья тут: https://www.domo.com/charts/period-over-period-charts
-норма - это некое расчётное среднее/медиана/любой квартиль (и на графике появляется ещё одна рассчитанная метрика, которая, однако, не является независимой)
Сложные случаи:
-норма задана в видна границы от и до, и на самом деле мы ищем места, где метрика "вышла за корридор"
-нормативным значением в моменте принимается другая метрика, которая от нашей не зависит (похоже на сравнение с эталоном, где эталон - это динамический ряд, а не конкретное значение). В худших случаях норма - это результаты некой функции.

Что всегда интересно визуализировать:
-случаи, когда норма - это тренд или соответствие тренду (темпам изменений) некой другой метрики (и тогда здравствуй data blending https://t.me/dashboardets/215)
-определенной нормы нет, но пользователь должен иметь возможность задать её как параметр
-случаи, когда наша метрика -это частота, интенсивность, и для неё план - это попадание в значение некого диапазона (но их несколько, и коридор уже не нарисуешь, так что привет всяким тепловым картам), и тут априори мы включаем цветовое кодирование
-сравниваемое значение - это территория/участок/кластер(часто используется на картах, но бывает и на графиках сетей). Тут уже мы можем поиграться с визуализацией с помощью "маски", где можно задействовать не только цвет, но и размер.

Что почитать:
-немного теории про показатели и метрики: https://babok-school.ru/blogs/metrics-and-kpi-technique-from-babok-and-product-analytics/
https://www.quanthub.com/designing-charts-relative-and-absolute-measurements/
-очень стандартный подход к выбору визуализаций для показателей сравнения :
https://www.geckoboard.com/blog/6-data-visualization-techniques-to-display-your-key-metrics/
-подходы и типы диаграмм, которые используются в операционных панелях, когда "нет времени объяснять": https://www.dimins.com/online-help/diveport_admin_help/Content/Reference/indicator-types71.html


Forward from: Чартомойка
Хорошая статья с описанием ошибок в научных визуализациях. Помимо широко описанных, есть и довольно специфичные именно для научных, рекомендую к прочтению.

https://habr.com/ru/companies/ruvds/articles/776672/

Оригинал на английском


Котятки🐱,
Меня всегда восхищали шайтан-машинки campaign management, которые позволяют формировать выборки под любой запрос буквально на лету с учётом кучи доп факторов и ограничений.
Но когда денег на них нет, а ваш набор клиентов - отнюдь не биг дата, а вполне очерченный круг, ваш лучший друг BI-разработчик вполне способен соорудить вам динамическую сегментацию)
Например, по этому гайду:
https://www.daxpatterns.com/dynamic-segmentation/


Forward from: Инжиниринг Данных
Термин data observability достаточно недавно стал применятся к хранилищам данных и ETL. Раньше просто говорили - качество данных.

The concept of data observability was first described by Barr Moses, co-founder and CEO of software vendor Monte Carlo Data. Moses coined the term in 2019, when she wrote a blog post about applying the general principles of observability for IT systems to data.



а сам термин observability пришел из devops, подразумевает процесс мониторинга ИТ систем и возможность быстро найти причину неполадки.
Где как не на сайте Мonte Carlo можно узнать больше про data observability - What is Data Observability? Для меня это просто процесс мониторинги всего чего только можно в нашем хранилище данных и случае отклонения -> ⚠️.
Самое интересное у них это типы "мониторов", то есть типы проверок ваших данных, которые могут покрыть все решение. Я сам пользуюсь уже год, и продукт мне нравится, а недавно мы стали интегрировать dbt и MC.
Если нет денег на MC, всегда можно подсмотреть идеи у них и уже сделать с помощью dbt, python, или какой язык вы там используете.


Котятки🐱,
рылась вчера по своему гиту - и нашла в закладках пример "от заявки до поставки": расписанный кейс с выделением бизнес-требований, постановкой, пошаговым построением дашборда, элементами анализа и выводами) В целом, очень неплохой комплексный пример, который раскрывает пайплайн работы BI-аналитика.
Чтобы сформировать понимание "а чего ждут от BI-аналитика" - самое оно.
Линк:
https://github.com/prachitqwer/Power-BI---Product-Rationalization




Котятки🐱,
Обычно я в офис хожу за едой, признаюсь честно) Но вчера между поисками печенек и энергетиков успела зарулить на VK Data Meetup.
Ссылка на запись: https://www.youtube.com/live/BGTF6TefJdA?si=HqJkVrUXNTkofrcQ
Мои выводы и прогнозы на 5 лет по итогам докладов (главное, не забыть этот пост):
-крупный кровавый энтерпрайз породил много новых ролей и процессов в data- сфере, которые в принципе не применимы для средних и маленьких бизнесов, и разрыв в майндсетах будет только расти;
-роль лидера и визионера занижается, а руководство в стиле "data-driven decision" ставится во главе угла. В итоге, учитывая тренды развития нейросетей, многих мидл-менеджеров можно будет заменить ИИ, а гуманитарии просто всех порвут;
-профессию Data Steward также будет сжирать ИИ;
-мы уже сейчас не спрашиваем пользователя, что ему нравится, а пытаемся проанализировать его поведение, и пользователь как бы "запирается" между популярным и предпочитаемым. Но, как выразился один гениальный маркетолог, "пользователь не любит знать правду о себе", поэтому выиграют те рекомендательные системы, которые научатся слышать глубинные мечты;
-опенсорс всех разорвёт, ибо он становится всё более friendly. Зачем платить за SAS DQ, если есть Great expectations?
P. S. Самый лучший доклад, по моему скромному мнению, - у Алексея Ерюкова, про data quality. На видео начинается примерно с 2:00:00.


Forward from: Визуализируй это!
Пока я тут путешествовала, выложили шортлист премии Information is Beautiful!

В этом году туда попали несколько работ знакомых:
1. Визуализация рынка акций США Market Map от Никиты Рокотяна в категории Business Analytics.
2. Визуализация Divided World с разными экономическими показателями в разных странах от Ромы Бунина в категории Humanitarian.
3. Постер по рок-опере Jesus Christ Superstar от Нади Андриановой в категории Arts, Entertainment & Culture.

И ещё одна необычная работа из России:
Инсталяция про загрязнение воздуха в категории Unusual.

И отдельно ещё пара работ, которые мне очень понравились.
1. When I Was Your Age — сравнение привычек американцев разных поколений.
2. Библиотека цветов традиционной китайской живописи.

До конца этой недели ещё можно проголосовать, чтобы помочь работам получить приз зрительстких симпатий! Для этого нужно зарегистрироваться на сайте и на странице каждой работы нажать кнопку “Vote”. Можно проголосовать только 1 раз в каждой категории.


Котятки🐱,
Я достаточно прохладно отношусь ко всевозможным сертификациям по использованию BI- инструментов, ибо скорость выпуска релизов, да и смены технологий в целом , столь высока, что знания быстро устаревают (если, конечно, ты не работаешь с этим каждый день) .
Но PL300 - экзамен по Power BI -я люблю нежно, ибо часто даю задачки из него на собеседованиях.
Линк на задачки с ответами и пояснениями:
https://www.examtopics.com/exams/microsoft/pl-300/view/1/


Forward from: Power BI Design
Всем привет!
Приглашаю на бесплатный вебинар 13.09.23 в 19:00 мск на тему:
"Как снять ТЗ с заказчика и отрисовать макет за 30 минут в On-line".

Меня часто нанимают в продуктовые команды, чтобы собрать всю нужную информацию с заказчика и вместе за ручку с ним отрисовать макеты.
Полагаю, что каждый найдёт для себя интересные приёмы.

Приходите, покажу свои наработки и поделюсь макетами и алгоритмами.

✨Бесплатно. Буду рада вашим вопросам.

Регистрация по ссылке:
https://analyticworkspace.ru/tz-za-30-min


Котятки🐱,
Сегодня ко мне залетел такой редкий зверь, как Orbit chart. Использовала его в промышленных макетах один раз, но показываю их в портфолио до сих пор)
Ну и в презах они хорошо смотрятся.
Туториал
Гид по построению в Tableau: https://tableau.toanhoang.com/drawing-orbit-charts-in-tableau/


Котятки🐱,
Казалось бы, про визуализацию временных рядов уже всё сказано... И всё равно что-то - да и может нас удивить. Потоковый граф меня сильно озадачил, а вот heat map для иллюстрации сезонности, - прямо стоит отметить.
Линк: https://humansofdata.atlan.com/2016/11/visualizing-time-series-data/


​​Котятки🐱,
Сегодня у меня необычная связочка, - паттерны дизайна дашиков+ нейросеть.
Что делали: выбирали паттерн отсюда для понимания структуры, искали референсы на behance или в своём архивчике и потом с помощью нейросети https://imagevariations.com/ генерировали похожие изображения.
Зачем: когда-то на заре работы наш великолепный дизайнер дашиков давала на вход заказчикам несколько макетов, чтобы они отчего-то оттолкнулись, и потом их кастомизировала. Количество итераций иногда было болезненно. Текущий способ реально чуть шакальный, однако быстро помогает выбрать фрейм и экономит время дизайнера на уже точечную проработку макета.

20 last posts shown.