Чартомойка


Гео и язык канала: Россия, Русский
Категория: Технологии


О графиках: плохих, хороших и других. От восхищения до ненависти — один chart.
Заметили подозрительный график, присылайте — @bogachev11


Гео и язык канала
Россия, Русский
Категория
Технологии
Статистика
Фильтр публикаций


Просто симпатичный график о смертях от ДТП в Осло.

Нравится как решен показ неполноты данных с 1975 по 2000 год. Линия времени непрерывная, и данные показаны только там, где они были.

(И да, в Осло, где живет 600 с лишним тысяч человек за год от ДТП погиб один водитель, 0 пешеходов, 0 велосипедистов)

#датавизприемы


Репост из: Reveal the Data
⚡️Yandex DataLens в open source!
Сегодня для DataLens большой день, теперь доступна open-source версия инструмента. Каждый может предложить улучшения на GitHub или доработать инструмент под себя и использовать на своих серверах. Это первый релиз и со временем работа c открытой версией будет проще и удобнее. Комьюнити очень круто выиграет от того, что это не просто open source, а коммерческий проект, который будет развиваться профессиональной командой.

Я наблюдал за проектом со стороны и был удивлён тем, что выйти в open source — это совсем не «мы просто сейчас возьмём репозиторий, в github переложим и всё». Было проделано много работы: с кодом, сборкой проекта, дизайном, юридическими нюансами (оказывается их очень много!) и работой с зависимостями.

🎉 Поздравляю всю команду проекта! 💪

🔗 Ссылки
Сайт проекта
GitHub
Статья на Хабр
Чат DataLens
P.S. А ещё классный новый логотип во всех версиях =)
#ссылка


Репост из: Weekly Charts
🤖 Rtutor.ai для работы с вашими данными с помощью запросов на естественном языке

Steven Ge написал приложение RTutor, которое позволяет генерировать и тестировать код на языке R, просто "общаясь" с ним. Например, на основе набора данных mpg можно задавать такие вопросы: "С помощью ggplot2 создай боксплот (boxplot) для зависимости hwy от класса. Цвет по классам. Добавь джиттер" (Use ggplot2 to create a boxplot of hwy vs. class. Color by class. Add jitter).

RTutor сгенерирует функциональный код для ответа на ваш вопрос, что упрощает проведение предварительного анализа и визуализации данных для тех, кто не имеет опыта работы с R. Тем же, кто имеет опыт работы с R, RTutor поможет сэкономить время, предоставляя код, который можно использовать в качестве отправной точки для своих проектов.

RTutor может быть запущен локально как пакет R. Он также генерирует код R в формате Markdown и html-отчеты.

#R #ggplot2 #AI #chatGPT


Вообще, Лиза Шарлотта Мут из Датавраппер справедливо указывает, что WCAG не вполне применим к визуализации данных. И рассказывает о том, что Эндрю Сомерс разрабатывает собственный стандарт — APCA, который даёт более адекватные результаты по контрасту цветов, в применении к визуализации данных.

Кроме того, на различимость цветов влияет не только яркость фона и основного цвета, но и размер цветового элемента, характер фона (на темном фоне светлые оттенки более различимы, чем наоборот), качество экрана, конкретные оттенки, освещенность окружающей среды, отступ до краев фона и другие.

В качестве примера, я хочу показать инфографику, которая использовалась в рекламе Экономист про города, наиболее пригодные для жизни. Я проверил их через WCAG — и результаты получились катастрофические. 3 цвета из 5 имели недостаточный уровень контраста по WCAG — 1,02, 1,44, 1,87, а еще один — 2.22 — тоже ниже нормы по контрасту. (Норма — 3:1 и более для крупных элементов и 7:1 и более для мелких)

Эндрю Соммерс предлагает свой инструмент для стандарта APCA. Я проверил картинку от Экономист там... и результаты оказались теми же самыми :))

45% — это минимум для крупного текста (аналог 3:1 для WCAG). 60% — норма для среднего размера объектов. И для мелких объектов контраст должен быть не меньше 75%. Этот тест также прошел лишь один цвет. Добавим, что еще и точки очень маленькие.

(Вообще, я обратил внимание на эту картинку именно потому, что засомневался, что бледно-желтый проходит по читаемости, потому что на телефоне эти точки было не видно вовсе)

Сложно понять, чем руководствовались дизайнеры Экономист, возможно это просто картинка для промо, и она и не должна была быть 100% читаемой, но очевидно, что бледно-голубой и бледно-желтый на этом сером имеют катастрофически низкий контраст.

Пожалуйста, продумывая цвета для датавиз, учитывайте не только их функциональность с точки зрения выполнения датавиз-функций, эстетику, но также не забывайте про различимость их между собой и с фоном.




Репост из: настенька и графики
Sam Epley сделал инструмент для проверки контраста и восприятия цвета. Он опирается на The Web Content Accessibility Guidelines (WCAG) стандартам, чтобы текст и цвет легко читались и воспринимались.

Можно выбрать цвет фона, текста и тип начертания и он подскажет, какие стандарты вы нарушили, и предложит более оптимальные варианты.

Про сам стандарт и как с ним работать.


Артём Иволгин, один из лучших журналистов-инфограферов в нашей стране, выпустил новый проект — про то, как меняется популярность имен в России. Глубокая работа с множеством прекрасных визуализаций, которые могут стать референсами и для ваших проектов. Причем интересны не только вид визуализации, работа с цветом и подписями, но и работа с данными и сторителлинг-ракурсы этих визуализаций.

https://journal.tinkoff.ru/name-stat/


Есть, кстати, еще один популярный спор насчет инфографики. Джанк-чарты (или графики, сделанные специально, чтобы привлекать внимание, но искажающие значения) могут быть такими же эффективными в точности представления информации, и при этом сильно выигрывать по наглядности, вовлечению и запоминаемости. Противоположное мнение состоит в том, что джанк-чарты должны умереть, ведь они как минимум подают плохой пример.

Давайте сравним. График слева я нашел в интернете. А график справа сделал сам.

Какой лучше?

Если исходный, ставьте ❤️,
если переделанный — 🔥.


А сечёт!


Планы на среду: прокачать SQL и расчет продуктовых метрик!

📣 20 сентября в 19:00 по Мск пройдет бесплатный live-интенсив по теме: “Расчет продуктовых метрик с помощью SQL”.

Мы проводили такой интенсив в прошлом месяце, но многие не успели на него записаться, а очень хотели — поэтому мы решили, почему бы не провести его еще раз 😍
А еще он очень понравился участникам, и мы собрали много положительного фидбека 💫

👉🏻 На live-интенсиве мы с вами подключимся к реальной облачной базе PostgreSQL и с помощью SQL рассчитаем основные продуктовые метрики онлайн-сервиса:

* Activation rate
* MAU
* ARPU и ARPPU
* другие метрики

На интенсиве вы узнаете:

◾️ Как используют SQL в реальной работе — вы сможете сохранить это в портфолио и показать на собеседовании: работодатель точно оценит 🤘🏻

◾️ Профессиональные фишки и лайфхаки SQL: мы копили их годами и хотим рассказать вам 😏

◾️ Как писать код на SQL, а также мы расскажем про продуктовые метрики — подробно объясним всё с нуля 😍

🔗 Регистрируйтесь по ссылке


Реклама. ООО АЙТИ РЕЗЮМЕ. Erid:LjN8KWcDm


Репост из: Домашка.
Классный получился эфир. Всем спасибо, кто пришел, прокачали компоненты, интерактивные прототипы и конечно же графики 😏

Спасибо Явно.Дизайн в лице Антона, Миши, Ники и Оли, что поучаствовали в Домашке и отдельное спасибо Саше Богачеву, что залетел в нашу движуху и дал полезные комментарии по графикам!

⚡️ Обязательно подписывайтесь на канал Явно.Дизайн и на канал Чартомойка про графики, их критику и переверстки, датавиз-сообщество, который ведет Саша.

И пока тепленькое, ловите полезные ссылки, которые упоминались на эфире и не только:

✦ На русском:

«Графики, которые убеждают всех» лучшая современная книга на русском языке про базовые знания по визуализации данных и графикам;

Постер от Саши, который помогает выбрать тип графика;

Постер по основным ошибкам в графиках от агентства DataYoga;

Сборник шпаргалок по способу выбора типа графика/визуализации от них же;

Подборка папок с ТГ-каналами по инфографике, визуализации данных и аналитике;

✦ На английском:

Заметки Лизы Шарлотты Мут про цвет в блоге инструмента для визуализации Datawrapper, которые скоро станут отдельной книгой. Новости про книгу тут;

Lisa Sharlotte Muth Songbook миро-доска выжимка с подсказками по улучшению графиков по мотивам статей Лизы.

Запись эфира будет чуть позже 😎




Репост из: Data Nature
Info Design Songbook - Сделали с чудесной @nastengraph сборник do's / don'ts визуализации данных от экспертов

🗺 Борд в Miro

Давно была идея сделать сборник бестпрактик инфодизайна. Причем не своих, а от экспертов в авторитете.
Главная цель консолидировать всю суть без спекуляций в доступном для восприятии виде.

❤️ Серия статей от Lisa Charlotte Muth очевидно была первая в списке.
Этот автор отличается тем, что очень глубоко копает, круто и понятно объясняет. При этом ее рекомендации точны, они практически не вызывают желания их в чем-то оспорить (или есть такие примеры ?)

Борд можно включать в learning paths для data/bi аналитиков, в планы развития, в онбординг планы новичков, вo внутрикорпоративные курсы по визуализации данных.

Мне сложно придумать более наглядного способа показать как нужно и как не нужно дизайнить графики и при этом не заставлять читать книги - это делают единицы в итоге. А залипать в борд пока нравится большинству.

Есть уже идея, какого автора следующим добавить на борд.
Но мы примем и ваши предложения👇


Репост из: Магия Excel
Автосумма: одним движением суммы по всем столбцам/месяцам.

Сочетание клавиш Alt + = позволяет получить сумму быстро, не вводя руками функцию СУММ / SUM.
Если выделить ячейку под столбцом с числами и нажать Alt + =, то получим сумму по этому столбцу (одну функцию СУММ).
Уточняем: речь про "просто Alt", то есть левый Alt. Правый Alt заменяет сочетание Ctrl+Alt и в сочетании с плюсом-минусом будет менять масштаб листа.

А если - как в видео - выделить диапазон из нескольких столбцов и строк вместе с пустой строкой под ним и столбцом справа, то мы получим суммы по каждому столбцу и строке (и итоговую справа внизу).


Репост из: data.csv
Друг сегодня скинул тред в твиттере и спросил, считаю ли я этот график манипулятивным.

Короткий ответ — да, но не по той причине, о которой пишет автор твитов.

Длинный ответ:
1. Если мы используем в визуализации столбиковую диаграмму, то всегда должны строить её от нуля. Когда мы смотрим на столбики, то всегда сравниваем их длину. Тут кажется, что температура на первом столбике раз в пять меньше, чем температура на последнем столбике, что явно не так.

2. Вообще-то далеко не всегда нам надо сравнивать величины друг с другом, иногда нужно показать динамику или ранжирование. Сравнивать температуры между собой вообще немножко бесполезно, учитывая, что понятие нуля там неоднозначно.

Как можно было бы построить этот график иначе?
Лучший вариант — оставить просто точки или линии на значениях температур. В Data Viz Project это называется Dot Chart.
На худой конец можно использовать «леденцовый» график.

В этих случаях мы акцентируем внимание на положениях точек друг относительно друга, не сравнивая сами величины друг с другом.

Линейный график здесь использовать нельзя, потому что значения идут не в хронологическом порядке. Об этом — в следующем пункте.

3. Я не считаю ранжирование по значению температур манипуляцией. Здесь была задача показать рейтинг, это валидная задача.

Правда, в данном случае рейтинг очень сложно считать, потому что подписи лет перевёрнуты.
Лучше всего было бы располагать столбики друг под другом, а не слева направо.

Можно было бы попробовать ещё раскрасить подписи лет разными цветами — например, более близкие к современности красным, а более близкие к прошлому — синим. Тогда бы сразу стало понятно, что на первых местах в рейтинге — последние годы.

Какие ещё мнения? Пишите в комменты :)


Репост из: настенька и графики
Паспорт Сингапура дает возможность путешествовать в 193 страны без визы. А есть одна страна, которая очень символично лежит на графике почти посерединке и дает возможность путешествовать в 112 стран (что почти среднее значение). Эта же страна объединяет два континента.

А поисследовать можно тут.

ps beeswarm график делала через ladataviz, просто 5 минут и основа графика уже есть, прямо топ




Люди обычно не осознают как важно на графиках "ничего". Часто это "ничего" — именно то, ради чего график и делается.


Как строить прогнозы в нестабильное время?

И что делать, когда модели перестают работать, а сезонность больше не актуальна? На эти вопросы продуктовые аналитики Тинькофф и Яндекс Еды ответят на IT’s Tinkoff Product Analytics Meetup 30 августа.

Команды обсудят:
— как работала команда Тинькофф Путешествий в периоды резкого повышенного спроса;
— как под воздействием внешних обстоятельств и целей адаптировался алгоритм ценообразования в Яндекс Еде;
— из чего должны складываться прогнозы в нестабильное время.

После докладов будет нетворкинг и душевные разговоры о цифрах и не только.

📆 Митап пройдет 30 августа в Москве в офисе Тинькофф на «Водном». Не забудьте зарегистрироваться и позвать с собой коллег.

#направахрекламы



Показано 20 последних публикаций.