data.csv


Гео и язык канала: Россия, Русский
Категория: Новости и СМИ


Блог о журналистике данных и дата-сторителлинге
======
Канал ведут:
@BlackPineapple — аналитик в службе дата-журналистики Яндекса,
@marohovskaya — редакторка дата-отдела «Важных историй»

Связанные каналы  |  Похожие каналы

Гео и язык канала
Россия, Русский
Категория
Новости и СМИ
Статистика
Фильтр публикаций


Пока москвичи радуются стремительному развитию транспортной доступности, метро в других городах не может похвастаться такими успехами

Собака.ru в новом дата-материале рассказывает, как обстоят дела в Северной столице. За последние 10 лет метро в Питере строилось даже хуже, чем в 90-ые, хотя планы были хорошие...

https://www.sobaka.ru/city/transport/194548


Коллеги собрали красивый-красивый проект о том, когда ставят встречи пользователи Яндекс Календаря

Помимо «солнца встреч», которым можно полюбоваться в начале лендинга, есть много занятных выводов.

Например, что в начале дня чаще ставят более длинные встречи. Или что раньше всего встречи ставят сотрудники ЖКХ и производств, а позже всех — айтишники и креаторы.

https://yandex.ru/company/researches/2025/calendar


Вот вам идея для дата-исследования:

1) взять список популярных в мире музыкальных групп (например, из чартов Billboard Hot 100) и отобрать 100 самых прослушиваемых за каждый год
2) выгрузить с Setlist.fm все их концерты (обычно там всё подробно, вот пример)
3) посмотреть, как часто популярные артисты в разных жанрах на своих крупных выступлениях практикут «выход на бис»

Гипотеза — крупные артисты больше на бис не выходят. По крайней мере, так пишет колумнист издания The Paper.

А у меня для вас исследования нет, зато будет песня, которая так и называется — «Мы не выходим на бис». Это задорный и ироничный рок в духе Sum 41, который рассказывает о ценности момента.

Выйдет она в следующий четверг, но по правилам музыкальных площадок, чтобы эту песню могло услышать много людей, она должна получить много «пресейвов». Это заочный «лайк» песне, который напомнит вам о релизе.

Для вас — одна минута и один клик, для меня — возможно — много-много радости от новых слушателей 🥺

Поставить пресейв можно тут: https://band.link/RveEX


Т—Ж решил опросить своих читателей, чтобы узнать, действительно ли «троечники» более успешны, чем отличники

По субъективным ощущениям кажется, что — да. По крайней мере, троечники чаще отвечают, что довольный карьерой, и она движется быстрее, чем у окружающих.

Но метод, как мне кажется, мудрённый. Сходу не понять — среди троечников довольных примерно в два раза больше?
Я бы предпочёл смотреть на долю довольных, чем на не очень понятные коэфициенты.

Ещё прикольно, что «троечники» и «отличники» по-разному отвечали про качества, которые помогают им в работе. Первые значительно больше опираются на умение учиться на ошибках и смекалку, а вторые — на терпение и широкий кругозор.

И жаль про зарплаты ничего, хотелось бы опираться на что-то объективное, а не на самоощущения!

https://journal.tinkoff.ru/opros-pro-otsenki-rez/

3k 0 35 13 36

New York Times в своём материале раскрывают проблемы двухпартийной системы США в конгрессе, которая сложилась из принципа «победитель получает всё».

Партия, победившая в избирательном округе, в итоге забирает все места в конгрессе, из-за чего недопредставленными остаются как сторонники проигравшей партии, так и люди, не нашедшие своего кандидата. Отчасти это копенсируется неожиданными союзами, из-за которых в одной партии оказываются сторонники радикально разных взглядов.

Не мне рассуждать об американской политике, но в моих силах заметить тренд на скошенные Scatter Plot'ы в визуализации данных. В этот раз такое необычное положение особнованно метафорой — все либеральные показатели сконцентрированы слева, а все консервативные — справа.

https://www.nytimes.com/interactive/2025/01/14/opinion/fix-congress-proportional-representation.html


Дата-сторителлинг на большой сцене

Если вы посмотрите видео, то обнаружите на нём человека, выкрикивающего разные источники данных. Это титры к спектаклю «Человек среднестатистический», премьера которого состоялась вчера в Театре Ермоловой (Москва).

Вся постановка строится на данных официальной статистики, опросах и данных частных компаний, рисуя портреты персонажей. Особенно я порадовался, когда в какой-то момент со сцены цитировали данные одного из исследований Яндекса 😄

Спектакль очень сильно отличается от всего, что я раньше видел в театре. Это непривычно и может зайти не каждому. Но мне понравилось: получилось необычно, мило и моментами смешно.

Повторные показы планируют 5 и 27 февраля, так что берите билеты, если вдруг вас заинтересовало:
https://www.ermolova.ru/afisha/view/218/


New York Times пишут про проблему, которая может привести к потенциальной стагнации генеративных нейросетей.

Дело в том, что для улучшения моделей нужно много контента, который создатели сеток беспорядочно пылесосят из интернета. Но вот незадача — в интернете становится всё больше контента, который уже сгенерирован нейросетями. И оказывается, что сетки, обученные на сгенерированном контенте, с каждой итерацией начинают выдавать всё большую чушь.

New York Times понятно и популярно объясняют, почему качественное определение сгенерированного контента — это сейчас вопрос выживания для компаний, занимающихся разработкой подобных моделей

https://www.nytimes.com/interactive/2024/08/26/upshot/ai-synthetic-data.html

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

3.9k 1 89 14 64

Любопытно. Чтобы серьёзно это воспринимать, критически не хватает чисел и ограничений данных — например, какие страны вошли в выборку и за какой год (UPD: источник намекает, что это может быть только Великобритания)

Но двухсекундный фактчек показал, что это должно быть близко к правде:

В 2021 году 933 тысячи россиян умерли от болезней сердца и сосудов, 283 тысячи — от злокачественных новообразований.

— Т—Ж

В январе - ноябре 2024 года зарегистрировано 6,4 тыс. убийств (с покушениями), что ниже на 7,1% уровня сопоставимого периода 2023 года

— ТАСС

Тут интересно и важно, что инфографика вызывает эмоцию: с гораздо большей вероятностью вы умерёте от заболеваний (проще сказать, от старости), чем от внешних факторов — убийств, несчастных случае и т.д

Это, кстати, можно было и цветом выделить 👀


Очаровательный проект про одинаковые имена на выборах в Индии.

Есть там такая проблема на выборах разных уровней: в одном бюллетене могут оказаться кандидаты с крайне созвучными именами. Автор приводит пример, когда однажды выбирать предстояло из четырёх Gandhi, трое из которых к тому же были и Rahul'ами. Неприятно.

Материал притягателен разными формами подачи: тут и иллюстрации, и графы, и интерактив.

https://diagramchasing.fun/2024/votes-in-a-name


Видео недоступно для предпросмотра
Смотреть в Telegram
Изучал материалы предыдущего года и нашёл такую залипательную анимацию о том, как в мире менялось число ядерных боеголовок

Вообще весь материал NYT про ядерное оружие — это просто какой-то впечатляющий боевик, просто полюбуйтесь:

https://www.nytimes.com/interactive/2024/03/07/opinion/nuclear-war-prevention.html

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

4k 0 33 4 37

Смотрите, какая очаровательная штучка от NASA!

На лендинге можно ввести своё имя, и получите набор спутниковых снимков, на которых местность напоминает буквы из него. На каждое место можно клинкуть, посмотреть, где оно находится.

https://landsat.gsfc.nasa.gov/apps/YourNameInLandsat-main/index.html


В материале SCMP помимо прочего есть такой симпатичный дата-арт

На инфографике показана активность Солнца за последние почти 200 лет. Временной ряд идёт по спирали, а цвет и одновременно размер полосочек показывает среднее за год число пятен на Солнце.


Вот несколько моих видео с того самого шоу в Гонконге, на которое я попал


В декабре я побывал в Гонконге, где своими глазами увидел одно из самых впечатляющих шоу в своей жизни. Прямо над бухтой Виктория в воздух взлетели дроны, создавая светящиеся изображения милых панд: они анимировались, искрились и плавно перетекали в другие формы.

Огромные панды на фоне небоскрёбов выглядели так, словно кто-то смонтировал видео со спецэффектами, но всё это происходило на самом деле.

И вот South China Morning Post выпускает инфографику, которая объясняет, как устроены такие шоу, и что может помешать их проведению.

После завершения разработки дизайна каждый дрон программируется со всеми необходимыми данными: точным местоположением, высотой и цветом подсветки в каждый момент шоу. Эти данные загружаются в контроллеры полёта дронов, что позволяет им автономно выполнять представление.

Во время шоу дроны не общаются друг с другом и не получают инструкций в режиме реального времени. Вместо этого они независимо друг от друга следуют по заранее запрограммированным траекториям, подобно танцорам, выступающим по памяти.


https://multimedia.scmp.com/infographics/news/world/article/3292066/drone-shows/index.html


Планируя 2025 год, важно помнить о правиле: за каждым большим делом всегда стоят маленькие шаги

Очень мне нравится эта метафора в картиночках @newhappyco

У них вообще клёвый стиль: выглядит как визуализация данных, но в основе скорее что-то философское про жизнь

Источник:
https://www.instagram.com/newhappyco


Анализ новогодних обращений президента от студентов магистратуры ВШЭ

Настроение, популярные темы и пожелания — в карточках

Авторы: Валерия Немна, Филипп Попов, Владимир Малючков

5.6k 2 241 13 163

Мой дата-год ❤‍🔥

Хочется зафиналить 2024, рассказав себе и вам о самых важных своих дата-активностях

1⃣ Придумал и запустил свой курс по визуализации данных. Испытываю огромное удовольствие от обсуждений со студентами и особенно работы над финальными проектами.

Прошло уже два потока, за время которых ребята сделали много крутейших работ. Посмотреть их можно тут: #работы_студентов@data_csv

2⃣ Выпустил два исследования вместе со своей прекрасной командой в Яндексе: про то, как изменился климат России за 70 лет, и о том, что заказывают в доставке в разных городах страны.

3⃣ Много выступал. Съездил на фестиваль TIME CODE в Екатеринбург, выступил на главной сцене Матемаркетинга, прочитал две лекции на Летней Школе под Дубной; ходил в гости к магистрам из Вышки, а ещё провёл тренинги для своих коллег из Яндекс Лавки и команды 1C.

А ещё — вёл вебинары для студентов своего курса и профессии «Дата-журналист» в Нетологии.

4⃣ Сделал исследование для Картетики о рынке ГИС-специлистов, которые они презентовали на своей конференции Мапакон. Некоторые выводы есть в двух материалах, которые они выпустили «по следам»: 1, 2

5⃣ Разработал небольшой курс по дата-журналистике в МГУ. Коллега в рамках этого курса предложил использовать платформу «Яндекс Контест» для проверки заданий. Студенты загружали эксельки в систему, мы писали тесты, и программа автоматически проверяла работы. Опыт был любопытный, хотя и местами стрессовый

6⃣ Написал для Т—Ж цикл авторских материалов под кодовым названием «Одураченные статистикой»: о том, какие манипуляции осознанно или неосознанно используют авторы графиков, чтобы нас запутать

Спасибо, что следите и читаете! 20 тысяч пересылок и почти полторы тысячи комментариев — это мощь 😍


Моё уважение коллегам из «Новой газеты Европа», которые сделали очень подробный калькулятор инфляции с 2019 года, называется «Новогодняя корзина»

Можно буквально собрать корзину из привычных для вас товаров, и посмотреть, как поменялась цена каждого; можно посмотреть на готовые наборы.

Новая-Европа — нежелательная организация в России, за распространение ссылок на их материалы граждане РФ могут получить наказание, поэтому ссылки здесь не будет.


Дата-сторителлинг по-шанхайски: заходишь во двор жилого дома, а там цифры висят. Эти цифры — доля вакцинированных жителей в доме.

Увидишь низкое число, значит, к этим не ходи, люди это нехорошие 😁


Во время моей поездки в Японию я выкладывал много инфографики, которую находил в городе

Кажется, многим это понравилось, мне недавно даже коллега выразила за это отдельный респект. Поэтому продолжим рубрику!

Сейчас я в Шанхае, в музее шоколада. Как вам кажется, что показывает график снизу? Правильный ответ выложу под спойлер в комментарии :)

Показано 20 последних публикаций.