Алгоритм визуализации на Фестивале 404

25-го сентября представила свой алгоритм визуализации сложных данных на Фестивале 404.

Моё обычное лицо во время выступления (◕‿◕)

Здесь будет пара слов, пока выкладываю презентацию.

Фестиваль 404 — ван лав ♥️

Поделиться
Отправить
Запинить
1 комментарий
Vitaly

На визуализации Московского Марафона в возрастной гистограмме использованы разные по размеру корзины: 5 лет, 3 года, 12 лет. Чем это обусловлено?
Так делать не стоит, т. к. это фактически манипуляция (см. https://github.com/nalgeon/dataviz/blob/main/docs/07-check.md#ch-13-avoid-different-class-sizes).

Кроме того, в этой гистограмме ширина столбцов отражает размер корзины, длина — кол-во людей (что встречается нечасто, обычно ширина одинаковая).
Думаю, это дополнительно вводит в заблуждение, т. к. интуитивно человек сравнивает размеры закрашенных площадей, а в данном случае ему нужно сравнивать только длины.

Таня Мисютина: mail@infotanka.ru

Виталий, а вот и нет. Здесь нет никаких манипуляций, графически всё абсолютно точно.

Спортивные возрастные группы объединяют людей по физическим возможностям. Например, пик формы приходится на 20…22 года, поэтому эта небольшая по возрастному диапазону группа выделена в отдельную категорию. Следующая группа 23…34, наоборот, самая большая. В этом возрастном диапазоне спортивная форма в среднем меняется незначительно, а вот позже начинает заметно убывать с каждыми пятью годами.

Толщина слоя на возрастной диаграмме учитывает эту неоднородность и отвечает количеству лет в соответствующей возрастной группе. Количество участников возрастной группы показано площадью, как вы и написали — сравнивать наш глаз будет именно её. Тогда высота столбцов показывает удельное количество участников на каждый год возрастной группы, то есть насколько популярно участие в марафоне для людей этого возраста. Если бы все столбцы были одинаковой ширины, столбец самой большой по количеству лет и по популярности группы 23…34 был бы намного выше всех остальных, и сложно было бы сказать, за счёт какого из двух параметров он так «выстрелил». А на нашей диаграмме видно, что хотя 35…39 меньше по количеству бегунов (площадь), но по количеству бегунов на год она сравнима, то есть люди в возрасте 23…39 примерно одинаково интересуются забегами на длинные дистанции.

Популярное