Алгоритм визуализации на Фестивале 404
25-го сентября представила свой алгоритм визуализации сложных данных на Фестивале 404.
Моя большая радость, что в часовой доклад удалось упаковать большую часть теории, которую я преподаю на учебном курсе «Визуализация данных». Видео-запись выступления доступна на ютубе:
В алгоритме важна не только последовательность шагов, но и то, как следующий шаг связан с предыдущим, как один вытекает из другого, а также метаморфозы, происходящие внутри шагов — и всё это отражено в презентации. Важно: переключайте слайды стрелками справа и слева от содержания, а не встроенными контролами фигмы (внизу), тогда будут видны анимации, которые играют здесь ключевую роль.
Фестиваль 404 — ван лав ♥️
На визуализации Московского Марафона в возрастной гистограмме использованы разные по размеру корзины: 5 лет, 3 года, 12 лет. Чем это обусловлено?
Так делать не стоит, т. к. это фактически манипуляция (см. https://github.com/nalgeon/dataviz/blob/main/docs/07-check.md#ch-13-avoid-different-class-sizes).
Кроме того, в этой гистограмме ширина столбцов отражает размер корзины, длина — кол-во людей (что встречается нечасто, обычно ширина одинаковая).
Думаю, это дополнительно вводит в заблуждение, т. к. интуитивно человек сравнивает размеры закрашенных площадей, а в данном случае ему нужно сравнивать только длины.
Виталий, а вот и нет. Здесь нет никаких манипуляций, графически всё абсолютно точно.
Спортивные возрастные группы объединяют людей по физическим возможностям. Например, пик формы приходится на 20…22 года, поэтому эта небольшая по возрастному диапазону группа выделена в отдельную категорию. Следующая группа 23…34, наоборот, самая большая. В этом возрастном диапазоне спортивная форма в среднем меняется незначительно, а вот позже начинает заметно убывать с каждыми пятью годами.
Толщина слоя на возрастной диаграмме учитывает эту неоднородность и отвечает количеству лет в соответствующей возрастной группе. Количество участников возрастной группы показано площадью, как вы и написали — сравнивать наш глаз будет именно её. Тогда высота столбцов показывает удельное количество участников на каждый год возрастной группы, то есть насколько популярно участие в марафоне для людей этого возраста. Если бы все столбцы были одинаковой ширины, столбец самой большой по количеству лет и по популярности группы 23…34 был бы намного выше всех остальных, и сложно было бы сказать, за счёт какого из двух параметров он так «выстрелил». А на нашей диаграмме видно, что хотя 35…39 меньше по количеству бегунов (площадь), но по количеству бегунов на год она сравнима, то есть люди в возрасте 23…39 примерно одинаково интересуются забегами на длинные дистанции.