Избранное

Лучшие визуализации — 2017

Начнём с визуализаций, которые адресованы читателю, затрагивают разные аспекты его жизни и помогают найти ответы на волнующие его вопросы. В этом году таких примеров особенно много.

Вот «Блумберг» прогнозирует вероятность автоматизации и исчезновения профессий:

График снабжён полем поиска, чтобы найти свою профессию и оценить риск остаться без работы в ближайшем будущем. Кроме того, авторы статьи выделили области наименьшего и наибольшего риска и делятся наблюдениями и выводами прямо на графике.

«Гардиан» предлагает читателю сравнить своё финансовое положения с представителями других поколений:

Для начала читатель указывает свой возраст и выбирает страну — статья становится персональной. После этого он по шагам знакомится с графиками, которые дают ответы на конкретные вопросы «Богаче или беднее были 30-летние в моей стране раньше?», «В каких странах 30-летние богаче или беднее, чем я?», «Соотечественники какого возраста богаче и беднее меня?». Эти ответы помогают разобраться в информационно нагруженной «матрице поколений» по странам. К сожалению, в списке стран нет России.

«Вашингтон-пост» рассчитывает налоговые послабления для граждан, проживающих в разных штатах, с разным доходом, с учётом семейного статуса и налоговых вычетов:

«Нью-йорк-таймс» анализирует пригороды крупных американских городов по соотношению доступности жилья и качества школьного образования:

Городки в правом нижнем углу — лакомый кусочек. Зелёным выделены пригороды, в которых комьют (усреднённый по всем жителям) не превышает получаса. На графике поиском можно найти свой или соседний городок, а также присмотреть новое место жительства.

«Стек-оферфлоу» исследует популярность основных технологий разработки в развитых и развивающихся странах:

Очень интересные исследования в области данных простых людей проводит Натан Йяу у себя на «Flowing Data». Вот пара примеров.

Время жизни взрослого человека, распределённое по активностям (в днях):

Отличие в занятиях у людей без детей и людей с детьми (в часах):

Другая интересная тема — разводы, например, этот срез по профессиям:

К слову о вымирающих профессиях. Используя формат из прошлогодней визуализации «Блумберга» «Кто на ком женится», Натан отображает возможные маршруты смены рода деятельности:

Можно выбрать свою профессию и на что вы хотите её поменять, и посмотреть, как чаще всего такой переход происходит. А там уже решить, хотите ли вы повторить весь маршрут, или пойти напрямик :-)

Хенрик Линдберг визуализировал пики занятия разными видами спорта в течение дня:

Зен Армстронг показал паттерны рождения младенцев, с интересными акцентами и выводами:

Эти визуализации позволяют нам увидеть свою жизнь на большой шкале глобальных трендов и происходящих в мире изменений. Они вовлекают читателя, предостерегают или успокаивают, приносят пользу. Знаете ещё такие примеры?

Отмечу ещё несколько интересных исследований на тему геоданных.

Эссе Джастина О’Бирна, посвящённое новой технологии гугла, AOI (areas of interest) — читается как остросюжетный детектив:

Cистема отслеживания пиков загрузки на немецкой железной дороге (вся магия в скринкасте):

Красивое и содержательное исследование работы московского такси от Александра Кукушкина:

Отображение времени вызова цветом — настоящая находка!

Здания на Манхеттене, которые не были бы построены сегодня:

Другие достойные внимания, вдохновляющие и необычные визуализации.

Жизнь крупных городов, визуализированная чекинами на Форсквере:


Изохроны крупнейших городов Европы:

Интерактивное объяснение, которое в игровой форме рассказывает, как устроено доверие и насколько выигрышными являются различные модели человеческого поведения:

Температура, ветер и снего-дождь на новых погодных картах Яндекса:

«Дыщащая Земля» — симпатичная визуализация сезонных изменений зелёного покрова планеты:

Все солнечные затмения, которые произойдут в течение вашей жизни:

Для любителей живой природы — всё, что вы хотели знать о яйцах в визуализации журнала «Сайнс»:

Дотошное исследование того, как рисуют кружки представители разных культур с анализом прописных букв соответсвующих алфавитов и подробными распределениями результатов:

Сумасшедшей красоты картины машинного обучения:

Высочайшие статуи мира — бок о бок, один из моих любимых форматов:

Анализ результативности бейсбольных ударов в зависимости от угла и скорости мяча:

Все «пробеги» ресивера Нью-йоркских гигантов Оделла Бекхема в этом сезоне Американской футбольной лиги:

Больше вдохновения в твиттере по тегу #Δλlikes. С наступающим Новым годом!

Алгоритм Δλ: визуальные атомы, часть 3

Заключительная заметка о визуальных атомах (первая и вторая части). Сегодня поговорим о мини-графиках и картографических атомах.

Мини-графики
Иногда смысловой частицей данных, которую мы изучаем и сравниваем, является не единичное значние, а набор или серия значений. На прошедшем в апреле учебном курсе один из студентов визуализировал показания датчиков, контролирующих производственные процессы. Десятки датчиков измеряли различные величины иногда с частотой раз в секунду. В такой ситуации формально квантом информации является отдельное измерение, но осмысленной частицей данных будет «поток», то есть последовательность значений с каждого датчика. Потоки визуализируются мини-графиками, из которых складывается общая картина и которые можно сравнивать между собой. Вот грубая иллюстрация на примере схемы Регуляра — реальное расположение приборов и визуализация:

Вид мини-графика зависит от измеряемой величины, можно отметить минимумы, максимумы и допустимый диапазон

На визуализации занятости жителей Миннесоты хорошо видна сезонность в одних отраслях, рост и спад в других:

Видно появление и исчезновение таинственной отрасли Animal Aquaculture и космической программы — Space Research and Technology, в полной версии на сайте

Для удобства чтения все графики имеют одинаковую высоту в максимальной точке, соответсвенно разный масштаб. Конкретные значения показаны при наведении.

Частота употребления слов в официальных обращениях американских политиков:

Резкие пики сопровождаются пояснениями редакции

Климат разных городов на визуализации температурных рекордов, сравниваем толщину (разброс температур) и окраску (конкретные значения относительно нуля):

Активность у своих и чужих ворот, слабые и сильные стороны команд на визуализации голевых моментов:

Мини-графики хороши для больших наборов значений со стройной иерархией внутри. Осмелившись показать все значения, не усредняя и не обедняя выборку, вы получите информационно насыщенную, интересную для изучения визуализацию.

Географические атомы: точка, объект, область, маршрут

Визуальные атомы на карте могут быть точечными (точки, круги, объекты), площадными (области) и протяжёнными (линии).

Точки на карте — это места, события и объекты с конкретными координатами. В зависимости от масштаба карты точка может быть квартирой в доме на конкретной улице или целым городом.

Например, квартиры, сдающиеся через «Эйрбнб»:

Уже знакомые нам землетрясения:

И полезные/вредные приёмы пищи, слившиеся в облака:

Сложенные стопками смертельные случаи заболевания холерой на знаменитой карте Джона Сноу:

Дома Москвы, родом из разных эпох:

Достопримечательности на карте-путеводителе:

Точечные объекты на карте передают информацию своим положением, цветом, размером, а также засчёт подписей и картинок. Если данных для каждого объекта слишком много, располагать их на карте будет не лучшим решением. Карта диктует жёсткую топологию, и экранное пространство используется неэффективно. В таком случае я советую показать данные в виде мини-графиков, а карту использовать как дополнительный справочный элемент:

При наведении на мини-график город на карте подсвечивается красным.

Площадные объекты — это области на карте: городские кварталы, районы, округа, страны и другие государственные территориальные единицы, а также геологические и географические регионы. Площадные объекты передают сводную информацию по территории, чаще всего с помощью цветной заливки.

Однотонная показывает один параметр, например, высоту застройки или стоимость земли на Манхэттене:

Двухцветная — близость к полюсам шкалы:

Заливка полупрозрачными слоями делает акцент на пересечении накладывающихся друг на друга областей:

Границы районов Бостона, как их видят жители

На карте затопления Венеции площадная заливка улиц и площадей сочетается с точечной окраской пострадавших от наводнений зданий:

Карта может быть настоящим произведением искусства, с большим количеством цветов и оттенков:

Геологическая карта Пенсильвании

На «карте здоровья» части света покрыты паттерном человеческих тканей и клеток, поражаемых самой распространённой там болезнью:

Северная Америка покрыта жировой тканью, Европа — мозговыми нейронами (слабоумие), Африка — кровяными тельцами (малярия и СПИД), на страдающей от бесплодия Гренландии изображены сперматозоиды

Вместо заливки иногда используются изолинии, как на этой карте запахов Эдинбурга:

Протяжённые объекты на карте — это путевые сети, маршруты, границы, а также реки и горные цепи. Связанные с ними данные визуализируются линиями и змейками разной толщины, цвета и яркости.

Классическая карта Шарля Минара показывает объёмы экспорта угля Англией:

Поток делится на крупные рукава, потом на более мелкие — в соответствии с морскими путями доставки угля

Суточное движение швейцарских поездов:

Цветом линии показана скорость поездов, толщиной — их загруженность

Ветра в Токио в режиме реального времени:

Чем длиннее линии, тем сильнее дует

Воздушные пути на разной высоте над городами мира:

Высота полёта закодирована цветом

Поток беженцев из разных стран:

Чем больше поток, тем ярче луч

Вся пресная вода земного шара, как на ладони:

Сразу видно, где густо, а где пусто

При визуалиции геоданных важно учитывать характер данных и выбирать соответсвующие визуальные атомы. Привязывать точечные данные к областям, а сводные параметры по целым регионам или протяжённым объектам отображать точками, на мой взгляд, грубая ошибка.

Следующая теоретическая заметка выйдет 8 августа.

Алгоритм Δλ: визуальные атомы, часть 2

Продолжение заметки о визуальных атомах. Сегодня поговорим о прямоугольниках, отрезках и линиях.

Прямоугольник
Прямоугольники обладают четырьмя собственными свойствами (ширина, высота, их производная — площадь, цвет) и легко складываются друг с другом.

Прямоугольники единичной ширны складываются в столбиковую диаграмму:

Элементарная частица в личных финансах — трата, визуальный атом — прямоугольник единичной ширины, его высота соответствует размеру траты, цвет — категории. На диаграмме траты суммируются, высота столбика показывает размер недельных трат.

Элементарная частица продаж интернет-магазина — продажа, визуальный атом — прямоугольник единичной ширины, его высота соответствует сумме продажи. Высота столбика на диаграмме показывает суточную выручку. Цветом показаны будни и выходные дни.

Прямоугольники подходят для отображения групп элементов (чаще неразличимых пикселей, редко — точек), в этом случае ширина и высота прямоугольника задействуются для визуализации параметров группы. Важно выбирать параметры для ширины и высоты так, чтобы их произведение — площадь, также имело физический смысл.

Например, если количество детей в возрастной группе задаёт высоту прямоугольника, а доступность садиков для этой группы — его ширину, то площадь прямоугольника соответсвует количеству детей этого возраста, попавшему в сад.

Видим, что проблема для группы 1,5-2 года стоит острее, чем для группы 2-2,5 года — хоть доступность садов в ней и выше, но нуждающихся в садике детей намного больше.

По такому же принципу прямоугольники образуют квадратные и тримэп-диаграммы:

Отрезок
Отрезок визуализирует частицу данных, состоящую из двух связанных элементов.

Это может быть связь двух объектов, например, брачный союз людей разных профессий:

Связь «до и после» двух значений одного и того же параметра, например, количество высокооплачиваемых должностей в различных индустриях:

.
Связанные попарно значения, например, результаты ответов на вопросы теста, личный и средний по соотечественникам:

Или пара связанных пространственных координат, например, начальное и конечное положение мяча при ударе по воротам:

Линия
Линия показывает путь или историю объекта во времени. Для линии важны не только точка начала, точка конца и связь (как в отрезке), но и форма пути между ними. Линии сливаются в потоки и делятся на русла.

Частица данных — кандидат, проходящий этапы воронки собеседований
Частица данных — штат, изменяющий свои настроения во времени
Частица данных — поезд метро, движущийся между станциями
Частица данных — заключённый, проводящий срок в тюрьме Гуантанамо

Частным случаем линии является географический маршрут.

Частицы данных — французы армии Наполеона, наступающие на Москву и отступающие обратно

О мини-графике и географических атомах (точке, области, объекте и маршруте) я расскажу в третьей, заключительной заметке.

Следующая теоретическая заметка выйдет 4 июля.

Алгоритм Δλ: визуальные атомы, часть 1

Сегодня я расскажу о наглядном визуальном кодировании частиц, из которого естественным образом вырастает содержательная и наглядная визуализация.

После ответа на вопрос о том, что является элементарной частицей данных, задумайтесь, как её лучше всего показать. Элементарная частица данных — это визуальный атом, и её воплощение должно быть атомарным. Основные визуальные атомы: пиксель, точка, круг, черта, квадрат, ячейка, объект, прямоугольник, отрезок, линия и мини-график. Выбор атома следует из свойств частицы данных и её поведения в реальности данных.

Пиксель
Пиксель — минимальная экранная единица, пиксели обозначают «безликие», неотличимые друг от друга частицы, которые сливаются в единое целое, например, бюджет страны, стоимость товаров и услуг, дефицит личного бюджета, бюджет фильма или результаты опроса. Пиксели суммируются в столбцы, прямоугольные области и потоки, площадь которых пропорциональна сумме частиц данных.

Эффективность предприятия в прошлой заметке также складывается из пикселей — тонн продукции:

Точка
В отличие от пикселя, точка кодирует отдельные, явно различимые объекты: спортсменов, рядовых американцев, сотрудников, температурные рекорды, землетрясения, медалистов, приёмы пищи и т. п. Цвет точек отражает качественную или количественную характеристику.

В простом случае точки занимают свои позиции и отображаются на графике по отдельности:

Медалисты всех олимпиад в беге на 100 м
Годовая зарплата и результативность ведущих американских бейсболистов (по командам)
Активность американцев в разное время суток

Иногда точки соединяет кривая:

Если точки необходимо просуммировать, способ визуального суммирования зависит от характера данных.

Для складывания элементов в стопки в одном измерении подходят чёрточки:

Для составления столбиковых диаграмм используют квадратики:

Иногда точки просто накладывают друг на друга с прозрачностью, в таком случае яркие точки показывают наиболее распространённые значения:

Температурные рекорды в РФ
Землетрясения с 1898 года

Большое количество точек сливают в круги, потоки и облака, в них точки перестают быть различимыми:

Визуальное сложение мы обсудим подробнее в следующих заметках.

Круг
Круг помимо цвета и расположения имеет радиус, который кодирует дополнительное измерение данных. Классический пример элементарных частиц-кругов — страны на Гэпмайндере, где изменяющийся со временем радиус круга показывает рост популяции:

Здесь частицей данных является страна, в отличие от рассмотренного выше примера с олимпийскими медалями, где элементарной частицей является медаль, и уже медали суммируются в круги-страны.

Другие примеры:

Круги — крупные американские компании, радиус показывает их «вес» (рыночную стоимость), цвет — размер налоговой ставки
Круги — картины Пабло Пикассо, радиус показывает стоимость проданных на аукционах картин, цвет — тип (масло/акварель-гуашь)

Ячейка
Ячейка — это элемент регулярной сетки, как правило, квадратной формы. Линейные размеры ячейки не имеют значения. Частицы данных распределяются по сетке, а их свойства суммируются или усредняются и отображаются цветом ячейки.

Суммирование может быть примитивным (чем больше, тем ярче):

Или оценочным, например, с использованием светофорного градиента «хорошо-плохо»:

В этом примере на одной сетке просуммированы сон и ходьба городских жителей:

Объект
Роль точки на графике может играть реальный объект. В этом случае к свойствам, показанным на графике, добавляется наглядная информация с изображения объекта.

Классический пример Эдварда Тафти — график соотношения массы мозга и массы тела с животными вместо точек. Легенда не требуется:

Точки-воины и мирные жители в визуализации потерь Второй мировой войны:

Лабораторная визуализация характеристик танков из игры WoT, размеры танков на графике соответствуют реальным размерам:

Диаграммы и графики о флагах мира, собранные из флагов:

График изменения шерсти амурского тигра из шерстинок показывает не только длину, но и густоту шерсти, и появление подшёрстка:

В следующих заметках я расскажу об оставшихся визуальных атомах: прямоугольнике, отрезке, линии и мини-графике.

Следующая теоретическая заметка выйдет 20 июня.

Янчик

Яночка — чувствительный, требовательный, неудобный ребёнок. Как и многие другие малыши, она нуждается во внимании постоянно, буквально всё время. В младенчестве она никогда не лежала «кабачком», ждала общения, требовала, чтобы её носили на руках и развлекали. Стоило отвлечься, задуматься, не дай бог, заглянуть в телефон, она разражалась криком, как будто ей грозила опасность. Телефон и ноутбук в её присутствии до сих пор, за редким исключением, — табу. Когда ей что-то не нравится, она яростно протестует; когда чего-то хочет, настойчиво объясняет и требует, пока мы не поймём. Она наотрез отказывается ездить в коляске и автокресле. Она спокойно спит, только когда я рядом.

Я пытаюсь удовлетворить её потребности, и это самая тяжёлая работа в моей жизни.

Яночка-полугодовасик

Малышка обладает надо мной властью, которой ни у кого не было. Она меняет мои привычки, рушит планы, ломает меня. За год после её рождения моя жизнь изменилась сильнее, чем за десять лет до. Никогда раньше я не погружалась в такие бездны усталости и неуверенности в себе. Всё, что я до этого считала сложностями и испытаниями, теперь кажется беззаботными развлечениями. Я попрощалась с перфекционизмом, работой в привычном темпе и профессиональными амбициями, кажется, навсегда. Прощание было болезненным.

Я верю, что дети приходят неслучайно, что они учителя, а не мучители, нужно только разглядеть путь, по которому они ведут. Мне достался строгий и непримиримый наставник. Если бы к нему в придачу не достался самый понимающий, принимающий и, главное, помогающий во всём папа, я бы не справилась.

С мамой в йога-кемпе, 8 месяцев. Фото Виктории Мироновой.
С папой на пляже в Курортном, 10 месяцев

Глаза у Янчика светятся, в них — неиссякаемое любопытство и жажда исследований. Она изучает всё: рассматривает, трогает, тянет в рот; с одинаковым энтузиазмом пробует на зуб новую игрушку, бренчит по гитарным струнам и копается в мусорном пакете. В новом месте её невозможно удержать на руках, она бежит ползёт охотиться за новыми впечатлениями. Она обожает животных и приветствует восторженным писком кошек, собак, свинок, телят и другую соседскую живность (мы с недавних пор живём в деревне :-) Она собирает грецкие орехи, упавшие с растущего во дворике дерева, и колет их большим камнем, подражая папе. У неё чудесные молочные щёки и мягкие золотые завитки на затылке. Когда я её целую, она замирает с закрытыми глазами и полуулыбкой на лице — «млеет». В такие моменты время останавливается. И ещё, когда она смеётся.

С папой во дворике, 11 месяцев

Яночке сегодня исполнился год. Быть её мамой — очень трудное и очень настоящее счастье!

Ранее Ctrl + ↓