о визуализации данных и жизни

Позднее Ctrl + ↑

Лучшие визуализации — 2018

Начнём с визуализаций, посвящённых горячим новостям и острым темам 2018-го.

Спасательная операция в пещере Тхамлуангнангнон

Визуальные рассказы о спасении двенадцати юных футболистов и их тренера из затопленных пещер в Таиланде, опубликовали многие ведущие мировые СМИ. Мой фаворит — статья «Lucky 13» от Рейтерс. Они единственные показали маршрут спасательной операции на непрерывной схеме от начала и до конца со всеми вызовами и техническими решениями.

Там же есть понятная карта пещер с поперечным сечением в ключевых точках маршрута, включая полость под названием «Паттайя-бич», настолько узкую, что спасатели снимали кислородные баллоны, чтобы её преодолеть.

Другие достойные внимания визуальные истории на эту тему: Нью-йорк-таймс, Гардиан, Саус-чайна-пост.

Природные катастрофы

В мае на самом большом из гавайских островов произошло необычное — газовое или фреатрическое — извержение вулкана Килауэа, а также открылись трещины в жилом районе Леилани-Эстейтс, через которые вытекала лава. Хороший материал об этом — в Вашингтон-пост. Там и изящные карты, и наглядная схема-объяснение механизма извержения, и временная развёртка упавшего уровня лавы в лавовом озере кратера Халемаумау, и захватывающее видео фонтанов лавы, и самая красноречивая, на мой взгляд, визуализация — вот это изображение извергающейся трещины в тихом жилом квартале на пересечении улиц Лауны и Леилани:

В мае Нью-йорк-таймс проанализировало регионы, наиболее подверженные природным катастрофам:

В сентябре они же опубликовали завораживающую визуализацию урагана Флоренс:

А в ноябре — рассказ о лесном пожаре, уничтожившем городок Парадайз в Калифорнии:

На этой визуализации удачно подружились пространственное и временное измерение, и очень эффектно работает скролл (см. оригинал).

Китай

В 2018-м Китай продолжал строить дороги, мосты, дамбы, газо- и нефте-проводовы, тепло-, гидро- и атомные электростанции по всему миру. Нью-йорк-таймс, Гардиан, Блумберг и другие издания визуализируют масштабы строительства, анализируют стратегические цели Китая и проблему «долговой ловушки», в которой оказываются страны-партнёры.

Журналисты Рейтерс опубликовали визуальное расследование вокруг объектов, которые предположительно являются китайскими лагерями для заключённых-мусульман. В статье «Tracking China’s Muslim Gulag» они анализируют снимки со спутника и фотографии объектов и делают выводы об увеличении как количества лагерей, так и их размеров. Выводы подкреплены убедительной и интересной графикой:

Здесь же классный приём — обход периметра по скроллу:

Саус-чайна-морнинг-пост разбавляет китайскую тему материалом о богатых азиатах с серией визуализаций разной степени серьёзности:

Деньги и общество

Гениальная в своей простоте визуализация использования земли в США:

Разбив карту на маленькие квадраты и сгруппировав их по назначению земли внутри самой карты, авторы добились метафоры, понятной любому американскому школьнику. Будь-то леса, пастбища или сельскохозяйственные угодия, все эти территории теперь можно «измерить» в штатах. Интересно было бы взглянуть на аналогичную визуализацию о родных просторах.

Маленькая, да удаленькая визуализация, посвящённая «триллионному» рубежу компании Эппл:

У визуализации очень приятная механика, которую не передать статичными картинками — нечто среднее между тетрисом и «карандашной физикой» (Сrayon Physics). А ещё она очень понравилась Яне. Сидя у меня на коленях, пока я в ночи составляла этот список, она без конца просила: «Включи ту зацию, где вываливаются разноцветные штуки». И я включала, снова и снова :-)

Безумно красивая идея от «Нэшнл-географик» — волны иммиграции показаны как годовые кольца дерева:

Цветные пики по секторам — приток приезжих из той или иной части света. В «увеличительном стекле» показано, что график состоит из атомов — чёрточек, каждая чёрточка — 100 «одноцветных» иммигрантов. Благодаря такой дробности, формат работает и в разбивке по штатам:

Ещё одна визуализация на тему иммиграции опровергает связь между притоком иммигрантов и ростом преступности:

Обратите внимание, как множество графиков работают вместе, не превращаясь в кашу.

Города

Глубокое и необычное исследование названий улиц в немецких городах:

Я читала немецкую статью, переведённую браузером на английский. В английскую версию статьи на сайте большая часть «вкуснятины» не вошла.

Исследование причин задержек в Нью-йоркском метро с анимированными пояснениями и подробной интерактивной моделью наглядно демонстрирует причины транспортного кризиса:

На этой шестой по счёту визуализации от Нью-йорк-таймс скорее всего сработает ограничение на просмотр. Если не планируете оформлять подписку, воспользуйтесь  режимом «Инкогнито». 

Ещё одна эффектная городская визуализация — сейсмоопасные небоскрёбы Сан-Франциско:

Эволюцию метро в городах Китая с 1990 по 2020 годы в формате гиф:

Природа и экология

Изящная карта с первыми листочками показывает раньше или позже приходит весна в разные регионы США по сравнению с данными 50-летней давности:

Замечательный пример буквального кодирования — по всей карте «распускаются» первые листочки. Здесь же картина по годам за последние 35 лет. Видно, что хотя «в среднем по больнице» весна приходит раньше, года между собой отличаются довольно значительно, как в одну, так и в другую сторону:

В той же статье есть и график цветения вишни с точками-лепестками. Интересно, насколько точным оказался прогноз на 2018-й?

Плакат и интерактивная визуализация о загрязнении морей пластиком:

На карте показано три среза данных: страны закрашены тем ярче, чем больше пластиковых отходов производят, светло-жёлтые воронки в устьях рек показывают, сколько пластика приносит река в открытое море, а круги в океане — это плавучие скопления пластикового мусора. Обратите внимание, что отсутствие кругов не означает отсутствие мусора. Области, где исследовательские суда не обнаружили пластика показаны чёрными точками, и их не так уж много по сравнению с подтверждёнными «мусорными кучами».

Трогательные изображения семи исчезающих видов, которых осталось так мало, что все их представители помещаются в вагон метро:

Там, где сухое число скорее всего оставило бы читателя равнодушным, автор нашла понятную, наглядную и близкую большинству метафору и воплотила её в выразительной графической форме.

Любопытный проект «Небесные фигуры», который собрал воедино 28 систем созвездий разных мировых культур:

Все жители Земли во все времена смотрели на одно и то же звёздное небо. Во многих культурах звёзды объединяли в небесные фигуры. На визуализации можно взглянуть на небо глазами арабов, китайцев, египтян, индусов, ацтеков и других народов, а также увидеть созвездия, связанные в разных культурах с одними и теми же звёздами.

Cпорт

Зимняя олимпиада как обычно богата на графику, но примечательных визуализаций мне удалось найти не так уж много.

Самым интересным мне показался сюжет с графическим объяснением сложных трюков фигуристов, лыжников и сноубордистов:

Уже привычный, но от этого не менее захватывающий спортивный формат — раскадровка:

На прошлой олимпиаде Нью-йорк-таймс использовали гениальные живые превьюшки соревнований. В этом году изображения стали более детализированными, сохранив при этом лаконичность исходного формата:

Визуализация, которая раз и навсегда закрыла вопрос о первенстве по медалям, рассчитывает место в общем списке по всевозможным системам от «все медали одинаковы» до «только золото имеет значение»:

Весь чемпионат мира по футболу, начиная с одной восьмой финала:

Очень здорово показано, как в ходе игры менялись шансы на победу команды.

Искусство

Неоднозначный, но занятный анализ летних хитов с 1970-х до 2018-го:

Автор «раскладывает» композиции по выбранным шести характеристикам-векторам и, сравнивая профили между собой, делает вывод о том, что музыкальное разнообразие в 2000-х практически отсутствует. К методологии много вопросов: почему только летние хиты, почему именно эти вектора и именно шесть, насколько субъективны и измеряемы оценки по шкале «акустичности» и «весёлости», но в целом интересная идея и качественная реализация.

Шедевральное полотно с анализом работ Пабло Пикассо:

Создатели визуализации выделили 12 ключевых тем творчества художника, разделили более чем 8000 произведений по темам и подтемам, на большом холсте разметили области, форма которых напоминает стиль художника, а площади пропорциональны количеству работ по теме, и закрасили области масляными красками. Получилась впечатляющая полутораметровая картино-грамма.

Сценические костюмы Дэвида Боуи в формате дополненной реальности:

Экскурсию по сценическим образам музыканта на примере четырёх феерических костюмов, конечно, сложно назвать визуализацией данных в классическом смысле слова. Но такой плотностью информации (форма, крой, материалы, детали, текстура ткани, которую, кажется, можно пощупать), как на этих 3D-моделях, может похвастаться далеко не каждая визуализация.

Вселенная пятидесяти глав манги «Кардкэптор Сакура»:

Я не очень люблю такой закрученный по кругу формат, но здесь много приятных деталей и видно, что визуализация сделана с любовью к теме, а это, пожалуй, самое главное ❤️

В заключение, не могу не поделиться нашей коллаборацией с «Т—Ж»:

На оcнове указаных пожеланий, возможностей и ограничений, калькулятор рассчитывает выгодный для пользователя сценарий покупки квартиры в Москве: снимать и копить или взять ипотеку.

В этом году помимо отдельно стоящих визуализаций было много историй, расследований и просто статей, в которых интерактивная графика встречалась много раз по ходу повествования. При этом в лучших примерах на один материал приходилось сразу несколько уместных, качественных и продуманных визуализаций. Кроме того, активно используются 3D-модели и дополненная реальность, которые из инструментов «вау-эффекта» превращаются в полезных рабочих лошадок. Наблюдать эти изменения приятно.

Для тех, кто интересуется — подборки прошлых лет: 2017, 2016, 2015.

Лаборатория данных на паузе

Пришло время поделиться моими главными новостями.

10 апреля у нас с Димой родилась вторая дочка, Машенька. А чуть раньше я приняла непростое решение — поставить лабораторную работу на паузу. Лаборатория данных не берёт проекты до конца года, пока я наслаждаюсь моим первым полноценным декретным отпуском.

Последние три или даже четыре года дались мне нелегко. Яна родилась через полтора года после открытия лаборатории. Тогда я даже не помышляла о том, чтобы оторваться от дел и поставить работу на паузу. Совмещать бизнес и материнство, да ещё и в условиях нашего переезда, без поддержки бабушек и бебиситеров, оказалось почти героическим подвигом. Моя работа и семейные дела — это принципиально разные режимы работы мозга, и иногда я буквально физически ощущала, как меня разрывает на части. Я постоянно что-то делала на пределе своих возможностей, и постоянно с ощущением, что ничего не успеваю. Круче меня в это вкладывался только Дима, который всегда был на подхвате и в делах, и дома, и вообще самый лучший муж и отец, которого я могу представить.

А потом мы решились на Машу. И стало понятно, что на всё меня не хватит. Лаборатория данных — главное дело моей жизни, но семья важнее. Когда я узнала о беременности, я закрыла самый крупный лабораторный проект и распустила большую часть команды. В марте завершила работу над всеми проектами и попрощалась с оставшимися ребятами. С тех пор мой фокус полностью на себе и на семье.

В феврале, в Таиланде, пока ещё втроём

Я очень рада, что мой декрет — не вынужденная мера, а осознанное решение. Я хочу посвятить какое-то время семье, я заслужила отдых (ну, вы знаете этот отдых дома с двумя детьми :-) Я мечтаю вернуться к работе, когда почувствую сильный внутренний импульс, когда больше не смогу без неё жить. А пока я кайфую, днями напролёт напевая колыбельные и развешивая пелёнки. Сомневаюсь, что могла бы оказаться в этом состоянии, без всего моего предыдущего опыта.

Онлайн-курс по визуализации данных 23, 24 и 25 марта

23, 24 и 25 марта мы с Ромой и Димой проведём онлайн-курс по визуализации данных.

Содержание курса в точности повторяет наш обычный трехдневный «живой» курс, но поучаствовать в нём можно не выходя из дома. Мы набираем всего 15 человек, чтобы уделить внимание всем, и чтобы участие в онлайн-курсе было таким же полезным, как очное обучение. Места в группе пока есть.

В прошлый раз мы впервые подключили к «живому» курсу дистанционных участников, ребята остались довольны. Их отзывы можно почитать на странице курса. Если вам интересно, как обычно проходит обучение, читайте отчёт о декабрьском курсе.

Для тех, кто сомневается, насколько полезен лично ему будет курс, я собрала на хабре пять причин посетить курс по визуализации данных.

На онлайн-курс действует специальная цена: 35000 руб. — для самостоятельных участников и 45000 руб. — для представителей компаний. Скидок в этот раз нет. Если вы хотели попасть на курс, но откладывали, решайтесь. В этом году живых курсов больше не будет. Возможно, мы проведём ещё один онлайн-курс осенью, но и он пока под вопросом.

Подробности и запись на курс: http://datalaboratory.ru/course/

Лучшие визуализации — 2017

Начнём с визуализаций, которые адресованы читателю, затрагивают разные аспекты его жизни и помогают найти ответы на волнующие его вопросы. В этом году таких примеров особенно много.

Вот «Блумберг» прогнозирует вероятность автоматизации и исчезновения профессий:

График снабжён полем поиска, чтобы найти свою профессию и оценить риск остаться без работы в ближайшем будущем. Кроме того, авторы статьи выделили области наименьшего и наибольшего риска и делятся наблюдениями и выводами прямо на графике.

«Гардиан» предлагает читателю сравнить своё финансовое положения с представителями других поколений:

Для начала читатель указывает свой возраст и выбирает страну — статья становится персональной. После этого он по шагам знакомится с графиками, которые дают ответы на конкретные вопросы «Богаче или беднее были 30-летние в моей стране раньше?», «В каких странах 30-летние богаче или беднее, чем я?», «Соотечественники какого возраста богаче и беднее меня?». Эти ответы помогают разобраться в информационно нагруженной «матрице поколений» по странам. К сожалению, в списке стран нет России.

«Вашингтон-пост» рассчитывает налоговые послабления для граждан, проживающих в разных штатах, с разным доходом, с учётом семейного статуса и налоговых вычетов:

«Нью-йорк-таймс» анализирует пригороды крупных американских городов по соотношению доступности жилья и качества школьного образования:

Городки в правом нижнем углу — лакомый кусочек. Зелёным выделены пригороды, в которых комьют (усреднённый по всем жителям) не превышает получаса. На графике поиском можно найти свой или соседний городок, а также присмотреть новое место жительства.

«Стек-оферфлоу» исследует популярность основных технологий разработки в развитых и развивающихся странах:

Очень интересные исследования в области данных простых людей проводит Натан Йяу у себя на «Flowing Data». Вот пара примеров.

Время жизни взрослого человека, распределённое по активностям (в днях):

Отличие в занятиях у людей без детей и людей с детьми (в часах):

Другая интересная тема — разводы, например, этот срез по профессиям:

К слову о вымирающих профессиях. Используя формат из прошлогодней визуализации «Блумберга» «Кто на ком женится», Натан отображает возможные маршруты смены рода деятельности:

Можно выбрать свою профессию и на что вы хотите её поменять, и посмотреть, как чаще всего такой переход происходит. А там уже решить, хотите ли вы повторить весь маршрут, или пойти напрямик :-)

Хенрик Линдберг визуализировал пики занятия разными видами спорта в течение дня:

Зен Армстронг показал паттерны рождения младенцев, с интересными акцентами и выводами:

Эти визуализации позволяют нам увидеть свою жизнь на большой шкале глобальных трендов и происходящих в мире изменений. Они вовлекают читателя, предостерегают или успокаивают, приносят пользу. Знаете ещё такие примеры?

Отмечу ещё несколько интересных исследований на тему геоданных.

Эссе Джастина О’Бирна, посвящённое новой технологии гугла, AOI (areas of interest) — читается как остросюжетный детектив:

Cистема отслеживания пиков загрузки на немецкой железной дороге (вся магия в скринкасте):

Красивое и содержательное исследование работы московского такси от Александра Кукушкина:

Отображение времени вызова цветом — настоящая находка!

Здания на Манхеттене, которые не были бы построены сегодня:

Другие достойные внимания, вдохновляющие и необычные визуализации.

Жизнь крупных городов, визуализированная чекинами на Форсквере:


Изохроны крупнейших городов Европы:

Интерактивное объяснение, которое в игровой форме рассказывает, как устроено доверие и насколько выигрышными являются различные модели человеческого поведения:

Температура, ветер и снего-дождь на новых погодных картах Яндекса:

«Дыщащая Земля» — симпатичная визуализация сезонных изменений зелёного покрова планеты:

Все солнечные затмения, которые произойдут в течение вашей жизни:

Для любителей живой природы — всё, что вы хотели знать о яйцах в визуализации журнала «Сайнс»:

Дотошное исследование того, как рисуют кружки представители разных культур с анализом прописных букв соответсвующих алфавитов и подробными распределениями результатов:

Сумасшедшей красоты картины машинного обучения:

Высочайшие статуи мира — бок о бок, один из моих любимых форматов:

Анализ результативности бейсбольных ударов в зависимости от угла и скорости мяча:

Все «пробеги» ресивера Нью-йоркских гигантов Оделла Бекхема в этом сезоне Американской футбольной лиги:

Больше вдохновения в твиттере по тегу #Δλlikes. С наступающим Новым годом!

Отчёт о декабрьском курсе «Визуализация данных»

8, 9 и 10 декабря мы с Ромой и Димой провели в Москве очередной, шестой по счёту курс по визуализации данных. И по нашим ощущениям, и по результатам практики, и по отзывам участников, курс получился очень удачным. Он объединил все наши лучшие наработки и некоторые нововведения. Из нововведений, мы подготовили для участников конспект всех лекций с контрольными вопросами, а также в качестве эксперимента открыли дистанционный доступ к курсу для трёх участников.

В нашем курсе четыре учебных блока: теория визуализации данных (моя часть), знакомство с Табло (Ромина), знакомство с d3.js (Димина) и работа над мини-проектом (самостоятельная часть под руководством преподавателей). Курс идёт три дня, и в этот раз нам удалось найти идеальный рецепт распределения учебных блоков во времени.

Первый день до обеда мы посвятили теории визуализации данных. Мы с участниками рассмотрели классные примеры и вместе сформулировали признаки хорошей визуализации, после чего перешли к разбору алгоритма Δλ — познакомились с понятиями реальности данных и частицы данных, узнали, зачем они нужны и как их использовать. Хорошее представление об этом блоке даёт опубликованная на хабре расшифровка моего выступления на БДСЛ. После обеда у руля встал Рома и провёл для ребят мастер-класс по работе с Табло. Участники курса изучили возможности и ограничения инструмента и попробовали применить его на практике.

Второй день до обеда — продолжение теоретической части. Участники познакомились с понятиями визуального атома и каркаса, обсудили возможности сочетания разных атомов и каркасов между собой и разобрали по косточками около 50 (!) примеров визуализаций, от более-менее стандартных до самых экзотических. Ребята стоически выдержали такой плотный поток информации. После обеда Дима погрузил участников в мир веб-технологий: от создания векторной графики в SVG и написания функций на джаваскрипте, к освоению d3.js — выборкам, текучему интерфейсу, GUP (general update pattern) и работе со специфичными для d3 функциями.

Весь третий день участники работали над своими задачами. В первой половине дня учились применять алгоритм Δλ к своим данным, обсуждали со мной результаты и формулировали постановку задачи. Во второй половине — решали эту задачу с помощью выбранного инструмента (Табло или d3) под чутким руководством Ромы и Димы. На вечернем разборе 9 из 10 участников продемонстрировали интерактивные визуализации на основе собственных данных. До работоспособного результата не доплыл только Влад, который участвовал в курсе удалённо из Вашингтона, к третьему дню провёл с нами уже три бессонные ночи и ушёл спать раньше, чем начался разбор.

Покажу несколько примеров. Саша Котов из Авто.ру собрал в табло визуализацию для сравнения характеристик автомобилей:

В первой версии доступно сравнение по ограниченной выборке моделей и всего по нескольким параметрам, но у Саши масса идей по усовершенствованию интерфейса и развитию идеи.

Катя Гаврило, удалённая участница из Амстердама, выбрала для практики данные о 512 заключённых, казнённых в штате Техас, и продумала интереснейшую историю о них:

Ольга Макарова визуализировала работу своего отдела с разных точек зрения, в частности, сделала очень полезный срез о присутствии на рабочем месте в течение дня:

Филип Милевчич показал финансовые разночтения в отчётах аптечных сетей и дистрибьюторов, совместив на одном экране интерактивно связанные карту, таблицу и диаграммы:

Ира Митина, уже молодец хотя бы потому что не побоялась делать практику на d3.js, визуализировала извержения вулканов вместе с количеством жерт от каждого извержения. Пульсирующая обводка показывает извержения, которые сопровождались цунами.

А вот предмет нашей особой гордости — отзывы:

Как я уже писала, мы очень довольны курсом с точки зрения эффективности обучения. А ещё он получился очень камерным и душевным. Спасибо всем участникам за вовлечённость и искренний интерес к нашим знаниям ❤️

Следующий курс мы проведём в марте, и постараемся взять всё лучшее, что было на декабрьском курсе. В частности, мы ограничим размер группы десятью участниками: максимум пять дистанционных, остальные — в живую. Чтобы попасть в эту небольшую группу, оставьте свою почту на странице курса, и мы пришлём вам приглашение на один день раньше официального анонса.

Ранее Ctrl + ↓