Таня Бибикова

о визуализации данных и жизни

Коронавирус и визуализация данных

Пандемия коронавируса затронула почти все страны. Человечеству впервые выпадает шанс наблюдать нечто настолько глобальное, при этом касающееся каждого, и держать руку на пульсе с помощью современных технологий. Исследователи строят математические модели, которые учитывают поведение широких масс, и наблюдают в режиме реального времени, как эти прогнозы сбываются. Но что ещё важнее, они показывают свои модели тем самым широким массам, которые самостоятельно делают (или не делают) выводы, меняют (или не меняют) поведение и, как следствие, в какой-то мере определяют сценарий развития ситуации.

Сейчас, как никогда, важно не просто наблюдать процесс, но и доносить наблюдения и выводы учёных до обывателей. От способов представления данных, их прозрачности и наглядности, доверия к ним — от сообщения, вложенного в ту или иную визуализацию, зависит будущее, которое всех нас ждёт.

Поделюсь визуализациями, которые произвели лично на меня самое большое впечатление и сильнее всего повлияли на мои собственные решения.

График количества заболевших из статьи «Особенности и уроки вспышки коронавирусной инфекции — 2019 (COVID-19) в Китае», опубликованной 24 февраля в журнале Американской медицинской ассоциации, чаще всего цитируется в контексте «скрытой угрозы». И не случайно. Это гениальная в своей простоте визуализация показывает, что каждый обнаруженный случай заболевания, особенно в самом начале эпидемии, был диагностирован с задержкой около двух недель. Синие столбики — истинное количество заболевших, жёлтые — поставленные диагнозы. Подробный анализ графика можно почитать в оригинале и по-русски. Отмечу лишь главную мысль за этими данными: «Реального количества заболевших на данный момент не знает никто».

Другой впечатляющий формат — толпа корейцев, прихожан церкви Шинчионджи, самый обширный из корейских кластеров распространения короновируса:

Предположительно, вирус попал в церковное сообщество через единственную женщину, известную как «31-я пациентка», которая дважды посетила церковную службу, уже после появления симптомов и временной госпитализации, но до постановки диагноза. Мы видим каждого человека из 5016 инфицированных (вспомним визуализацию потерь Второй мировой войны). И, зная, что на данный момент 162 человека в Южной Корее погибли, можем представить это не как абстрактную цифру, а как реальные прервавшиеся жизни людей, в лицо которым мы как будто смотрим на этой визуализации. И цифра уже не кажется такой уж незначительной, какой она выглядит на общем трагическом фоне.

О том, как вирус распространился внутри Китая и по миру, обгоняя запаздывающие карантинные меры, лучше всего, на мой взгляд рассказывает Нью-йорк-таймс. Невероятно красивая и достаточно аккуратная визуализация, местами настоящее произведение искусства:

Обратите внимание, что здесь показаны либо статистически предполагаемые случаи, либо достоверно зафиксированные в будущем и отмеченные на карте «задним числом». Это даёт более-менее адекватную картину происходившего, аналогично графику выше. Ключевое слово здесь — происходившего. Картины происходящего прямо сейчас, как я писала выше, мы не знаем.

Отсюда проблемы с таблицами и картами, самыми популярными на данный момент форматами представления данных о текущей ситуации. Поговорим о них.

Университет Джона Хопкинса — один из самых надёжных источников данных о положении дел в мире. Но их карта, как и все остальные карты на сайтах всех новостных площадок, организаций и министерств здравоохранения, не говорит буквально ни о чём. Во-первых, процедуры тестирования в разных странах отличаются, и сравнивать Германию с массовыми тестированиями и Италию, в которой тесты проводят только больным с симптомами, просто бессмысленно. Во-вторых, данные по странам отличаются настолько сильно и меняются так быстро, что заметить важные изменения в формате карты просто невозможно. В-третьих, карта не выполняет свою основную функцию  — она не показывает текущее положение дел. Данные о количестве подтверждённых случаев не отражают ситуацию и могут отличаться от истинного количества заболевших в разы и даже на порядки, в зависимости от процедуры тестирования и карантинных мер в отдельно взятой стране. При этом обычные люди, глядя на карту и изучая цифры с точностью до одного заболевшего, как правило, не отдают себе отчёта в том как сильно эта «текущая ситуация» отличается от истинного положения дел.

Следующий по популярности формат — график роста заболевших/умерших по странам на таймлайне, который показывает изменение ситуации с течением времени. Например, вот такой, созданный командой «Our world in data» (интерактивная версия ↓):



На горизонтальной оси время, но не календарные даты, а дни, начиная с пятой смерти в стране. На вертикальной — логарифмическая шкала смертей. Это редкий случай, когда логарифмическая шкала по-настоящему уместна. Рост заражений и смертей идёт по экспоненте, и числа разных порядков оказываются близкими друг к другу: где вчера было 10 случаев, там через неделю (или раньше) их уже 100. Обратите внимание на пунктирную разметку, которая показывает на графике зоны разных темпов роста (число удваивается каждый день, раз в два дня, раз в три дня и т. д.) Смертельные случаи отражают ситуацию намного точнее, чем количество заболевших.

На этом графике видны страны с самыми высокими темпами роста:

И страны, которые взяли эпидемию под контроль:

Но как насчёт стран, оказавшихся где-то между? Есть ещё один формат, который отлично проявляет текущую ситуацию, а именно, продолжается ли экспоненциальный рост заболевших в стране или эпидемия замедляется. Это график дневного прироста заболевших против суммарного их количества. Больше всего мне нравится реализация, опубликованная на днях Сергеем Кашиным:

На графике можно отследить момент, когда кривая начинает отклоняться от основного направления вниз — это и есть замедление экспоненциального роста. Не всем странам удаётся удержать это движение (см. Иран, который было нырнул вниз, но снова подтянулся к диагонали), но для большинства стран их прогресс из этого графика становится понятен. Большой плюс этого графика в том, что мы смотрим на зависимость величин, которые измерены одинаковым образом, на их соотношение. И это отчасти нивелирует неточность, заложенную в параметре «количество заболевших», о которой я писала выше. Благодаря этому можно делать выводы о странах, в которых количество смертей ещё недостаточно велико, но количество подтверждённых случаев растёт достаточно быстро:

Помимо суммарного количества заболевших и ежедневного прироста, на графике показаны также суммарное количество смертей (размер кружка) и ежедневный прирост смертей (толщина и цвет линии). Визуализация также снабжена временным слайдером, который можно запустить или подвигать вручную. Итого — пять измерений данных на одном графике. Сергей, снимаю шляпу :-)

Ещё один жанр, который не могу обойти вниманием, — интерактивные модели. Вашингтон-пост приводит сильно упрощённую демонстрацию влияния мер разной степени жёсткости на темпы распространения инфекции:

В конце статьи можно сравнить между собой графики всех четырёх процессов:

Модель примитивная, и к ней есть вопросы. Но я лично знаю людей, для которых она оказалась достаточным аргументом, чтобы пересмотреть привычки и взгляд на социальное дистанцирование.

А вот потрясающий калькулятор эпидемии:

Наглядный, быстрый, с большим количеством настроек — настоящий инструмент исследователя. В статье Томаса Пуйо «Молот и танец» показано, как приближая момент и увеличивая степень вмешательства в естественный ход распространения вируса, можно снизить нагрузку на систему здравоохранения с десятков миллионов до десятков тысяч обращений. И как это позволит выиграть время, чтобы встретить врага (коронавирус) во всеоружии.

Кстати, о нагрузке на больницы и медперсонал. На визуализации Нью-йорк-таймс показан риск заражения вирусом для разных профессий:

Неудивительно, что доктора (особенно, дантисты и пульмонологи), медсёстры и врачи скорой помощи оказались в самом рисковом, правом верхнем углу графика:

Кстати, это один из немногих графиков, который соотносит события глобального масштаба и личные тревоги: можно вбить в поиск свою профессию и увидеть свои риски на общем фоне. Мне не хватает визуализаций с таким подходом, не хватает возможности оценить риск для себя и близких с учётом географии, пола, возраста, профессии и других нюансов.

Ну и напоследок, давайте посмотрим врагу в лицо:

Эта иллюстрация вириона SARS-CoV-2 — самое распространённое в сети изображение частицы вируса, который вызывает COVID-19, — создана учёными Центра по контролю и профилактике заболеваний США (CDC).

А вот вирионы снятые через электронный микроскоп. На поверхности частиц видные выступы гликопротеинов, которые напоминают зубцы короны. Отсюда и название всей группы — «коронавирусы»:

На фликре NIAID целый альбом с красочными микрофотографиями вируса на поражённых клетках:

Если не можете устоять перед потоками информации (как я), лучше потратьте время на внимательное изучение всей этой красоты, чем на очередную горячую новость :-)

Оставайтесь дома. Сохраняйте спокойствие. Будьте здоровы.

Курс по визуализации данных 18, 19 и 20 мая

18, 19 и 20 мая мы с Ромой проведём в Москве учебный курс по визуализации данных.

Как всегда после декрета долгого перерыва, я новыми глазами взглянула на свою теоретическую часть, придумала, как упростить подачу материала, там где у слушателей были сложности, пересобрала лекции и добавила новую тему — об интерфейсе управления данными и их представлением. Раньше мы это тоже обсуждали, но без подробностей, вскользь.

Это первый курс, на котором не будет практики с библиотекой d3.js. Мы в лаборатории очень любим этот инструмент и все наши визуализации разрабатываем с его помощью, поэтому он так долго продержался в нашей программе, несмотря на все «но». На курсе мы обязательно расскажем о нём и покажем, на какие чудеса он способен. Но всё же опыт показал, что изучение d3.js не вписывается в формат короткого интенсивного обучения. Только опытные разработчики за полдня успевают «въехать» в особенности библиотеки, для остальных участников это тяжёлый труд с минимальным результатом. Табло, с другой стороны, доступен для быстрого изучения и полезен всем. Не случайно на курсах, где был выбор между двумя инструментами, только один студент из десяти выбирал d3 для самостоятельно работы, остальные делали практику в Табло. Надеюсь, когда-нибудь мы в лаборатории сделаем отдельный курс по d3 для разработчиков. А пока уделим вдвое больше времени Табло для более глубокого погружения в процессе и классных проектов в результате.

Сейчас из шестнадцати мест на курсе осталось пять. Два из них могу занять дистанционные участники. Если вам интересно, как обычно проходит обучение, читайте отчёт о последнем живом курсе в декабре 2017-го.

Подробности и запись на курс: http://datalaboratory.ru/course/

Консультации и экспресс-визуализация

Ура, я возвращаюсь к работе! Брать на себя большие проекты и долгосрочные обязательства я пока не готова, но придумала, кому и как буду полезна сейчас.

Во-первых, я начинаю консультировать по визуализации данных. На консультацию есть смысл приносить существующие проекты, отчёты и дашборды, которые вы хотите улучшить, или нерешённые пока задачи по визуализации. На часовом созвоне я задам вопросы о вашей задаче, выскажу свои идеи, покажу полезные приёмы и похожие решения. По итогам консультации подготовлю резюме в гуглдоке: сформулирую свои советы, опишу перспективные идеи, при необходимости снабжая их карандашными набросками, подберу полезные ссылки. Одна консультация скорее всего не решит всех проблем, но с большой вероятностью даст свежий, неожиданный взгляд на задачу и пару стоящих идей. Стоимость консультации — 10000 ₽.

Во-вторых, для тех, кому мало консультации и хочется получить осязаемый результат, мы с Ромой Буниным предлагаем «экспресс-визуализацию». Это та же консультация плюс базовый прототип в Табло от Ромы, который иллюстрирует одну или несколько моих идей. Этот формат лучше всего подойдёт для бизнес-задач, особенно для задач с готовым набором данных, который будут использованы в прототипе. Рома готовит прототип в течение недели после консультации. Базовый прототип — это демонстрационная штука, интерактивный дашборд, на котором можно «пощупать» идеи в действии, в приложении к своим данным. Не ждите от него слишком многого. Если вы захотите превратить прототип в полноценный инструмент работы с данными, об этом можно договориться с Ромой отдельно. Стоимость экспресс-визуализации — 30000 ₽.

В-третьих, в мае мы проведём учебный курс по визуализации данных. Годовая пауза — как и в прошлый раз — пошла курсу на пользу, он стал яснее и глубже. Ждите анонс!

В-четвёртых, если у вас есть не банальный и (важно!) не авральный проект по визуализации, дайте мне знать. Ну, мало ли :-)

Использованы оригинальные иллюстрации к «Алисе в Стране чудес» сэра Джона Тенниела

Лучшие визуализации — 2018

Начнём с визуализаций, посвящённых горячим новостям и острым темам 2018-го.

Спасательная операция в пещере Тхамлуангнангнон

Визуальные рассказы о спасении двенадцати юных футболистов и их тренера из затопленных пещер в Таиланде, опубликовали многие ведущие мировые СМИ. Мой фаворит — статья «Lucky 13» от Рейтерс. Они единственные показали маршрут спасательной операции на непрерывной схеме от начала и до конца со всеми вызовами и техническими решениями.

Там же есть понятная карта пещер с поперечным сечением в ключевых точках маршрута, включая полость под названием «Паттайя-бич», настолько узкую, что спасатели снимали кислородные баллоны, чтобы её преодолеть.

Другие достойные внимания визуальные истории на эту тему: Нью-йорк-таймс, Гардиан, Саус-чайна-пост.

Природные катастрофы

В мае на самом большом из гавайских островов произошло необычное — газовое или фреатрическое — извержение вулкана Килауэа, а также открылись трещины в жилом районе Леилани-Эстейтс, через которые вытекала лава. Хороший материал об этом — в Вашингтон-пост. Там и изящные карты, и наглядная схема-объяснение механизма извержения, и временная развёртка упавшего уровня лавы в лавовом озере кратера Халемаумау, и захватывающее видео фонтанов лавы, и самая красноречивая, на мой взгляд, визуализация — вот это изображение извергающейся трещины в тихом жилом квартале на пересечении улиц Лауны и Леилани:

В мае Нью-йорк-таймс проанализировало регионы, наиболее подверженные природным катастрофам:

В сентябре они же опубликовали завораживающую визуализацию урагана Флоренс:

А в ноябре — рассказ о лесном пожаре, уничтожившем городок Парадайз в Калифорнии:

На этой визуализации удачно подружились пространственное и временное измерение, и очень эффектно работает скролл (см. оригинал).

Китай

В 2018-м Китай продолжал строить дороги, мосты, дамбы, газо- и нефте-проводовы, тепло-, гидро- и атомные электростанции по всему миру. Нью-йорк-таймс, Гардиан, Блумберг и другие издания визуализируют масштабы строительства, анализируют стратегические цели Китая и проблему «долговой ловушки», в которой оказываются страны-партнёры.

Журналисты Рейтерс опубликовали визуальное расследование вокруг объектов, которые предположительно являются китайскими лагерями для заключённых-мусульман. В статье «Tracking China’s Muslim Gulag» они анализируют снимки со спутника и фотографии объектов и делают выводы об увеличении как количества лагерей, так и их размеров. Выводы подкреплены убедительной и интересной графикой:

Здесь же классный приём — обход периметра по скроллу:

Саус-чайна-морнинг-пост разбавляет китайскую тему материалом о богатых азиатах с серией визуализаций разной степени серьёзности:

Деньги и общество

Гениальная в своей простоте визуализация использования земли в США:

Разбив карту на маленькие квадраты и сгруппировав их по назначению земли внутри самой карты, авторы добились метафоры, понятной любому американскому школьнику. Будь-то леса, пастбища или сельскохозяйственные угодия, все эти территории теперь можно «измерить» в штатах. Интересно было бы взглянуть на аналогичную визуализацию о родных просторах.

Маленькая, да удаленькая визуализация, посвящённая «триллионному» рубежу компании Эппл:

У визуализации очень приятная механика, которую не передать статичными картинками — нечто среднее между тетрисом и «карандашной физикой» (Сrayon Physics). А ещё она очень понравилась Яне. Сидя у меня на коленях, пока я в ночи составляла этот список, она без конца просила: «Включи ту зацию, где вываливаются разноцветные штуки». И я включала, снова и снова :-)

Безумно красивая идея от «Нэшнл-географик» — волны иммиграции показаны как годовые кольца дерева:

Цветные пики по секторам — приток приезжих из той или иной части света. В «увеличительном стекле» показано, что график состоит из атомов — чёрточек, каждая чёрточка — 100 «одноцветных» иммигрантов. Благодаря такой дробности, формат работает и в разбивке по штатам:

Ещё одна визуализация на тему иммиграции опровергает связь между притоком иммигрантов и ростом преступности:

Обратите внимание, как множество графиков работают вместе, не превращаясь в кашу.

Города

Глубокое и необычное исследование названий улиц в немецких городах:

Я читала немецкую статью, переведённую браузером на английский. В английскую версию статьи на сайте большая часть «вкуснятины» не вошла.

Исследование причин задержек в Нью-йоркском метро с анимированными пояснениями и подробной интерактивной моделью наглядно демонстрирует причины транспортного кризиса:

На этой шестой по счёту визуализации от Нью-йорк-таймс скорее всего сработает ограничение на просмотр. Если не планируете оформлять подписку, воспользуйтесь  режимом «Инкогнито». 

Ещё одна эффектная городская визуализация — сейсмоопасные небоскрёбы Сан-Франциско:

Эволюцию метро в городах Китая с 1990 по 2020 годы в формате гиф:

Природа и экология

Изящная карта с первыми листочками показывает раньше или позже приходит весна в разные регионы США по сравнению с данными 50-летней давности:

Замечательный пример буквального кодирования — по всей карте «распускаются» первые листочки. Здесь же картина по годам за последние 35 лет. Видно, что хотя «в среднем по больнице» весна приходит раньше, года между собой отличаются довольно значительно, как в одну, так и в другую сторону:

В той же статье есть и график цветения вишни с точками-лепестками. Интересно, насколько точным оказался прогноз на 2018-й?

Плакат и интерактивная визуализация о загрязнении морей пластиком:

На карте показано три среза данных: страны закрашены тем ярче, чем больше пластиковых отходов производят, светло-жёлтые воронки в устьях рек показывают, сколько пластика приносит река в открытое море, а круги в океане — это плавучие скопления пластикового мусора. Обратите внимание, что отсутствие кругов не означает отсутствие мусора. Области, где исследовательские суда не обнаружили пластика показаны чёрными точками, и их не так уж много по сравнению с подтверждёнными «мусорными кучами».

Трогательные изображения семи исчезающих видов, которых осталось так мало, что все их представители помещаются в вагон метро:

Там, где сухое число скорее всего оставило бы читателя равнодушным, автор нашла понятную, наглядную и близкую большинству метафору и воплотила её в выразительной графической форме.

Любопытный проект «Небесные фигуры», который собрал воедино 28 систем созвездий разных мировых культур:

Все жители Земли во все времена смотрели на одно и то же звёздное небо. Во многих культурах звёзды объединяли в небесные фигуры. На визуализации можно взглянуть на небо глазами арабов, китайцев, египтян, индусов, ацтеков и других народов, а также увидеть созвездия, связанные в разных культурах с одними и теми же звёздами.

Cпорт

Зимняя олимпиада как обычно богата на графику, но примечательных визуализаций мне удалось найти не так уж много.

Самым интересным мне показался сюжет с графическим объяснением сложных трюков фигуристов, лыжников и сноубордистов:

Уже привычный, но от этого не менее захватывающий спортивный формат — раскадровка:

На прошлой олимпиаде Нью-йорк-таймс использовали гениальные живые превьюшки соревнований. В этом году изображения стали более детализированными, сохранив при этом лаконичность исходного формата:

Визуализация, которая раз и навсегда закрыла вопрос о первенстве по медалям, рассчитывает место в общем списке по всевозможным системам от «все медали одинаковы» до «только золото имеет значение»:

Весь чемпионат мира по футболу, начиная с одной восьмой финала:

Очень здорово показано, как в ходе игры менялись шансы на победу команды.

Искусство

Неоднозначный, но занятный анализ летних хитов с 1970-х до 2018-го:

Автор «раскладывает» композиции по выбранным шести характеристикам-векторам и, сравнивая профили между собой, делает вывод о том, что музыкальное разнообразие в 2000-х практически отсутствует. К методологии много вопросов: почему только летние хиты, почему именно эти вектора и именно шесть, насколько субъективны и измеряемы оценки по шкале «акустичности» и «весёлости», но в целом интересная идея и качественная реализация.

Шедевральное полотно с анализом работ Пабло Пикассо:

Создатели визуализации выделили 12 ключевых тем творчества художника, разделили более чем 8000 произведений по темам и подтемам, на большом холсте разметили области, форма которых напоминает стиль художника, а площади пропорциональны количеству работ по теме, и закрасили области масляными красками. Получилась впечатляющая полутораметровая картино-грамма.

Сценические костюмы Дэвида Боуи в формате дополненной реальности:

Экскурсию по сценическим образам музыканта на примере четырёх феерических костюмов, конечно, сложно назвать визуализацией данных в классическом смысле слова. Но такой плотностью информации (форма, крой, материалы, детали, текстура ткани, которую, кажется, можно пощупать), как на этих 3D-моделях, может похвастаться далеко не каждая визуализация.

Вселенная пятидесяти глав манги «Кардкэптор Сакура»:

Я не очень люблю такой закрученный по кругу формат, но здесь много приятных деталей и видно, что визуализация сделана с любовью к теме, а это, пожалуй, самое главное ❤️

В заключение, не могу не поделиться нашей коллаборацией с «Т—Ж»:

На оcнове указаных пожеланий, возможностей и ограничений, калькулятор рассчитывает выгодный для пользователя сценарий покупки квартиры в Москве: снимать и копить или взять ипотеку.

В этом году помимо отдельно стоящих визуализаций было много историй, расследований и просто статей, в которых интерактивная графика встречалась много раз по ходу повествования. При этом в лучших примерах на один материал приходилось сразу несколько уместных, качественных и продуманных визуализаций. Кроме того, активно используются 3D-модели и дополненная реальность, которые из инструментов «вау-эффекта» превращаются в полезных рабочих лошадок. Наблюдать эти изменения приятно.

Для тех, кто интересуется — подборки прошлых лет: 2017, 2016, 2015.

Лаборатория данных на паузе

Пришло время поделиться моими главными новостями.

10 апреля у нас с Димой родилась вторая дочка, Машенька. А чуть раньше я приняла непростое решение — поставить лабораторную работу на паузу. Лаборатория данных не берёт проекты до конца года, пока я наслаждаюсь моим первым полноценным декретным отпуском.

Последние три или даже четыре года дались мне нелегко. Яна родилась через полтора года после открытия лаборатории. Тогда я даже не помышляла о том, чтобы оторваться от дел и поставить работу на паузу. Совмещать бизнес и материнство, да ещё и в условиях нашего переезда, без поддержки бабушек и бебиситеров, оказалось почти героическим подвигом. Моя работа и семейные дела — это принципиально разные режимы работы мозга, и иногда я буквально физически ощущала, как меня разрывает на части. Я постоянно что-то делала на пределе своих возможностей, и постоянно с ощущением, что ничего не успеваю. Круче меня в это вкладывался только Дима, который всегда был на подхвате и в делах, и дома, и вообще самый лучший муж и отец, которого я могу представить.

А потом мы решились на Машу. И стало понятно, что на всё меня не хватит. Лаборатория данных — главное дело моей жизни, но семья важнее. Когда я узнала о беременности, я закрыла самый крупный лабораторный проект и распустила большую часть команды. В марте завершила работу над всеми проектами и попрощалась с оставшимися ребятами. С тех пор мой фокус полностью на себе и на семье.

В феврале, в Таиланде, пока ещё втроём

Я очень рада, что мой декрет — не вынужденная мера, а осознанное решение. Я хочу посвятить какое-то время семье, я заслужила отдых (ну, вы знаете этот отдых дома с двумя детьми :-) Я мечтаю вернуться к работе, когда почувствую сильный внутренний импульс, когда больше не смогу без неё жить. А пока я кайфую, днями напролёт напевая колыбельные и развешивая пелёнки. Сомневаюсь, что могла бы оказаться в этом состоянии, без всего моего предыдущего опыта.

Онлайн-курс по визуализации данных 23, 24 и 25 марта

23, 24 и 25 марта мы с Ромой и Димой проведём онлайн-курс по визуализации данных.

Содержание курса в точности повторяет наш обычный трехдневный «живой» курс, но поучаствовать в нём можно не выходя из дома. Мы набираем всего 15 человек, чтобы уделить внимание всем, и чтобы участие в онлайн-курсе было таким же полезным, как очное обучение. Места в группе пока есть.

В прошлый раз мы впервые подключили к «живому» курсу дистанционных участников, ребята остались довольны. Их отзывы можно почитать на странице курса. Если вам интересно, как обычно проходит обучение, читайте отчёт о декабрьском курсе.

Для тех, кто сомневается, насколько полезен лично ему будет курс, я собрала на хабре пять причин посетить курс по визуализации данных.

На онлайн-курс действует специальная цена: 35000 руб. — для самостоятельных участников и 45000 руб. — для представителей компаний. Скидок в этот раз нет. Если вы хотели попасть на курс, но откладывали, решайтесь. В этом году живых курсов больше не будет. Возможно, мы проведём ещё один онлайн-курс осенью, но и он пока под вопросом.

Подробности и запись на курс: http://datalaboratory.ru/course/

Лучшие визуализации — 2017

Начнём с визуализаций, которые адресованы читателю, затрагивают разные аспекты его жизни и помогают найти ответы на волнующие его вопросы. В этом году таких примеров особенно много.

Вот «Блумберг» прогнозирует вероятность автоматизации и исчезновения профессий:

График снабжён полем поиска, чтобы найти свою профессию и оценить риск остаться без работы в ближайшем будущем. Кроме того, авторы статьи выделили области наименьшего и наибольшего риска и делятся наблюдениями и выводами прямо на графике.

«Гардиан» предлагает читателю сравнить своё финансовое положения с представителями других поколений:

Для начала читатель указывает свой возраст и выбирает страну — статья становится персональной. После этого он по шагам знакомится с графиками, которые дают ответы на конкретные вопросы «Богаче или беднее были 30-летние в моей стране раньше?», «В каких странах 30-летние богаче или беднее, чем я?», «Соотечественники какого возраста богаче и беднее меня?». Эти ответы помогают разобраться в информационно нагруженной «матрице поколений» по странам. К сожалению, в списке стран нет России.

«Вашингтон-пост» рассчитывает налоговые послабления для граждан, проживающих в разных штатах, с разным доходом, с учётом семейного статуса и налоговых вычетов:

«Нью-йорк-таймс» анализирует пригороды крупных американских городов по соотношению доступности жилья и качества школьного образования:

Городки в правом нижнем углу — лакомый кусочек. Зелёным выделены пригороды, в которых комьют (усреднённый по всем жителям) не превышает получаса. На графике поиском можно найти свой или соседний городок, а также присмотреть новое место жительства.

«Стек-оферфлоу» исследует популярность основных технологий разработки в развитых и развивающихся странах:

Очень интересные исследования в области данных простых людей проводит Натан Йяу у себя на «Flowing Data». Вот пара примеров.

Время жизни взрослого человека, распределённое по активностям (в днях):

Отличие в занятиях у людей без детей и людей с детьми (в часах):

Другая интересная тема — разводы, например, этот срез по профессиям:

К слову о вымирающих профессиях. Используя формат из прошлогодней визуализации «Блумберга» «Кто на ком женится», Натан отображает возможные маршруты смены рода деятельности:

Можно выбрать свою профессию и на что вы хотите её поменять, и посмотреть, как чаще всего такой переход происходит. А там уже решить, хотите ли вы повторить весь маршрут, или пойти напрямик :-)

Хенрик Линдберг визуализировал пики занятия разными видами спорта в течение дня:

Зен Армстронг показал паттерны рождения младенцев, с интересными акцентами и выводами:

Эти визуализации позволяют нам увидеть свою жизнь на большой шкале глобальных трендов и происходящих в мире изменений. Они вовлекают читателя, предостерегают или успокаивают, приносят пользу. Знаете ещё такие примеры?

Отмечу ещё несколько интересных исследований на тему геоданных.

Эссе Джастина О’Бирна, посвящённое новой технологии гугла, AOI (areas of interest) — читается как остросюжетный детектив:

Cистема отслеживания пиков загрузки на немецкой железной дороге (вся магия в скринкасте):

Красивое и содержательное исследование работы московского такси от Александра Кукушкина:

Отображение времени вызова цветом — настоящая находка!

Здания на Манхеттене, которые не были бы построены сегодня:

Другие достойные внимания, вдохновляющие и необычные визуализации.

Жизнь крупных городов, визуализированная чекинами на Форсквере:


Изохроны крупнейших городов Европы:

Интерактивное объяснение, которое в игровой форме рассказывает, как устроено доверие и насколько выигрышными являются различные модели человеческого поведения:

Температура, ветер и снего-дождь на новых погодных картах Яндекса:

«Дыщащая Земля» — симпатичная визуализация сезонных изменений зелёного покрова планеты:

Все солнечные затмения, которые произойдут в течение вашей жизни:

Для любителей живой природы — всё, что вы хотели знать о яйцах в визуализации журнала «Сайнс»:

Дотошное исследование того, как рисуют кружки представители разных культур с анализом прописных букв соответсвующих алфавитов и подробными распределениями результатов:

Сумасшедшей красоты картины машинного обучения:

Высочайшие статуи мира — бок о бок, один из моих любимых форматов:

Анализ результативности бейсбольных ударов в зависимости от угла и скорости мяча:

Все «пробеги» ресивера Нью-йоркских гигантов Оделла Бекхема в этом сезоне Американской футбольной лиги:

Больше вдохновения в твиттере по тегу #Δλlikes. С наступающим Новым годом!

Отчёт о декабрьском курсе «Визуализация данных»

8, 9 и 10 декабря мы с Ромой и Димой провели в Москве очередной, шестой по счёту курс по визуализации данных. И по нашим ощущениям, и по результатам практики, и по отзывам участников, курс получился очень удачным. Он объединил все наши лучшие наработки и некоторые нововведения. Из нововведений, мы подготовили для участников конспект всех лекций с контрольными вопросами, а также в качестве эксперимента открыли дистанционный доступ к курсу для трёх участников.

В нашем курсе четыре учебных блока: теория визуализации данных (моя часть), знакомство с Табло (Ромина), знакомство с d3.js (Димина) и работа над мини-проектом (самостоятельная часть под руководством преподавателей). Курс идёт три дня, и в этот раз нам удалось найти идеальный рецепт распределения учебных блоков во времени.

Первый день до обеда мы посвятили теории визуализации данных. Мы с участниками рассмотрели классные примеры и вместе сформулировали признаки хорошей визуализации, после чего перешли к разбору алгоритма Δλ — познакомились с понятиями реальности данных и частицы данных, узнали, зачем они нужны и как их использовать. Хорошее представление об этом блоке даёт опубликованная на хабре расшифровка моего выступления на БДСЛ. После обеда у руля встал Рома и провёл для ребят мастер-класс по работе с Табло. Участники курса изучили возможности и ограничения инструмента и попробовали применить его на практике.

Второй день до обеда — продолжение теоретической части. Участники познакомились с понятиями визуального атома и каркаса, обсудили возможности сочетания разных атомов и каркасов между собой и разобрали по косточками около 50 (!) примеров визуализаций, от более-менее стандартных до самых экзотических. Ребята стоически выдержали такой плотный поток информации. После обеда Дима погрузил участников в мир веб-технологий: от создания векторной графики в SVG и написания функций на джаваскрипте, к освоению d3.js — выборкам, текучему интерфейсу, GUP (general update pattern) и работе со специфичными для d3 функциями.

Весь третий день участники работали над своими задачами. В первой половине дня учились применять алгоритм Δλ к своим данным, обсуждали со мной результаты и формулировали постановку задачи. Во второй половине — решали эту задачу с помощью выбранного инструмента (Табло или d3) под чутким руководством Ромы и Димы. На вечернем разборе 9 из 10 участников продемонстрировали интерактивные визуализации на основе собственных данных. До работоспособного результата не доплыл только Влад, который участвовал в курсе удалённо из Вашингтона, к третьему дню провёл с нами уже три бессонные ночи и ушёл спать раньше, чем начался разбор.

Покажу несколько примеров. Саша Котов из Авто.ру собрал в табло визуализацию для сравнения характеристик автомобилей:

В первой версии доступно сравнение по ограниченной выборке моделей и всего по нескольким параметрам, но у Саши масса идей по усовершенствованию интерфейса и развитию идеи.

Катя Гаврило, удалённая участница из Амстердама, выбрала для практики данные о 512 заключённых, казнённых в штате Техас, и продумала интереснейшую историю о них:

Ольга Макарова визуализировала работу своего отдела с разных точек зрения, в частности, сделала очень полезный срез о присутствии на рабочем месте в течение дня:

Филип Милевчич показал финансовые разночтения в отчётах аптечных сетей и дистрибьюторов, совместив на одном экране интерактивно связанные карту, таблицу и диаграммы:

Ира Митина, уже молодец хотя бы потому что не побоялась делать практику на d3.js, визуализировала извержения вулканов вместе с количеством жерт от каждого извержения. Пульсирующая обводка показывает извержения, которые сопровождались цунами.

А вот предмет нашей особой гордости — отзывы:

Как я уже писала, мы очень довольны курсом с точки зрения эффективности обучения. А ещё он получился очень камерным и душевным. Спасибо всем участникам за вовлечённость и искренний интерес к нашим знаниям ❤️

Следующий курс мы проведём в марте, и постараемся взять всё лучшее, что было на декабрьском курсе. В частности, мы ограничим размер группы десятью участниками: максимум пять дистанционных, остальные — в живую. Чтобы попасть в эту небольшую группу, оставьте свою почту на странице курса, и мы пришлём вам приглашение на один день раньше официального анонса.

Курс по визуализации данных, 8, 9 и 10 декабря в Москве

8, 9 и 10 декабря мы с Ромой и Димой проведём в Москве учебный курс по визуализации данных.

В прошлый раз мы в качестве эксперимента дополнили нашу обычную программу блоком о Табло и добавили целый день на работу с мини-проектами. Эксперимент удался, Табло пришёлся по душе многим участникам, а у тех, кто решил всё-таки разобраться с D3.js было больше времени на общение с Димой и разбор сложных случаев. В последний день ребята так сильно увлеклись работой над собственными визуализациями, что не расходились до позднего вечера.

В этот раз мы решились на ещё один эксперимент, впервые на курсе будет возможность удалённого участия. Мы начнём с трёх мест, чтобы обкатать новый для нас формат. Мы получили много запросов на удалённое обучение, поэтому если вы хотите пройти курс дистанционно, поторопитесь забронировать место. Стоимость дистанционного участия такая же, как при очном участии.

Для тех, кто сомневается, насколько полезен лично ему будет курс, я собрала на хабре пять причин посетить курс по визуализации данных. А для тех, кто читает блог, по традиции скидка — 5 тыс. руб. (при записи в поле «Комментарий» сделайте пометку «из блога Тани»).

До встречи в Москве!

Лабораторный слёт на Байкале

В ноябре прошлого года мне написала Маша Комарова и пригласила в байкальский дизайнерский лагерь. Я согласилась, не раздумывая. Этим летом мы всей семьёй и всей лабораторной командой побывали в необыкновенных местах.

БДСЛ
Первые дни мы провели в лагере, в посёлке Большие Коты (ударение на первый слог). Дорога от дверей дома до гостиницы в Котах заняла 28 часов: выехали утром, приехали в обеде следующего дня. Но вид с балкона того стоил:

В лагере я провела мастер-класс по визуализации данных — одно из немногих моих выступлений, которым я безоговорочно довольна. Сосны и Байкал в открытых окнах аудитории добавляли мне спокойствия, а моему рассказу последовательности и ясности. Кроме выступления, лагерь запомнился классной атмосферой научной биостанции, посиделками у костра, беседой на берегу озера и новыми приятными знакомствами.

Фото Юли Поздняковой

Спасибо Маше за чудесную организацию и гостеприимство! Всё сделано с любовью и продумано до мелочей. Особенно умилили бейджики для малышей с формулировками вроде «Ты проживаешь в номере со своими мамой и папой» :-)

Яна и её «бэжик»

Харанцы
После лагеря мы перебрались на остров Ольхон, где провели ещё две недели с лаборантами.

Нам повезло, с помощью иркутян Маши и Фёдора мы нашли в посёлке Харанцы дом отдыха на восемь номеров — как раз столько нам было нужно на шесть семей и трёх лаборантов, путешествующих в одиночестве.

Справа — наш домик, слева — столовая с верандой, которая служила нам коворкингом

От дома открывался ошеломительный вид на озеро и скалу Плывущий лев:

Наш дом справа за деревьями

Наблюдаю со своего балкона единственный рассвет, который мне удалось не проспать:

По приезду нас ждали напряжённые рабочие будни, так как на нашем главном в то время проекте случилась непростая ситуация. Расхлёбывали все вместе, сидя рядышком на веранде возле столовой — редкая удача для нашей распределённой команды. Правда, ситуацию осложнял медленный, периодически исчезающий вайфай, а однажды на полдня пропало электричество. Но мы всё равно как-то всё в итоге разрулили.

В свободное время гуляли по окрестностям, дивились байкальским просторам и вдыхали запах дикого чабреца:

Отдельным пунктом программы были вечерние развлечения. Почти каждый вечер мы ходили на берег озера и любовались закатом, а после этого возвращались домой и устраивали посиделки у костра. Количество сосисок, съеденных на этих посиделках, превысило мою годовую норму (не то чтобы она была большой, но всё же :-)

Закат без фильтров
Всё в сборе у костра, сфотографировал Кирилл Беляев

Самый классных досуг был у детишек. Они бегали по степи, лазали по деревьям и запускали воздушных змеев и парашюты.

Фотография Полины Ошурковой
Воздушный змей Саши и Лизы Моисеенко

Ещё нам вместе с малышами посчастливилось наблюдать, как суслик роет нору — он делал это прямо возле нашего дома:

Яна с Данилой были неразлучны ❤️

Экскурсии

За всё время на Ольхоне, мы несколько раз выбрались в столицу острова Хужир и съездили на две морские (потому что по Малому Морю) экскурсии.

Скала Шаманка в Хужире — сердце Ольхона и символ Байкала
На ритуальных столбах (сэргэ) паломники-буряты завязывают цветные лоскуты
Звериные тотемы, сфотографировала Яна

В Хужире мы исследовали два пляжа — один галечный раскинулся у подножия Шаманки, и ещё один, песчаный и бесконечно длинный, простирается на север от Шаманки, почти до Харанцов. На большом пляже многие купаются и подолгу резвятся в ледяной воде, но мы просто отдыхали и восстанавливали силы после долгих прогулок.

Посиделки на маленьком пляже

Поездки на катере по Малому Морю оставили ощущение сплошного концентрированного счастья.

Мы прокатились до острова Огой, по пути видели нерпу в бухте острова Замогой и запилили корпоративный лук на фоне сложенного из камней логотипа лаборатории в непосредственной близости от буддистской ступы:

Переплыли Малое море и прогулялись по противоположному берегу:

Обогнули мыс Хобой:

Проползли по узенькой пещере, чтобы вылезти на скале прямо над водой:

Лазали по валунам из белого мрамора, пока наш капитан, стоя по колено в воде, мощным бедром придерживал картер, который сносило волной:

Рассмотрели вблизи скалу Плывущий лев, на которую до этого любовались с берега:

Байкал — необыкновенное место. То, что задумывалось как беззаботный отдых, обернулось глубоким и непростым опытом. Сама того не желая, я оказалась лицом к лицу с важными вопросами, которые давно отодвигала на задний план. В долгих прогулках вдоль озера у меня было время для размышлений. Ответы на вопросы пришли уже после возвращения из поездки и оказались неожиданными для меня самой.

К сожалению, этот лабораторный слёт был последним в таком большом составе. В сентябре я отказалась от самого крупного лабораторного проекта, и мне пришлось попрощаться с большей частью команды. Тем лучше, что наши последние совместные воспоминания окажутся такими особенными ✨

Ранее Ctrl + ↓