12 заметок с тегом

алгоритм Δλ

Алгоритм визуализации на Фестивале 404

25-го сентября представила свой алгоритм визуализации сложных данных на Фестивале 404.

Моё обычное лицо во время выступления (◕‿◕)

Моя большая радость, что в часовой доклад удалось упаковать большую часть теории, которую я преподаю на учебном курсе «Визуализация данных». Видео-запись выступления доступна на ютубе:



В алгоритме важна не только последовательность шагов, но и то, как следующий шаг связан с предыдущим, как один вытекает из другого, а также метаморфозы, происходящие внутри шагов — и всё это отражено в презентации. Важно: переключайте слайды стрелками справа и слева от содержания, а не встроенными контролами фигмы (внизу), тогда будут видны анимации, которые играют здесь ключевую роль.

Фестиваль 404 — ван лав ♥️

Визуализация данных в Школе дизайнеров

Визуализация данных стала одним из предметов бюрошной Школы дизайнеров. Для меня и для лаборатории — это большой шаг.

То, что Артём поверил в наш подход и доверил вести занятия в школе — неожиданное и важное подтверждение того, что мы на правильном пути. Я беспокоюсь, что визуализация окажется очень сложным и не слишком нужным большинству дизайнеров предметом, но надеюсь, что будет хотя бы интересно. А для тех ребят, кто интересуется визуализацией и периодически спрашивает нас об онлайн-курсах, — это прекрасная возможность познакомиться с актуальной теорией и алгоритмом Δλ, а заодно получить другие бесценные знания.

Набор в школу открыт до 24 июля, старт занятий — 28 августа. На выполнение вступительного задания осталось всего 6 дней, поэтому не откладывайте. После 24 июля тоже можно попробовать, но не факт, что будут места.

Добавлю пару слов о школе, как работодатель. Из девяти лаборантов, которые сейчас работают со мной, двое прошли обучение в школе. Наташа (разработчик) — одну ступень, Ваня (дизайнер) — все три. Это не сделало их монстрами, мы многому доучиваем ребят не только по части программирования и визуализации, но и по тем предметам, которые были в программе школы. Зато, совпадение или нет, при выборе кандидатов на финишной прямой школа в обоих случаях сыграла роль. Наташа опередила более опытного разработчика без школьного образования, а Ваня — дизайнера с двумя ступенями за плечами. И я ни разу не пожалела о своём выборе. Для меня школа — это не столько знания и навыки, сколько отличительный знак бойца и единомышленника. Тех качеств, которые сложно проверить тестовым заданием.

2017   алгоритм Δλ   учебный курс

Алгоритм Δλ: новая подача, учебный курс и БДСЛ

Весь прошлый год я работала над алгоритмом визуализации данных. Я сознательно избегала упрощения и стремилась к универсальности. Мне хотелось, чтобы алгоритм принимал на вход данные любой сложности и позволял получить максимально подходящую для них визуализацию, выраженную стандартными или нестандартными форматами. Но как любой гибкий и мощный инструмент, алгоритм оказался сложен для понимания и изучения. Даже после моего объяснения на курсе, некоторые участники не смогли применить его для решения своих, зачастую достаточно простых, задач. Да и развивать алгоритм было чем дальше, тем сложнее. Короче, перемудрила :-)

В хорошем интерфейсе простые, часто используемые функции находятся на виду, а для выполнения более узкой задачи нужно углубиться в систему. Обычные пользователи с лёгкостью решают обычные задачи, не спотыкаясь о ненужный им функционал, а продвинутые находят все необходимые функции и наслаждаются широкими возможностями приложения.

В этом году я буду развивать алгоритм по схеме «хорошего интерфейса». База останется прежней, я верю, что сформулированные мной принципы полезны для работы с любыми данными. Более того, в лабораторных проектах я часто вижу, как отсутствие такой базы мешает прекрасным специалистам на стороне заказчика, которые годами работают с данными, распутать клубок и увидеть простое решение.

Изменится подача: я попробую раскрыть алгоритм от простого к сложному. Я уделю много внимания базовым форматам, разберу их с точки зрения алгоритма и покажу, как обогатить их данными и срезами. Это будет фундамент для решения большинства задач — польза всем. Оттолкнувшись от привычных форматов, мы с участниками курса вместе дойдём до «визуальных атомов» и «каркасов», и обсудим, как можно произвольно комбинировать их для решения более сложных и нестандартных задач. Это будет вход вглубь алгоритма, в очень важную (но далеко не всем нужную) его часть. На практике каждый участник сам решит, хочет ли он применить знания об алгоритме на стандартных форматах или копнуть вглубь. В работе с инструментами мы пошли тем же путём: мы знакомим ребят с Табло и d3.js, а на практике участники сами выбирают, что им ближе — быстрый результат или неограниченные возможности.

Курс пройдёт в Москве 17, 18 и 19 июня. А 22 июля я проведу четырёхчасовой мастер-класс по визуализации в Байкальском дизайнерском спецлагере. Там будет меньше времени и меньше практики, чем на нашем курсе, зато будут другие классные лекторы, посиделки у костра и Байкал! По традиции читателям блога — скидка 5 тыс. руб. на курс (при записи в поле «Имя и фамилия» сделайте пометку «из блога Тани»). Насчёт скидки на БДСЛ ничего не знаю, просто передавайте Маше от меня привет :-)

До встречи этим летом!

2017   алгоритм Δλ   учебный курс

Алгоритм Δλ: реальность данных и каркас визуализации

На качественной визуализации оба экранных измерения работают, образуя один или несколько каркасов для массы данных. О типах осей и образованных ими каркасах мы поговорили в предыдущей заметке. Сегодня обсудим, как выбрать из множества измерений реальности данных те, что станут хорошим каркасом.

У этой задачи две степени сложности. В простом случае выбор каркаса очевиден. Это случай, когда измерений не слишком много, и сразу понятно, какие из них наиболее значимы и станут основой визуализации. В простом случае после того, как мы нашли частицу данных, сформировали массу из этих частиц и выделили эту массу в реальности данных, у нас остаётся этакий «остов», жёсткий статичный ландшафт, который и послужит каркасом визуализации. Этот ландшафт может быть плоским, тогда он просто становится каркасом визуализации. Например, мировая карта в истории землетрясений:

Временная ось, вдоль которой раскрываются траты из личного бюджета:

История голосования разных штатов — не самый очевидный на первый взгляд формат. На деле, простая комбинация из визуальных атомов — линий-штатов, на каркасе временой оси и оси процентного преимущества победившего кандидата:

Ландшафт может быть многомерным, тогда нужно придумать, как его свернуть в плоскую картину. Например, схема маршрута и временной слайдер на визуализации Московского марафона:

Схема линии и временные интервалы на диаграмме загруженности Московского метро:

Результаты забега на стометровке — время финиша трансформировано в отставание (в метрах) от последнего мирового рекорда:

Если вы без труда выбрали осмысленные оси для обоих экранных измерений и получили интересный результат — ура, вам повезло! Подумайте, чем дополнить основной каркас и какие интересные измерения остались за кадром.

Например, визуализация Московского марафона дополнена интерактивной картой высот (оси— координата на дистанции и высота над уровнем моря) и диаграммой финишей (бегуны вдоль оси времени):

Траты личного бюджета можно перегруппировать по категориям или по времени суток/дню недели:

В истории землетрясений тоже интересно было бы взглянуть на временную развёртку, чтобы отследить отличившиеся по количеству и силе землетрясений года.

В сложных случаях я комбинирую оси с важными параметрами более-менее случайным образом, формулирую, на какой вопрос отвечает то или иное сочетание осей, выбираю самые удачные сочетания. Интересные картины получаются на стыке предположительно зависимых параметров данных:

И из распределения частиц данных вдоль разных осей:

При сочетании простых и удачных каркасов между собой получаются по-настоящему мощные визуализации. Например, исходная диаграмма активности и отдыха жителей разных городов:

Может быть дополнена сводными данными, усреднёнными по городам и показаными на одном графике:

И диаграммой среднестатистических недель по городам:

Объединим эти каркасы с помощью интерактивной связи в одну визуализацию и увидим множество срезов данных как на ладони:

Другие примеры комбинированных каркасов. Таймлайн + карта:

Карта + хитмеп:

Несколько однотипных графиков:

И даже последовательности однотипных графиков:

http://www.nytimes.com/interactive/2012/11/30/us/tax-burden.html?_r=0 http://www.nytimes.com/interactive/2012/11/30/us/tax-burden.html?_r=0

Выбор каркаса (или нескольких) — последний, самый трудный шаг, когда от массы данных и списка измерений мы переходим к визуализации в её окончательном виде. Признаюсь, я пока не до конца сформулировала все хитрости и подводные камни этого перехода, и ещё буду о нём писать. Надеюсь, что в этой заметке мне удалось ответить на вопросы Дениса и Ивана. Буду рада новым вопросам читателей.

Чтобы познакомиться с нашим алгоритмом «из первых рук» и научиться его применять, приходите на курс по визуализации данных, который я проведу в Москве, 8 и 9 октября.

Следующая теоретическая заметка выйдет 28 ноября.

2016   алгоритм Δλ   визуализация данных   теория

Алгоритм Δλ: каркас визуализации и виды осей

Интерактивная визуализация живёт в двух измерениях плоскости экрана. Именно эти два измерения придают массе данных «жёсткость», систематизируют визуальные атомы и служат каркасом визуализации. От того, как использованы эти два измерения, зависит насколько интересной, информативной и полезной получится визуализация.

На хорошей визуализации каждому измерению соответсвует ось, которая выражает значимый параметр данных. В этой заметке поговорим о видах осей.

Непрерывная ось
На такой оси значения параметра откладываются вдоль одного из экранных измерений. При этом каждой точке на оси соответсвует своё значение параметра, а двум разным значениям параметра (даже близким) соответствуют разные точки на оси. Непрерывная ось подходит только для отображения количественных параметров.

С непрерывными осями мы знакомимся в школе, когда строим параболы:

Вообще, под графиком обычно понимают именно такой каркас — из двух непрерывных осей. Зачастую график показывает зависимость одной величины от другой, в таком случае по сложившейся традиции независимая величина откладывается по горизонтали, а предположительно зависимая — по вертикали:

График из двух непрерывных осей с точками-объектами:

Иногда на осях отмечают средние значения, и график делится на осмысленные квадранты («дорогие результативные игроки», «дешёвые результативные» и т. д.):

Также на графике можно провести лучи, они покажут соотношение параметров, отложенных по осям, которое само по себе может оказаться значимым параметром (в данном случае, конкуренция в отрасли):

Для наглядного отображения параметра с большим разбросом значений используют ось с логарифмической шкалой:

Оси пространства и времени
Важный частный случай непрерывных осей — оси пространства и времени, например, географическая координата или линия времени.

Карта, вид футбольного поля или баскетбольной площадки, схема производства — примеры комбинации двух пространственных осей.

Основой визуализации бывает одна непрерывная пространственная ось, например, погружение вглубь океана, в недра Земли или подъем в высоту:

Ещё один пример логарифмической оси

Графики с временной осью — первые абстрактные графики, которые положили начало визуализации данных:

И с успехом применяются до сих пор:

Ещё один способ показать временное измерение — дополнить пространственную картину слайдером:

В исключительных случаях пространство и время получается совместить на плоской карте или вдоль одной оси:

Карта наступления Наполеона на Москву в 1812 году
Диаграмма экспедиций Амундсена и Скотта

Интервальная ось
Интервальная ось разделена на отрезки (равные или неравные), которым ставится в соответствие значение параметра по определённым правилам. Интервальная ось подходит как для качественных, так и для количественных параметров.

Хитмеп — классический пример комбинации двух интервальных осей. Например, количество случаев заболевания по штатам и годам, показанных на соответствующем каркасе:

Название штата — чисто качественный параметр, каждому штату соответствует один шаг по вертикали. Год — непрерывное временное измерение, редуцированное до годовых интервалов. Каждому году соответствует один шаг по горизонтали.

Интервальные оси с мелким шагом (дни года по горизонтали, часы суток по вертикали) дают очень подробную, почти «непрерывную» картину:

Две интервальные оси не обязаны превращаться в хитмеп:

Интервальная ось может комбинироваться с непрерывной. Например, на этой визуализации наследия Пикассо по горизонтали отложены годовые интервалы, а по вертикали — непрерывная ось количества работ:

Другой пример комбинации интервальной и непрерывной осей — диаграмма найма «Хантфлоу». По горизонтали отложены этапы собеседования (качественный параметр), по вертикали — количество кандидатов на этапе:

Слоистая ось
В одно экранное измерение можно уложить сразу несколько осей (непрерывных и интервальных). Чаще всего этот приём работает с таймланами, когда на одну временную ось накладываются слои с данными, текстами и графикой:

Вырожденная ось
Иногда визуализации требуется ось, к которой не привязан конкретный параметр, либо на которой показано всего два значения. Чаще всего такое случается, когда визуализация иллюстрирует связи — чтобы проявить связь, необходимо пространство между объектами.

В комиксе о высоте Вселенной горизонтальное измерение также вырожденное.

Данные формата «было-стало» чаще всего требуют вырожденной оси:

Но она не обязательно «съедает» экранное измерение:

Вырожденная ось допустима, если проявляет важные особенности данных и таким образом «окупает» потерю целого экранного измерения. Но использовать её стоит только в крайнем случае. К сожалению, в эффектных популярных форматах инфографики часто вырождена одна или даже обе экранных оси.

Равномерная сетка
Ещё один способ использовать пространство экрана — заполненить его последовательными блоками по сетке. Объекты внутри сетки упорядочены линейно, например, по алфавиту:

По размеру города:

Или по номеру билета:

Сетка подстраивается под размер экрана и не имеет ярко выраженной горизонтальной и вертикальной направляющих.

В большинстве случаев каркас визуализации складывается из перечисленных выше осей. Редким исключением являются трёхмерные визуализации, ещё более редким — удачные их примеры. Встречаются также комбинированные визуализации, например, в которых график совмещён с хитмепом или картой. О комбинированных каркасах мы поговорим отдельно.

В следующий заметке я расскажу, как выбрать из множества измерений реальности данных те, что станут хорошим каркасом и отвечу на вопросы Дениса и Ивана.

Чтобы познакомиться с нашим алгоритмом «из первых рук» и научиться его применять, приходите на курс по визуализации данных, который я проведу в Москве, 8 и 9 октября.

Следующая теоретическая заметка выйдет 26 сентября.

2016   алгоритм Δλ   визуализация данных   теория
Ранее Ctrl + ↓