39 заметок с тегом

вопрос-ответ

О востребованности визуализации данных

Спрашивает Игорь Трафимович:

Я довольно активно слежу за тематическими блогами о визуализации данных и у меня сложилось впечатление, что создание всех этих потрясающих интерактивных работ — не слишком прибыльное занятие, ведь для большинства бизнес-задач достаточно простейших барчартов, которые можно сделать в Excel без участия дизайнера.

Расскажи, востребована ли визуализация данных на рынке и насколько перспективной ты сама видишь эту область?

Я не знаю, как оценить перспективность области. Если 99,9% преступлений в Лондоне раскрывают полицейские Скотленд-ярда, делает ли это работу Шерлока Холмса менее перспективной?

Фото Роберта Вигласки, PA

Визуализация — это сверх-мощный инструмент. Она наглядно показывает огромные объёмы данных, проявляет закономерности, которые никто не надеялся найти, сворачивает 30-страничные отчёты в одну интерактивную картину, экономит время и вычислительные ресурсы. Визуализацией, как любым инструментов, нужно уметь пользоваться, но я верю, что грамотная визуализация способна творить чудеса.

При этом визуализация, как Шерлок, решает очень узкий круг задач — запутанные дела со сложными, многомерными данными, в которых скрываются полезные для бизнеса знания. Такие задачи найдутся далеко не в каждой компании, а если и найдутся, от них необязательно зависит успех бизнеса, и даже когда зависит, лица, принимающие решения, могут не знать о том, что задачу можно решить с помощью визуализации данных. Рынок крошечный, риск остаться без работы велик.

Вот что делаем я и моя команда, чтобы чувствовать себя хорошо.

  • Главное правило, занимаемся только визуализацией данных (сродни правилу балерин зарабатывать только балетом :-)
  • Когда заказов нет, делаем бесплатные прототипы в рамках рубрики «Вопрос-ответ» или сами придумываем себе задачи.
  • Отвечаем на вопросы в блоге.
  • Выступаем на конференциях (в прошлом году был перерыв).
  • Записываем видео-лекции, организуем учебные курсы.
  • Рассказываем о работе всем, кто готов слушать.

Всё это, и немного везения, приводит в лабораторию клиентов мечты с самыми запутанными и интересными задачами. Чем больше задач мы решаем, тем искуснее используем визуализацию данных и тем уверенне чувствуем себя на рынке. Это единственный известный мне путь к востребованности в этой области.

Кстати, мы в Лаборатории данных ищем веб-разработчика. Вакансия открыта до 31 января.

Присылайте вопросы о визуализации данных на почту: data@datalaboratory.ru. Следующая заметка выйдет 1 февраля.

2016   визуализация данных   вопрос-ответ

Вопрос-ответ: рынок труда в динамике

Спрашивает Жанна Гугунова из «HeadHunter»:

Мы каждый месяц составляем отчет по рынку труда Москвы, например, вот отчет за ноябрь: http://hh.ru/article/307200. Как можно представить эту статистику за год в динамике?

В статье рынок труда показан стандартными временными графиками (динамика вакансий, резюме и заработных плат) и столбиковыми диаграммами (доли рынка по профессиональным сферам) — итого около 20 иллюстраций. Каждая картинка в отдельности решает узкую задачу, но полную картину рынка за ними разглядеть сложно.

Попробуем отобразить все три параметра на одной интерактивной визуализации. Пусть по оси X будет количество вакансий, по оси Y — количество резюме, а среднюю зарплату покажем размером точки. Рынок труда в Москве в ноябре по топовым профсферам будет выглядеть так:

Масштаб по осям отличается, потому что активных резюме обычно больше, чем вакансий. Чтобы проявить эту особенность на графике, добавим лучи, соответствующие разным уровням конкуренции:

Видим, что самые активные профсферы — «Продажи» и «Начало карьеры», причём в первой конкуренция относительно низкая (3 резюме на вакансию), а во второй — высокая (более 10). Конкуренция в большинстве профсфер превышает 5 резюме на вакансию, нет ни одной профсферы ниже единицы, то есть дефицита кадров не наблюдается нигде.

По средним зарплатам с большим отрывом лидирует «Топ-менеджмент», но и конкуренция там самая большая, более 20 резюме на вакансию. Самые низкие средние зарплаты — в профсферах «Администрация» и, как ни странно, «Банки»; они даже ниже средней зарплаты в «Начале карьеры».

Добавим на график временную динамику. История одной профессиональной области будет выглядеть так:

Движении точки вдоль луча означает рост активности (и работодателей, и соискателей) в данной проф. области. Движение от луча к лучу — рост или падение конкуренции. Зарплата заметно не менялась, поэтому скроем промежуточные значения, чтобы лучше разглядеть хвост:

На графике проявилась форма, похожая на букву «s». Это сезонные рост (весна-лето) и спад (осень-зима) активности на фоне увеличения конкуренции. В «Продажах» активность в ноябре 2015 года осталась на том же уровне, что и в ноябре 2014 года, а вот конкуренция выросла с 2 до 3 резюме на вакансию.

Посмотрим на историю других профобластей:

«Айти» и «маркетинг» демонстрируют форму похожую на «продажи», но не такую симметричную. В 2014 году они делаю два витка активности (промежуточное затишье в мае), конкуренция растёт почти непрерывно, не считая небольшого спада в мае-июне 2015. «Начало карьеры» — ещё более искажённая «s» с быстрым ростом конкуренции (с 7 до 10+ резюме на вакансию) и большими «провалами» в январе и мае — во время студенческих сессий.

Посмотрим на динамику рынка в целом (гифка):

На полной картине сложнее уловить детали по отдельным профсферам, зато бросаются в глаза общие тенденции на рынке. Видно, как в 2014 году активность растёт вместе с конкуренцией, потом — резкий зимний спад, быстрый скачок конкуренции, и снова сезонный полукруг. Профсферы, как синхронные пловчихи, выписывают одни и те же фигуры, слегка отличающиеся исполнением.

Присылайте вопросы о визуализации данных на почту: data@datalaboratory.ru. При участии Кирилла Беляева, Романа Бунина и Дамира Мельникова. Спасибо Службе исследований «Headhunter» за предоставленные данные. Подписи на осях скрыты по просьбе заказчика, поведение профсфер на графике соответствует реальному положению дел.

Вопрос-ответ: о работе со сложными системами

Анонимно:

Я начинающий дизайнер и мне поручили обновить интерфейс сложной банковской системы. С чего лучше начать работу, как удержать в голове зависимости между разными элементами? Таблицы и списки, кажется, только сильнее запутывают.

Представьте, что перед вами гигантский паззл. Вы можете сначала рассмотреть и классифицировать все кусочки, а потом приступить к сборке. Или взяться за небольшой фрагмент, собрать его, перейти к следующей тематической горстке, и так, пока «слепых пятен» почти не останется.

В работе над сложными системами я придерживаюсь второго пути: начинаю с относительно небольшой, но важной задачи, досконально разбираюсь в ней, предлагаю решение и довожу его до внедрения. Один хороший интерфейс в системе — это уже польза, а в качестве бонуса я получаю близкое знакомство с частью системы и плюс в репутацию. Чем больше таких готовых фрагментов, тем более полная картина складывается в голове, тем более сложные и комплексные задачи я готова решать. Ничего страшного, если после «вскрытия» очередного пласта какие-то из ранних решений придётся пересмотреть, к тому времени они уже принесут пользу.

Я всегда ставлю задачу самостоятельно. Обсуждаю проект с ответственными лицами, разбираюсь, задаю вопросы, после чего формулирую задачу своими словами в 2-3-4 абзаца текста. В «Нет-крекере» я периодически сталкивалась с длинными ТЗ, но мне всегда удавалось договориться о живом обсуждении и ни разу не пришлось тратить время на изучение многостраничной документации.

Во время работы над задачей я «загружаю» всю доступную информацию в мозг и даю ей «повариться», пока решение не будет готово. После этого я «выгружаю» готовый фрагмент (фиксирую решение в виде картинок с пояснениями, например, в бейскемпе) и готова приступать к следующей задаче. Пока я ищу решение, я не берусь за другие проекты, не участвую в обсуждениях и встречах, не относящихся к теме. Входящая информация по другим задачам копится в почте и ждёт своего часа.

Резюме
Не пытайтесь объять необъятное, начните с быстрых побед. Ставьте задачу сами, избегайте формальных ТЗ. Сохраняйте фокус, работайте над одной задачей в один момент времени. Фиксируйте результаты для быстрого доступа в будущем. Постепенно собирайте «большую картину» из качественно проработанных фрагментов.

Подробный рассказ о моём опыте работы со сложными системами в «Нет-крекере», 2011 год:

Присылайте вопросы на почту data@datalaboratory.ru — о визуализации данных и не только.

Вопрос-ответ: история университета в лицах

Спрашивает Константин Когут:

Составляя инфографику о сотрудниках университета, перерыл немало таблиц по данным за каждый год. Помогите улучшить инфографику. Приму любую критику.

В плавно перетекающем графике потерялась важная составляющая истории: путь каждого отдельного преподавателя, доцента и профессора. Кто-то из них проработал всего несколько лет, другие посвятили университету всю жизнь, прошли путь от преподавателя до профессора и, возможно, даже заняли пост декана факультета и стали ректорами. Сейчас они выглядят безликой массой, «свалены в кучу».

Смотрите, как визуализировали похожую информацию о заключённых тюрьмы в Гуантанамо дизайнеры «13pt», выигравшие с этой работой престижный конкурс «Малофей»:

Каждый заключённый показан отдельной линией, истории персонажей подписаны прямо на графике рядом с линиями. Думаю, служители науки достойны такого же уважительного обращения :-)

Начните с того, что выделите линии жизни в общей массе:

Такое представление позволяет проследить за судьбой каждого преподавателя, видно общее количество преподавателей за год и как оно получилось: сколько ушло, сколько пришло. Легко показать превращения преподавателя в доцента и доцента в профессора (преподавателей лучше расположить на нижнем этаже графика, профессоров — на верхнем):

Сам график я советую вытянуть в ширину, чтобы избавиться от частых резких скачков и приблизиться к тафтианскому правилу «сорока пяти градусов». В освободившемся пространстве над графиком покажите лица и расскажите историю выдающихся деятелей университета:

Визуализация «количества доцентов, профессоров и преподавателей» превратилась в историю университета в лицах. Такое превращение потребует дополнительного исследования, зато изучать результат будет гораздо интереснее, особенно, если он будет интерактивным.

Присылайте вопросы о визуализации данных на почту: data@datalaboratory.ru, ответы публикуются ежемесячно.

Вопрос-ответ: тендеры в РФ

Спрашивает Алексей Булгаков из компании «Bicotender»:

У нас есть структурированные данные по тендерным закупкам с 2011 года, на основе их мы делаем продукт «Аналитика закупок». Нам интересно визуализировать эти данные: показать суммарные показатели и проявить основные тенденции тендерного рынка.

Главные особенности тендерного рынка, которые проявятся на макроуровне, — это региональность и временная динамика, в т. ч. сезонность. Мы в лаборатории уже сталкивались с похожей задачей, когда визуализировали аномалии оборота наличности. Временная диаграмма и карта, интерактивно связанные между собой, оказались удачным решением для данных такого рода. Возьмём за основу этот формат и адаптируем для тендеров.

Ключевые свойства тендера — стоимость и индустрия. Интересно узнать, какое соотношение тендеров по индустриям, как оно меняется со временем, какие индустрии преобладают в разных регионах. Обозначим индустрию цветом и покрасим регионы на карте цветом главной (по объёму закупок) индустрии, а на диаграмме покажем суммарные объёмы РФ в разбивке по индустриям:

При наведении на месяц видим главные индустрии в этом месяце по регионам; при наведении на регион — временное распределение закупок по индустриям в нём:

Фильтры по индустрии, ценовой категории и региону отсекают потенциально интересные срезы. Например, можно посмотреть только крупные строительные тендеры в Красноярском крае. В этом случае на диаграмме будет показана не только динамика, но и отдельные тендеры:

При наведении на тендер показана подробная информация о нём:

На визуализации показаны только электронные аукционы, завершённые с августа 2014 по июль 2015. Видим, что самые «жирные» индустрии — строительство, медицина, финансы. Строительство преобладает в большинстве регионов, его активность предсказуемо падает в зимние месяцы. В январе самый низкий объём завершённых тендеров по всем индустриям. Что касается регионов, лишь некоторые активно используют систему электронных аукционов: это Москва и Московская область, Санкт-Петербург, Нижний Новгород, Самара, Краснодарский и Краясноярский края, с 2015 года к ним присоединилась Волгоградская область. В других регионах электронные аукционы единичные, касаются одной-двух индустрий, их объёмы незначительны. Во многих регионах (показаны белым цветом) они вообще не проводились.

Живой прототип: http://tenders.datalaboratory.ru/

Присылайте вопросы о визуализации данных на почту: data@datalaboratory.ru, ответы публикуются ежемесячно. При участии Дамира Мельникова.

Вопрос-ответ: оценка ресторана

Спрашивает Паша Омелёхин:

Расскажите, как рисовать графики из псевдокривых, наложенных друг на друга, если на них будут смотреть со смартфонов? Как обойтись без легенды, и какие еще есть нюансы при проектировании инфографики для мобильных устройств?

Чтобы ответить максимально по делу, я уточнила у Паши, о каких графиках идёт речь.

Графики показывают оценки разных качеств заведения, например цены и скорости обслуживания. Люди ставят оценки от 0 до 100 на планшете, который им выдают, если они согласны оценить. Все оценки прилетают в личный кабинет владельца бизнеса, на мобильный телефон.

Я попробовал найти решение сам. Сначала это был график, потом я додумался до точек. Большое скопление покажет среднюю оценку, но редкие и сильные отклонения тоже будут видны. Обычный график их не покажет. Не знаю, насколько хорошо мое решение, поэтому интересно посмотреть на твое и узнать, как лучше делать.

Кирпичик данных — это один ответ. Проявив его, Паша показал откуда берутся средние значения, как ответы распределены по оценкам и во времени. Отличная работа с микроуровнем!

Беда в том, что на новых графиках потерялась самая важная информация. Наш мозг не способен «подсчитать» среднее значение, глядя на визуальное распределение результатов, а именно средние оценки и их динамика интересуют владельца ресторана в первую очередь.

Данные отвечают на вопросы пользователя. Отранжируем вопросы и ответы по важности:

  1. «Что происходит сейчас?» — средняя оценка за неделю по каждому критерию и свежие комментарии.
  2. «Как изменилась ситуация за последнее время?» — динамика средних оценок и история комментариев.
  3. «Что стоит за средними оценками? Насколько они достоверны?» — распределение конкретных ответов.

Исходные графики показываю только динамику (2), пашин вариант даёт доступ к детальным данным (3). Проявим на макроуровне все данные с соответсвующим важности весом — оценку за прошлую неделю крупным числом, динамику ярким графиком, распределение полупрозрачным облаком на фоне:

Вместо батареи переключателей «день | неделя | месяц | год» выберем временные отрезки, близкие к реальности ресторатора, например, средние за неделю, полное распределение по дням и часам. Комментарии предлагаю не прятать, а показать тут же, бесконечно уходящей в прошлое лентой.

Цвет сейчас дублирует вертикальное измерение. Вместо этого предлагаю использовать разные цвета для разных критериев.

На визуализации мгновенно считывается проблемы со скоростью; легко заметить, что сервис хороший, но ухудшается; при желании можно рассмотреть, что оценки последнюю неделю ставили активно, их много, и стоит к ним прислушаться. Сразу видны недавние комментарии гостей с конкретными замечаниями и похвалой.

Такой экран отвечает на большинство вопросов большинства пользователей. Остальные сценарии (динамика за год, фильтрация комментариев, оценки по времени суток) предлагаю реализовать на внутренних экранах приложения.

Присылайте вопросы о визуализации данных на почту: data@datalaboratory.ru, ответы публикуются ежемесячно.

Вопрос-ответ: OEE

Спрашивает Роман Бунин:

Для процессных производств (добыча нефти, пищевая промышленность, химическая промышленность) основными источниками затрат являются сырьё, расходы на энергию и оборудование. Оборудование пытаются загрузить как можно больше, так как оно дорогое и если оно простаивает, то это приводит к упущенной прибыли. Основные причины простоев — поломки, производство брака, мойки оборудования, тех. обслуживание и т. п.

Чтобы отслеживать загрузку оборудования, используется специальный KPI — OEE (Overall equipment effectiveness, или Общая эффективность оборудования). Это комплексный показатель, который состоит из трёх частей: доступность, производительность и качество. Каждый измеряется в процентах, которые при перемножении дают общее значение. Анализируя данные, как в целом, так и по каждой составной части, можно найти основные причины простоев. Данные интересны в разрезе единиц оборудования, причин простоев, времени и смен.

Как визуализировать эти данные и срезы?

На приведённом дашборде индикаторы, графики и диаграммы разрознены, никак не связаны между собой. Попробуем выстроить последовательную картину работы предприятия, которая продемонстрирует эффективность каждой машины в отдельности и производства в целом.

На микроуровне работают машины, которые производят продукт (качественный и бракованный) с определённой скоростью (производительностью), нулевой, если машина недоступна. Кирпичик данных — это результат работы одной машины в единицу времени. А именно, объём фактически произведённой продукции в тоннах (факт), объём качественной продукции в тоннах (факт − брак) и производные относительные характеристики: доступность (время факт / время план), производительность (факт / план), качество (кондиция / факт) и ОЕЕ (Д × П × К). По формулам выходит, что ОЕЕ показывает отношение выпущенной качественной продукции к запланированному максимально возможному объёму.

Покажем произведённую в единицу времени продукцию столбиком из двух частей, кондиции и брака. Над столбиком отметим уровень запланированного максимума:

То же самое в процентах:

Соберём из столбиков картину дневной эффективности, объединим дни в недели на календарной сетке месяца. Абсолютное значение планового объёма может меняться в разные дни и смены, поэтому на графике покажем относительные значения в процентах.

Уровень полных столбцов показывает производительность машины в течение дня, уровень жёлтых столбцов показывает динамику ОЕЕ. Разные оттенки жёлтого, меняющиеся в течение дня, иллюстрируют сменяющие друг друга бригады. Причины простоя показаны разноцветными полосками в дырах на графике.

На таком графике виден не только общий уровень производительности и OEE, но и причины снижения показателей: продолжительное отсутствие сырья, несколько крупных поломок, сопровождающиеся выпуском брака и т. п.

Мы визуализировали эффективность работы одной машины по часам на протяжение месяца. Тот же подход сработает для макроуровней: цеха и завода, а также других временных отрезков, например, целого года. Дополним график таблицей с ключевыми параметрами и интерактивной легендой, которая показывает полный набор параметров при наведении на график.

Живой прототип: http://oee.datalaboratory.ru/

В таблице видно какие цеха и машины снижают общую эффективность, по клику в цех и машину открываются соответсвующие показатели слева и графики справа. Низкая эффективность пресового цеха объясняется плохой работой 1-й жаровни и 2-го пресса. Жаровня простаивает в основном из-за отсутсвия сырья, а также почти на сутки 17-18 июля вышла из строя из-за серьёзной поломки. Пресс в основном простаивает без сырья и заказов. При этом по упущенной прибыли всех опережает цех очистки.

Получившаяся визуализация показывает динамику OEE, объясняет, что значит этот параметр и каковы причины снижения эффективности производства.

Присылайте вопросы о визуализации данных на почту: data@datalaboratory.ru, ответы публикуются ежемесячно. При участии Романа Бунина, Кирилла Беляева и Сергея Долинина.

Вопрос-ответ: анализ футбольных матчей

Спрашивает Дамир Мельников:

Спортивный журналист и аналитик Вадим Лукомский предложил альтернативный способ подсчёта очков футбольных команд в чемпионате на основе явных голевых моментов. В статье Вадим приводит таблицы расчёта по новой схеме и выводы. Было бы интересно сравнить результаты Вадима с официальными турнирными таблицами.

В традиционных таблицах порядок столбцов отражает ход чемпионата: в матчах (М) забивают и пропускают голы, в результате — выигрыш (В), ничья (Н) или проигрыш (П), на основе которых подсчитываются очки (О). У Вадима то же самое, только вместо голов — моменты, ВНП и О рассчитываются именно для них.

Объединим две таблицы:
М | Зб Пр | ВНП О для голов
+
М | Сз Дп | ВНП О для моментов
=
М | Сз Зб Дп Пр | ВНП О для моментов | ВНП О  для голов | Разница очков

Момент предшествует голу, поэтому статистика моментов в таблице идёт перед статистикой голов. Cозданные моменты сгрупируем с забитыми голами, допущенные моменты с пропущенными. При наведении покажем разницу этих показателей, которую анализирует в статье Вадим. Избавимся от графического мусора, выровняем подписи по левому краю, а цифры по разрядам, для наглядности поставим на строки логотипы команд. Вишенка на торте — временной слайдер, который показывает историю изменения таблицы с начала чемпионата:

Внутри лиги таблица сортируется по очкам, голам или моментам. По альтернативной версии в Премьер-лиге Арсенал опередил Челси и Манчестер Сити.

Как сделать футбольную статистику ещё интереснее и нагляднее? Дополним таблицу (информативную, но всё же суховатую) полем, на котором при выборе команды будем отмечать голы и голевые моменты. Слева свои ворота, справа — ворота всех противников. Голы с голевым моментом и без показаны красными стрелками, нерезультативные моменты — фиолетовыми линиями: промах со стрелкой, «сейв» с кружком, заблокированный удар с перпендикулярной чертой соответственно.

При наведении на линии можно показать информацию об ударе: дату матча и время удара, команду-соперника, нападающего и защитника.

Сравним игру команд на одном экране:

Живой прототип: http://big-chances.datalaboratory.ru/

Команды-лидеры создают больше моментов у ворот противника, чем допускают у своих; у команд, замыкающих список, ситуация противоположная. У ворот Сандерленда практически отсутствую фиолетовые стрелки — много голов, мало нереализованных голевых моментов. Ну и, конечно, сразу бросается в глаза гол Чарли Адама с середны поля в ворота Челси. Мы собрали полные данные только для Премьер-лиги, но и они хорошо демонстрируют подход.

Ничто так не обогощает спортивную визуализацию, как игровое поле (трасса, дорожка, снаряд) с наглядными попытками и результатами. Другие примеры: анализ бросков НБА и история стометровки.

Присылайте вопросы о визуализации данных на почту: data@datalaboratory.ru, ответы публикуются ежемесячно. При участии Кирилла Беляева и Дамира Мельникова.

Вопрос-ответ: история цен на авиабилеты

Спрашивает Андрей:

Есть интересная задача — визуализировать историческую стоимость билета (авиа, жд и т. п.) в зависимости от даты его покупки. Наиболее простым кажется следующий вариант: пользователь выбирает направление (откуда и куда), авиакомпанию-перевозчика, выбирает дату отправления и на графике ему показывается стоимость в зависимости от даты покупки.

Но это не удобно для пользователя, так как придется перебирать авиакомпании/перевозчики. Для этого можно несколько графиков рисовать сразу. Но даже этот подход не решает самую главную задачу: если пользователь может изменить дату поездки (например, плюс/минус неделя), то чтобы найти наиболее удобный вариант, ему придется перебирать и дату отправления.

Как бы вы предложили показать на одном графике (возможно, интерактивном) изменение цены в зависимости от даты покупки билета, даты отправления и перевозчика?

Давайте для простоты рассуждений сузим задачу до авиабилетов. Предложенный вами график цены билета на определённую дату вылета в зависимости от даты покупки — это первый шаг в решении задачи. Именно такой тренд интересно изучать и сравнивать для разных дат и сезонов вылета, перевозчиков, направлений. Это идеальный элементарный кирпичик визуализации: графики удобно сравнивать между собой (сравнимость) и складывать друг с другом для получения глобальных картин (аддитивность). Глобальные картины, полученные суммированием графиков, в свою очередь тоже можно сравнивать.

Чтобы проиллюстрировать свою мысль я воспользуюсь данными, любезно предоставленными туристическим сервисом «Туту.ру». Это усреднённые данные по покупкам: 5384 цены на билеты Аэрофлота в направлении Москва → Симферополь, 1480 усреднённых по различным авиакомпаниям цен в направлении Москва → Берлин и 1035 усреднённых по авиакомпаниям цен Москва → Тиват. Данные не совсем полные и однородные, тем не менее интересные для изучения.

Чтобы отличать графики между собой используем цветной градиент для разных дат вылета:

Живой прототип: http://ticket-prices.datalaboratory.ru/

В целом подтверждается гипотеза, что чем ближе вылет, тем дороже билеты: в правой части графика дорогих покупок больше, сеть плотнее. Но и исключений из этого правила — нисходящих графиков с заблаговременными дорогими покупками — довольно много.

Изучим внимательно наиболее подробные и однородные данные о перелёте Москва → Симферополь (только Аэрофлот):

Билеты в прошлом летнем сезоне покупались и заранее, и накануне вылета, в среднем за 5 тыс. руб со случайными отклонениями до 7—10 тыс. Осенью плотность «хвоста» слева уменьшилась, покупки совершались ближе к дате вылета, при этом ранняя цена в среднем чуть меньше поздней. Зимой билеты никто не покупал раньше, чем за полтора месяца до вылета, зато цены покупок в последние дни заметно скачут — до 10—15 тыс. Весной проявились ярко выраженные ступеньки (фиксированные тарифы): синие мартовские ступеньки до снижения цен по указанию президента, зелёные апрельские — после.

Интересно, какие закономерности найдут на визуализации внимательные читатели :-)

Присылайте вопросы о визуализации данных на почту: data@datalaboratory.ru, ответы публикуются ежемесячно. При участии Кирилла Беляева и Сергея Долинина. Спасибо Никите Иванову и Наталье Анисимовой за данные для эксперимента.

Вопрос-ответ: Рига-Вена-Будапешт

Спрашивает Кирилл Беляев:

С 1 по 10 мая 2014 мы путешествовал на машине по Европе. Записывали время и существенные траты. Собрал маршрут, схему с отрезками пути и временем, которое они заняли, основные траты. Подскажите, пожалуйста, какой полезной информация не хватает, и какую стоит подавать иначе.

Иллюстрация получилась аккуратная, но без души. Кому и почему интересно будет её изучать? Яркие моменты, полюбившиеся места, фотографии — всё самое главное в путешествии осталось за кадром.

На мой взгляд, привязка к карте мешает показать полную картину. Я предлагаю перевернуть задачу с ног на голову: пусть впечатления правят балом, данные о поездке (твиты, чекины, фотографии) вплетаются в повествование и служат отсылкой к первоисточнику, а маршрут скромно сопровождает рассказ, например, залипающей шапкой, в которой показан прогресс путешествия.

Надеюсь когда-нибудь опубликовать интерактивные рассказы о своих главных приключениях :-)

Дорогие читатели, делитесь достойными внимания визуализациями путешествий в комментариях!

Присылайте вопросы о визуализации данных на почту: data@datalaboratory.ru, ответы публикуются по понедельникам.

Ctrl + ↓ Ранее