39 заметок с тегом

вопрос-ответ

Позднее Ctrl + ↑

Вопрос-ответ: качество работы маршруток

Спрашивает Евгений Макаров из Baseride Technologies:

Мы собираем данные о работе маршрутных такси в Нижнем Новгороде для центральной диспетчерской, которая контролирует качество перевозок. На каждой машине установлен GPS-передатчик, который передаёт данные в «Клаудбас». На основании данных формируются ежедневные и ежемесячные отчёты о выполненной работе и нарушениях.

Нужно визуализировать два ключевых параметра: отклонение от расписания движения по остановкам маршрута и превышение скорости. Правда, в условиях пробок точное время отправления практически никогда не выдерживается, и маршрутчикам сказано контролировать интервал и число автобусов на маршруте.

Как наглядно отобразить эту информацию?

Часто подобные задачи решают так: данные складывают в таблицы, а ключевые параметры (среднее отклонение, количество нарушений) рассчитывают и выводят на дашборд. На виду оказываются оторванные от реальных данных, «средние по больнице» показатели, а на поиски проблем и их возможных причин пользователи системы отправляются в громоздкие, неприспособленные для этого таблицы.

Попробуем решить задачу иначе: от частного (одного рейса) к общему (ежедневным и ежемесячным отчётам). Как наглядно показать отклонения и превышения маршрутки за один рейс? Расположим остановки по горизонтали, сохранив пропорциональность растояний между ними. Отклонения от расписания при посещении конкретной остановки покажем кругом, площадь которого пропорциональна опозданию/опережению в минутах. Участки превышения скорости закрасим красным цветом: чем больше превышение, тем краснее участок.

Рейсы без нарушений или с небольшими нарушениями выглядят нейтрально:

Конкретные опоздания и превышения показаны при наведении:

Чтобы картина была нагляднее, оживим её временным слайдером.

Чем «краснее» рейс, тем больше нарушений и тем они серьёзнее:

Масштаб кружков выбран таким образом, чтобы их радиус не превышал оптимальный для чтения диаграммы максимум.

Во-первых, такие рейсы легко сравнивать между собой. Например, можно одним взглядом окинуть все утренние рейсы, расположив их друг под другом (слева — время старта):


Живой прототип: http://minibus.datalaboratory.ru/onebyone/

Во-вторых, рейсы можно складывать между собой. Та же картина дня может быть свёрнута в одну линию с суммарным опозданиям по остановкам и суммарными (полупрозрачными) нарушениями на участках:

Последние четыре остановки сильнее других страдают от нарушений расписания, а скорость превышают чаще всего в начале и на длинном перегоне в конце маршрута. Благодаря интерактивности видно, как маршрутки, стартовавшие в разное время дня, распределяются по маршруту: кто и где отстаёт и, наоборот, опережает общую массу.

Дополним картину средними показателями, над каждой остановкой подпишем средний интервал ожидания:

Живой прототип: https://minibus.datalaboratory.ru/all/

Плюс такого подхода в том, что можно наглядно показать любой срез по рейсам: за определённую дату или время дня, для конкретного водителя, по определённым нарушениям, — а также сравнивать эти срезы между собой. Так можно показать все городские маршруты со статистикой за любой временной период на одном экране. При этом будет видна общая картина и каждый конкретный рейс в удобной для дальнейшего исследования форме.

Мы в Лаборатории данных создаём наглядные системы мониторинга для траспортных компаний и городских служб. Пишите: data@datalaboratory.ru

Присылайте вопросы о визуализации данных на почту: data@datalaboratory.ru, ответы публикуются по понедельникам. При участии Кирилла Беляева и Сергея Долинина.

Вопрос-ответ: календарь рекордов

Спрашивает Денис Хрипков:

Делаю первые шаги, приму любые замечания! http://denisx.ru/calendar2015/

Вы показали много данных — это хорошее начало. Но таблица получилась скучной и однообразной, её не хочется разглядывать, изучать, повесить на стену. Температурная диаграмма не читается из-за того, что глаз вынужден каждый раз скакать сверху вниз. Сравнивать между собой ежедневные рекорды не слишком увлекательное занятие, а ничего другого на такой визуализации не видно.

Чтобы привлечь внимание зрителя, задумайтесь, что ему интересно и близко в этих данных, и сделайте на этом акцент. Например, можно поставить на первый план рекорды сегодняшнего дня — их интересно сравнить с температурой за окном. Вот как выглядит распределение температур за последние 10 лет с акцентом на сегодняшних рекордах:

Рекорды за другие даты можно показать при наведении на график.

Чтобы сравнение было ещё более многогранным, дополним картину погодой и рекордами в других городах. Здесь также уместно показать соотношение ясных/пасмурных дней и годовое количество осадков, чтобы дать общее представление о климате городов.

Живой прототип: https://weather-records.datalaboratory.ru/

Видно, что самое жаркое 13 апреля было в Нижнем Новгороде — +20°С, а самое холодное в Красноярске — -10°С. В Москве за рекордно жарким днём (+18°С) в 2008 году последовал рекордно холодный (-1°С) в 2009. Конечно, данные за сто лет более показательны, но и десятилетнего периода достаточно, чтобы проиллюстририровать подход.

Если у вас душа не лежит к интерактивным визуализациям, выпустите отрывной календарик с ежедневными рекордами :-)

Присылайте вопросы о визуализации данных на почту: data@datalaboratory.ru, ответы публикуются по понедельникам. При участии Сергея Долинина.

Вопрос-ответ: Инстатрек

Спрашивает Николай Жарый:

Таня, вот мой «Инстатрек» — инстаграмм для спортивных треков, в котором можно выбрать тип линии, карту и т. д. Хочется улучшить визуализацию самого изображения и добавить дополнительные параметры: пульс, высоту, темп (пэйс), показать скорость цветом линии, разделить наложившиеся участки трека.

В нынешнем интерфейсе мне не нравится, что можно настроить буквально всё. Как правило, такая свобода означает, что автор поленился продумать сценарии и переложил ответственность за дизайн на пользователя :-)

Я советую придумать несколько эффектных «картофильтров», из которых захочется выбирать и которыми захочется делиться. Например, минималистичный приятный глазу вариант с ярким треком по умолчанию:

Красивая рельефная карта со скромным треком — для пробежок по запоминающейся местности:

Чёрная карта со светящейся линией — для ночных покатушек и забегов:

На инстатреке полезно подписать место пробежки, её длину и продолжительность, закодировать темп цветом трека. Тут же покажем график пульса и линию набора высоты (включается-отключается при создании трека). Максимальная и минимальная скорость, максимальный пульс, самая высокая и низкая точки трассы подписаны прямо на карте:

Можно автоматически распознавать инстатреки с соревнований, оформлять их в фирменном стиле забега и добавлять информацию о времени победителя и занятом месте:

Настройку «всего» не обязательно убирать совсем, просто спрятать её поглубже — как это сделано в инстаграмме.

Присылайте вопросы о визуализации данных на почту: data@datalaboratory.ru, ответы публикуются по понедельникам. При участии Кирилла Беляева.

2015   бег   визуализация данных   вопрос-ответ   Инстатрек   спорт

Вопрос-ответ: частота ошибок на экзаменах по ПДД

Спрашивает Антон Созоров:

Мы с друзьями сделали онлайн-систему решения билетов ПДД: http://pdd.atrena.org. C 2012 года люди используют его для подготовки к экзаменам на права. У нас в базе скопилось много интересных данных, и сколько бы я не думал как их визуализировать чтобы люди могли извлечь пользу, у меня никак не получается придумать что-нибудь дельное.

Могли бы вы посоветовать какие представить данные, чтобы это принесло максимальную пользу людям?

В данных скрыт ответ на вопрос, сколько нужно тренироваться, чтобы успешно сдать экзамен. На мой взгляд, в этом их главный интерес и польза. Попробуем проявить этот ответ в визуализации.

Как измерить скорость прогресса? Кто-то тренируется часами, а кто-то регулярно, но по чуть-чуть. Кто-то решает билеты подряд, а кто-то отвечает на вопросы по темам или вразнобой. Для визуализации нам нужен элементарный кирпичик, единица информации, одинаковая для всех пользователей во всех ситуациях. В данном случае это попытка — ответ конкретным пользователем на конкретный вопрос в N-й раз и результат («правильно» или «ошибка»).

Для каждого вопроса вычислим процент ошибок в зависимости от номера попытки и покажем, как он меняется, на сетке сгруппированных по билетам вопросов:

Сложные вопросы выделяются на общем фоне, и для их освоения требуется в среднем больше попыток. Картина заметно улучшается уже со второй попытки.

Для каждого билета можно рассчитать среднее количество ошибок, приходящихся на человека в выбранную попытку. Если оно больше двух, билет считается не сданным («крестик» в правом нижнем углу), если меньше — сдан («галочка»).

Живой прототип: https://pdd.datalaboratory.ru/

Используя тот же кирпичик можно «построить» индивидуальную картину обучения пользователя, проанализировать затраченное на решение вопросов время, оценить эффективность разных тактик (регулярно/нерегулярно, по билетам/вразнобой).

Присылайте вопросы о визуализации данных на почту: data@datalaboratory.ru, ответы публикуются по понедельникам. При участии Сергея Долинина.

2015   визуализация данных   вопрос-ответ   ПДД

Вопрос-ответ: мир танков

Спрашивает Кирилл Чокпаров:

Я ради интереса создал небольшой сайтик по визуализации параметров танков в моей любимой игре World Of Tanks Blitz. Сейчас я визуализировал данные так, как мне понятно и наглядно. Однако может быть есть еще какие-то способы, чтобы еще лучше сделать представления. Может быть они будут еще более наглядные.

Мне было бы очень интересно обсудить идеи, как сделать визуальные представления лучше.

Мне представляется, что главные характеристики танков — это мобильность, «атака» и «защита». Будет здорово сравнить их на одном графике. Мобильность в данном случае определяется скоростью. С атакой и защитой сложнее, здесь показателей сразу несколько: бронебойность и урон разными орудиями и снарядами, броня разных элементов танка.

Попробуем проявить эти характеристики на двумерном графике:

Скорость отложена по горизонтали, а максимальный урон за 10 сек., который я выбрала в качестве параметра атаки, по вертикали. Точки на графике — танки на поле боя, можно сравнить их внешний вид, размер и ключевые характеристики. Ещё одна прямая аналогия: чем дальше от начала координат танк расположен по горизонтали, тем он быстрее (дальше уедет) в жизни. Страны, типы и уровни танков настраиваются в фильтрах над графиком, на осях можно выбрать любые другие параметры.

Крепость разных участков брони показана цветом — так сразу виден и уровень защиты танка в целом, и слабые места. На сайте такое представление тоже есть, но в отдельном отчёте «Зоны пробития». Кстати, красным цветом логичнее обозначать опасные, плохо защищённые участки, а зелёным — укреплённые и надёжные (у Кирилла наоборот).

Наводя на разные танки, увидим и сравним не попавшие на график параметры:

На такой визуализации видно, например, что советский Т-44 очень близок по параметрам к немецкой «Пантере»: чуть быстрее, слабее и меньше размером, зато лучше укреплён, особенно башня. Прошу прощения у знатоков военной техники и любителей игры World Of Tanks Blitz, если на визуализацию и в выводы закрались фактические ошибки.

Недостаток исходной визуализации в разрозненности информации и в том, что для отображения разных по смыслу параметров, используются одни и те же столбиковые диаграммы. Удобнее сравнивать танки и выбирать тактику, когда картина боя наглядно представлена на одном графике и все параметры находятся «под рукой».

Присылайте вопросы о визуализации данных на почту: tm@datalaboratory.ru, ответы публикуются по понедельникам. При участии Сергея Долинина.

Ранее Ctrl + ↓