Реальность данных
Я придумываю визуализации без алгоритмов и правил, по наитию. Знакомлюсь с данными, изучаю их и щёлк… вижу картину, которая впоследствии, проработанная и уточнённая, становится визуализацией. Я могу разобрать результат «по косточкам», объяснить, почему он именно такой и в чём его сила, сформулировать принципы, которые лежат в его основе, но не могу рассказать, как я к нему пришла. Это делает меня никчёмным арт-директором и преподавателем, и я хочу это исправить.
Дважды в месяц я буду публиковать размышления о моём подходе к визуализации данных, чтобы постепенно сформировать теоретическую базу и докопаться до заветных алгоритмов. Забраться в собственный мозг и понять, что происходит в нём в момент «щелчка», непросто. Но я попробую.
Обычно данные хранятся в таблицах и базах, объединяющих множество таблиц. Все таблицы выглядят одинаково, как и круговые диаграммы, построенные на их основе. Все данные — уникальны, они наделены смыслом, подчинены внутренней иерархии, пронизаны связями, содержат закономерности и аномалии. Чтобы проявить сущность данных в визуализации нужно выйти за пределы табличного представления — в реальность данных.
Данные каждой задачи живут в собственной реальности. Там в нескольких измерениях (пространственных, временных или каких-то совсем иных) существуют и взаимодействуют объекты, текут потоки, меняются характеристики и свойства, случаются события. В этой реальности свои действующие лица, свои законы; данные в ней свободные от ограничений операционной системы, экрана и нашего физического мира.
Мой рецепт качественной визуализации: перенести реальность данных на интерактивную веб-страницу с минимальными потерями (неизбежными из-за ограничений носителя).
В ближайших заметках:
— я попробую объяснить, как заглянуть в реальность данных,
— расскажу о микро- и макро-уровнях этой реальности,
— разберу конкретные примеры.
Буду рада вопросам и комментариям.
Рубрика «вопрос-ответ» временно на паузе, но всё равно присылайте вопросы на почту: data@datalaboratory.ru. Следующая теоретическая заметка выйдет 14 марта.
А в какой месте в данном процессе появляется вопрос? В смысле, у нас же не просто данные которые нам нужно красиво визуализировать, у нас есть вопрос и ответ или подсказки к ответу которые мы хотим получить при помощи визуализации.
«докопаться до заветных алгоритмов» — я бы назвал это формализацией. Мы у себя в ВУЗе одно время плотно помогали преподавателям формализовать их знания. Могу сказать что это действительно не легкий процесс. Добавлю что даже получив алгоритм, регулярно приходится его изменять или дополнять. Если же появится цель передать этот алгоритм (профессиональная процедура — как мы его называли), то выяснится что еще некоторые блоки надо будет декомпозировать (расписывать более детально), иначе некоторые слушатели не поймут.
В связи с этой темой порекомендую книгу: «Почему мудрец похож на обезьяну», автор Паронджанов В.Д. Нам эта книга очень помогла.
Антон, спасибо за совет, книгу изучу.
Павел, вопрос хороший. Чаще всего данные тематические, то есть вопрос уже содержится в них. Если это не так, то, в моём представлении, вопрос влияет не на саму реальность данных, а на то, с какого бока мы на неё посмотрим. Напишу об этом подробнее в следующих заметках.
Хм... Я думал для курсов вы уже систематизировали знания. А получается все эмпирически. Что же тогда на курсах рассказываете?
На курсе была система, но она опиралась на разбор уже решённых задач и изучение существующих приёмов. Сейчас я хочу копнуть глубже, в том числе, чтобы сделать более глубокий учебный курс.