1 заметка с тегом

IMDB

Вопрос-ответ: Как улучшить постер об истории киножанров?

Спрашивает Энжи Сказка:

Запилил курсач для универа. Задание было, имея доступ к данным IMDB, сделать инфографику, которая рассказывает историю про киношки (журнальную, настенную, интерактивную, HTML, D3.js, какую угодно). Вот датасет (155 Мб).

Я выбрал рассказать про жанры, про то, какую долю они занимали в истории кино и как сопоставлялись с событиями в киноиндустрии. Про это мой настенный постер. Как можно было визуализировать то же самое по-другому? Где косяки и как улучшить? Какую другую историю можно было бы поведать?

Честно говоря, я не поняла, что показано на главной диаграмме. Какое измерение отложено по вертикали? Что означают пики и провалы? Почему высота диаграммы постоянна, тогда как сумма долей жанров всегда превышает 100% (у одного фильма несколько жанров) и меняется со временем?

Самая интересная особенность данных: один фильм ≠ один жанр, она ни в коем случае не должна потеряться.

Художественные и документальные фильмы — это разные категории, а не жанры. Их лучше показать на отдельных графиках. Предлагаю также выделить в качестве категорий короткометражки и анимационные фильмы. Для каждой категории составь список мета-жанров (жанров, объединённых одним фильмом): наряду с комедиями и драмами, туда попадут музыкальные вестерны, романтические драмы, военные боевики. Документальные фильмы разделятся на военные, исторические и спортивные. Мультфильмы — на семейные комедии и взрослые драмы. Отложим на таймлайне художественные фильмы, сгруппированные по мета-жанрам с учётом времени их появления, чтобы можно было отследить зарождение мистических триллеров или комедийных ужастиков. Получится что-то вроде музыкального генеалогического дерева:

Можно придумать хитрое цветовое кодирование, обозначив основные жанры чистыми цветами, а производные — смешанными. Интересные факты и важные фильмы нужно обязательно сохранить, разнообразив текстовые описания крупными числовыми фактоидами, афишами и кадрами из фильмов. Не стоит расшифровывать жанры, их названия говорят сами за себя. Правая часть дублирует основной график, от неё лучше избавиться.

По мелочам. Эффект «бумажной гармошки» создаёт впечатление трёхмерной картинки и визуально искажает график. Чёрная обводка лет на нижней шкале — лишняя . Резкое увеличение количества фильмов в 2000-х расшифрует только очень сообразительный читатель. Total number of movies per year → Movies per year.

Предлагаю читателям высказать свои идеи визуализации кино-данных.

P.S. Энжи делится статьями по визуализации информации:

  1. Storytelling: The Next Step for Visualization, Robert Kosara, Jock Mackinlay from Tableau Software
  2. Scientific Storytelling using Visualization, Kwan-Liu Ma, University of California, Davis, CA, USA
  3. Narrative Visualization: Telling Stories with Data, Edward Segel and Jeffrey Heer

Спасибо!

Ответы на вопросы о визуализации данных, организации времени, рабочем процессе, спорте и путешествиях выходят по понедельникам. Пишите: mail@infotanka.ru.