52 заметки с тегом

визуализация данных

Позднее Ctrl + ↑

Вопрос-ответ: Как извлечь больше пользы из таблицы личных финансов?

Спрашивает Алексей Червяков:

Я веду учет личных финансов в таблицах Google. Каждый вечер я добавляю в таблицу расходы за день. Каждый месяц добавляю новый столбец «С», а остальные скрываю, чтобы не отвлекали. Часто редактируемые ячейки расположил выше.

Как из этой таблицы извлечь больше пользы? Как сделать ее более удобной?

Во-первых, прошу прощения у читателей рубрики за запоздалый ответ. Вопрос показался мне очень интересным, и я решила сделать визуализацию собственных расходов. Подготовка данных и работа над интерактивной расходограммой заняли чуть больше времени, чем я ожидала :-)

Алексей, суммируя данные по месяцам, вы оставляете за кадром весь сок — отдельные транзакции, которые позволяют подмечать закономерности и делать выводы. На своей расходограмме я собрала все траты по одной из банковских карт с 1 января 2012 года по настоящее время.

Транзакции сгруппированы по неделям, при наведении показан размер, категория и конкретный товар (если его удалось вспомнить). Расходы в иностранной валюте показаны флагами стран внизу графика. Траты фильтруются по категориям:

Какие знания можно извлечь из этой диаграммы? Да какие угодно. В 2013 году я тратила больше, чем в 2012, причём в основном снимала наличные. В марте 2013 карту скомпрометировали и до возвращения из Таиланда в Москву я ей не пользовалась. Основные статьи расходов — транспорт и еда (супермаркеты и рестораны). В 2012 году я покупала продукты в «Перекрёстке» и «Азбуке вкуса» и привозила из дьютифри дорогой алкоголь, в 2013 перешла на «Алые паруса» (переехала) и спорттовары (увлеклась бегом). В Таиланде, Хорватии и Черногории я почти не использовала карту, в Скандинавии, Штатах и ЮАР — наоборот. Неделя в Нью-йорке поставила абсолютный рекорд по развлекательным тратам. В Финляндии и Норвегии я покупала платья Marimekko и COS — это мои любимые скандинавские марки.

Расходы рассказывают интересную историю. Жаль только, что не все данные доступны в удобном для визуализации формате.

Живая расходограмма: https://budget.datalaboratory.ru/

Спасибо Диме Тихвинскому за помощь в работе над визуализацией.

Присылайте вопросы о визуализации данных, организации времени, рабочем процессе, спорте и путешествиях на почту: mail@infotanka.ru. Ответы публикуются по понедельникам.

2014   d3.js   визуализация данных   вопрос-ответ   деньги   прототип   расходы

Вопрос-ответ: Как выбрать цветовую схему?

На прошедшем курсе мой коллега Дима Тихвинский, который обучал ребят основам D3.js, между делом прочитал неожиданно крутую лекцию про цвета. Для меня выбор цветов для визуализации всегда был головной болью, поэтому я с радостью поделюсь димиными секретами и отвечу на свой собственный вопрос:

Как выбрать цветовую схему?

Самое полезное открытие — набор палитр «Колорбрюер». Он поддерживается в D3.js и часто используется в визуализациях, созданных с помощью этой библиотеки. В набор входят приятные монохромные и разноцветные палитры для отображения качественных и количественных параметров. Для числовых массивов, расходящихся в обе стороны от нуля, подобраны градиенты с белым цветом посередине шкалы. Майк Босток собрал все палитры вместе:

Интересно было узнать о преимуществах цветового пространства HCL для визуализации данных и сравнить между собой градиенты в разных пространствах:

Ещё один полезный инструмент — HCL-пипетка.

Дима рассказал о проблеме искуственных палитр, советовал почитать психологический трактат Макса Люшера «Сигналы личности» и «Искусство цвета» Иоханнеса Иттена о закономерностях цветовой гармонии и конструирования. И если психологические теории цвета лично у меня не вызывают доверия, то вторая книга точно достойна внимания.

Делитесь в комментариях своими «цветовыми» рецептами!

2014   d3.js   визуализация данных   вопрос-ответ   цвета

Вопрос-ответ: С каких курсов, статей и книг лучше всего начать?

Спрашивает Люба Смирнова:

Меня зовут Люба, мне 27 лет и к инфографике на данный момент я не имею вообще никакого отношения. Но очень хотелось бы. Какое-то время назад начала читать про информационный дизайн, потом наткнулась на ваш блог, и стала все больше этим загораться — ищу онлайн-курсы, пока что бесплатные, не только про data vizualization, но и про data analysis, читаю статьи и журналы. При отсутствии опыта и более толковых знаний пока не очень получается все это систематизировать. И была бы очень благодарна вашим советам на тему:

  1. С каких курсов, статей и книг лучше всего начать? Курсы пока что интересуют онлайн, но со временем не отметаю возможность и того, что какой-нибудь из отпусков бы потратила на обучение в России или за рубежом.
  2. Какие языки программирования необходимо выучить и какие программы освоить?
  3. 27 лет — это не поздно осваивать что-то абсолютно новое с потенциальными планами сделать это своей профессией? :) Моя работа никогда не была связана с дизайном (в любом смысле), но вот анализа данных в ней хватало, и это то, чем мне очень нравится заниматься. Кроме того, я сейчас работаю в Гугл, так что данных для анализа уж точно всегда хватает :) Также уже несколько лет увлекаюсь фотографией, начинаю осваивать монтаж (в качестве хобби), так что создание ярких, но простых для понимания визуальных образов мне тоже не чуждо :)

Буду крайне благодарна за любые советы, которые вы посчитаете нужным мне дать!

Инфографика и визуализация — горячие темы. На популярных сайтах Visually, Infogram, Daily Infographic ежедневно появляются сотни работ. К сожалению, не все они заслуживают внимания и научат вас полезным приёмам.

Чтобы заложить прочный надёжный фундамент, начните с книг Эдварда Тафти. В них сформулированы универсальные принципы информационного дизайна и приведены проверенные временем примеры. Эти книги — кладезь полезных знаний, и я не совру, если скажу, что знакомство с ними изменило мою жизнь.

Из современных авторов следите за Майком Бостоком — создателем библиотеки D3.js и художественным редактором The New York Times, Хуаном Веласко — арт-директором National Geographic и Бретом Виктором — мыслителем и изобретателем. Сильные работы каждый год попадают в шортлист конкурса «Малофей». Я ищу и собираю хорошие примеры на пинтересте.

Что касается технологий, я советую освоить D3.js и записаться на курсеровский курс «Data Science». На курсе знакомят с пайтоном, SQL и R в достаточной степени, чтобы потом вы самостоятельно выбирали и использовали подходящий инструмент. Если захотите с головой погрузиться в тему, приходите на наш практический двухдневный курс.

Лучшие примеры информационного дизайна, такие как карта нашествия Наполеона Шарля Менара и расследование эпидемии холеры Джона Сноу, созданы не профессиональными дизайнерами, а инженерами, врачами, экономистами, учёными, которые ценили данные и стремились извлечь из них смысл и пользу. Свою первую визуализацию — пассажиропотоки в метро — я нарисовала, едва освоив фотошоп, и до сих пор ей горжусь.

Для визуализации данных одинаково необходимы навыки аналитика, дизайнера и программиста. Поэтому из какой бы области вы не пришли, придётся чему-то учиться. Мне кажется, что это здорово, и что осваивать новое никогда не поздно. Ищите задачи по душе, практикуйтесь, изучайте хорошие примеры, пополняйте арсенал форматов и приёмов. Ваше главное оружие — искренний интерес и любовь к данным.

Желаю удачи!

Присылайте вопросы о визуализации данных, организации времени, рабочем процессе, спорте и путешествиях на почту: mail@infotanka.ru. Ответы публикуются по понедельникам.
2014   визуализация данных   вопрос-ответ   обучение

Вопрос-ответ: Как улучшить постер об истории киножанров?

Спрашивает Энжи Сказка:

Запилил курсач для универа. Задание было, имея доступ к данным IMDB, сделать инфографику, которая рассказывает историю про киношки (журнальную, настенную, интерактивную, HTML, D3.js, какую угодно). Вот датасет (155 Мб).

Я выбрал рассказать про жанры, про то, какую долю они занимали в истории кино и как сопоставлялись с событиями в киноиндустрии. Про это мой настенный постер. Как можно было визуализировать то же самое по-другому? Где косяки и как улучшить? Какую другую историю можно было бы поведать?

Честно говоря, я не поняла, что показано на главной диаграмме. Какое измерение отложено по вертикали? Что означают пики и провалы? Почему высота диаграммы постоянна, тогда как сумма долей жанров всегда превышает 100% (у одного фильма несколько жанров) и меняется со временем?

Самая интересная особенность данных: один фильм ≠ один жанр, она ни в коем случае не должна потеряться.

Художественные и документальные фильмы — это разные категории, а не жанры. Их лучше показать на отдельных графиках. Предлагаю также выделить в качестве категорий короткометражки и анимационные фильмы. Для каждой категории составь список мета-жанров (жанров, объединённых одним фильмом): наряду с комедиями и драмами, туда попадут музыкальные вестерны, романтические драмы, военные боевики. Документальные фильмы разделятся на военные, исторические и спортивные. Мультфильмы — на семейные комедии и взрослые драмы. Отложим на таймлайне художественные фильмы, сгруппированные по мета-жанрам с учётом времени их появления, чтобы можно было отследить зарождение мистических триллеров или комедийных ужастиков. Получится что-то вроде музыкального генеалогического дерева:

Можно придумать хитрое цветовое кодирование, обозначив основные жанры чистыми цветами, а производные — смешанными. Интересные факты и важные фильмы нужно обязательно сохранить, разнообразив текстовые описания крупными числовыми фактоидами, афишами и кадрами из фильмов. Не стоит расшифровывать жанры, их названия говорят сами за себя. Правая часть дублирует основной график, от неё лучше избавиться.

По мелочам. Эффект «бумажной гармошки» создаёт впечатление трёхмерной картинки и визуально искажает график. Чёрная обводка лет на нижней шкале — лишняя . Резкое увеличение количества фильмов в 2000-х расшифрует только очень сообразительный читатель. Total number of movies per year → Movies per year.

Предлагаю читателям высказать свои идеи визуализации кино-данных.

P.S. Энжи делится статьями по визуализации информации:

  1. Storytelling: The Next Step for Visualization, Robert Kosara, Jock Mackinlay from Tableau Software
  2. Scientific Storytelling using Visualization, Kwan-Liu Ma, University of California, Davis, CA, USA
  3. Narrative Visualization: Telling Stories with Data, Edward Segel and Jeffrey Heer

Спасибо!

Ответы на вопросы о визуализации данных, организации времени, рабочем процессе, спорте и путешествиях выходят по понедельникам. Пишите: mail@infotanka.ru.
2014   IMDB   визуализация данных   вопрос-ответ   кино   постер

Брейнвошинг «Визуализация данных»

Осень — горячая пора выступлений. В октябре и ноябре я рассказывала о визуализации данных участникам «Фестиваля 404» и ВУДа, посетителям обычных и «живых» советов, студентам МАИ. Впереди дизайн-пуфики, практические занятия в МГУ и на «Дизайн-треке», мастер-класс для «Креативных людей». Мне очень нравится делиться своими наблюдениями, знаниями и опытом, отвечать на вопросы, обсуждать задачи и искать решения.

Получасовые доклады и короткие мастер-классы пробуждают у слушателей интерес и задают направление для самостоятельного изучения, но не приносят практической пользы. Для тех, кто хочет перейти «на ты» с данными, я организую двухдневный учебный курс «Визуализация данных».


Курс пройдёт 25 и 26 января в штаб-квартире Злых марсиан. Он будет полезен дизайнерам инфографики, аналитикам, журналистам, редакторам онлайн-изданий и всем, кто интересуется визуализацией сложных данных.

На курсе участники учатся работать с данными: извлекать из них знания с помощью дизайнерских инструментов и демонстрировать результаты в эффективных и эффектных визуализациях. Первый день посвящён принципам визуализации данных, грамотной работе с базовыми графиками и диаграммами, изучению нестандартных способов представления данных. Во второй день участники знакомятся с D3.js — самым современным и гибким инструментом интерактивных визуализаций, и создают с его помощью графики и инфограммы. Все участники курса получают раздаточные материалы с кратким конспектом лекций:

Программа и запись на курс: http://brainwashing.pro/dataviz

2013   брэйнвошинг   визуализация данных   учебный курс
Ранее Ctrl + ↓