Визуализация данных - это графика представление из данных. Он включает в себя изображения, которые передают отношения между представленными данными зрителям изображений. Эта связь достигается за счет использования систематического сопоставления между графическими метками и значениями данных при создании визуализации. Это сопоставление устанавливает, как значения будут данных представлены визуально, как и в какой степени свойства графической метки, такое как размер или цвет, будет изменяться, чтобы отразить изменения в значении датума.
Для четкой и эффективной передачи информации в визуализации данных используются статистические графики, графики, информационные графики и другие инструменты. Числовые данные могут быть закодированы с использованием точек, линий или полос, чтобы визуально количественное сообщение. Эффективная визуализация помогает пользователям анализировать и рассуждать о данных и доказательствах. Это делает сложные данные более доступными, понятными и удобными. У пользователей могут быть аналитические характеристики, такие как сравнение или понимание причинно-следственной связи, и принципов связи графики (т.е.показание сравнений или демонстрация причинно-следственной связи) следует за соблюдением. Таблицы обычно используются там, где пользователи будут искать конкретное измерение, а диаграммы различных типов используются для отображения схем отображений или взаимосвязей данных для одной или нескольких чисел.
Визуализация данных - это одновременно искусство и наука. Одни рассматривают его как ветвь описательной статистики, а другие - как инструмент разработки обоснованной теории. Увеличенные объемы, создаваемые Интернет-активностью, и увеличивающееся количество датчиков в среде вещей называются «большими данными » или Интернетом. Обработка, анализ и передача этих данных предоставить этические и аналитические проблемы для визуализации данных. Область науки о данных и практики, называемые специалистами по данным, решить эту проблему. В коммерческой сфере такое увеличенное количество генерируемых данных привело к тому, что работники имели большую визуальную грамотность, чем требовалось ранее.
Визуализация данных относится к методам, используемым для передачи данных или информации путем их кодирования в виде визуальных объектов (например, точки, линии или полосы), содержащиеся в графике. Цель состоит в том, чтобы четко и передать информацию пользователю. Это один из этапов анализа данных или науки о данных. По Виталия Фридмана (2008), «основная цель визуализации данных - четко и выраженными данными с помощью графических средств. Это не означает, что визуализация должна выглядеть скучной, чтобы быть функциональной, или сложной, чтобы выглядеть красивой. Для передачи идей. По сути, эстетическая форма и функциональность должны идти рука об руку, понимание довольно разреженного и сложного набора данных более интуитивно понятным способом. Тем не менее, дизайнерам не удается достичь баланса между формой и часто функцией, создавая великолепные визуализации данных, которые не достигают своей основной цели - передаче информации ».
Действительно, Фернанда Вьегас и Мартин М. Ваттенберг предположили, что идеальная визуализация не должна общаться четко, но стимулируют заинтересованность и внимание зрителя.
Визуализация данных связана с информационной графикой, визуализацией информации, научным видением анализом, поисковым анализом данных и статистические графики. В новом тысячелетии визуализация данных активная областью исследований, обучения и развития. По данным Post et al. (2002), он объединил научную и информационную визуализацию.
В коммерческой среде визуализацию данных часто называют дашбордами. Инфографика - еще одна очень распространенная форма визуализации данных.
Профессор Эдвард Тафте объяснил, что пользователи информационных дисплеев работают аналитические задачи, такие как сравнение. Принцип построения информационной графики должен поддерживать аналитическую задачу. Как показывают Уильям Кливленд и Роберт МакГилл, различные графические элементы выполняют это более или менее эффективно. Например, точечные диаграммы и гистограммы превосходят круговые диаграммы.
В книге 1983 года «Визуальное представление количественной информации» Эдвард Тафте определяет «графическое отображение» и принципы эффективного графического представления в следующем отрывок: «Превосходство в статистической графике из сложных идей переданных» с ясностью, точностью и эффективностью. Графические изображения должны:
Графики отображают данные.
, диаграмма Минара показывает результаты, понесенные армией Наполеона в период 1812–1813 годов. На графике нанесены шесть размеров: размер армии, ее расположение на двумерной поверхности (x и y), время, направление движения и температура. Ширина линии иллюстрирует сравнение (размер армии в моменты времени), а ось температуры указывает причину изменения. В 1983 году Тафт писал, что: «Это вполне может быть лучшая статистическая графика из когда-либо созданных».
Несоблюдение этих принципов может привести к вводящим в заблуждение графикам, которые искажают сообщение или подтверждают ошибочный вывод.Согласно Тафту, charjunk относится к внешнему внутреннему о формальному изображению, которое не радует сообщение или бесплатные трехмерные или перспективные эффекты. Излишне отделить пояснительный ключ от самого изображения, заставляя глаз перемещаться от изображения к ключу и обратно, представляет собой «административного мусора». Отношение «данные к чернилам» должны быть максимальными, стирая чернила, не являющиеся данными, там, где это возможно.
Бюджетное управление Конгресса обобщило несколько лучших практик для графических дисплеев в презентации в июне 2014 года. К ним относ: а) знание своей аудитории; б) разработка графики, которая может стоять отдельно вне контекста отчета; и c) Разработка графиков, которые передают ключевые сообщения в отчете.
Автор Стивен Фью за период времени, которые пользователи могут попытаться понять или передать на основе набора данных и связанных графиков, используемых для передачи сообщений:
Аналитики, просматривающие набор данных, могут подумать, применимы ли некоторые или все приведенные выше сообщения и графические типы их задач и аудитории. Процесс и ошибок для определения значимых взаимосвязей и сообщений является частью данных исследовательского анализа данных.
Человек может различать различия в длине, форме и ориентации строк, расстояния и цвет ( оттенок) без значительных усилий по обработке; они регистрируются как «предварительные атрибуты ». Например, может потребоваться значительное время и усилия («внимательная обработка»), чтобы определить, сколько раз цифра «5» появляется в серии чисел; но если эта цифра отличается по размеру, ориентации или цвету, экземпляры цифры можно быстро отметить с помощью предварительной обработки.
Эффективная графика использует преимущества предварительной обработки и атрибутов. (Которая использует длину линии для сравнения), а не круговые диаграммы (которые используют площадь поверхности для сравнения), может быть более эффективным использовать гистограмму.
Знание человеческого восприятия и познания необходимо при разработке интуитивных визуализаций. Познание относится к таким человеческим процессам, как восприятие, внимание, обучение, память, мышление. Обработка изображений людьми эффективными при обнаружении изменений и сравнения количества, размеров, форм и вариантов легкости., когда свойства символьных данных сопоставляются с визуальными методами, люди могут просматривать большие объемы данных. нейронов мозга могут участвовать в обработке изоб ражений. Правильная визуализация обеспечивает другой подход к отображению отношений, отношений и т. Д., Которые не так очевидны в не визуализированных количественных данных. Визуализация может стать средством исследования данных.
Исследования показали, что люди использовали в среднем на 19% меньше когнитивных ресурсов и на 4,5% лучше могли вспомнить детали при сравнении визуализации данных с текстом.
Нет исчерпывающей «истории» визуализации данных. Нет отчетов, которые охватывают все развитие визуального мышления и визуального представления данных и сопоставляют вклад различных дисциплин. Майкл Френдли и Дэниел Дж. Денис из Йоркского университета участвуют в проекте, который использует исчерпывающую историю визуализации. Вопреки распространенному мнению, визуализация данных - это не современная разработка. Звездные данные или информация, такое как расположение звезд, визуализировалась на стенах пещер (например, найденных в пещере Ласко на юге Франции) с эпохи плейстоцена. Физические артефакты, такие как месопотамские глиняные жетоны (5500 г. до н.э.), инков кипус (2600 г. до н.э.) и стикеры Маршалловых островов (nd), также могут рассматриваться как визуализирующие количественная информация.
Первая документированная визуализация данных может быть прослежена до 1160 г. до н.э. с Туринской картой папируса, которая точно показывает распределение геологических ресурсов и предоставляет информацию о разработке этих ресурсов. Такие карты можно отнести к категории тематической картографии, которая представляет собой тип визуализации данных, которая представляет данные и данные через географическую иллюстрацию, предназначенную для конкретной географической темы. Самыми ранними задокументированными формами визуализации данных были различные тематические карты из разных культур, а также идеограммы иероглифы, которые обеспечивают и позволяют интерпретировать проиллюстрированную информацию. Например, линейное письмо B таблицы Микены предоставили визуализацию информации о торговле эпохи поздней бронзы в Средиземноморье. Идея координат использовалась древнеегипетскими геодезистами при планировании городов, земные и небесные позиции определялись чем-то вроде широты и долготы, по крайней мере, к 200 г. до н.э., картографическая проекция сферической земли в широте и долготе - Клавдий Птолемей [ок.85 - ок. 165] в Александрии служили эталоном до XIV века.
Изобретение бумаги и пергамента обеспечивает дальнейшее развитие визуализаций на протяжении всей истории. На рисунке показан график 10-го или возможно, предназначенный для иллюстрации движения планет и используется в приложении к учебнику в монастырских школах. График, по-видимому, должен быть представлен собой наклонов планетных орбитов в зависимости от графика времени. Для этой зоны зодиака изображалась на плоскости с горизонтальной линией, разделенной на тридцать частей в качестве временной или продольной оси. Вертикальная ось обозначает ширину зодиака. Горизонтальный масштаб, по-видимому, был выбран для каждой планеты индивидуально, поскольку периоды не могут быть согласованы. Сопроводительный текст относится только к амплитудам. Видимо, кривые не связаны во времени.
Движение планетК XVI веку методы и инструменты для точного наблюдения и улучшения географического положения были (например, «квадрант стены», построенный Тихо Браге [1546 –1601], покрывающий всю стену в его обсерватории). Особенно важным было развитие триангуляции и других методов для точного определения местоположения на карте.
Французский философ и математик Рене Декарт и Пьер де Ферма разработали аналитическую геометрию и два- система координат, которая сильно повлияла на практические методы отображения и расчета значений. Ферма и Блез Паскаль работали над статистикой и теорией вероятностей, заложив основу для того, что мы теперь концептуализируем как данные. Согласно Interaction Design Foundation, эти разработки позволили и помогли Уильяму Playfair, который видел потенциал для графической передачи количественных данных, создать и разработать графические методы статистики.
Playfair TimeSeriesво второй половине 20 века Жак Бертин использовал количественные графики для представления информации «интуитивно, ясно, точно и эффективно».
Джон Тьюки и Эдвард Тафте раздвинули границы визуализации данных; Тьюки с его новым статистическим подходом к исследовательскому анализу данных и Тафте с его книгой «Визуальное отображение количественной информации» проложили путь к совершенствованию методов визуализации данных не только для статистиков. С развитием технологий пришла и визуализация данных; начиная с рисованной визуализации и развиваясь в более технические приложения, включая интерактивные разработки, ведущие к визуализации программного обеспечения.
Такие программы, как SAS, SOFA, R, Minitab, Cornerstone и more позволяют визуализировать данные в области статистики. Другие приложения для визуализации данных, более целенаправленные и уникальные для отдельных лиц, языки программирования, такие как D3, Python и JavaScript, помогают сделать визуализацию количественных данных возможной. Частные школы также разработали программы для удовлетворения спроса на визуализацию обучающих данных и соответствующие библиотеки программирования, включая бесплатные программы, такие как The Data Incubator, или платные программы, такие как General Assembly.
Beginning with the Symposium "Data to Discovery »в 2013 году Колледж дизайна ArtCenter, Калифорнийский технологический институт и Лаборатория реактивного движения в Пасадене запустили ежегодную программу по интерактивной визуализации данных. Программа задает вопрос: как интерактивная визуализация данных может помочь ученым и инженерам более эффективно исследовать свои данные? Как вычисления, дизайн и дизайн-мышление могут помочь максимизировать результаты исследований? Какие методологии наиболее эффективны для использования знаний из этих областей? Кодируя реляционную информацию с соответствующими визуальными и интерактивными характеристиками, чтобы помочь исследовать и, в конечном итоге, получить новое представ ление о данных, программа разрабатывает новые междисциплинарные подходы к сложным научным проблемам, используя дизайнерское мышление и новейшие методы вычислений, ориентированного на пользователя дизайна, дизайна взаимодействия. и 3D-графика.
Визуализация данных включает в себя особую терминологию, некоторые из которых получены из статистики. Например, автор Стивен Фью определяет два типа данных, которые используются в комбинации для поддержки значимого анализа или визуализации:
Различие между количественными и категориальными важными, потому что два типа требуют разных методов визуализации.
Два основных типа информационных дисплеев - это таблицы и графики.
Эпплер и Ллер разработали «Периодическую таблицу методов визуализации», интерактивную диаграмму, отображающую различные методы визуализации данных. Он включает шесть типов методов визуализации данных: данные, информация, концепция, стратегия, метафора и состав.
Имя | Визуальные измерения | Описание / пример использования | |
---|---|---|---|
Гистограмма подсказок по дням недели | Гистограмма |
|
|
Гистограмма цен на жилье | Гистограмма |
|
|
Базовая диаграмма рассеяния двух чисел | Диаграмма рассеяния |
|
|
График рассеяния | Диаграмма рассеяния (3D) |
|
|
Сетевой анализ | Сеть |
|
|
Круговая диаграмма | Круговая диаграмма |
|
|
Линейная диаграмма | Линейная диаграмма |
|
|
Streamgraph | Streamgraph |
|
|
Древовидная карта | Древовидная карта |
|
|
Диаграмма Ганта | Диаграмма Ганта |
|
|
Тепловая карта | Тепловая карта |
|
|
Полосовой рисунок | Полосовой рисунок |
|
|
Анимированная спиральная графика | Анимированная спиральная графика |
|
|
График прямоугольников и усов | График прямоугольников и усов |
|
|
Блок-схема | Блок-схема |
| |
Радарная диаграмма | Радарная диаграмма |
|
|
диаграмма Венна | диаграмма Венна |
|
|
Существуют разные подходы к области визуализации данных. Одним из наиболее распространенных направлений является представление информации, например, Фридман (2008). Friendly (2008) предполагает две основные части визуализации данных: статистическая графика и тематическая картография. В этой строке в статье «Визуализация данных: современные подходы» (2007) дается обзор семи предметов визуализации данных:
Все эти темы тесно связаны с графическим дизайном и информацией представление.
С другой стороны, с точки зрения информатики, Фриц Х. Пост в 2002 году разделил это поле на подполя:
В Harvard Business Review, Скотт Беринато разработала основу для подхода к визуализации данных. Чтобы начать думать визуально, пользователи должны рассмотреть два вопроса; 1) что у вас есть и 2) чем вы занимаетесь. Первая ул