В статистике вводящий в заблуждение график, также известный как искаженный график, представляет собой график, который искажает данные, составляя неправильное использование статистики, и в результате из этого можно сделать неверный вывод.
Графики могут вводить в заблуждение из-за чрезмерной сложности или плохого построения. Даже если они построены для точного отображения характеристик своих данных, графики могут подвергаться различной интерпретации, или непреднамеренный вид данных может казаться и в конечном итоге быть получен ошибочно.
Вводящие в заблуждение графики могут создаваться намеренно, чтобы препятствовать правильной интерпретации данных или случайно из-за незнания графического программного обеспечения, неверной интерпретации данных или из-за того, что данные не могут быть точно переданы. Вводящие в заблуждение графики часто используются в ложной рекламе. Одним из первых авторов, написавших о вводящих в заблуждение графиках, был Даррелл Хафф, издатель книги 1954 года Как лгать со статистикой.
Область визуализации данных описывает способы представить информацию, которая позволяет избежать создания вводящих в заблуждение графиков.
--Как лгать со статистикой (1954)
Есть много способов, которыми h может быть построен вводящий в заблуждение граф.
Использование графиков там, где они не нужны, может привести к ненужной путанице / интерпретации. Как правило, чем больше объяснений требуется графу, тем меньше требуется сам граф. Графики не всегда передают информацию лучше, чем таблицы.
Использование смещенных или загруженных слов в заголовке графика, метках оси или заголовке может быть неуместным простимулируйте читателя.
Точно так же попытка провести линии тренда через некоррелированные данные может ввести читателя в заблуждение и заставить поверить в то, что тренд существует там, где его нет. Это может быть как результатом намеренной попытки ввести читателя в заблуждение, так и явлением иллюзорной корреляции.
Перспектива (3D) круговая диаграмма используется для отображения диаграмма в 3D виде. Третье измерение, которое часто используется по эстетическим соображениям, не улучшает чтение данных; напротив, эти графики трудно интерпретировать из-за искаженного эффекта перспективы, связанного с третьим измерением. Использование излишних измерений, не используемых для отображения интересующих данных, не рекомендуется для диаграмм в целом, а не только для круговых диаграмм. На трехмерной круговой диаграмме срезы, расположенные ближе к читателю, кажутся больше, чем срезы сзади, из-за угла, под которым они представлены. Этот эффект делает читателей менее эффективными при оценке относительной величины каждого среза, когда с использованием 3D, чем 2D
Вводящая в заблуждение круговая диаграмма | Обычная круговая диаграмма |
---|---|
На вводящей в заблуждение круговой диаграмме элемент C выглядит как минимум такого же размера, как элемент A, тогда как в на самом деле он меньше половины.
Эдвард Тафте, известный американский статистик, заметил, почему таблицы могут быть предпочтительнее круговых диаграмм в Визуальное отображение количественной информации :
Таблицы предпочтительнее графики для многих небольших наборов данных. Таблица почти всегда лучше, чем тупая круговая диаграмма; Единственное, что хуже круговой диаграммы - это несколько из них, поскольку тогда зрителя просят сравнить количества, расположенные в пространственном беспорядке как внутри, так и между пирогами - учитывая их низкую плотность данных и неспособность упорядочить числа по визуальному измерению, круговые диаграммы никогда не следует использовать.
При использовании пиктограмм в гистограммах их не следует масштабировать равномерно, так как это создает вводящее в заблуждение сравнение. Интерпретируется область пиктограммы, а не только ее высота или ширина. Это приводит к тому, что при масштабировании разница оказывается возведенной в квадрат.
Неправильное масштабирование | Обычное | Сравнение |
---|---|---|
В неправильно масштабированной пиктограмма гистограммы, изображение для B фактически в 9 раз больше A.
Квадрат | Круг | Треугольник |
---|---|---|
Воспринимаемый размер увеличивается, когда масштабирование.
Эффект неправильного масштабирования пиктограмм дополнительно проиллюстрирован, когда пиктограмма имеет 3 измерения, и в этом случае эффект отображается в кубе.
График продаж домов (слева) вводит в заблуждение. Похоже, что продажи домов в 2001 году выросли в восемь раз по сравнению с предыдущим годом, тогда как на самом деле они выросли вдвое. Кроме того, не уточняется количество продаж.
Неправильно масштабированная пиктограмма также может указывать на то, что сам предмет изменился в размере.
Вводящий в заблуждение | Обычный |
---|---|
Предполагая, что изображения представляют эквивалентные количества, вводящий в заблуждение график создает впечатление, что бананов больше, потому что они занимают большую часть площади и находятся дальше всего правее.
Логарифмические (или логарифмические) шкалы являются допустимым средством представления данных. Но при использовании без четкой маркировки в виде шкалы журнала или при отображении для читателя, незнакомого с ними, они могут ввести в заблуждение. Шкалы журналов помещают значения данных в виде выбранного числа (основание журнала) в определенную степень. Базой часто является e (2,71828...) или 10. Например, шкала журнала может давать высоту 1 для значения 10 в данных и высоту 6 для значения 1 000 000 (10) в данных. Логарифмические шкалы и варианты обычно используются, например, для индекса вулканической взрывоопасности, шкалы Рихтера для землетрясений, магнитуды звезд и pH кислотных и щелочных растворов. Даже в этих случаях логарифмический масштаб может сделать данные менее заметными для глаза. Часто причиной использования логарифмических шкал является то, что автор графика желает отобразить эффекты совершенно разных масштабов на одной оси. Без логарифмических шкал сравнение таких величин, как 10 и 10, становится визуально непрактичным. График с логарифмической шкалой, которая не была четко обозначена как таковая, или график с логарифмической шкалой, представленный зрителю, не знающему логарифмических шкал, обычно приводит к представлению, при котором значения данных выглядят одинакового размера, пока факт существования самых разных величин. Неправильное использование логарифмической шкалы может привести к тому, что сильно различающиеся значения (например, 10 и 10 000) будут выглядеть близко друг к другу (в логарифмической шкале с основанием 10 они будут только 1 и 4). Или же небольшие значения могут казаться отрицательными из-за того, как логарифмическая шкала представляет числа, меньшие, чем основание.
Неправильное использование логарифмических шкал может также привести к тому, что отношения между величинами будут казаться линейными, в то время как эти отношения на самом деле являются экспоненциальными или степенными законами, которые очень быстро растут в сторону более высоких значений. Было заявлено, хотя в основном в юмористической форме, что «все выглядит линейно на бревенчатом участке толстым маркером».
Линейная шкала | Логарифмическая шкала |
---|---|
Оба графика показывают идентичную экспоненциальную функцию f (x) = 2. На графике слева используется линейная шкала, четко показывающая экспоненциальный тренд. Однако на графике справа используется логарифмическая шкала, которая образует прямую линию. Если бы наблюдатель графика не знал об этом, график мог бы показывать линейный тренд.
.
A усеченный граф (также известный как разорванный граф ) имеет ось y, которая не начинается с 0. Эти графики могут создавать впечатление важных изменений там, где относительно небольшое изменение.
Хотя усеченные графики можно использовать для перерисовки различий или для экономии места, их использование часто не рекомендуется. Коммерческое программное обеспечение, такое как MS Excel, будет по умолчанию обрезать графики, если все значения находятся в узком диапазоне, как в этом примере. Чтобы показать относительные различия значений во времени, можно использовать индексную диаграмму. Усеченные диаграммы всегда будут визуально искажать лежащие в основе числа. Несколько исследований показали, что даже если люди были правильно проинформированы об усечении оси Y, они все равно переоценили фактические различия, часто существенно.
Усеченная гистограмма | Обычная гистограмма |
---|---|
Оба этих графика отображают идентичные данные; однако на усеченной гистограмме слева данные, по-видимому, показывают значительные различия, тогда как на обычной гистограмме справа эти различия едва заметны.
. Существует несколько способов обозначить разрывы оси Y:
Исходный график | Меньший максимум | Больший максимум |
---|---|---|
Изменение максимума оси Y влияет на вид графика. Более высокий максимум приведет к тому, что график будет иметь меньшую волатильность, меньший рост и менее крутую линию, чем более низкий максимум.
Исходный график | Полуширина, удвоенная высота | Двойная ширина, половина высоты |
---|---|---|
Изменение соотношения размеров графика повлияет на то, как график появляется.
Масштаб графика часто используется для преувеличения или минимизации различий.
Меньше разницы | Больше разницы |
---|---|
Отсутствие начального значения для оси y не позволяет понять, усечен ли график. Кроме того, отсутствие отметок не позволяет читателю определить, правильно ли масштабированы столбцы графика. Без шкалы можно легко управлять визуальной разницей между полосами.
Волатильность | Устойчивый, быстрый рост | Медленный рост |
---|---|---|
Хотя все три графика имеют одни и те же данные, и, следовательно, реальный наклон данных (x, y) такой же, способ построения данных может изменить внешний вид угла, образованного линией на графике. Это потому, что каждый график имеет разный масштаб по вертикальной оси. Поскольку масштаб не показан, эти графики могут вводить в заблуждение.
Интервалы и единицы, используемые на графике, можно изменять для создания или уменьшения выраженности изменения.
Графики, созданные с пропущенными данными, удаляют информацию, на основе которой можно сделать вывод.
Точечная диаграмма с отсутствующими категориями | Обычная точечная диаграмма |
---|---|
На диаграмме рассеяния с отсутствующими категориями слева рост выглядит более линейным с меньшими вариациями.
В финансовых отчетах отрицательная доходность или данные, которые не коррелируют с положительным прогнозом, могут быть исключены, чтобы создать более благоприятное визуальное впечатление.
Использование лишнего Использование третьего измерения, которое не содержит информации, настоятельно не рекомендуется, поскольку оно может запутать читателя.
Третье измерение может запутать читателей
Из-за перспективы синий столбец спереди кажется больше зеленого столбца сзади, несмотря на то же самое значение
При масштабировании в трех измерениях эффект изменения кубизируется
Графики предназначены для упрощения интерпретации статистических данных. Однако графики с чрезмерной сложностью могут запутать данные и затруднить интерпретацию.
Плохо построенные графики могут затруднить распознавание и интерпретацию данных.
В свою очередь, вводящие в заблуждение графики могут использоваться для экстраполяции вводящих в заблуждение тенденций.
Было разработано несколько методов чтобы определить, искажены ли графики, и количественно оценить это искажение.
где
График с высоким коэффициентом лжи (>1) преувеличивает изменение данных, которые он представляет, а график с небольшим фактором лжи (>0, <1) would obscure change in the data. A perfectly accurate graph would exhibit a lie factor of 1.
где
индекс расхождения графика, также известный как индекс искажения графика (GDI ), был первоначально предложен Полом Джоном Стейнбартом в 1998 году. GDI рассчитывается в процентах от -100% до положительной бесконечности, при этом ноль процентов указывает на то, что график был правильно построен, и все, что выходит за пределы диапазона ± 5%, считается искаженный. Исследование использования GDI в качестве меры искажения графики показало, что оно непоследовательно и непостоянно, что затрудняет использование GDI в качестве меры для сравнения.
Соотношение чернил и данных должно быть относительно высоким, в противном случае диаграмма может содержать ненужную графику.
Плотность данных должна быть относительно высокой, в противном случае таблица может быть лучше подходит для отображения данных.
Графики полезны для обобщения и интерпретации финансовые данные. Графики позволяют видеть тенденции в больших наборах данных, а также позволяют интерпретировать данные неспециалистам.
Графики часто используются в корпоративных годовых отчетах как форма управление впечатлениями. В Соединенных Штатах Америки графики не подлежат аудиту, поскольку они подпадают под Раздел 550 AU «Прочая информация в документах, содержащих проверенные финансовые отчеты».
В нескольких опубликованных исследованиях рассматривается использование графиков в корпоративных отчетах для различных корпораций. в разных странах и обнаружили в этих отчетах частое использование неправильной конструкции, избирательности и искажений измерений. Наличие вводящих в заблуждение графиков в годовых отчетах привело к появлению запросов на установление стандартов.
Исследования показали, что, хотя читатели с низким уровнем финансового понимания имеют больше шансов быть дезинформированными вводящими в заблуждение графиками, даже те, кто финансовых специалистов, таких как кредитные специалисты, могут быть введены в заблуждение.
Восприятие графиков изучается в психофизике, когнитивной психологии и вычислительное видение.