Вводящий в заблуждение график

редактировать
График, искажающий данные

В статистике вводящий в заблуждение график, также известный как искаженный график, представляет собой график, который искажает данные, составляя неправильное использование статистики, и в результате из этого можно сделать неверный вывод.

Графики могут вводить в заблуждение из-за чрезмерной сложности или плохого построения. Даже если они построены для точного отображения характеристик своих данных, графики могут подвергаться различной интерпретации, или непреднамеренный вид данных может казаться и в конечном итоге быть получен ошибочно.

Вводящие в заблуждение графики могут создаваться намеренно, чтобы препятствовать правильной интерпретации данных или случайно из-за незнания графического программного обеспечения, неверной интерпретации данных или из-за того, что данные не могут быть точно переданы. Вводящие в заблуждение графики часто используются в ложной рекламе. Одним из первых авторов, написавших о вводящих в заблуждение графиках, был Даррелл Хафф, издатель книги 1954 года Как лгать со статистикой.

Область визуализации данных описывает способы представить информацию, которая позволяет избежать создания вводящих в заблуждение графиков.

Содержание
  • 1 Методы, вводящие в заблуждение
    • 1.1 Чрезмерное использование
    • 1.2 Предвзятые метки
      • 1.2.1 Созданные тренды
    • 1.3 Круговая диаграмма
      • 1.3.1 Перспектива среза трехмерной круговой диаграммы
    • 1.4 Неправильное масштабирование
      • 1.4.1 Логарифмическое масштабирование
    • 1.5 Усеченный график
    • 1.6 Изменения осей
    • 1.7 Нет масштаба
    • 1.8 Неправильные интервалы или единицы
    • 1.9 Отсутствие данных
    • 1.10 3D
    • 1.11 Сложность
    • 1.12 Плохая конструкция
    • 1.13 Экстраполяция
  • 2 Измерение искажений
    • 2.1 Фактор лжи
    • 2.2 Индекс несоответствия графика
    • 2.3 Соотношение данных и чернил
    • 2.4 Плотность данных
  • 3 Использование в финансовой и корпоративной отчетности
  • 4 Академия
  • 5 См. Также
  • 6 Ссылки
    • 6.1 Книги
  • 7 Дополнительная литература
  • 8 Внешние ссылки
Методы вводящих в заблуждение графов
Этот [вводящий в заблуждение график] намного более эффективен, однако, поскольку он не содержит прилагательных или наречий, разрушающих иллюзию объективности, никто не может вас повесить.

--Как лгать со статистикой (1954)

Есть много способов, которыми h может быть построен вводящий в заблуждение граф.

Чрезмерное использование

Использование графиков там, где они не нужны, может привести к ненужной путанице / интерпретации. Как правило, чем больше объяснений требуется графу, тем меньше требуется сам граф. Графики не всегда передают информацию лучше, чем таблицы.

Смещенная маркировка

Использование смещенных или загруженных слов в заголовке графика, метках оси или заголовке может быть неуместным простимулируйте читателя.

сфабрикованные тренды

Точно так же попытка провести линии тренда через некоррелированные данные может ввести читателя в заблуждение и заставить поверить в то, что тренд существует там, где его нет. Это может быть как результатом намеренной попытки ввести читателя в заблуждение, так и явлением иллюзорной корреляции.

Круговой диаграммы

  • Сравнение круговых диаграмм разных размеров может ввести в заблуждение, поскольку люди не могут точно прочитать сравнительную область кругов.
  • Использование тонких срезов, которые трудно различить, может быть трудно интерпретировать.
  • Использование процентов в качестве меток на круговой диаграмме может вводить в заблуждение, когда размер выборки
  • Создание трехмерной круговой диаграммы или добавление наклона затруднит интерпретацию из-за искаженного эффекта перспективы. Круговые диаграммы в виде гистограмм, в которых высота срезов варьируется, могут запутать читателя.

Перспектива среза трехмерной круговой диаграммы

Перспектива (3D) круговая диаграмма используется для отображения диаграмма в 3D виде. Третье измерение, которое часто используется по эстетическим соображениям, не улучшает чтение данных; напротив, эти графики трудно интерпретировать из-за искаженного эффекта перспективы, связанного с третьим измерением. Использование излишних измерений, не используемых для отображения интересующих данных, не рекомендуется для диаграмм в целом, а не только для круговых диаграмм. На трехмерной круговой диаграмме срезы, расположенные ближе к читателю, кажутся больше, чем срезы сзади, из-за угла, под которым они представлены. Этот эффект делает читателей менее эффективными при оценке относительной величины каждого среза, когда с использованием 3D, чем 2D

Сравнение круговых диаграмм
Вводящая в заблуждение круговая диаграммаОбычная круговая диаграмма
Misleading Pie Chart.png Образец круговой диаграммы.png

На вводящей в заблуждение круговой диаграмме элемент C выглядит как минимум такого же размера, как элемент A, тогда как в на самом деле он меньше половины.

Эдвард Тафте, известный американский статистик, заметил, почему таблицы могут быть предпочтительнее круговых диаграмм в Визуальное отображение количественной информации :

Таблицы предпочтительнее графики для многих небольших наборов данных. Таблица почти всегда лучше, чем тупая круговая диаграмма; Единственное, что хуже круговой диаграммы - это несколько из них, поскольку тогда зрителя просят сравнить количества, расположенные в пространственном беспорядке как внутри, так и между пирогами - учитывая их низкую плотность данных и неспособность упорядочить числа по визуальному измерению, круговые диаграммы никогда не следует использовать.

Неправильное масштабирование

При использовании пиктограмм в гистограммах их не следует масштабировать равномерно, так как это создает вводящее в заблуждение сравнение. Интерпретируется область пиктограммы, а не только ее высота или ширина. Это приводит к тому, что при масштабировании разница оказывается возведенной в квадрат.

Неправильное масштабирование 2D-пиктограммы на столбчатой ​​диаграмме
Неправильное масштабированиеОбычноеСравнение
Неправильно масштабировано picture graph.svg Picture Graph.svg Сравнение правильно и неправильно масштабированного графа изображения. svg

В неправильно масштабированной пиктограмма гистограммы, изображение для B фактически в 9 раз больше A.

Сравнение масштабирования 2D-формы
КвадратКругТреугольник
Box scaling.svg Circle scaling.svg Triangle scaling.svg

Воспринимаемый размер увеличивается, когда масштабирование.

Эффект неправильного масштабирования пиктограмм дополнительно проиллюстрирован, когда пиктограмма имеет 3 измерения, и в этом случае эффект отображается в кубе.

График, показывающий неправильную трехмерную пиктограмму scaling.svg

График продаж домов (слева) вводит в заблуждение. Похоже, что продажи домов в 2001 году выросли в восемь раз по сравнению с предыдущим годом, тогда как на самом деле они выросли вдвое. Кроме того, не уточняется количество продаж.

Неправильно масштабированная пиктограмма также может указывать на то, что сам предмет изменился в размере.

Вводящий в заблуждениеОбычный
Пиктограмма не выровнена и имеет другой размер.svg Пиктограмма с выравниванием и аналогичным размером.svg

Предполагая, что изображения представляют эквивалентные количества, вводящий в заблуждение график создает впечатление, что бананов больше, потому что они занимают большую часть площади и находятся дальше всего правее.

Логарифмическое масштабирование

Логарифмические (или логарифмические) шкалы являются допустимым средством представления данных. Но при использовании без четкой маркировки в виде шкалы журнала или при отображении для читателя, незнакомого с ними, они могут ввести в заблуждение. Шкалы журналов помещают значения данных в виде выбранного числа (основание журнала) в определенную степень. Базой часто является e (2,71828...) или 10. Например, шкала журнала может давать высоту 1 для значения 10 в данных и высоту 6 для значения 1 000 000 (10) в данных. Логарифмические шкалы и варианты обычно используются, например, для индекса вулканической взрывоопасности, шкалы Рихтера для землетрясений, магнитуды звезд и pH кислотных и щелочных растворов. Даже в этих случаях логарифмический масштаб может сделать данные менее заметными для глаза. Часто причиной использования логарифмических шкал является то, что автор графика желает отобразить эффекты совершенно разных масштабов на одной оси. Без логарифмических шкал сравнение таких величин, как 10 и 10, становится визуально непрактичным. График с логарифмической шкалой, которая не была четко обозначена как таковая, или график с логарифмической шкалой, представленный зрителю, не знающему логарифмических шкал, обычно приводит к представлению, при котором значения данных выглядят одинакового размера, пока факт существования самых разных величин. Неправильное использование логарифмической шкалы может привести к тому, что сильно различающиеся значения (например, 10 и 10 000) будут выглядеть близко друг к другу (в логарифмической шкале с основанием 10 они будут только 1 и 4). Или же небольшие значения могут казаться отрицательными из-за того, как логарифмическая шкала представляет числа, меньшие, чем основание.

Неправильное использование логарифмических шкал может также привести к тому, что отношения между величинами будут казаться линейными, в то время как эти отношения на самом деле являются экспоненциальными или степенными законами, которые очень быстро растут в сторону более высоких значений. Было заявлено, хотя в основном в юмористической форме, что «все выглядит линейно на бревенчатом участке толстым маркером».

Сравнение линейной и логарифмической шкал для идентичных данных
Линейная шкалаЛогарифмическая шкала
Linear scale.png Логарифмическая шкала (2).png

Оба графика показывают идентичную экспоненциальную функцию f (x) = 2. На графике слева используется линейная шкала, четко показывающая экспоненциальный тренд. Однако на графике справа используется логарифмическая шкала, которая образует прямую линию. Если бы наблюдатель графика не знал об этом, график мог бы показывать линейный тренд.

.

Усеченный граф

A усеченный граф (также известный как разорванный граф ) имеет ось y, которая не начинается с 0. Эти графики могут создавать впечатление важных изменений там, где относительно небольшое изменение.

Хотя усеченные графики можно использовать для перерисовки различий или для экономии места, их использование часто не рекомендуется. Коммерческое программное обеспечение, такое как MS Excel, будет по умолчанию обрезать графики, если все значения находятся в узком диапазоне, как в этом примере. Чтобы показать относительные различия значений во времени, можно использовать индексную диаграмму. Усеченные диаграммы всегда будут визуально искажать лежащие в основе числа. Несколько исследований показали, что даже если люди были правильно проинформированы об усечении оси Y, они все равно переоценили фактические различия, часто существенно.

Усеченная гистограмма
Усеченная гистограммаОбычная гистограмма
Усеченная гистограмма.svg Bar graph.svg

Оба этих графика отображают идентичные данные; однако на усеченной гистограмме слева данные, по-видимому, показывают значительные различия, тогда как на обычной гистограмме справа эти различия едва заметны.

EU 3.png

. Существует несколько способов обозначить разрывы оси Y:

Указать разрыв оси Y
Bar graph break.svg Ось Y break.svg

Изменения оси

Изменение максимума оси Y
Исходный графикМеньший максимумБольший максимум
Line graph1.svg Line graph3.svg Line grapdiv class=

Изменение максимума оси Y влияет на вид графика. Более высокий максимум приведет к тому, что график будет иметь меньшую волатильность, меньший рост и менее крутую линию, чем более низкий максимум.

Изменение соотношения размеров графика
Исходный графикПолуширина, удвоенная высотаДвойная ширина, половина высоты
Line graph1.svg Line graph1-3.svg Линейный график1–4. svg

Изменение соотношения размеров графика повлияет на то, как график появляется.

Без шкалы

Масштаб графика часто используется для преувеличения или минимизации различий.

Вводящая в заблуждение гистограмма без шкалы
Меньше разницыБольше разницы
Пример усеченной гистограммы.svg На гистограмме отсутствует zero1.svg

Отсутствие начального значения для оси y не позволяет понять, усечен ли график. Кроме того, отсутствие отметок не позволяет читателю определить, правильно ли масштабированы столбцы графика. Без шкалы можно легко управлять визуальной разницей между полосами.

Вводящий в заблуждение линейный график без шкалы
ВолатильностьУстойчивый, быстрый ростМедленный рост
Без масштабной линии graph1.svg Линия масштаба отсутствует grapdiv class= Без масштабной линии graph3.svg

Хотя все три графика имеют одни и те же данные, и, следовательно, реальный наклон данных (x, y) такой же, способ построения данных может изменить внешний вид угла, образованного линией на графике. Это потому, что каждый график имеет разный масштаб по вертикальной оси. Поскольку масштаб не показан, эти графики могут вводить в заблуждение.

Неправильные интервалы или единицы

Интервалы и единицы, используемые на графике, можно изменять для создания или уменьшения выраженности изменения.

Пропуск данных

Графики, созданные с пропущенными данными, удаляют информацию, на основе которой можно сделать вывод.

Точечная диаграмма с отсутствующими категориями
Точечная диаграмма с отсутствующими категориямиОбычная точечная диаграмма
Точечная диаграмма без категорий.svg Диаграмма рассеяния без пропущенных категорий.svg

На диаграмме рассеяния с отсутствующими категориями слева рост выглядит более линейным с меньшими вариациями.

В финансовых отчетах отрицательная доходность или данные, которые не коррелируют с положительным прогнозом, могут быть исключены, чтобы создать более благоприятное визуальное впечатление.

3D

Использование лишнего Использование третьего измерения, которое не содержит информации, настоятельно не рекомендуется, поскольку оно может запутать читателя.

Сложность

Графики предназначены для упрощения интерпретации статистических данных. Однако графики с чрезмерной сложностью могут запутать данные и затруднить интерпретацию.

Плохое построение

Плохо построенные графики могут затруднить распознавание и интерпретацию данных.

Экстраполяция

В свою очередь, вводящие в заблуждение графики могут использоваться для экстраполяции вводящих в заблуждение тенденций.

Измерение искажений

Было разработано несколько методов чтобы определить, искажены ли графики, и количественно оценить это искажение.

Фактор лжи

Фактор лжи = размер эффекта, показанный в графическом виде, размер эффекта, показанный в данных, {\ displaystyle {\ text {фактор лжи}} = {\ frac {\ text {размер эффекта, показанный в графике}} {\ text {размер эффекта, показанный в данных}}},}{\ text {Коэффициент лжи}} = {\ frac {{\ text {размер эффекта, показанный на графике}}} {{\ text { размер эффекта показан в данных}}}},

где

размер эффекта = | второе значение - первое значение первое значение |. {\ displaystyle {\ text {размер эффекта}} = \ left | {\ frac {{\ text {второе значение}} - {\ text {первое значение}}} {\ text {первое значение}}} \ right |.}{\ text {размер эффекта}} = \ left | {\ frac {{\ text {второе значение}} - {\ text {первое значение}}} {{\ text {первое значение}}}} \ right |.

График с высоким коэффициентом лжи (>1) преувеличивает изменение данных, которые он представляет, а график с небольшим фактором лжи (>0, <1) would obscure change in the data. A perfectly accurate graph would exhibit a lie factor of 1.

Индекс несоответствия графика

Индекс несоответствия графика = 100 (ab - 1), {\ displaystyle {\ text {индекс несоответствия графика}} = 100 \ left ({\ frac {a} {b}} - 1 \ right),}{\ text {graph индекс несоответствия}} = 100 \ left ({\ frac {a} {b}} - 1 \ right),

где

a = процент изменение, изображенное на графике, {\ displaystyle a = {\ text {процентное изменение, изображенное на графике}},}a = {\ text {процентное изменение, отображаемое на графике}},
b = процентное изменение данных. {\ displaystyle b = {\ text {процентное изменение данных}}.}b = {\ text {процентное изменение данных}}.

индекс расхождения графика, также известный как индекс искажения графика (GDI ), был первоначально предложен Полом Джоном Стейнбартом в 1998 году. GDI рассчитывается в процентах от -100% до положительной бесконечности, при этом ноль процентов указывает на то, что график был правильно построен, и все, что выходит за пределы диапазона ± 5%, считается искаженный. Исследование использования GDI в качестве меры искажения графики показало, что оно непоследовательно и непостоянно, что затрудняет использование GDI в качестве меры для сравнения.

Соотношение данных-чернил

соотношение данных-чернил = «Чернила», используемые для отображения общего количества «чернил», используемых для отображения графики {\ displaystyle {\ text {соотношение чернил и данных}} = {\ frac {\ text {«чернила», используемых для отображения данных}} { \ text {общее количество «чернил», использованных для отображения графики}}}}{\ displaystyle {\ text {data- соотношение чернил}} = {\ frac {\ text {«чернила», используемые для отображения данных}} {\ text {общее количество «чернил», используемых для отображения графики}}}}

Соотношение чернил и данных должно быть относительно высоким, в противном случае диаграмма может содержать ненужную графику.

Плотность данных

плотность данных = количество записей в области матрицы данных графического изображения данных {\ displaystyle {\ text {плотность данных}} = {\ frac {\ text {количество записей в матрице данных}} {\ text {область графического изображения данных}}}}{\ text {data density}} = {\ frac {{\ text {количество записей в матрице данных}}} {{\ text {область данных graphic}}}}

Плотность данных должна быть относительно высокой, в противном случае таблица может быть лучше подходит для отображения данных.

Использование в финансовых и корпоративных отчетах

Графики полезны для обобщения и интерпретации финансовые данные. Графики позволяют видеть тенденции в больших наборах данных, а также позволяют интерпретировать данные неспециалистам.

Графики часто используются в корпоративных годовых отчетах как форма управление впечатлениями. В Соединенных Штатах Америки графики не подлежат аудиту, поскольку они подпадают под Раздел 550 AU «Прочая информация в документах, содержащих проверенные финансовые отчеты».

В нескольких опубликованных исследованиях рассматривается использование графиков в корпоративных отчетах для различных корпораций. в разных странах и обнаружили в этих отчетах частое использование неправильной конструкции, избирательности и искажений измерений. Наличие вводящих в заблуждение графиков в годовых отчетах привело к появлению запросов на установление стандартов.

Исследования показали, что, хотя читатели с низким уровнем финансового понимания имеют больше шансов быть дезинформированными вводящими в заблуждение графиками, даже те, кто финансовых специалистов, таких как кредитные специалисты, могут быть введены в заблуждение.

Академия

Восприятие графиков изучается в психофизике, когнитивной психологии и вычислительное видение.

См. Также
Ссылки

Книги

Дополнительная литература
Внешние ссылки
Последняя правка сделана 2021-05-30 14:47:58
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте