Точечная диаграмма | |
---|---|
Один из Семь основных инструментов качества | |
Впервые описано | Джоном Гершелем |
Цель | Определить тип взаимосвязи (если есть) между двумя количественными переменными |
A диаграмма рассеяния (также называемая диаграммой рассеяния, диаграммой рассеяния, диаграмма рассеивания, диаграмма рассеяния или диаграмма рассеяния ) - это тип графика или математической диаграммы с использованием декартовых координат для отображения значений обычно двух переменных для набора данных. Если точки закодированы (цвет / форма / размер), может отображаться одна дополнительная переменная. Данные отображаются в виде набора точек, каждая из которых имеет значение одной переменной, определяющей положение на горизонтальной оси, и значение другой переменной, определяющей положение на вертикальной оси.
Диаграмма рассеяния может может использоваться либо когда одна непрерывная переменная находится под контролем экспериментатора, а другая зависит от него, либо когда обе непрерывные переменные независимы. Если существует параметр , который систематически увеличивается и / или уменьшается другим, он называется управляющим параметром или независимой переменной и обычно наносится на горизонтальную ось. Измеренная или зависимая переменная обычно откладывается по вертикальной оси. Если зависимой переменной не существует, любой тип переменной может быть нанесен на любую ось, а диаграмма рассеяния будет показывать только степень корреляции (не причинно-следственной связи ) между двумя переменными.
Диаграмма рассеяния может предлагать различные виды корреляций между переменными с определенным доверительным интервалом. Например, вес и рост, вес будут по оси y, а высота по оси x. Корреляции могут быть положительными (рост), отрицательными (падение) или нулевыми (некоррелированными). Если рисунок точек наклоняется от нижнего левого угла к верхнему правому, это указывает на положительную корреляцию между изучаемыми переменными. Если рисунок точек наклоняется из верхнего левого угла в нижний правый, это указывает на отрицательную корреляцию. Линия наилучшего соответствия (также называемая «линией тренда») может быть проведена для изучения взаимосвязи между переменными. Уравнение корреляции между переменными может быть определено с помощью установленных процедур наилучшего соответствия. Для линейной корреляции процедура наилучшего соответствия известна как линейная регрессия и гарантированно генерирует правильное решение за конечное время. Ни одна универсальная процедура наилучшего соответствия не может гарантировать правильное решение для произвольных отношений. Диаграмма рассеяния также очень полезна, когда мы хотим увидеть, как два сопоставимых набора данных согласуются, чтобы показать нелинейные отношения между переменными. Возможность сделать это можно улучшить, добавив плавную линию, например LOESS. Более того, если данные представлены смешанной моделью простых отношений, эти отношения будут визуально очевидны как наложенные шаблоны.
Диаграмма разброса - один из семи основных инструментов контроля качества.
Диаграмма разброса может быть построена в виде пузырька, маркера, или / и линейные диаграммы.
Например, чтобы отобразить связь между объемом легких человека и тем, как долго этот человек может задерживать дыхание, исследователь должен выбрать группу людей, чтобы исследования, затем измерьте емкость легких каждого человека (первая переменная) и то, как долго этот человек может задерживать дыхание (вторая переменная). Затем исследователь нанесет данные на диаграмму рассеяния, назначив «емкость легких» на горизонтальную ось и «время задержки дыхания» на вертикальную ось.
Человек с объемом легких 400 мл, задержавший дыхание на 21,7 секунды, будет представлен одной точкой на диаграмме рассеяния в точке (400, 21,7) в декартовых координатах. Диаграмма разброса всех людей в исследовании позволит исследователю получить визуальное сравнение двух переменных в наборе данных и поможет определить, какие отношения могут быть между двумя переменными.
Для набора переменных данных (измерений) X 1, X 2,..., X k, матрица точечной диаграммы показывает все попарные точечные диаграммы переменных в одном представлении с множеством точечных диаграмм в формате матрицы. Для k переменных матрица диаграммы рассеяния будет содержать k строк и k столбцов. График, расположенный на пересечении i-й строки и j-го столбца, представляет собой график зависимости переменных X i от X j. Это означает, что каждая строка и столбец представляют собой одно измерение, а каждая ячейка представляет собой двухмерную диаграмму рассеяния.
A матрица обобщенной диаграммы разброса предлагает ряд отображаемых парных комбинаций категориальных и количественных переменных. Мозаичный график или фасетная столбчатая диаграмма могут использоваться для отображения двух категориальных переменных. Остальные графики используются для одной категориальной и одной количественной переменных.
Визуализация трехмерных данных вместе с соответствующей матрицей диаграммы рассеянияВикискладе есть материалы, связанные с диаграммами рассеяния. |