Пространственная описательная статистика

редактировать

Пространственная описательная статистика является пересечением пространственная статистика и описательная статистика ; эти методы используются для различных целей в географии, особенно для количественного анализа данных с использованием географических информационных систем (ГИС).

Содержание

1 Типы пространственных данных
2 Измерения центральной пространственной тенденции
3 Меры пространственной дисперсии
4 Меры пространственной однородности
- 4.1 K- и L-функции Рипли
5 См. Также
6 Ссылки

Типы пространственных данных

Простейшие формы пространственных данных представляют собой данные с координатной привязкой, в которых скалярная величина измеряется для каждой точки в регулярной сетке точек, и наборы точек, в которых наблюдается набор координат (например, точек на плоскости). Примером данных с координатной привязкой может быть спутниковое изображение плотности леса, которое было оцифровано на сетке. Примером набора точек могут быть координаты широты и долготы всех вязов на определенном участке земли. Более сложные формы данных включают в себя отмеченные наборы точек и пространственные временные ряды.

Меры пространственной центральной тенденции

Координатным средним для набора точек является центроид, который решает ту же вариационную задачу в плоскость (или евклидово пространство более высокой размерности), которую известное усреднение решает на реальной прямой, то есть центроид имеет наименьшее возможное среднее квадратическое расстояние до всех точек в наборе.

Меры пространственной дисперсии

Дисперсия определяет степень, в которой точки в наборе точек отделены друг от друга. Для большинства приложений пространственная дисперсия должна определяться количественно, инвариантно по отношению к поворотам и отражениям. Несколько простых мер пространственной дисперсии для набора точек можно определить с помощью ковариационной матрицы координат точек. След , детерминант и наибольшее собственное значение ковариационной матрицы могут использоваться в качестве мер пространственной дисперсии.

Мерой пространственной дисперсии, не основанной на ковариационной матрице, является среднее расстояние между ближайшими соседями.

Меры пространственной однородности

Однородный набор точек в Плоскость - это набор, который распределен таким образом, что примерно одинаковое количество точек встречается в любой круговой области данной области. Набор точек, в которых отсутствует однородность, может быть пространственно сгруппирован в определенном пространственном масштабе. Простая вероятностная модель для пространственно однородных точек - это процесс Пуассона на плоскости с постоянной функцией интенсивности.

K- и L-функции Рипли.

K- и L-функции Рипли являются тесно связанными описательными статистическими данными для обнаружения отклонений от пространственной однородности. Функция K (технически ее оценка на основе выборки) определяется как

K ^ (t) = λ - 1 ∑ i ≠ j I (dij < t) n, {\displaystyle {\widehat {K}}(t)=\lambda ^{-1}\sum _{i\neq j}{\frac {I(d_{ij}

{\ widehat {K}} (t) = \ lambda ^ {- 1} \ sum _ {i \ neq j} {\ frac {I (d_ {ij } <t)} {n}},

, где d ij - евклидово расстояние между i и j точек в наборе данных из n точек, t - радиус поиска, λ - средняя плотность точек (обычно оценивается как n / A, где A - площадь области, содержащей все точки), а I - индикаторная функция (1, если ее операнд истинен, 0 в противном случае). В двух измерениях, если точки приблизительно однородны, $K ^ (t) {\ displaystyle {\ widehat {K}} ( t)}$ ${\ displaystyle {\ widehat {K}} ( t)}$ должен быть приблизительно равен πt.

Для анализа данных обычно используется стабилизированная по дисперсии K-функция Рипли, называемая функцией L. Примерная версия функции L определяется как

L ^ (t) = (K ^ (t) π) 1/2. {\ Displaystyle {\ widehat {L}} (t) = \ left ({\ frac {{\ widehat {K}} ( t)} {\ pi}} \ right) ^ {1/2}.}

{\ displaystyle {\ widehat {L}} (t) = \ left ({\ frac {{\ widehat {K}} (t)} {\ pi}} \ right) ^ {1 /2}.}

Для приблизительно однородных данных функция L имеет математическое ожидание t, а ее дисперсия приблизительно равна нт в т. Обычный график представляет собой график зависимости $t - L ^ (t) {\ displaystyle t - {\ widehat {L}} (t)}$ ${\ displaystyle t - {\ widehat {L}} (t)}$ от t, который приблизительно соответствует горизонтальному нулю. ось с постоянной дисперсией, если данные следуют однородному пуассоновскому процессу.

Используя K-функцию Рипли, вы можете определить, имеют ли точки случайный, дисперсный или кластерный характер распределения в определенном масштабе.

См. Также

Геостатистика
Вариограмма
Коррелограмма
Кригинга
Тест Кузика – Эдвардса для кластеризации субпопуляций внутри группированных популяций
Пространственная автокорреляция

Литература

^Кларк, Филип; Эванс, Фрэнсис (1954). «Расстояние до ближайшего соседа как мера пространственных отношений в популяциях». Экология. 35 (4): 445–453. doi : 10.2307 / 1931034. JSTOR 1931034.
^Рипли, Б.Д. (1976). «Анализ второго порядка стационарных точечных процессов». Журнал прикладной теории вероятностей. 13 (2): 255–266. doi : 10.2307 / 3212829. JSTOR 3212829.
^Диксон, Филип М. (2002). «К-функция Рипли» (PDF). В Эль-Шаарави, Абдель Х.; Пигорш, Вальтер В. (ред.). Энциклопедия окружающей среды. Джон Вили и сыновья. С. 1796–1803. ISBN 978-0-471-89997-6. Проверено 25 апреля 2014 г.
^Wilschut, L.I.; Laudisoit, A.; Hughes, N.K.; Addink, E.A.; de Jong, S.M.; Heesterbeek, J.A.P.; Reijniers, J.; Eagle, S.; Дубянский, В.М.; Бегон, М. (2015). «Пространственное распределение носителей чумы: точечный анализ норы большой песчанки в Казахстане». Журнал биогеографии. 42 (7): 1281–1292. doi : 10.1111 / jbi.12534. PMC 4737218. PMID 26877580.