Дистанционная выборка - это широко используемая группа тесно связанных методов для оценки плотности и / или численность из популяций. Основные методы основаны на разрезах линии или точечных разрезов. В этом методе выборки собираемые данные представляют собой расстояния до исследуемых объектов от этих случайно расположенных линий или точек, и цель состоит в том, чтобы оценить среднюю плотность объектов в пределах региона.
Обычным подходом к дистанционному отбору образцов является использование линейных разрезов. Наблюдатель пересекает прямую линию (размещенную случайным образом или следуя некоторому запланированному распределению). Каждый раз, когда они наблюдают за интересующим объектом (например, за животным того типа, в котором ведется наблюдение), они записывают расстояние от их текущего положения до объекта (r), а также угол обнаружения до линии разреза (θ). Затем расстояние от объекта до трансекты можно рассчитать как x = r * sin (θ). Эти расстояния x представляют собой расстояния обнаружения, которые будут проанализированы при дальнейшем моделировании.
Объекты обнаруживаются на заранее определенной максимальной дальности обнаружения w. Не все объекты в пределах w будут обнаружены, но фундаментальное предположение состоит в том, что обнаруживаются все объекты на нулевом расстоянии (то есть на самой линии). Таким образом, ожидается, что общая вероятность обнаружения на линии будет равна 1 и будет уменьшаться с увеличением расстояния от линии. Распределение наблюдаемых расстояний используется для оценки «функции обнаружения», которая описывает вероятность обнаружения объекта на заданном расстоянии. Учитывая, что выполняются различные основные предположения, эта функция позволяет оценить среднюю вероятность P обнаружения объекта, находящегося в пределах ширины w линии. Затем плотность объектов можно оценить как D = n / (P * a), где n - количество обнаруженных объектов, а a - размер покрываемой области (общая длина разреза (L), умноженная на 2w).
Таким образом, моделирование того, как обнаруживаемость падает с увеличением расстояния от разреза, позволяет оценить, сколько всего объектов находится в интересующей области, на основе количества, которое действительно наблюдали.
Методология обследования на точечных трансектах немного отличается. В этом случае наблюдатель остается неподвижным, съемка заканчивается не по достижении конца разреза, а по прошествии заранее определенного времени, и измеренные расстояния до наблюдателя используются напрямую без преобразования в поперечные расстояния. Типы функций обнаружения и их настройка также в некоторой степени различаются.
Падение обнаруживаемости с увеличением расстояния от линии разреза моделируется с помощью функции обнаружения g (y) (здесь y - расстояние от линии). Эта функция приспособлена к распределению дальностей обнаружения, представленному как функция плотности вероятности (PDF). PDF представляет собой гистограмму собранных расстояний и описывает вероятность того, что объект на расстоянии y будет обнаружен наблюдателем на центральной линии, причем обнаружение на самой линии (y = 0) предполагается достоверным. (Р = 1).
Предпочтительно, g (y) - это надежная функция, которая может представлять данные с нечеткими или слабо определенными характеристиками распределения, как это часто бывает в полевых данных. Обычно используются несколько типов функций, в зависимости от общей формы PDF-файла данных обнаружения:
Функция обнаружения | Форма |
---|---|
Равномерная | 1 / w |
Полунормальная | exp (-y / 2σ) |
Уровень опасности | 1-exp (- (y / σ)) |
Отрицательная экспонента | exp (-ay) |
Здесь w - общее усечение обнаружения расстояние и a, b и σ - параметры, зависящие от функции. Полунормальные функции и функции степени опасности обычно считаются наиболее вероятными для представления полевых данных, собранных в хорошо контролируемых условиях. Вероятность обнаружения увеличивается или остается постоянной по мере удаления от линии разреза, что может указывать на проблемы со сбором данных или планом съемки.
Часто используемый метод для Улучшение соответствия функции обнаружения данным заключается в использовании расширений в ряд. Здесь функция разделена на «ключевую» часть (описанного выше типа) и «серийную» часть; т.е. g (y) = key (y) [1 + series (y)]. Ряд обычно принимает форму полинома (например, полинома Эрмита ) и предназначен для добавления гибкости в форму ключевой функции, позволяя ей более точно соответствовать данным. PDF. Хотя это может улучшить точность оценок плотности / численности, его использование оправдано только в том случае, если набор данных имеет достаточный размер и качество для представления надежной оценки распределения расстояний обнаружения. В противном случае существует риск переобучения данных и допуска нерепрезентативных характеристик набора данных для искажения процесса подбора.
Поскольку расстояние выборка - сравнительно сложный метод исследования, надежность результатов модели зависит от выполнения ряда основных предположений. Наиболее фундаментальные из них перечислены ниже. Данные, полученные в результате опросов, которые нарушают одно или несколько из этих предположений, могут часто, но не всегда, корректироваться до некоторой степени до или во время анализа.
Допущение | Нарушение | Профилактика / апостериорная коррекция | Пример данных |
---|---|---|---|
Обнаружены все животные на самой линии разреза (т. Е. P (0) = 1) | Часто это может быть предполагается при наземных съемках, но может быть проблематичным при съемках с корабля. Нарушение может привести к сильному смещению оценок модели | При съемках с двумя наблюдателями одному наблюдателю может быть поручено «охранять центральную линию». Постфактум иногда возможны, но могут быть сложными. Таким образом, стоит избегать любых нарушений этого предположения | |
Животные распределены случайным образом и равномерно по исследуемой территории | Основными источниками систематической ошибки являются а) сгруппированные популяции (стаи и т. д.), но отдельные обнаружения рассматриваются как независимые b) трансекты не размещаются независимо от градиентов плотности (дороги, водотоки и т. д.) c) трансекты являются слишком близко друг к другу | a) записывать не отдельные лица, а кластеры + размер кластера, затем включать оценку размера кластера в функцию обнаружения b) размещать трансекты либо случайным образом, либо через известные градиенты плотности c) убедитесь, что максимальная дальность обнаружения (w) не перекрывается между трансектами | |
Животные не двигаются до обнаружения | Результирующая систематическая ошибка незначительна, если движение является случайным. Движение в ответ на наблюдателя (избегание / привлечение) вызовет отрицательное / положительное смещение в обнаруживаемости. | Уклонение является обычным явлением, и его может быть трудно предотвратить в полевых условиях. Эффективным апостериорным средством является усреднение данных путем разделения обнаружений на интервалы и использования функций обнаружения с плечом (например, степень опасности) | Указание поведения избегания в данных - обнаружения сначала скорее увеличиваются. чем уменьшение с увеличением расстояния до линии разреза |
Измерения (углы и расстояния) точны | Случайные ошибки незначительны, но систематические ошибки могут вносить систематические ошибки. Это часто происходит с округлением углов или расстояний до предпочтительных («круглых») значений, что приводит к набору определенных значений. Округление углов до нуля является особенно распространенным. | Избегайте точного счисления в полевых условиях, используя дальномеры и угловые доски. Апостериорное сглаживание данных путем разделения на интервалы обнаружения эффективно при устранении незначительных смещений | Индикация округления угла до нуля в данных - обнаружений больше, чем ожидалось, в самом первом интервале данных |