Геокодирование

редактировать
Система геопространственных координат для указания точного местоположения геопространственной точки на, ниже или над поверхностью земли в данный момент времени.

Геокодирование - это процесс ввода текста, такого как адрес или название места, и возвращение местоположения широты / долготы на земном поверхность для этого места. Обратное геокодирование, с другой стороны, преобразует географические координаты в описание местоположения, обычно это название места или адресуемого местоположения. Геокодирование основывается на компьютерном представлении адресных точек, улично-дорожной сети, а также почтовых и административных границ.

  • Геокодировать (глагол): указать географические координаты, соответствующие (местоположению).
  • Геокод (существительное): это код, который представляет географический объект (местоположение или объект ).. Иногда этот термин может использоваться в более широком смысле: характеристика района, местности и т. д. в соответствии с такими демографическими характеристиками, как этнический состав или средний доход или образование уровень его обитателей, особенно используемый в маркетинге.
  • Геокодер (существительное): часть программного обеспечения или (веб) сервис, который реализует процесс геокодирования, то есть набор взаимосвязанных компонентов в форме операций, алгоритмы и источники данных, которые работают вместе для создания пространственного представления для описательных привязок местоположения.

Географические координаты, представляющие местоположения, часто сильно различаются по точности позиционирования. Примеры включают построение центроидов, земельных участков центроидов, интерполированных местоположений на основе диапазонов проезжей части, центроидов сегментов улиц, центроидов почтовых индексов (например, Почтовые индексы, CEDEX ) и Административное деление Центроиды.

Содержание

  • 1 История
    • 1.1 1960-е
    • 1.2 1980-е
    • 1.3 1990-е
    • 1.4 2000-е
    • 1.5 2010s
  • 2 Процесс геокодирования
    • 2.1 Входные данные
      • 2.1.1 Классификация входных данных
        • 2.1.1.1 Относительные входные данные
        • 2.1.1.2 Абсолютные входные данные
  • 3 Адресная интерполяция
    • 3.1 Пример
    • 3.2 Усложняющие факторы
  • 4 Другие методы
  • 5 Исследования
  • 6 Использование
  • 7 Проблемы конфиденциальности
  • 8 См. Также
  • 9 Ссылки
  • 10 Внешние ссылки

История

Геокодирование - подмножество Географической информации Система (ГИС) пространственный анализ - вызывает интерес с начала 1960-х годов.

1960-е годы

В 1960 году д-ром Роджером Томлинсоном была изобретена первая действующая ГИС, названная Канадской географической информационной системой (CGIS)., который с тех пор был признан отцом GIS. CGIS использовалась для хранения и анализа данных, собранных для Canada Land Inventory, которая отображала информацию о сельском хозяйстве, дикой природе и лесном хозяйстве в масштабе 1: 50 000, чтобы регулировать площадь земель для сельских районов Канады. Однако CGIS просуществовала до 1990-х годов и никогда не была коммерчески доступной.

1 июля 1963 года пятизначные почтовые индексы были введены по всей стране почтовым отделением США (USPOD). В 1983 году девятизначные коды ZIP + 4 стали дополнительным идентификатором для более точного определения местоположения адресов.

В 1964 году Гарвардская лаборатория компьютерной графики и пространственного анализа разработала новаторский программный код - например, GRID и SYMAP - все они были источниками для коммерческого развития ГИС.

В 1967 году группа из Бюро переписи населения, в которую входили математик Джеймс Корбетт и Дональд Кук, изобрела двойное независимое кодирование карты (DIME) - первую современную модель векторного отображения, которая зашифровала адрес диапазонов в файлы уличных сетей и включает алгоритм геокодирования "процент вдоль". По-прежнему используется такими платформами, как Google Maps и MapQuest, алгоритм "процент вдоль" обозначает, где сопоставленный адрес расположен вдоль эталонного объекта, в виде процента от общей длины эталонного объекта.. DIME был предназначен для использования Бюро переписи населения США, и он включал точное отображение граней кварталов, оцифровку узлов, представляющих перекрестки улиц, и формирование пространственных отношений. Нью-Хейвен, штат Коннектикут, был первым городом на Земле с геокодируемой сетевой базой данных улиц.

1980-е годы

В конце 1970-х годов разрабатывались две основные общедоступные платформы геокодирования: GRASS GIS и MOSS. В начале 1980-х годов появилось гораздо больше коммерческих поставщиков программного обеспечения для геокодирования, а именно Intergraph, ESRI, CARIS, ERDAS и Корпорация MapInfo. Эти платформы объединили подход 1960-х годов к разделению пространственной информации с подходом организации этой пространственной информации в структуры базы данных.

В 1986 году система отображения и анализа карт (MIDAS) стала первой настольной программой геокодирования, разработанной для операционной системы DOS. Геокодирование вышло из исследовательского отдела в деловой мир с приобретением MIDAS компанией MapInfo. С тех пор MapInfo была приобретена Pitney Bowes и стала пионером в объединении геокодирования с бизнес-аналитикой; позволяя анализу местоположения предоставлять решения для государственного и частного секторов.

1990-е

В конце 20-го века геокодирование стало более ориентированным на пользователя, особенно с помощью открытых исходное программное обеспечение ГИС. Картографические приложения и геопространственные данные стали более доступными через Интернет.

Поскольку метод отправки по почте / обратной связи был настолько успешным во время переписи 1980 года, Бюро переписи США смогло собрать большую геопространственную базу данных, используя интерполированные геокодирование улиц. Эта база данных - наряду с общенациональным охватом домашних хозяйств переписью - позволила рождение TIGER (Топологически интегрированное географическое кодирование и привязка ).

Содержащий диапазоны адресов вместо отдельных адресов, TIGER с тех пор был реализован почти на всех платформах программного обеспечения геокодирования, используемых сегодня. К концу переписи 1990 года, TIGER "содержал координату широта / долгота для более чем 30 миллионов пересечений и конечных точек объектов и почти 145 миллионов точек" формы "объектов, которые определяли более 42 миллионов сегментов объектов, которые очерчивают более 12 миллионов полигонов ».

TIGER стал прорывом для геопространственных решений« больших данных ».

2000-е годы

В начале 2000-х годов произошел рост стандартизации адресов системы поддержки точности кодирования (CASS). Сертификация CASS предлагается всем программным продуктам продавцам и рекламным рассылкам, которые хотят, чтобы Почтовая служба США (USPS) оценила качество их программного обеспечения для стандартизации адресов. Ежегодно обновляемая сертификация CASS основана на кодах точки доставки, почтовых индексах и почтовых индексах + 4. Внедрение сертифицированного CASS программного обеспечения поставщиками программного обеспечения позволяет им получать скидки на массовую рассылку и на транспортные расходы. Они могут извлечь выгоду из повышенной точности и эффективности этих массовых рассылок после наличия сертифицированной базы данных. В начале 2000-х годов платформы геокодирования также могли поддерживать несколько наборов данных.

В 2003 году платформы геокодирования были способны объединять почтовые индексы с данными улиц, обновляемыми ежемесячно. Этот процесс получил название «слияние».

Начиная с 2005 года платформы геокодирования включали геокодирование на основе центроидов участков. Геокодирование на основе центроидов участков позволило обеспечить высокую точность геокодирования адреса. Например, центроид участка позволяет геокодеру определять центроид определенного здания или участка земли. Платформы теперь также могут определять высоту отдельных участков .

. В 2005 году также был введен номер участка эксперта (APN). налоговый инспектор юрисдикции смог присвоить этот номер участкам недвижимости. Это позволило правильно идентифицировать и вести учет. APN важен для геокодирования территории, на которую распространяется аренда газа или нефти, а также для индексации информации о налоге на имущество, предоставляемой общественности.

В 2006 году для платформ геокодирования были введены обратное геокодирование и обратный поиск APN. Это включало геокодирование местоположения числовой точки - с долготой и широтой - на текстовый, читаемый адрес.

В 2008 и 2009 годах наблюдался рост интерактивных, ориентированных на пользователя платформ геокодирования, а именно MapQuest, Google Maps, Bing Maps и Global Positioning Systems (GPS). Эти платформы стали еще более доступными для общественности с одновременным ростом мобильной индустрии, в частности смартфонов.

2010-е

В 2010-х поставщики полностью поддерживают геокодирование и обратное геокодирование во всем мире. Интерфейс прикладного программирования (API) облачного геокодирования и локальное геокодирование позволили повысить коэффициент соответствия, точность и скорость. Сейчас популярна идея о том, что геокодирование может влиять на бизнес-решения. Это интеграция между процессом геокодирования и бизнес-аналитикой.

Будущее геокодирования также включает в себя трехмерное геокодирование, внутреннее геокодирование и многоязычные возвраты для платформ геокодирования.

Процесс геокодирования

Геокодирование - это задача, которая включает в себя несколько наборов данных и процессов, которые работают вместе. Геокодер состоит из двух важных компонентов: набора базовых данных и алгоритма геокодирования. Каждый из этих компонентов состоит из подопераций и подкомпонентов. Без понимания того, как работают эти процессы геокодирования, трудно принимать обоснованные бизнес-решения на основе геокодирования.

Входные данные

Входные данные - это описательная текстовая информация (адрес или название здания), которую пользователь хочет преобразовать в числовые пространственные данные (широта и долгота) - в процессе геокодирования.

Классификация входных данных

Входные данные подразделяются на две категории: относительные входные данные и абсолютные входные данные.

Относительные входные данные

Относительные входные данные - это текстовые описания местоположения, которые сами по себе не могут вывести пространственное представление этого местоположения. Такие данные выводят относительный геокод, который зависит от других базовых местоположений и географически относительно них. Примером относительного геокода является интерполяция адреса с использованием площадных единиц или линейных векторов. «Через дорогу от Эмпайр-стейт-билдинг» - пример относительных входных данных. Искомое местоположение не может быть определено без идентификации Эмпайр-стейт-билдинг. Платформы геокодирования часто не поддерживают такие относительные местоположения, но в этом направлении есть успехи.

Абсолютные входные данные

Абсолютные входные данные - это текстовые описания местоположения, которые сами по себе могут выводить пространственное представление этого местоположения. Этот тип данных выводит абсолютное известное местоположение независимо от других местоположений. Например, почтовые индексы USPS; Почтовый индекс USPS + 4 кода; полные и частичные почтовые адреса; Почтовые ящики USPS; сельские маршруты; города; округа; перекрестки; и именованные места могут быть абсолютно указаны в источнике данных.

Когда способы представления адресов сильно различаются - например, слишком много входных данных или слишком мало входных данных - геокодеры используют нормализацию адресов и стандартизацию адресов для решения этой проблемы.

Интерполяция адреса

Простым методом геокодирования является интерполяция адреса . В этом методе используются данные из географической информационной системы улицы, в которой уличная сеть уже нанесена на карту в пространстве географических координат. Каждому сегменту улицы присваивается диапазон адресов (например, номера домов от одного сегмента до другого). Геокодирование берет адрес, сопоставляет его с улицей и определенным сегментом (например, блок в городах, которые используют соглашение о «блоке»). Затем геокодирование интерполирует положение адреса в пределах диапазона сегмента.

Пример

Возьмем для примера: 742 Evergreen Terrace

Предположим, что этот сегмент (например, квартал) Evergreen Terrace проходит от 700 до 799. Четные номера адреса расположены на восточной стороне Evergreen Terrace, а адреса с нечетными номерами - на западной стороне улицы. 742 Evergreen Terrace (вероятно) будет расположен чуть менее чем на полпути вверх по кварталу, на восточной стороне улицы. В этом месте вдоль улицы будет нанесена точка, возможно, смещенная на расстояние к востоку от центральной линии улицы.

Усложняющие факторы

Однако этот процесс не всегда так прост, как в этом примере. Трудности возникают при

  • различении неоднозначных адресов, таких как 742 Evergreen Terrace и 742 W Evergreen Terrace.
  • попытка геокодирования новых адресов для улицы, которая еще не добавлена ​​в базу данных географической информационной системы.

Хотя в Спрингфилде может быть 742 Evergreen Terrace, в Шелбивилле может быть и 742 Evergreen Terrace. Эту проблему можно решить, спросив название города (а также штата, провинции, страны и т. Д.). Бостон, Массачусетс имеет несколько местоположений «100 Вашингтон-стрит», потому что несколько городов были присоединены без изменения названий улиц, что требует использования уникальных почтовых индексов или названий районов. для устранения неоднозначности. Точность геокодирования можно значительно повысить, сначала применив передовые методы проверки адреса. Проверка адреса подтвердит существование адреса и устранит двусмысленность. Как только действительный адрес определен, очень легко выполнить геокодирование и определить координаты широты и долготы. Наконец, несколько предостережений при использовании интерполяции:

  • Типичная атрибуция участка улицы предполагает, что все участки с четными номерами находятся на одной стороне сегмента, а все участки с нечетными номерами - на другой. В реальной жизни это часто не так.
  • Интерполяция предполагает, что данные участки равномерно распределены по длине сегмента. В реальной жизни это почти никогда не бывает; нередко геокодированный адрес отклоняется на несколько тысяч футов.
  • Интерполяция также предполагает, что улица прямая. Если улица изогнута, то геокодированное местоположение не обязательно соответствует физическому местоположению адреса.
  • Информация о сегменте (особенно из таких источников, как TIGER ) включает максимальную верхнюю границу адресов и интерполируется, как если бы использовался полный диапазон адресов. Например, для сегмента (блока) может быть указан диапазон 100–199, но последний адрес в конце блока - 110. В этом случае адрес 110 будет геокодирован на 10% расстояния вниз по сегменту, а не чем ближе к концу.
  • Большинство реализаций интерполяции создают точку в качестве их результирующего адреса. На самом деле физический адрес распределен по длине сегмента, т.е. рассмотрите возможность геокодирования адреса торгового центра - физический лот может проходить на некотором расстоянии вдоль сегмента улицы (или его можно рассматривать как двумерный многоугольник, заполняющий пространство, который может выходить на несколько разных улиц - или, что еще хуже, для городов с многоуровневыми улицами, трехмерная форма, которая встречается с разными улицами на нескольких разных уровнях), но интерполяция рассматривает его как сингулярность. 229>Очень распространенная ошибка - верить рейтингам точности геокодируемых атрибутов данной карты. Такая точность, указанная поставщиками, не влияет на присвоение адреса правильному сегменту или правильной стороне сегмента, а также не приводит к точному положению в этом правильном сегменте. При использовании процесса геокодирования для США Перепись наборов данных TIGER, 5–7,5% адресов могут быть назначены другому переписному участку, в то время как исследование австралийской системы, подобной TIGER, показало, что 50% геокодированных точек были сопоставлены с неправильный земельный участок. Точность геокодированных данных также может иметь отношение к качеству исследования, в котором эти данные используются. Одно исследование, проведенное группой исследователей из Айовы, показало, что общий метод геокодирования с использованием наборов данных TIGER, как описано выше, может привести к потере до 40% мощности статистического анализа. Альтернативой является использование ортофото или данных с кодировкой изображений, таких как данные Address Point из Ordnance Survey в Великобритании, но такие наборы данных обычно дороги.

    Из-за этого очень важно избегать использования интерполированных результатов, за исключением некритических приложений. Интерполированное геокодирование обычно не подходит для принятия авторитетных решений, например, если это решение повлияет на безопасность жизни. Например, аварийные службы не принимают авторитетных решений на основе своих интерполяций; скорая помощь или пожарная машина всегда будет отправлена ​​независимо от того, что написано на карте.

    Другие методы

    В сельской местности или других местах, где отсутствуют высококачественные данные уличной сети и адресация, GPS полезен для отображения местоположения. Для дорожно-транспортных происшествий подходящим методом является геокодирование до перекрестка улиц или средней точки вдоль центральной линии улицы. На большинстве автомагистралей в развитых странах есть мили-маркеры для помощи при аварийном реагировании, техническом обслуживании и навигации. Также возможно использовать комбинацию этих методов геокодирования - используя конкретный метод для определенных случаев и ситуаций и другие методы для других случаев. В отличие от геокодирования записей структурированного почтового адреса, разрешение топонима сопоставляет названия мест в коллекциях неструктурированных документов с их соответствующими пространственными следами.

    Коды мест предлагают новый способ создания адресов, сгенерированных в цифровом виде, при отсутствии информации с использованием спутниковых изображений и машинного обучения, например, Робокоды

    Исследования

    Исследования представили новый подход к аспектам управления и знаний при геокодировании, используя парадигму на основе агентов. В дополнение к новой парадигме геокодирования были разработаны дополнительные методы коррекции и алгоритмы управления. Подход представляет собой географические элементы, которые обычно встречаются в адресах как отдельных агентов. Это обеспечивает общность и двойственность управления и географического представления. Помимо научных публикаций, новый подход и последующий прототип получили освещение в национальных СМИ Австралии. Исследование было проведено в Университете Кертина в Перте, Западная Австралия.

    Использование

    Геокодированные местоположения полезны во многих ГИС-анализах, картографии, рабочих процессах принятия решений, смешивании транзакций или внедрении в более крупные деловые процессы. В Интернете геокодирование используется в таких сервисах, как маршрутизация и локальный поиск. Геокодирование вместе с GPS предоставляет данные о местоположении для медиафайлов с геотегами, таких как фотографии или элементы RSS.

    Проблемы конфиденциальности

    Распространение и простота доступа к службам геокодирования (и обратного геокодирования ) вызывает проблемы конфиденциальности. Например, при составлении карты преступлений правоохранительные органы стремятся уравновесить права потерпевших и правонарушителей на неприкосновенность частной жизни с правом общественности на получение информации. Правоохранительные органы экспериментировали с альтернативными методами геокодирования, которые позволяют им замаскировать часть деталей местоположения (например, особенности адреса, которые могут привести к идентификации жертвы или преступника). Кроме того, предоставляя общественности онлайн картирование преступлений, они также помещают отказ от ответственности в отношении точности местоположения точек на карте, признавая эти методы маскировки местоположения, и налагают условия использования информации.

    См. Также

    Ссылки

    Внешние ссылки

    .

Последняя правка сделана 2021-05-21 03:20:43
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте