Геокодирование - это процесс ввода текста, такого как адрес или название места, и возвращение местоположения широты / долготы на земном поверхность для этого места. Обратное геокодирование, с другой стороны, преобразует географические координаты в описание местоположения, обычно это название места или адресуемого местоположения. Геокодирование основывается на компьютерном представлении адресных точек, улично-дорожной сети, а также почтовых и административных границ.
Географические координаты, представляющие местоположения, часто сильно различаются по точности позиционирования. Примеры включают построение центроидов, земельных участков центроидов, интерполированных местоположений на основе диапазонов проезжей части, центроидов сегментов улиц, центроидов почтовых индексов (например, Почтовые индексы, CEDEX ) и Административное деление Центроиды.
Геокодирование - подмножество Географической информации Система (ГИС) пространственный анализ - вызывает интерес с начала 1960-х годов.
В 1960 году д-ром Роджером Томлинсоном была изобретена первая действующая ГИС, названная Канадской географической информационной системой (CGIS)., который с тех пор был признан отцом GIS. CGIS использовалась для хранения и анализа данных, собранных для Canada Land Inventory, которая отображала информацию о сельском хозяйстве, дикой природе и лесном хозяйстве в масштабе 1: 50 000, чтобы регулировать площадь земель для сельских районов Канады. Однако CGIS просуществовала до 1990-х годов и никогда не была коммерчески доступной.
1 июля 1963 года пятизначные почтовые индексы были введены по всей стране почтовым отделением США (USPOD). В 1983 году девятизначные коды ZIP + 4 стали дополнительным идентификатором для более точного определения местоположения адресов.
В 1964 году Гарвардская лаборатория компьютерной графики и пространственного анализа разработала новаторский программный код - например, GRID и SYMAP - все они были источниками для коммерческого развития ГИС.
В 1967 году группа из Бюро переписи населения, в которую входили математик Джеймс Корбетт и Дональд Кук, изобрела двойное независимое кодирование карты (DIME) - первую современную модель векторного отображения, которая зашифровала адрес диапазонов в файлы уличных сетей и включает алгоритм геокодирования "процент вдоль". По-прежнему используется такими платформами, как Google Maps и MapQuest, алгоритм "процент вдоль" обозначает, где сопоставленный адрес расположен вдоль эталонного объекта, в виде процента от общей длины эталонного объекта.. DIME был предназначен для использования Бюро переписи населения США, и он включал точное отображение граней кварталов, оцифровку узлов, представляющих перекрестки улиц, и формирование пространственных отношений. Нью-Хейвен, штат Коннектикут, был первым городом на Земле с геокодируемой сетевой базой данных улиц.
В конце 1970-х годов разрабатывались две основные общедоступные платформы геокодирования: GRASS GIS и MOSS. В начале 1980-х годов появилось гораздо больше коммерческих поставщиков программного обеспечения для геокодирования, а именно Intergraph, ESRI, CARIS, ERDAS и Корпорация MapInfo. Эти платформы объединили подход 1960-х годов к разделению пространственной информации с подходом организации этой пространственной информации в структуры базы данных.
В 1986 году система отображения и анализа карт (MIDAS) стала первой настольной программой геокодирования, разработанной для операционной системы DOS. Геокодирование вышло из исследовательского отдела в деловой мир с приобретением MIDAS компанией MapInfo. С тех пор MapInfo была приобретена Pitney Bowes и стала пионером в объединении геокодирования с бизнес-аналитикой; позволяя анализу местоположения предоставлять решения для государственного и частного секторов.
В конце 20-го века геокодирование стало более ориентированным на пользователя, особенно с помощью открытых исходное программное обеспечение ГИС. Картографические приложения и геопространственные данные стали более доступными через Интернет.
Поскольку метод отправки по почте / обратной связи был настолько успешным во время переписи 1980 года, Бюро переписи США смогло собрать большую геопространственную базу данных, используя интерполированные геокодирование улиц. Эта база данных - наряду с общенациональным охватом домашних хозяйств переписью - позволила рождение TIGER (Топологически интегрированное географическое кодирование и привязка ).
Содержащий диапазоны адресов вместо отдельных адресов, TIGER с тех пор был реализован почти на всех платформах программного обеспечения геокодирования, используемых сегодня. К концу переписи 1990 года, TIGER "содержал координату широта / долгота для более чем 30 миллионов пересечений и конечных точек объектов и почти 145 миллионов точек" формы "объектов, которые определяли более 42 миллионов сегментов объектов, которые очерчивают более 12 миллионов полигонов ».
TIGER стал прорывом для геопространственных решений« больших данных ».
В начале 2000-х годов произошел рост стандартизации адресов системы поддержки точности кодирования (CASS). Сертификация CASS предлагается всем программным продуктам продавцам и рекламным рассылкам, которые хотят, чтобы Почтовая служба США (USPS) оценила качество их программного обеспечения для стандартизации адресов. Ежегодно обновляемая сертификация CASS основана на кодах точки доставки, почтовых индексах и почтовых индексах + 4. Внедрение сертифицированного CASS программного обеспечения поставщиками программного обеспечения позволяет им получать скидки на массовую рассылку и на транспортные расходы. Они могут извлечь выгоду из повышенной точности и эффективности этих массовых рассылок после наличия сертифицированной базы данных. В начале 2000-х годов платформы геокодирования также могли поддерживать несколько наборов данных.
В 2003 году платформы геокодирования были способны объединять почтовые индексы с данными улиц, обновляемыми ежемесячно. Этот процесс получил название «слияние».
Начиная с 2005 года платформы геокодирования включали геокодирование на основе центроидов участков. Геокодирование на основе центроидов участков позволило обеспечить высокую точность геокодирования адреса. Например, центроид участка позволяет геокодеру определять центроид определенного здания или участка земли. Платформы теперь также могут определять высоту отдельных участков .
. В 2005 году также был введен номер участка эксперта (APN). налоговый инспектор юрисдикции смог присвоить этот номер участкам недвижимости. Это позволило правильно идентифицировать и вести учет. APN важен для геокодирования территории, на которую распространяется аренда газа или нефти, а также для индексации информации о налоге на имущество, предоставляемой общественности.
В 2006 году для платформ геокодирования были введены обратное геокодирование и обратный поиск APN. Это включало геокодирование местоположения числовой точки - с долготой и широтой - на текстовый, читаемый адрес.
В 2008 и 2009 годах наблюдался рост интерактивных, ориентированных на пользователя платформ геокодирования, а именно MapQuest, Google Maps, Bing Maps и Global Positioning Systems (GPS). Эти платформы стали еще более доступными для общественности с одновременным ростом мобильной индустрии, в частности смартфонов.
В 2010-х поставщики полностью поддерживают геокодирование и обратное геокодирование во всем мире. Интерфейс прикладного программирования (API) облачного геокодирования и локальное геокодирование позволили повысить коэффициент соответствия, точность и скорость. Сейчас популярна идея о том, что геокодирование может влиять на бизнес-решения. Это интеграция между процессом геокодирования и бизнес-аналитикой.
Будущее геокодирования также включает в себя трехмерное геокодирование, внутреннее геокодирование и многоязычные возвраты для платформ геокодирования.
Геокодирование - это задача, которая включает в себя несколько наборов данных и процессов, которые работают вместе. Геокодер состоит из двух важных компонентов: набора базовых данных и алгоритма геокодирования. Каждый из этих компонентов состоит из подопераций и подкомпонентов. Без понимания того, как работают эти процессы геокодирования, трудно принимать обоснованные бизнес-решения на основе геокодирования.
Входные данные - это описательная текстовая информация (адрес или название здания), которую пользователь хочет преобразовать в числовые пространственные данные (широта и долгота) - в процессе геокодирования.
Входные данные подразделяются на две категории: относительные входные данные и абсолютные входные данные.
Относительные входные данные - это текстовые описания местоположения, которые сами по себе не могут вывести пространственное представление этого местоположения. Такие данные выводят относительный геокод, который зависит от других базовых местоположений и географически относительно них. Примером относительного геокода является интерполяция адреса с использованием площадных единиц или линейных векторов. «Через дорогу от Эмпайр-стейт-билдинг» - пример относительных входных данных. Искомое местоположение не может быть определено без идентификации Эмпайр-стейт-билдинг. Платформы геокодирования часто не поддерживают такие относительные местоположения, но в этом направлении есть успехи.
Абсолютные входные данные - это текстовые описания местоположения, которые сами по себе могут выводить пространственное представление этого местоположения. Этот тип данных выводит абсолютное известное местоположение независимо от других местоположений. Например, почтовые индексы USPS; Почтовый индекс USPS + 4 кода; полные и частичные почтовые адреса; Почтовые ящики USPS; сельские маршруты; города; округа; перекрестки; и именованные места могут быть абсолютно указаны в источнике данных.
Когда способы представления адресов сильно различаются - например, слишком много входных данных или слишком мало входных данных - геокодеры используют нормализацию адресов и стандартизацию адресов для решения этой проблемы.
Простым методом геокодирования является интерполяция адреса . В этом методе используются данные из географической информационной системы улицы, в которой уличная сеть уже нанесена на карту в пространстве географических координат. Каждому сегменту улицы присваивается диапазон адресов (например, номера домов от одного сегмента до другого). Геокодирование берет адрес, сопоставляет его с улицей и определенным сегментом (например, блок в городах, которые используют соглашение о «блоке»). Затем геокодирование интерполирует положение адреса в пределах диапазона сегмента.
Возьмем для примера: 742 Evergreen Terrace
Предположим, что этот сегмент (например, квартал) Evergreen Terrace проходит от 700 до 799. Четные номера адреса расположены на восточной стороне Evergreen Terrace, а адреса с нечетными номерами - на западной стороне улицы. 742 Evergreen Terrace (вероятно) будет расположен чуть менее чем на полпути вверх по кварталу, на восточной стороне улицы. В этом месте вдоль улицы будет нанесена точка, возможно, смещенная на расстояние к востоку от центральной линии улицы.
Однако этот процесс не всегда так прост, как в этом примере. Трудности возникают при
Хотя в Спрингфилде может быть 742 Evergreen Terrace, в Шелбивилле может быть и 742 Evergreen Terrace. Эту проблему можно решить, спросив название города (а также штата, провинции, страны и т. Д.). Бостон, Массачусетс имеет несколько местоположений «100 Вашингтон-стрит», потому что несколько городов были присоединены без изменения названий улиц, что требует использования уникальных почтовых индексов или названий районов. для устранения неоднозначности. Точность геокодирования можно значительно повысить, сначала применив передовые методы проверки адреса. Проверка адреса подтвердит существование адреса и устранит двусмысленность. Как только действительный адрес определен, очень легко выполнить геокодирование и определить координаты широты и долготы. Наконец, несколько предостережений при использовании интерполяции:
Из-за этого очень важно избегать использования интерполированных результатов, за исключением некритических приложений. Интерполированное геокодирование обычно не подходит для принятия авторитетных решений, например, если это решение повлияет на безопасность жизни. Например, аварийные службы не принимают авторитетных решений на основе своих интерполяций; скорая помощь или пожарная машина всегда будет отправлена независимо от того, что написано на карте.
В сельской местности или других местах, где отсутствуют высококачественные данные уличной сети и адресация, GPS полезен для отображения местоположения. Для дорожно-транспортных происшествий подходящим методом является геокодирование до перекрестка улиц или средней точки вдоль центральной линии улицы. На большинстве автомагистралей в развитых странах есть мили-маркеры для помощи при аварийном реагировании, техническом обслуживании и навигации. Также возможно использовать комбинацию этих методов геокодирования - используя конкретный метод для определенных случаев и ситуаций и другие методы для других случаев. В отличие от геокодирования записей структурированного почтового адреса, разрешение топонима сопоставляет названия мест в коллекциях неструктурированных документов с их соответствующими пространственными следами.
Коды мест предлагают новый способ создания адресов, сгенерированных в цифровом виде, при отсутствии информации с использованием спутниковых изображений и машинного обучения, например, Робокоды
Исследования представили новый подход к аспектам управления и знаний при геокодировании, используя парадигму на основе агентов. В дополнение к новой парадигме геокодирования были разработаны дополнительные методы коррекции и алгоритмы управления. Подход представляет собой географические элементы, которые обычно встречаются в адресах как отдельных агентов. Это обеспечивает общность и двойственность управления и географического представления. Помимо научных публикаций, новый подход и последующий прототип получили освещение в национальных СМИ Австралии. Исследование было проведено в Университете Кертина в Перте, Западная Австралия.
Геокодированные местоположения полезны во многих ГИС-анализах, картографии, рабочих процессах принятия решений, смешивании транзакций или внедрении в более крупные деловые процессы. В Интернете геокодирование используется в таких сервисах, как маршрутизация и локальный поиск. Геокодирование вместе с GPS предоставляет данные о местоположении для медиафайлов с геотегами, таких как фотографии или элементы RSS.
Распространение и простота доступа к службам геокодирования (и обратного геокодирования ) вызывает проблемы конфиденциальности. Например, при составлении карты преступлений правоохранительные органы стремятся уравновесить права потерпевших и правонарушителей на неприкосновенность частной жизни с правом общественности на получение информации. Правоохранительные органы экспериментировали с альтернативными методами геокодирования, которые позволяют им замаскировать часть деталей местоположения (например, особенности адреса, которые могут привести к идентификации жертвы или преступника). Кроме того, предоставляя общественности онлайн картирование преступлений, они также помещают отказ от ответственности в отношении точности местоположения точек на карте, признавая эти методы маскировки местоположения, и налагают условия использования информации.
.