Daitch – Mokotoff Soundex

редактировать

Daitch – Mokotoff Soundex (D – M Soundex) является фонетический алгоритм изобретен в 1985 году еврейскими генеалогами Гэри Мокотовым и. Это усовершенствованный алгоритм Рассела и американского Soundex, разработанный для обеспечения большей точности сопоставления славянских и идиш фамилий с похожими произношение, но различия в написании.

Daitch – Mokotoff Soundex иногда называют «Jewish Soundex» и «Eastern European Soundex», хотя авторы не рекомендуют использовать эти псевдонимы для алгоритма, потому что сам алгоритм не зависит от того факта, что мотивация для создания новая система оказалась плохой по сравнению с предыдущими системами при работе со славянскими и идишскими фамилиями.

Содержание
  • 1 Улучшения
  • 2 Примеры
  • 3 Алгоритм сопоставления фонетических имен Бейдера – Морзе
  • 4 Примечания
  • 5 Внешние ссылки
Улучшения

Улучшения по сравнению с предыдущими Алгоритмы Soundex включают:

  • Кодированные имена состоят из шести цифр, что приводит к большей точности поиска (традиционный Soundex использует четыре символа)
  • Кодируется начальный символ имени.
  • Несколько правил в алгоритм кодирует многосимвольные n-граммы как однозначные (American и Russell Soundex не обрабатывают многосимвольные n-граммы)
  • Для одного имени может быть возвращено несколько возможных кодировок (традиционный Soundex возвращает только одну кодировку, даже если написание имени потенциально может иметь несколько вариантов произношения)
Примеры

Некоторые примеры:

Фамилия American SoundexD – M Soundex
PetersP362739400, 734000
ПетерсонP362739460, 734600
МосковицM232645740
МосковицM213645740
АуэрбахA612097500, 097400
UhrbachU612097500, 097400
ДжексонJ250154600, 454600, 145460, 445460
Джексон-ДжексонJ252154664, 454664, 145466, 445466, 154646, 454646, 145464, 445464
Бейдер – Морзе Алгоритм сопоставления фонетических имен

Для устранения большого количества ложноположительных результатов, генерируемых D – M Soundex, Стивен П. Морс и Александр Бейдер создали Beider– Алгоритм сопоставления фонетических имен Морзе. Этот новый алгоритм сокращает количество ложных срабатываний за счет некоторых ложноотрицательных результатов. Ряд сайтов предлагают звуковой индекс B – M в дополнение к звуку D – M.

Примечания
Внешние ссылки
Последняя правка сделана 2021-05-16 10:34:30
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте