Предиктивный текст

редактировать

Интеллектуальный текст - это технология ввода, используемая, когда одна клавиша или кнопка представляет множество букв, например, на цифровых клавиатурах в мобильных телефонах и в доступность технологий. Каждое нажатие клавиши приводит к предсказанию, а не к многократному просмотру одной и той же группы «букв», которые оно представляет, в одном и том же неизменном порядке. Интеллектуальный ввод текста может позволить ввести все слово одним нажатием клавиши. Интеллектуальный ввод текста позволяет эффективно использовать меньшее количество клавиш устройства для ввода записи в текстовое сообщение, электронное письмо, адресную книгу, календарь и т.п.

Наиболее широко используемыми общими системами интеллектуального ввода текста являются T9, iTap, eZiText и LetterWise / WordWise. Есть много способов создать устройство, которое предсказывает текст, но все системы предсказания текста имеют начальные лингвистические настройки, которые предлагают предсказания с измененным приоритетом для адаптации к каждому пользователю. Это обучение адаптируется через память устройства к устраняющей неоднозначности обратной связи пользователя, которая приводит к корректирующим нажатиям клавиш, таким как нажатие клавиши «далее» для перехода к намерению. Большинство систем интеллектуального ввода текста имеют базу данных пользователей для облегчения этого процесса.

Теоретически количество нажатий клавиш, необходимое для каждого желаемого символа в законченном письме, в среднем сопоставимо с использованием клавиатуры. Это приблизительно верно при условии, что все используемые слова находятся в его базе данных, пунктуация игнорируется, и при вводе не делается ошибок при вводе или написании. Теоретическое количество нажатий клавиш на символ, KSPC, для клавиатуры составляет KSPC = 1,00, а для многократного нажатия - KSPC = 2,03. Eatoni LetterWise - это интеллектуальный гибрид с несколькими нажатиями, который при работе со стандартной телефонной клавиатурой достигает KSPC = 1,15 для английского языка.

Выбор наиболее подходящей системы интеллектуального ввода текста включает соответствие предпочтительному стилю интерфейса пользователя, уровню обучения пользователя работе с программным обеспечением с интеллектуальным вводом текста и цели пользователя по эффективности. Существуют различные уровни риска в системах интеллектуального ввода текста по сравнению с системами с несколькими нажатиями, потому что прогнозируемый текст, который автоматически записывается, что обеспечивает повышение скорости и механической эффективности, может, если пользователь не будет внимательно просматривать, приводят к передаче дезинформации. Системам интеллектуального ввода текста требуется время, чтобы научиться правильно их использовать, и поэтому, как правило, система устройства имеет пользовательские параметры для настройки выбора нескольких нажатий или любой из нескольких школ методов интеллектуального ввода текста.

Содержание

1 Предпосылки
2 Словарь против систем, не являющихся словарями
3 История
4 Пример
5 Компании и продукты
6 Текстонимы
7 Сбой устранения неоднозначности и орфографические ошибки
8 См. Также
- 8.1 Концепции
- 8.2 Продукты
- 8.3 Устройства
9 Ссылки
10 Дополнительная литература
11 Внешние ссылки

Справочная информация

Служба коротких сообщений (SMS) позволяет пользователю мобильного телефона отправлять текстовые сообщения (также называемые сообщениями, SMS-сообщениями, текстами и txts) в виде коротких сообщений. Наиболее распространенная система ввода текста SMS называется «multi-tap ». При многократном нажатии на клавишу нажимается несколько раз, чтобы получить доступ к списку букв на этой клавише. Например, нажатие клавиши «2» один раз отображает «a», дважды отображает «b» и трижды отображает «c». Чтобы ввести две последовательные буквы, которые находятся на одной и той же клавише, пользователь должен либо сделать паузу, либо нажать кнопку «Далее». Пользователь может вводить текст, нажимая буквенно-цифровую клавиатуру, не глядя на дисплей электронного оборудования. Таким образом, мульти-касание легко понять и использовать без какой-либо визуальной обратной связи. Однако многократное нажатие не очень эффективно, поскольку для ввода одной буквы может потребоваться несколько нажатий клавиш.

В идеальном режиме интеллектуального ввода текста все используемые слова находятся в словаре, пунктуация игнорируется, орфографические ошибки и опечатки не допускаются. Идеальный словарь должен включать весь сленг, имена собственные, сокращения, URL-адреса, слова на иностранном языке и другие уникальные для пользователя слова. Это идеальное обстоятельство позволяет программному обеспечению с предиктивным вводом текста сокращать количество нажатий клавиш, которое требуется пользователю для ввода слова. Пользователь нажимает цифру, соответствующую каждой букве, и, пока слово существует в словаре предиктивного ввода текста или правильно устраняется не словарными системами, оно будет отображаться. Например, нажатие «4663» обычно интерпретируется как слово «хорошо» при условии, что в настоящее время используется лингвистическая база данных на английском языке, хотя альтернативы, такие как «дом», «капюшон» и «копыто», также являются допустимыми интерпретациями последовательности нажатий клавиш.

Наиболее широко используемые системы интеллектуального ввода текста - Tegic T9, Motorola iTap и Eatoni Ergonomics 'LetterWise и WordWise. T9 и iTap используют словари, но продукты Eatoni Ergonomics используют процесс устранения неоднозначности, набор статистических правил для воссоздания слов из последовательностей нажатий клавиш. Все системы интеллектуального ввода текста требуют наличия лингвистической базы данных для каждого поддерживаемого языка ввода.

Словарь против систем без словаря

Традиционное устранение неоднозначности работает путем ссылки на словарь наиболее часто используемых слов, хотя предлагает систему устранения неоднозначности без словаря.

В системах на основе словарей, когда пользователь нажимает цифровые кнопки, алгоритм ищет в словаре список возможных слов, которые соответствуют комбинации нажатия клавиш, и предлагает наиболее вероятный выбор. Затем пользователь может подтвердить выбор и перейти к следующему шагу или с помощью клавиши просмотреть возможные комбинации.

Система без словаря строит слова и другие последовательности букв на основе статистики частей слова. Чтобы попытаться предсказать предполагаемый результат еще не введенных нажатий клавиш, устранение неоднозначности может быть объединено с функцией завершения слова.

Любая система (устранение неоднозначности или прогнозирующая) может включать базу данных пользователей, которую можно дополнительно классифицировать как «обучающую» систему, когда слова или фразы вводятся в базу данных пользователя без прямого вмешательства пользователя. База данных пользователей предназначена для хранения слов или фраз, неоднозначность которых не устраняется заранее предоставленной базой данных. Некоторые системы устранения неоднозначности в дальнейшем пытаются исправить орфографию, форматировать текст или выполнить другие автоматические перезаписи, что может привести к увеличению или уменьшению количества попыток пользователя ввести текст.

История

Управляющие клавиши китайской пишущей машинки, созданной Линь Ютаном в 1940-х годах, включали предложения для символов, следующих за выбранным. В 1951 году китайский наборщик Чжан Цзиин собрал китайские иероглифы в ассоциативные кластеры, что стало предшественником современного интеллектуального ввода текста, и таким образом побил рекорды скорости. Интеллектуальный ввод текста с клавиатуры телефона известен как минимум с 1970-х годов (Smith and Goodwin, 1971). Некоторые аспекты интеллектуального ввода текста были запатентованы, например, Кондраске (1985), в то время как полнофункциональная клавиатура для текстовой системы для общения с глухими людьми по телефону была запатентована в 1988 году Роем Фейнсоном (# 4,754,474 ), которая включала большинство функций современных систем интеллектуального ввода текста, включая устранение неоднозначности и локальное хранение словаря. Прогнозирующий текст в основном использовался для поиска имен в каталогах по телефону, пока текстовые сообщения на мобильных телефонах не стали широко использоваться.

Пример

Стандартная клавиатура ITU-T E.161, используемая для обмена текстовыми сообщениями

На обычной клавиатуре телефона, если пользователи хотели ввести в системе ввода с клавиатуры с несколькими нажатиями им потребуется:

Нажмите 8 (tuv) один раз, чтобы выбрать t.
Нажмите 4 (ghi) дважды, чтобы выбрать h.
Дважды нажмите 3 (def), чтобы выбрать e.

Между тем, в телефоне с интеллектуальным вводом текста им нужно только:

Нажмите 8 один раз, чтобы выбрать группу (tuv) для первого символа.
Нажмите 4 один раз, чтобы выбрать группу (ghi) для второго символа.
Нажмите 3 один раз, чтобы выбрать группу (def) для третьего символа.

Система обновляет дисплей при каждом нажатии клавиши, чтобы показать наиболее вероятный ввод. В этом примере прогнозирование сократило количество нажатий кнопок с пяти до трех. Эффект еще больше усиливается при использовании более длинных слов и тех, которые состоят из букв позже в последовательности каждой клавиши.

Система прогнозирования на основе словаря основана на надежде, что искомое слово есть в словаре. Эта надежда может быть неуместной, если слово каким-либо образом отличается от обычного употребления - в частности, если слово написано или напечатано неправильно, является сленгом или является существительным собственным. В этих случаях необходимо использовать какой-либо другой механизм для ввода слова. Более того, простой словарный подход не работает с агглютинативными языками, где одно слово не обязательно представляет собой одну семантическую сущность.

Компании и продукты

Интеллектуальный текст разработан и продается в различных конкурирующих продуктах, таких как Nuance Communications T9. Другие продукты включают Motorola iTap, LetterWise (предсказание по символам, а не по словам), WordWise (предсказание по словам без словаря), EQ3 (QWERTY -подобная раскладка, совместимая с обычными телефонными клавиатурами); s; '(шестиклавишная уменьшенная клавиатура QWERTY); Adaptxt (учитывает язык, контекст, грамматику и семантику); Lightkey (программа для интеллектуального набора текста для Windows); (статистический характер языка, отсутствие словарей, динамическое распределение ключей); и (временная неоднозначность); Intelab's Tauto; Платформа Intelligent Input Platform ™ от WordLogic (запатентованная технология прогнозирования текста на основе слоев, включает многоязычный словарь, проверку орфографии, встроенный поиск в Интернете).

Текстонимы

Слова, образованные одной и той же комбинацией нажатий клавиш, были названы «текстонимами»; также «текстонимы»; или «T9onyms» (произносится «тинонимы»), хотя они не являются специфическими для T9. Выбор неправильного текстонима может произойти без орфографических ошибок или опечаток, если по умолчанию выбран неправильный текстоним или ошибка пользователя. Как упоминалось выше, последовательность клавиш 4663 на клавиатуре телефона, снабженной лингвистической базой данных на английском языке, обычно не имеет двусмысленности как слово «хорошо». Однако та же последовательность клавиш соответствует и другим словам, таким как дом, ушел, копыто, капюшон и так далее. Например, «Ты дома?» может быть передано как "Ты в порядке?" если пользователь пренебрегает изменением слова по умолчанию 4663. Это может привести к недоразумениям; например, последовательность 735328 может соответствовать либо select, либо его антониму reject. Ряд 2010 года, который привел к непредумышленному убийству, был вызван ошибкой текстонима. Предиктивный текст, выбирающий значение по умолчанию, отличное от ожидаемого пользователем, имеет сходство с эффектом Купертино, с помощью которого программа проверки орфографии меняет написание на написание непредусмотренного слова.

Текстонимы использовались в качестве сленга поколения Y ; например, слово «книга» означает «круто», поскольку «книга» используется по умолчанию в тех системах интеллектуального ввода текста, которые предполагают, что это слово чаще, чем «круто». Это связано с cacography.

Ошибка устранения неоднозначности и орфографические ошибки

Текстонимы, в которых система устранения неоднозначности дает более одного словарного слова для одной последовательности нажатий клавиш, не единственная проблема или даже самая важная проблема, ограничивающая эффективность реализации интеллектуального текста. Более важными, согласно приведенным выше ссылкам, являются слова, для которых устранение неоднозначности дает единственный неправильный ответ. Система может, например, ответить Блерфом при вводе 252473, когда предполагаемое слово было Блейз или Клэр, оба из которых соответствуют последовательности нажатия клавиш, но в этом примере не обнаруживаются системой предсказания текста. Когда возникают опечатки или орфографические ошибки, очень маловероятно, что они будут правильно распознаны системой устранения неоднозначности, хотя механизмы исправления ошибок могут смягчить этот эффект.

См. Также

Основные понятия

Продукты

Устройства

Ссылки

Дополнительная литература

Smith, Sidney L.; Гудвин, Нэнси С. (1971). «Ввод данных в алфавитном порядке с помощью сенсорной панели: комментарий». Человеческие факторы. 13 (2): 189–190. doi : 10.1177 / 001872087101300212.