В вычислительной технике термин обработка текста относится к теории и практике автоматизации создания или обработки электронного текста. Текст обычно относится ко всем буквенно-цифровым символам, указанным на клавиатуре человека, занимающегося практикой, но в целом текст означает уровень абстракции , расположенный непосредственно над стандартной кодировкой символов целевого текста. Термин обработка относится к автоматизированной (или механизированной) обработке, в отличие от аналогичных манипуляций, выполняемых вручную.
Обработка текста включает в себя компьютерные команды, которые вызывают содержимое, изменение содержимого и перемещение курсора, например, для
Обработка текста регулярного выражения - это виртуальная машина для редактирования, имеющая примитивный язык программирования с именем регистры (идентификаторы) и именованные позиции в последовательности символов, составляющих текст. Используя их, «текстовый процессор» может, например, пометить область текста, а затем переместить ее. Обработка текста утилитой - это программа-фильтр , или фильтр. Эти два механизма включают обработку текста.
Поскольку стандартизованный разметка, такая как escape-коды ANSI, обычно невидима для редактора, они содержат набор временных свойств, которые иногда становятся неотличимы от обработки текстов. Но определенные отличия от текстового редактора заключаются в том, что обработка текста собственно:
Таким образом, разметка, такая как шрифт и цвет на самом деле не являются отличительным фактором, потому что последовательности символов, которые влияют на шрифт и цвет, являются просто стандартными символами, автоматически вставленными в фоновом режиме обработки текста, сделанными для прозрачной работы совместимыми текстовыми редакторами, но в остальном становятся видимыми как команды обработки текста, когда этот режим не действует. Таким образом, обработка текста в основном (но не полностью) определяется визуальными символами (или графемами ), а не стандартными, но невидимыми символами.
Развитие компьютерной обработки текста всерьез началось с того, что Клини формализовала то, что является обычным языком. Такие регулярные выражения затем могут стать мини-программой, завершенной процессом компиляции, доступной для выполнения любого редактирования, как только этот язык будет расширен. Аналогичным образом фильтры расширяются за счет развития конкретных параметров.
Редактор по существу вызывает входной поток и направляет его в среду обработки текста, которая является либо командной оболочкой или а. Полученный результат применим для дальнейшей обработки текста, конечный результат сравним с однократным применением алгоритма, применяемым один раз более сложной и структурированной компьютерной программой.
Обработка текста, в отличие от алгоритма, представляет собой управляемую вручную последовательность более простых макросов, которые представляют собой выражения действия шаблона и механизмы фильтрации. В любом случае намерение программиста косвенно отражается на заданном наборе текстовых символов в процессе обработки текста. Результаты этапа обработки текста иногда только обнадеживают, и пытающийся механизм часто подвергается многократным проектам через визуальную обратную связь, пока регулярное выражение или детали языка разметки, или пока параметры утилиты не будут полностью освоены.
Обработка текста связана в основном с созданием текстовых символов на самом высоком уровне вычислений, где ее деятельность чуть ниже практического использования вычислений - ручной передачи информации.
В конечном итоге все вычисления - это обработка текста, от самкомпилируемых текстовых символов ассемблера до автоматизированного языка программирования, созданного для обработки большого количества графических данных, и, наконец, до метасимволов регулярных выражений, которые обрабатывают существующий текст. документы.
Обработка текста - это собственная автоматизация.
Текстовые символы входят в стандартные наборы символов, содержащие также управляющие символы, такие как символ новой строки, которые упорядочивают текст. Другие типы управляющих символов организуют передачу, определяют наборы символов и выполняют другие служебные задачи.