Обработка текста

редактировать
Создание или изменение электронного текста P.Oxy.6.993 text transcribed.svg

В вычислительной технике термин обработка текста относится к теории и практике автоматизации создания или обработки электронного текста. Текст обычно относится ко всем буквенно-цифровым символам, указанным на клавиатуре человека, занимающегося практикой, но в целом текст означает уровень абстракции , расположенный непосредственно над стандартной кодировкой символов целевого текста. Термин обработка относится к автоматизированной (или механизированной) обработке, в отличие от аналогичных манипуляций, выполняемых вручную.

Обработка текста включает в себя компьютерные команды, которые вызывают содержимое, изменение содержимого и перемещение курсора, например, для

  • поиска и замены
  • формат
  • создания обработанного отчета содержимое или
  • фильтровать файл или отчет текстового файла.

Обработка текста регулярного выражения - это виртуальная машина для редактирования, имеющая примитивный язык программирования с именем регистры (идентификаторы) и именованные позиции в последовательности символов, составляющих текст. Используя их, «текстовый процессор» может, например, пометить область текста, а затем переместить ее. Обработка текста утилитой - это программа-фильтр , или фильтр. Эти два механизма включают обработку текста.

Содержание

  • 1 Определение
  • 2 История
  • 3 Основные понятия
    • 3.1 Символы
  • 4 См. Также
  • 5 Внешние ссылки

Определение

Поскольку стандартизованный разметка, такая как escape-коды ANSI, обычно невидима для редактора, они содержат набор временных свойств, которые иногда становятся неотличимы от обработки текстов. Но определенные отличия от текстового редактора заключаются в том, что обработка текста собственно:

  • представляет собой "утилиты обработки текста", а не только приложения "редактирования текста".
  • - это гораздо больше "клавиатура" ", в отличие от" способа мыши "(например, перетаскивания, вырезания и вставки) инициирования редактирования.
  • - это последовательный доступ, а не произвольный доступ.
  • действует непосредственно в уровень представления , а не косвенно на уровне приложения.
  • обрабатывает необработанные данные, которые стандартизированы и работают более открыто, а не склоняются к каким-либо частным методам.

Таким образом, разметка, такая как шрифт и цвет на самом деле не являются отличительным фактором, потому что последовательности символов, которые влияют на шрифт и цвет, являются просто стандартными символами, автоматически вставленными в фоновом режиме обработки текста, сделанными для прозрачной работы совместимыми текстовыми редакторами, но в остальном становятся видимыми как команды обработки текста, когда этот режим не действует. Таким образом, обработка текста в основном (но не полностью) определяется визуальными символами (или графемами ), а не стандартными, но невидимыми символами.

История

Развитие компьютерной обработки текста всерьез началось с того, что Клини формализовала то, что является обычным языком. Такие регулярные выражения затем могут стать мини-программой, завершенной процессом компиляции, доступной для выполнения любого редактирования, как только этот язык будет расширен. Аналогичным образом фильтры расширяются за счет развития конкретных параметров.

Основные концепции

Редактор по существу вызывает входной поток и направляет его в среду обработки текста, которая является либо командной оболочкой или а. Полученный результат применим для дальнейшей обработки текста, конечный результат сравним с однократным применением алгоритма, применяемым один раз более сложной и структурированной компьютерной программой.

Обработка текста, в отличие от алгоритма, представляет собой управляемую вручную последовательность более простых макросов, которые представляют собой выражения действия шаблона и механизмы фильтрации. В любом случае намерение программиста косвенно отражается на заданном наборе текстовых символов в процессе обработки текста. Результаты этапа обработки текста иногда только обнадеживают, и пытающийся механизм часто подвергается многократным проектам через визуальную обратную связь, пока регулярное выражение или детали языка разметки, или пока параметры утилиты не будут полностью освоены.

Обработка текста связана в основном с созданием текстовых символов на самом высоком уровне вычислений, где ее деятельность чуть ниже практического использования вычислений - ручной передачи информации.

В конечном итоге все вычисления - это обработка текста, от самкомпилируемых текстовых символов ассемблера до автоматизированного языка программирования, созданного для обработки большого количества графических данных, и, наконец, до метасимволов регулярных выражений, которые обрабатывают существующий текст. документы.

Обработка текста - это собственная автоматизация.

Символы

Текстовые символы входят в стандартные наборы символов, содержащие также управляющие символы, такие как символ новой строки, которые упорядочивают текст. Другие типы управляющих символов организуют передачу, определяют наборы символов и выполняют другие служебные задачи.

См. Также

Внешние ссылки

Последняя правка сделана 2021-06-10 03:39:03
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте