A фильтр - это компьютерная программа или подпрограмма для обработки поток, создающий другой поток. Хотя один фильтр можно использовать по отдельности, они часто объединяются в цепочку конвейер.
Некоторые операционные системы, такие как Unix, богаты программами фильтрации. Windows 7 и более поздние версии также богаты фильтрами, поскольку они включают Windows PowerShell. Для сравнения, однако, в cmd.exe (исходный интерфейс командной строки Windows) встроено несколько фильтров, большинство из которых имеют значительные улучшения по сравнению с аналогичными командами фильтров, которые были доступно в MS-DOS. OS X включает фильтры из своей базовой базы Unix, но также имеет Automator, который позволяет объединять фильтры (известные как «Действия») вместе для формирования конвейера.
In Unix и Unix-подобных операционных систем, фильтр - это программа, которая получает большую часть своих данных из своего стандартного ввода (основной входной поток) и записывает свои основные результаты в свой стандартный вывод (основной выходной поток). Вспомогательный ввод может поступать из флагов командной строки или файлов конфигурации, а вспомогательный вывод может поступать в стандартную ошибку. Синтаксис команды для получения данных с устройства или файла, отличного от стандартного ввода, - это оператор ввода (<
). Точно так же для отправки данных на устройство или в файл, кроме стандартного вывода, используется оператор вывода (>
). Чтобы добавить строки данных в существующий выходной файл, можно использовать оператор добавления (>>
). Фильтры могут быть объединены в конвейер с помощью оператора конвейера («|
»). Этот оператор означает, что основной вывод команды слева передается как основной ввод для команды справа.
Философия Unix поощряет объединение небольших дискретных инструментов для выполнения более крупных задач. Классический фильтр в Unix - это grep Кена Томпсона, который Дуг Макилрой называет тем, что «безвозвратно закрепило перспективы у инструментов» в операционной системе, а позднее инструменты, имитирующие его. grep в простейшем виде выводит на свой вывод любые строки, содержащие символьную строку. Ниже приведен пример:
cut -d: -f 1 / etc / passwd | grep foo
Это обнаруживает всех зарегистрированных пользователей, у которых есть "foo" как часть их имени пользователя, используя команду cut, чтобы взять первое поле (имя пользователя) каждой строки файла паролей системы Unix и передать все они являются входными данными для grep, который ищет на своем входе строки, содержащие символьную строку «foo», и печатает их на своем выходе.
Общие программы фильтрации Unix: cat, cut, grep, head, sort, uniq и tail. Такие программы, как awk и sed, можно использовать для создания довольно сложных фильтров, поскольку они полностью программируемы. Фильтры Unix также могут использоваться специалистами по данным, чтобы получить быстрый обзор набора данных на основе файлов.
Два стандартных фильтра из первых дней компьютеров на базе DOS: find и sort.
Примеры:
find "ключевое слово" < inputfilename>outputfilename sort "keyword" < inputfilename>outputfilename find / v "keyword" < inputfilename | sort>outputfilename
Такие фильтры можно использовать в пакетных файлах (*.bat, *.cmd и т. Д.).
Для использования в той же среде командной оболочки доступно гораздо больше фильтров, чем встроенных в Windows. Некоторые из них являются бесплатными, некоторые условно-бесплатными и некоторые - коммерческими программами. Некоторые из них имитируют функции и особенности фильтров в Unix. Некоторые программы фильтрации имеют графический пользовательский интерфейс (GUI), позволяющий пользователям разрабатывать индивидуальный фильтр в соответствии со своими особыми требованиями обработки данных и / или интеллектуального анализа данных.
Командная строка Windows унаследовала команды MS-DOS, улучшила некоторые и добавила несколько. Например, Windows Server 2003 содержит шесть фильтров командной строки для изменения Active Directory, которые могут быть связаны с помощью конвейера: DSAdd, DSGet, DSMod, DSMove, DSRm и DSQuery.
Windows PowerShell добавляет целый набор фильтров, известных как «командлеты», которые можно связать вместе с конвейером, за исключением нескольких простых, например Очистить экран
. В следующем примере получается список файлов в папке C: \ Windows
, размер каждого из них и сортировка по возрастанию. Он показывает, как три фильтра (Get-ChildItem
, ForEach-Object
и Sort-Object
) связаны с конвейерами.
Get-ChildItem C: \ Windows | ForEach-Object {$ _. Length} | Сортировка-Объект-По возрастанию