Список программ распознавания речи

редактировать
Статья списка Викимедиа

Программа распознавания речи доступна для многих вычислительных платформ, операционные системы, модели использования и лицензии на программное обеспечение. Вот их список, сгруппированный по различным полезным способам.

Содержание
  • 1 Акустические модели и речевой корпус (компиляция)
  • 2 Macintosh
  • 3 Кросс-платформенные веб-приложения
  • 4 Кросс-платформенные веб-приложения на основе Chrome
  • 5 Мобильные устройства и смартфоны
  • 6 Windows
    • 6.1 Встроенная Windows распознавание речи
    • 6.2 Надстройки для распознавания речи Windows 7
    • 6.3 Распознавание речи сторонних производителей в Windows 7, 8, 10
    • 6.4 Только для Windows XP или 2000
  • 7 Bui Программное обеспечение lt-in
  • 8 Интерактивный голосовой ответ
  • 9 Unix-подобное программное обеспечение для транскрипции речи x86 и x86-64
  • 10 Программное обеспечение, снятое с производства
  • 11 См. также
  • 12 Ссылки
Акустические модели и речь корпус (компиляция)

В следующем списке представлены известные программные механизмы распознавания речи с кратким обзором характеристик.

Название приложенияОписаниеОткрытый исходный код Лицензия Операционная система Язык программирования Поддерживаемый язык, примечаниеОфлайн или онлайн
CMU Sphinx HMM ДаСтиль BSD Кросс-платформенный Java Английский, немецкий, французский, китайский, русскийАвтономный
HTK HMM нейронная сеть No, специфичная для HTKКросс-платформенная C Английский; версия 3.5 выпущена в декабре 2015 г.
Юлиус триграммы HMMДастиль BSD, некоммерческийКросс-платформенный CЯпонский, английский; [2] Офлайн
Kaldi Нейронная сеть ДаApache Кросс-платформенный C ++ Английский
RWTH ASR RWTH Университет АахенаNoRWTH ASR, только для некоммерческого использованияLinux, macOS C++Английский
Macintosh
Название приложенияОписаниеОткрытый исходный код Лицензия ЦенаПримечание
Dragon для Mac (снято с производства в 2018 г.)macOS ; от NuanceNoСобственный
Dragon Dictate (снято с производства)macOS; от NuanceNoСобственный
MacSpeech Scribe (снято с производства)Транскрипция из записанного текста; приобретено Nuance
iListen (снято с производства)PowerPC Macintosh; прекращено MacSpeech; приобретено Nuance
Speakable items Включено в macOS
ViaVoice (снято с производства)Продукт IBM; приобретено Nuance
Voice Navigator Оригинальным GUI голосовым управлением; 1989
Кросс-платформенные веб-приложения

Trint.com

Temi.com

Ebby.co

Sonix.ai

Simonsays.ai.

Кросс-платформенные веб-приложения на базе Chrome

В следующем списке представлены известные программы распознавания речи, которые работают в браузере Chrome как веб-приложения. Они используют HTML5 Web-Speech-API.

Название приложенияОписаниеОткрытый исходный код Лицензия ЦенаПримечание
Speechmatics Облачное и локальное автоматическое распознавание речиNoСобственное От 0,06 фунта стерлингов за минуту звука
Мобильные устройства и смартфоны

Многие мобильные телефоны телефоны, включая функциональные телефоны и смартфоны, такие как iPhone и BlackBerrys, имеют встроенные базовые функции голосового набора. Многие сторонние приложения имеют реализована поддержка распознавания естественной речи, в том числе:

Название приложенияОписаниеОткрытый исходный код Лицензия ЦенаПримечание
Assistant.ai Assistant для Android, iOS и Windows PhoneNoпроприетарное, бесплатно бесплатноснято с производства
Dragon Dictation Noпроприетарное, бесплатное Бесплатная
Google Now Голосовой поиск AndroidNoСобственная, бесплатная Бесплатная
Голосовой поиск Google NoPropr ietary, бесплатное ПО Бесплатное
Microsoft Cortana Голосовой поиск MicrosoftNoСобственное, бесплатное Бесплатное
Siri Personal Assistant Apple виртуальный персональный помощникNoСобственное, бесплатное ПО Бесплатно
Alexa - Amazon Echo Персональный помощник AmazonNoСобственный
SILVIA Android и iOSNo
Vlingo
Windows

Встроенное распознавание речи Windows

Windows Speech Recognition версия 8.0 от Microsoft встроено в Windows Vista, Windows 7, Windows 8 и Windows 10. Распознавание речи доступно только на английском, французском, испанском, немецком, японском, упрощенном китайском и традиционном китайском языках и только в соответствующей версии Windows; Это означает, что вы не можете использовать механизм распознавания речи на одном языке, если вы используете версию Windows на другом языке. Windows 7 Ultimate и Windows 8 Pro позволяют изменить язык системы и, следовательно, изменить доступный механизм речи. Распознавание речи Windows превратилось в Cortana (программное обеспечение), персонального помощника, включенного в Windows 10.

Надстройки для распознавания речи Windows 7

Windows 7, 8, 10 стороннее распознавание речи

  • Braina - Диктовка в стороннем программном обеспечении и на веб-сайтах, заполнение веб-форм и выполнение голосовых команд.
  • Dragon NaturallySpeaking из Nuance Communications - Преемник старый продукт DragonDictate. Сосредоточьтесь на диктовке. Поддержка 64-битной ОС Windows с версии 10.1.
  • SpeechMagic - Nuance Communications приобретена, принадлежит Philips. Ориентация на медицинскую промышленность согласно Frost Sullivan. Автономный или встроенный.
  • Tazti - Создание профилей голосовых команд для игры в компьютерные игры и управления приложениями - программами. Создавайте голосовые команды для открытия файлов, папок, веб-страниц, приложений. Версии Windows 7, Windows 8 и Windows 8.1.

Только Windows XP или 2000

  • Microsoft Speech API - функция распознавания речи включена как часть Microsoft Office и на планшетных ПК под управлением Microsoft Windows XP Tablet PC Edition. Его также можно загрузить как часть Speech SDK 5.1 для приложений Windows, но поскольку он предназначен для разработчиков, создающих речевые приложения, в чистой форме SDK отсутствует какой-либо пользовательский интерфейс, и поэтому он не подходит для конечных пользователей.
Встроенный программное обеспечение
Интерактивный голосовой ответ

Ниже перечислены системы интерактивного голосового ответа (IVR):

  • CSLU Toolkit
  • Genesys
  • HTK - защищено авторским правом Microsoft, но позволяет изменять программное обеспечение для внутреннего использования лицензиатом
  • LumenVox ASR
  • Tellme Networks ; приобретено Microsoft
Unix-подобное программное обеспечение для транскрипции речи x86 и x86-64
Снятое с производства программное обеспечение
  • IBM VoiceType (ранее IBM Personal Dictation System)
  • IBM ViaVoice - Встроенная версия все еще поддерживается IBM. Больше не поддерживается для версий выше Windows Vista. Не тестировалось выше macOS 10.4 или на Macintosh с чипсетом Intel.
  • Quack.com ; приобретено AOL ; теперь это имя было повторно использовано для поискового приложения на iPad.
  • SpeechWorks от Nuance Communications.
  • Yap Speech Cloud - платформа преобразования речи в текст, приобретенная Amazon.com.
См. Также
Ссылки
Последняя правка сделана 2021-05-28 13:43:04
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте