PlainTalk

редактировать

PlainTalk - это собирательное название для нескольких синтеза речи (MacinTalk ) и технологии распознавания речи, разработанные Apple Inc. В 1990 году Apple вложила много труда и денег в технологию распознавания речи, наняв многих исследователей в этой области. Результатом стал "PlainTalk", выпущенный с моделями AV в серии Macintosh Quadra с 1993 года. Он был сделан стандартным системным компонентом в System 7.1.2, и с тех пор поставляется на всех PowerPC и некоторых других 68k Macintosh.

Содержание
  • 1 Программное обеспечение
    • 1.1 Синтез речи
      • 1.1.1 Технология
      • 1.1.2 Исходный MacinTalk
      • 1.1.3 MacinTalk 2
      • 1.1.4 MacinTalk 3, Pro
      • 1.1.5 Преобразование текста в речь в Mac OS X
    • 1.2 Распознавание речи
  • 2 В популярной культуре
    • 2.1 На радио
    • 2.2 В музыке
    • 2.3 В кино
    • 2.4 На телевидении
    • 2.5 В видеоиграх
    • 2.6 В веб-видео
  • 3 Аппаратное обеспечение
  • 4 Ссылки
  • 5 Внешние ссылки
Программное обеспечение

Синтез речи

Технологии

Синтез речи Apple использует дифоны. По сравнению с другими методами синтеза речи, он не очень ресурсоемкий, но ограничивает естественность синтеза речи. Американско-английский и испанский версии были доступны, но с момента появления Mac OS X Apple поставляла только голоса на американском английском, полагаясь на сторонних поставщиков, например, для предоставления голосов для другие языки (в OS X 10.7 Apple лицензировала множество сторонних голосов и сделала их доступными для загрузки в панели управления речью).

интерфейс прикладного программирования, известный как Speech Manager, позволяет сторонним разработчикам использовать синтез речи в своих приложениях. Существуют различные контрольные последовательности, которые можно использовать для точной настройки интонации и ритма. громкость, высота и скорость речи также могут быть настроены, что позволяет петь.

Входом в синтезатор можно явно управлять с помощью специального алфавита фонем.

Original MacinTalk

Исходный механизм преобразования текста в речь Macintosh, MacinTalk (названный Дениз Чандлер), использовалась Apple в 1984 году, когда была представлена ​​модель Macintosh, в которой компьютер заявил о себе миру (и высмеял вес компьютера IBM). Хотя он был включен в операционную систему Macintosh, он официально не поддерживался Apple (хотя информация о программировании была доступна через Техническую записку Apple). MacinTalk был разработан Джозефом Кацем и Марком Бартоном, которые позже основали SoftVoice, Inc., которая в настоящее время продает движки TTS для Windows, Linux и встраиваемых платформ. Macintalk использовал прямой доступ к исходному звуковому оборудованию Macintosh, и все попытки Apple лицензировать исходный код для его обновления для новых компьютеров Mac не увенчались успехом. [1 ] [2]

MacinTalk 2

В конце концов, Apple выпустила поддерживаемую систему синтеза речи под названием MacinTalk 2. Она поддерживает любой Macintosh, на котором установлено системное программное обеспечение 6.0.7 или новее. Она оставалась рекомендованной версией для более медленных машин даже после выпуска MacinTalk 3 и Pro.

MacinTalk 3, Pro

MacinTalk 3 представил большое разнообразие голосов. Помимо стандартных взрослых голосов «Ральф», «Фред» и «Кэти», а также детских голосов, таких как «Принцесса» и «Джуниор», были включены различные новые голоса, такие как «Шепот», «Зарвокс» (роботизированный голос с мелодичным фоновые звуки, с похожим голосом, также называемым "Trinoids"), "Cellos" (голос, который спел свой текст на Эдвард Григ мелодию, с такими же поющими голосами, как " Хорошие новости »,« Плохие новости »,« Орган »),« Альберт »(хриплый голос),« Колокола »,« Боинг »,« Пузыри »и другие.

У каждого из этих голосов есть собственный пример текста, который будет произнесен при нажатии кнопки «Тест» на панели управления речью. Некоторые просто назвали свое имя, язык и версию MacinTalk, с которой они были представлены. Другие сказали бы смешные вещи, например: «Мне очень нравится находиться внутри этого модного компьютера», «У меня лягушка в горле... Нет, я имею в виду настоящую лягушку!», «Мы должны радоваться этому. этот болезненный голос »(пародия на церковный гимн западных стран с органной музыкой ), или« Свет, который вы видите в конце туннеля, - это налобный фонарь быстро приближающегося поезда ». Эти голоса, а также их тестовые тексты все еще присутствуют в Mac OS X сегодня.

С увеличением вычислительной мощности, которую обеспечивали компьютеры Mac AV и Macintosh на базе PowerPC, Apple могла позволить себе повысить качество синтеза. MacinTalk 3 требовал процессора 33 МГц 68030, а MacinTalk Pro требовал 68040 или лучше и не менее 1 МБ из ОЗУ.. Каждый синтезатор поддерживал свой набор голосов.

Преобразование текста в речь в Mac OS X

Преобразование текста в речь было частью каждой версии Mac OS X (более поздней версии macOS). Голос Виктории был значительно улучшен в Mac OS X v10.3 и добавлен как Вики (Виктория не была удалена). Его размер был почти в 20 раз больше за счет использования более качественных образцов дифонов.

Новый, гораздо более естественный голос под названием «Alex» был добавлен в список Mac для преобразования текста в речь с выпуском Mac OS X 10.5 Leopard.

В Mac OS X 10.7 Lion доступны голоса на дополнительном американском английском и других акцентах английского языка, а также на 21 другом языке.

Функция «Озвучивать выделенный текст при нажатии клавиши» позволяет читать выделенный текст из любого приложения с помощью комбинации клавиш. С Mac OS X 10.1 до Mac OS X 10.6 функция копирует выделенный текст в буфер обмена и считывает его оттуда. Начиная с Mac OS X 10.7 и заканчивая Mac OS X 10.10, новая реализация функции требовала, чтобы разработчики программного обеспечения реализовали синтез речи API в своих приложениях. Это предотвратило перезапись буфера обмена, но также означало, что для приложений, которые не использовали API, функция не будет работать должным образом, читая строку заголовка, а не выделенный текст.

В macOS Sierra 10.12, Siri была представлена ​​для Mac, однако голос не был доступен как системный голос, а это означало, что голоса Siri можно было использовать только в Siri. Siri была доступна как системный голос в macOS Catalina 10.15, так что она могла работать с любым текстом. Голоса Siri работают совершенно по-другому, и команда sayпо-прежнему не может использовать Siri.

Распознавание речи

Apple наняла множество исследователей распознавания речи в 1990 году. Примерно через год они продемонстрировали технологию под кодовым названием Casper. Он был выпущен как часть пакета PlainTalk в 1993 году. Хотя он доступен для всех компьютеров Macintosh PowerPC и компьютеров AV 68k (это было одно из немногих приложений, в которых использовался DSP в Centris 660AV и Quadra 840AV ), он не входил в стандартную установку системы до Mac OS X, требуя от пользователя выполнения специальной установки ОС, чтобы получить возможности распознавания речи.

В Mac OS X 10.7 Lion и ранее распознавание речи Apple было ориентировано только на голосовые команды, то есть не предназначалось для диктовки. Его можно настроить на прослушивание команд при нажатии горячей клавиши, после обращения с фразой активации, такой как «Компьютер» или «Macintosh», или без запроса. Графический монитор состояния, часто в виде анимированного персонажа, обеспечивает визуальную и текстовую обратную связь о состоянии прослушивания, доступных командах и действиях. Он также может общаться с пользователем с помощью синтеза речи.

Ранние версии распознавания речи предоставляли полный доступ к меню. Позднее эта поддержка была удалена, так как она требовала слишком много ресурсов и делала распознавание менее надежным, и была повторно добавлена ​​в Mac OS X 10.3 в качестве «технологии универсального доступа», называемой голосовым пользовательским интерфейсом.

Пользователь может запускать элементы, расположенные в специальной папке, называемой «Speakable Items», просто произнося их имя (когда система находится в режиме прослушивания). Apple поставила в эту папку несколько сценариев AppleScripts, но псевдонимы, документы и папки можно открывать аналогичным образом.

Дополнительные функции предоставляются отдельными приложениями. Интерфейс прикладного программирования позволяет программам определять и изменять доступный словарь. Например, Finder предоставляет словарь для управления файлами и окнами.

. В OS X 10.8 Mountain Lion Apple представила «Диктовку», предназначен для общего текста. Первоначально требовалась отправка аудиоданных на серверы Apple для обработки. В OS X 10.9 Mavericks Apple добавила возможность загрузки поддержки диктовки без подключения к Интернету. Начиная с OS X 10.9.3, поддерживаются восемь языков (19 диалектов).

В популярной культуре

На радио

Синтез речи MacinTalk можно услышать в нескольких радиопрограммах:

  • Некоторые из радиопередач в серии BBC Radio 1 Blue Jam используйте MacinTalk.

В музыке

Синтез речи MacinTalk можно услышать в нескольких песнях:

  • "Вики" из MacinTalk говорит во время перерывов в Studio Killers '"В Токио."
  • "Repeating Yesterday" из альбома As I Lay Dying Shadows Are Security во вступлении использовался MacinTalk. 284>Satisfaction "Бенни Бенасси, а также другие его песни.
  • " Toby's Mac "tobyMac
  • " Фред "MacinTalk представлен в песни Radiohead "Paranoid Android " и "Fitter Happier", обе из их альбома 1997 года OK Computer. В предыдущей песне Фред используется в качестве фона вокал, в то время как в последнем он выступает в качестве ведущего вокалиста.
  • Fall Out Boy использовал MacinTalk в начале «Grand Theft Autumn / Where Is Your Bo y "(Millennium Version) и в конце последнего трека и бонус-треков на их альбоме Infinity on High.
  • Французская группа Air использует несколько голосов Macintosh в их треке "How Does It Make You Feel"
  • "Йошими сражается с розовыми роботами, Pt. 1 "by The Flaming Lips включает голос" Zarvox "
  • Многие треки Aphex Twin, включая" ​​Funny Little Man "и В "Cow Cud Is a Twin " также есть PlainTalk
  • В песне "John Orr the Arsonist" And Then There Were None есть короткий монолог с использованием этого голоса.
  • «Интерпретация Vic-E - Interlude» из альбома TLC FanMail показывает «Викторию», сравнивающую и противопоставляющую клубную культуру США и Японии.
  • В "Intro" из альбома OutKast Stankonia используется голос "Bells".
  • Песня "Pomme C" французского певца Калоджеро в альбоме Pomme C в самом начале содержит короткий монолог с использованием голоса "Vicki"
  • "DWYL" Phil Joel
  • Альбом Antichrist Superstar группы Мэрилин Мэнсон многократно использует голоса MacinTalk «Кэти», «Принцесса» и «Джуниор», часто накладываемые друг на друга. заглавная песня заканчивается wi Голос MacinTalk повторяет: «Когда вы страдаете, знайте, что я предал вас». Голоса MacinTalk снова используются в музыкальных клипах и живых выступлениях "Antichrist Superstar ". Голоса MacinTalk повторяют: «С таким же успехом ты можешь убить себя - ты уже мертв» в конце песни. Песня «Man That You Fear » также заканчивается голосами MacinTalk, говорящими: «Когда все ваши желания будут выполнены, многие из ваших мечтаний будут разрушены».
  • Большая часть Альбом Transsexual EP и Lambs Anger г-на Оидзо содержит голоса MacinTalk
  • Korea Idol Песня T-ara "Bo Пип Бо Пип "из Absolute First Album вводная часть" Не теряйте самообладание так быстро "
  • Песня El-P " Фабрика отчима ", из альбом 2002 года Fantastic Damage заканчивается тем, что голоса MacinTalk повторяют: «Почему ты заставляешь меня причинять тебе боль? Я люблю тебя».
  • В EDM продюсер Трек Skrillex под названием «I Wish You All The World», голос MacinTalk «Alex» можно услышать, повторяя «Дэвид, я желаю тебе всего удачи в мире» несколько раз с различной высотой тона.
  • Трек Роба Голди 1997 года "The Shadow (The Process Mix by Rick Smith для Underworld )" широко использует голос "Victoria", читая ди ‑ ‑ ‑ ‑ ‑ ‑ е ‑ ‑ ‑ е ‑ н ‑ е н ‑ е ‑ н ‑ е ‑ ‑ е‑ н‑ ное слово в альбоме Жана-Мишеля Жарра ‑ 42 ‑ го года. трек "Love, Love, Love".
  • Вступительная строка "Treasure " Бруно Марса на альбоме Unorthodox Jukebox - голос Алекс говорит: «Белочка, ты сексуальный ублюдок».
  • В «Something Get, Whatever» от deadmau5 из альбома Случайное название альбома, зацикленная фраза «Иногда все становится сложно» - это комбинация голосов «Ральфа» и «Кэти».
  • Electro house дуэт BSOD (deadmau5 Steve Duda ) трек «This is the Hook» использует голос «Ральфа» для обозначения различных частей типичной электронной музыки трека.
  • Немецкая электронная группа Monolake использует PlainTalk "Whisper" голос в треке "Bicom" на их альбоме Cinemascope.
  • Виртуальный синтезатор Plogue Art et Technologie chi pspeech имитирует MacinTalk 1.0.
  • I'm A Disco Dancer (And A Sweet Romancer) Кристофера Джаста использует различные голоса MacinTalk
  • Дэвид Джеймс использует некоторые голоса MacinTalk в своей песне (Always) Постоянное состояние

В фильме

  • Голос «Ральфа» служит голосом компьютеризированного автопилота АВТО в 2008 Disney - Pixar фильм ВАЛЛ-И. MacinTalk упоминается как этот голос в финальных титрах фильма.
  • В Blank Check Престон использовал MacInTalk в качестве голоса М.Макинтоша, чтобы купить дом по телефону.

В телевидение

В видеоиграх

  • MacinTalk использовался в японской версии игры Killer7, как голоса Остаточных Психов.
  • MacinTalk использовался в игре No More Heroes. Перед каждой битвой с боссом голос «Шепот» объявлял имя текущего босса.
  • В оригинальном выпуске 1999 года Серебряный футляр во вступительной дорожке использовались «Ральф» и «Боинг».
  • Видеоигра Grand Theft Auto IV использовала «Вики» в качестве голоса ди-джея внутриигровой радиостанции «Путешествие ".
  • Видеоигра 2009 года Machinarium включает несколько голосов Macintalk в своей эмбиент-музыке.
  • В 3DO версии Star Control 2 «Брюс» использовался как голос Слайландро. Зонд. В игре голос Зонда обозначается как 840AV. «Агнес» также использовалась в качестве голоса компьютера корабля капитана, услышанного при первой встрече с расой Орз.
  • В японской и европейской версиях Sonic CD голоса MacinTalk использовались в качестве фоновой музыки для этапов Bad Future Metallic Madness.
  • В видеоигре Castle Crashers использовался голос новинки. Боинг для персонажа, известного как Художник.
  • Видеоигра 2003 года S hin Megami Tensei: Nocturne использовал «Альберта» для вокала в своем саундтреке.

В веб-видео

  • Голос MacinTalk «Zarvox» использовался для озвучивания робота в Smosh видео «УДИВИТЕЛЬНО» НОВЫЙ РОБОТ! », А голос« Фреда »был использован для озвучивания Стивена Хокинга в« 15 ЧАСОВ ЭНЕРГИИ! »
  • YouTuber Макс Джиларди использовал различные голоса Macintalk для его видео.
  • Веб-сериал Making Fiends содержал версию эпизода «Kitty Kitty Kitty», где исходный звук был заменен компьютерным симулятором речи.
  • В начале Nitro Rad голос произносит слова «Nitro Rad».
Оборудование

Apple выпустила два микрофона под названием «Apple PlainTalk Microphone». Первые поставлялись с Macintosh LC и ранними моделями Performa и имели круглую форму. Он был разработан для размещения в держателе, прикрепленном сбоку от ЭЛТ-дисплея, и его можно было поднимать и удерживать за рот во время разговора. Вторая модель была представлена ​​вместе с моделями AV в серии Macintosh Quadra в 1993 году, но также продавалась отдельно. Он был разработан так, чтобы располагаться над экраном и быть чувствительным к звуку спереди. Обе модели имели более длинный разъем, кончик которого использовался для подачи на микрофон напряжения смещения.

Ссылки
Внешние ссылки
Последняя правка сделана 2021-06-02 07:24:01
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте