Расширение имени файла | .spx |
---|---|
Тип Интернет-носителя | audio / x-speex, audio / speex, audio / ogg |
Разработано | Xiph.Org Foundation, Жан-Марк Валин |
Тип формата | Аудио |
Содержится | Ogg |
Стандартный | RFC 5574 |
Открытый формат ? | Да |
Веб-сайт | www.speex.org |
Разработчик (и) | Xiph.Org Foundation, Жан-Марк Валин |
---|---|
Первоначальный выпуск | 1.0 / март 2003 г. |
Стабильный выпуск | 1.2.0 / 7 декабря 2016 г.; 3 года назад (07.12.2016) |
Операционная система | Кросс-платформенность |
Тип | Аудиокодек, эталонная реализация |
Лицензия | Лицензия в стиле BSD |
Веб-сайт | Загрузки Xiph.org |
Speex - это кодек сжатия звука, специально настроенный для воспроизведения человеческой речи, а также бесплатное программное обеспечение речевой кодек, который можно использовать в приложениях VoIP и подкастах. Он основан на алгоритме кодирования речи CELP. Speex заявляет, что свободен от каких-либо патентных ограничений и лицензирован в соответствии с пересмотренной (3 пункта) лицензией BSD. Его можно использовать с форматом контейнера Ogg или напрямую передавать по UDP / RTP. Его также можно использовать с форматом контейнера FLV.
Разработчики Speex рассматривают свой проект как дополнение к Vorbis универсальному сжатию звука проект.
Speex - это формат с потерями, т. Е. Качество постоянно ухудшается, чтобы уменьшить размер файла.
Проект Speex был создан 13 февраля 2002 года. Первые разрабатываемые версии Speex были выпущены под лицензией LGPL, но начиная с версии 1.0 beta 1 Speex выпускается под версией Xiph. (пересмотренная) лицензия BSD. Speex 1.0 был анонсирован 24 марта 2003 года, после года разработки. Последняя стабильная версия кодировщика и декодера Speex - 1.2.0.
Xiph.Org теперь считает Speex устаревшим; его преемником является более современный кодек Opus, который превосходит по своим характеристикам во многих областях, за исключением самых низких частот дискретизации.
Speex нацелен на передачу голоса по IP (VoIP) и на основе файлов сжатие. Целью проектирования было создание кодека, который был бы оптимизирован для высококачественной речи и низкой скорости передачи данных. Для достижения этого кодек использует несколько битрейтов и поддерживает сверхширокополосный (32 кГц частота дискретизации ), широкополосный (частота дискретизации 16 кГц) и узкополосный ( телефонное качество, частота дискретизации 8 кГц). Поскольку Speex был разработан для VoIP вместо использования сотового телефона, кодек должен быть устойчивым к потерянным пакетам, но не к поврежденным. Все это привело к выбору линейного предсказания с кодовым возбуждением (CELP) в качестве метода кодирования для использования в Speex. Одна из основных причин заключается в том, что CELP уже давно доказал, что может выполнять свою работу и хорошо масштабироваться как до низких битрейтов (о чем свидетельствует DoD CELP @ 4.8 кбит / с), так и высоких битрейтов (как с G.728 @ 16 кбит / с). Основные характеристики можно резюмировать следующим образом:
Существует большая база приложений, поддерживающих кодек Speex. Примеры включают:
Большинство из них основаны на в фильтре DirectShow или кодеке OpenACM (например, Microsoft NetMeeting ) в Microsoft Windows или в эталонной реализации Xiph.org, libvorbis, в Linux (например, Ekiga ). Также существуют плагины для многих аудиоплееров. Подробнее см. на странице плагинов и программ на сайте speex.org.
Тип носителя для Speex - audio / ogg, когда он содержится в Ogg, и audio / speex (ранее audio / x-speex) при передаче через RTP или без контейнера.
The United Система Land Warrior армии штата, разработанная General Dynamics, также использует Speex для VoIP на радио EPLRS, разработанном Raytheon.
The Ear Bible - это наушники на одно ухо со встроенным проигрывателем Speex с 1 ГБ флэш-памяти, с предварительно загруженной записью Новой американской стандартной Библии.
ASL Safety Security на базе Linux VIPA Программное обеспечение ОС, которое используется в системах громкой связи на длинной линии связи и системах голосового оповещения на крупных международных авиатранспортных узлах и железнодорожных сетях.
Проект Rockbox использует Speex для своего голосового интерфейса. Он также может воспроизводить файлы Speex на поддерживаемых проигрывателях, таких как Apple iPod или iRiver H10.
Портативное устройство сбора данных Vernier LabQuest для естественнонаучного образования использует Speex для голосовых аннотаций, создаваемых учащимися и учителями с помощью встроенного или внешнего микрофона.
Мобильное приложение Google для iPhone в настоящее время включает Speex. Также предполагалось, что новое приложение Google голосовой поиск iPhone использует Speex для передачи голоса на серверы Google для интерпретации.
Adobe Flash Player поддерживает Speex, начиная с Flash Player 10.0.12.36, выпущенного в октябре 2008 года. Из-за некоторых ошибок в Flash Player первой рекомендуемой версией для поддержки Speex является 10.0.22.87 и более поздние версии. Speex в Flash Player может использоваться для обоих типов связи, через Flash Media Server или P2P. Speex можно декодировать или преобразовать в любой формат, в отличие от аудио Nellymoser, который был единственным речевым форматом в предыдущих версиях Flash Player. Speex также можно использовать в формате контейнера Flash Video (.flv), начиная с версии 10 Спецификации формата видеофайла (опубликованной в ноябре 2008 г.).
Диктофон JavaSonics ListenUp использует Speex для сжатия голосовых сообщений, которые записываются в браузере и затем загружаются на веб-сервер. Основные приложения - языковая подготовка, транскрипция и социальные сети.
Speex используется в качестве алгоритма сжатия голоса в голосовом помощнике Siri на iPhone 4S. Поскольку преобразование текста в речь происходит на серверах Apple, кодек Speex используется для минимизации пропускной способности сети.
В этой статье используется материал из Руководства по кодеку Speex, которое является авторским правом © Жан-Марк Валин и лицензировано в соответствии с условиями GFDL.