Поиск музыкальной информации

редактировать

Поиск музыкальной информации ( MIR) - это междисциплинарная наука об извлечении информации из музыки. MIR - это небольшая, но развивающаяся область исследований с множеством реальных приложений. Те, кто занимается MIR, могут иметь опыт работы в области музыковедения, психоакустики, психологии, академического музыкального исследования, обработки сигналов, информатики, машинного обучения, оптического распознавания музыки, вычислительного интеллекта или некоторой их комбинации.

СОДЕРЖАНИЕ

1 Приложения
- 1.1 Музыкальная классификация
- 1.2 Рекомендательные системы
- 1.3 Разделение источников музыки и распознавание инструментов
- 1.4 Автоматическая транскрипция музыки
- 1.5 Генерация музыки
2 Используемые методы
- 2.1 Источник данных
- 2.2 Представление функций
- 2.3 Статистика и машинное обучение
3 Прочие вопросы
4 Академическая деятельность
5 См. Также
6 Ссылки
7 Внешние ссылки
- 7.1 Примеры приложений MIR

Приложения

MIR используется предприятиями и учеными для классификации, манипулирования и даже создания музыки.

Музыкальная классификация

Одной из классических тем исследования MIR является классификация жанров, при которой музыкальные произведения делятся на один из заранее определенных жанров, таких как классика, джаз, рок и т. Д. Классификация настроения, классификация исполнителей и маркировка музыки также являются популярными темами.

Разделение источников музыки и распознавание инструментов

Разделение музыкального источника - это разделение исходных сигналов от смешанного аудиосигнала. Распознавание инструментов - это идентификация инструментов, задействованных в музыке. Были разработаны различные системы MIR, которые могут разделять музыку на составляющие треки без доступа к основной копии. Таким образом, например, треки караоке могут быть созданы из обычных музыкальных треков, хотя процесс еще не совершенен из-за того, что вокал занимает часть того же частотного пространства, что и другие инструменты.

Автоматическая транскрипция музыки

Автоматическая транскрипция музыки - это процесс преобразования аудиозаписи в символьную нотацию, например партитуру или файл MIDI. Этот процесс включает в себя несколько задач аудиоанализа, которые могут включать в себя обнаружение многотона, обнаружение начала, оценку продолжительности, идентификацию инструмента и извлечение гармонической, ритмической или мелодической информации. Эта задача усложняется при большем количестве инструментов и большем уровне полифонии.

Музыкальное поколение

Автоматическая генерация музыки является целью проводится многими исследователями MIR. Были предприняты попытки с ограниченным успехом с точки зрения оценки результатов людьми.

Используемые методы

Источник данных

Партитуры дают четкое и логичное описание музыки, над которой нужно работать, но доступ к нотам, цифровым или другим, часто бывает непрактичным. Музыка MIDI также использовалась по тем же причинам, но некоторые данные теряются при преобразовании в MIDI из любого другого формата, если музыка не была написана с учетом стандартов MIDI, что бывает редко. Цифровые аудиоформаты, такие как WAV, mp3 и ogg, используются, когда сам звук является частью анализа. Форматы с потерями, такие как mp3 и ogg, хорошо воспринимаются человеческим ухом, но могут не содержать важных данных для изучения. Кроме того, некоторые кодировки создают артефакты, которые могут ввести в заблуждение любой автоматический анализатор. Несмотря на это, повсеместное распространение mp3 означает, что многие исследования в этой области привлекают их в качестве исходного материала. Метаданные, добытые из Интернета, все чаще включаются в MIR для более всестороннего понимания музыки в ее культурном контексте, и в последнее время это состоит из анализа социальных тегов для музыки.

Представление функции

Для анализа часто может потребоваться некоторое обобщение, а для музыки (как и для многих других форм данных) это достигается путем извлечения признаков, особенно когда анализируется сам аудиоконтент и применяется машинное обучение. Цель состоит в том, чтобы уменьшить огромное количество данных до управляемого набора значений, чтобы обучение могло быть выполнено в разумные сроки. Одна из общих извлеченных черт - это коэффициент Mel-Frequency Cepstral Coefficient (MFCC), который является мерой тембра музыкального произведения. Другие функции могут использоваться для представления тональности, аккордов, гармоний, мелодии, основной высоты звука, ударов в минуту или ритма в пьесе. Существует ряд доступных инструментов для извлечения аудиофайлов, доступных здесь

Статистика и машинное обучение

Вычислительные методы классификации, кластеризации и моделирования - извлечение музыкальных признаков для моно- и полифонической музыки, сходство и сопоставление с образцом, поиск
Формальные методы и базы данных - приложения для автоматической идентификации и распознавания музыки, такие как отслеживание партитуры, автоматическое сопровождение, маршрутизация и фильтрация музыкальных и музыкальных запросов, языки запросов, стандарты и другие метаданные или протоколы для обработки и поиска музыкальной информации, многоагентные системы, распределенный поиск)
Программное обеспечение для поиска музыкальной информации - Semantic Web и музыкальные цифровые объекты, интеллектуальные агенты, программное обеспечение совместной работы, веб-поиск и семантический поиск, запрос по жужжанию / Поиск по звуку, акустическая дактилоскопии
Музыкальный анализ и представление знаний - автоматическое обобщение, цитирование, извлечение, понижение, преобразование, формальные модели музыки, цифровые партитуры и представления, индексация музыки и метаданные.

Другие вопросы

Человеко-компьютерное взаимодействие и интерфейсы - мультимодальные интерфейсы, пользовательские интерфейсы и удобство использования, мобильные приложения, поведение пользователей
Восприятие музыки, познание, аффект и эмоции - метрики сходства музыки, синтаксические параметры, семантические параметры, музыкальные формы, структуры, стили и методологии аннотации музыки
Музыкальные архивы, библиотеки и цифровые коллекции - музыкальные электронные библиотеки, открытый доступ к музыкальным архивам, контрольные показатели и исследовательские базы данных
Права интеллектуальной собственности и музыка - национальные и международные вопросы авторского права, управление цифровыми правами, идентификация и отслеживаемость
Социология и экономика музыки - музыкальная индустрия и использование MIR в производстве, распространении, цепочке потребления, профилирование пользователей, проверка, потребности и ожидания пользователей, оценка музыкальных IR-систем, сборка тестовых коллекций, экспериментальный дизайн и показатели

Академическая деятельность

Конференция Международного общества поиска музыкальной информации (ISMIR) является ведущим местом проведения исследований в области поиска музыкальной информации.
Международная конференция по акустике, речи и обработке сигналов (ICASSP) также является очень актуальным местом.

Смотрите также

использованная литература

Майкл Фингерхат (2004). «Поиск музыкальной информации, или как искать (и, возможно, находить) музыку и покончить с инципитами», Конгресс IAML-IASA, Осло (Норвегия), 8–13 августа 2004 г.

внешние ссылки