A Система поиска видео - это поисковая система в Интернете, которая сканирует Интернет для видео контента. Некоторые поисковые системы видео анализируют контент, размещенный на внешнем сервере, в то время как другие позволяют загружать контент и размещать его на своих серверах. Некоторые движки также позволяют пользователям выполнять поиск по типу видеоформата и по длине клипа. Результаты поиска видео обычно сопровождаются просмотром видео в виде эскиза.
Поисковые машины по видео - это компьютерные программы, разработанные для поиска видео, хранящихся на цифровых устройствах, либо через Интернет-серверы, либо в устройствах хранения на том же компьютере. Эти поиски могут выполняться с помощью аудиовизуальной индексации, которая может извлекать информацию из аудиовизуального материала и записывать ее в виде метаданных, которые будут отслеживаться поисковыми системами.
Основное применение этих поисковых систем - это увеличение объема создания аудиовизуального контента и необходимость управления им должным образом. Оцифровка аудиовизуальных архивов и создание Интернета привели к тому, что в больших базах данных хранится большое количество видеофайлов, восстановление которых может быть очень затруднено из-за огромных объемов данных и наличия семантического разрыва.
Критерий поиска, используемый каждой поисковой системой, зависит от ее характера и цели поиска.
Метаданные - это информация о фактах. Это может быть информация об авторе видео, дате создания, продолжительности и всей информации, которую можно извлечь и включить в те же файлы. Интернет часто используется на языке под названием XML для кодирования метаданных, который очень хорошо работает через Интернет и читается людьми. Таким образом, с помощью этой информации, содержащейся в этих файлах, проще всего найти интересующие нас данные.
В видео есть два типа метаданных, которые мы можем интегрировать в сам видеокод и внешние метаданные со страницы, на которой находится видео. В обоих случаях мы оптимизируем их, чтобы сделать их идеальными при индексировании.
Все видеоформаты включают собственные метаданные. Возможны название, описание, качество кодирования или транскрипция контента. Для просмотра этих данных существуют такие программы, как FLV MetaData Injector, Sorenson Squeeze или Castfire. У каждого есть свои утилиты и особые характеристики.
Преобразование из одного формата в другой может привести к потере большей части этих данных, поэтому проверьте правильность информации о новом формате. Поэтому рекомендуется иметь видео в нескольких форматах, чтобы все поисковые роботы могли его найти и проиндексировать.
В большинстве случаев должны применяться те же механизмы, что и при позиционировании изображения или текстового контента.
Они являются наиболее важными факторами при позиционировании видео, поскольку содержат большую часть необходимой информации. Заголовки должны быть четко описательными и удалять все бесполезные слова или фразы.
Оно должно быть описательным, включая ключевые слова, которые описывают видео без необходимости видеть их заголовок или описание. В идеале разделяйте слова тире «-».
На странице, где находится видео, должен быть список ключевых слов, связанных с микроформатом «rel-tag». Эти слова будут использоваться поисковыми системами как основа для систематизации информации.
Хотя и не полностью стандартные, существуют два формата, в которых информация хранится в указанном временном компоненте: один для субтитров, а другой - для транскриптов, которые также можно использовать для субтитров.. Форматы - SRT или SUB для субтитров и TTXT для стенограмм.
Распознавание речи состоит из расшифровки речи звуковой дорожки видео, создавая текстовый файл. Таким образом и с помощью экстрактора фраз можно легко найти интересующий видеоконтент. Некоторые поисковые системы, помимо использования распознавания речи для поиска видео, также используют его для нахождения определенной точки мультимедийного файла, в которой находится определенное слово или фраза, и переходят непосредственно к этой точке. Гауди (Google Audio Indexing), проект, разработанный Google Labs, использует технологию распознавания голоса для определения точного момента произнесения одного или нескольких слов в аудио, позволяя пользователю перейти непосредственно к точному моменту. что слова были сказаны. Если поисковый запрос совпадает с некоторыми видео с YouTube, позиции обозначаются желтыми маркерами, и необходимо навести курсор мыши, чтобы прочитать расшифрованный текст.
Распознавание текста может быть очень полезным для распознавания символов в видео через «хироны». Как и в случае с распознавателями речи, существуют поисковые системы, которые позволяют (посредством распознавания символов) воспроизводить видео с определенной точки.
TalkMiner, пример поиска определенных фрагментов из видео с помощью распознавания текста, анализирует каждое видео раз в секунду в поисках идентифицирующих признаков слайда, таких как его форма и статический характер, фиксирует изображение слайда и использует оптическое распознавание символов (OCR) для обнаружения слов на слайдах. Затем эти слова индексируются в поисковой системе TalkMiner, которая в настоящее время предлагает пользователям более 20 000 видео из таких учреждений, как Стэнфордский университет, Калифорнийский университет в Беркли и TED.
С помощью визуальных дескрипторов мы можем анализировать кадры видео и извлекать информацию, которая может быть оценена как метаданные. Описания создаются автоматически и могут описывать различные аспекты кадров, такие как цвет, текстура, форма, движение и ситуация.
Полезность поисковой системы зависит от релевантности возвращенного набора результатов. Хотя могут быть миллионы видеороликов, содержащих определенное слово или фразу, некоторые видеоролики могут быть более актуальными, популярными или иметь больший авторитет, чем другие. Такой порядок имеет прямое отношение к поисковой оптимизации.
Большинство поисковых систем используют разные методы для классификации результатов и предоставления лучшего видео в первых результатах. Однако большинство программ позволяет сортировать результаты по нескольким критериям.
Этот критерий более неоднозначен и менее объективен, но иногда он наиболее близок к тому, что мы хотим; полностью зависит от поисковика и алгоритма, выбранного владельцем. Вот почему это всегда обсуждалось, а теперь, когда результаты поиска так прочно укоренились в нашем обществе, они обсуждались еще больше. Этот тип управления часто зависит от количества появлений искомого слова, количества его просмотров, количества страниц, ссылающихся на этот контент, и оценок, выставленных пользователями, которые его видели.
Этот критерий полностью основан на временной шкале. Результаты можно отсортировать по старшинству в хранилище.
Это может дать нам представление о популярности каждого видео.
Это длина видео, которая может дать представление о том, какое это видео.
Обычной практикой в репозиториях является предоставление пользователям возможности оценивать видео, чтобы качественный и релевантный контент занимал высокое место в списке результатов, становящихся заметнее. Эта практика тесно связана с виртуальными сообществами.
Мы можем выделить два основных типа интерфейсов: некоторые из них представляют собой веб-страницы, размещенные на серверах, к которым осуществляется доступ через Интернет и поиск по сети, а другие - компьютерные программы, выполняющие поиск в частная сеть.
В интерфейсах Интернета мы можем найти репозитории, в которых размещаются видеофайлы, которые включают поисковую систему, которая выполняет поиск только в собственных базах данных, и программы поиска видео без репозитория, которые ищут в источниках внешнего программного обеспечения.
Обеспечивает размещение в видеофайлах, хранящихся на его серверах, и обычно имеет встроенную поисковую систему, которая выполняет поиск по видео, загруженным пользователями. Одними из первых веб-репозиториев или, по крайней мере, самыми известными являются порталы Vimeo, Dailymotion и YouTube.
Их поиск часто основан на чтении тегов метаданных, заголовков и описаний, которые пользователи присваивают своим видео. Критерий распределения и порядка результатов этих поисков обычно выбирается между датой загрузки файла, количеством просмотров или тем, что они называют релевантностью. Тем не менее, критерий сортировки в настоящее время является основным оружием этих сайтов, потому что позиционирование видео важно с точки зрения продвижения.
Это веб-сайты, специализирующиеся на поиске видео в сети или в определенных заранее выбранных репозиториях. Они работают с помощью веб-пауков, которые проверяют сеть автоматически, чтобы создавать копии посещенных веб-сайтов, которые затем индексируются поисковыми системами, чтобы они могли обеспечивать более быстрый поиск.
Иногда поисковая система выполняет поиск только в аудиовизуальных файлах, хранящихся на компьютере или, как это происходит в телевизорах, на частном сервере, к которому пользователи получают доступ через локальную сеть. Эти средства поиска обычно представляют собой программное обеспечение или многофункциональные Интернет-приложения с очень специфическими параметрами поиска для максимальной скорости и эффективности при представлении результатов. Обычно они используются для больших баз данных и поэтому ориентированы на удовлетворение потребностей телевизионных компаний. Примером такого типа программного обеспечения может быть Digition Suite, который, помимо того, что является эталоном для такого рода интерфейсов, очень близок нам в отношении системы хранения и поиска файлов из Corporació Catalana de Mitjans Audiovisuals.
Этот конкретный пакет и, возможно, его самая сильная сторона, заключается в том, что он объединяет весь процесс создания, индексации, хранения, поиска, редактирования и восстановления. После того, как у нас есть оцифрованный аудиовизуальный контент, он индексируется с помощью различных методов разного уровня в зависимости от важности контента и хранится. Пользователь, когда он хочет получить конкретный файл, должен заполнить поля поиска, такие как название программы, дата выпуска, действующие персонажи или имя производителя, и робот начинает поиск. Как только появятся результаты и они будут упорядочены в соответствии с предпочтениями, пользователь может воспроизводить видео низкого качества, чтобы работать как можно быстрее. Когда он находит желаемый контент, он загружается с хорошим разрешением, редактируется и воспроизводится.
Поиск видео медленно развивался благодаря нескольким основным форматам поиска, которые существуют сегодня и все используют ключевые слова. Ключевые слова для каждого поиска можно найти в названии медиа, любом тексте, прикрепленном к медиа, и связанных с контентом веб-страницах, также определяемых авторами и пользователями размещенных на видео ресурсов.
Некоторые поиски видео выполняются с использованием поиска, выполняемого человеком, другие создают технологические системы, которые работают автоматически, чтобы обнаруживать, что находится в видео, и соответствовать потребностям искателей. Много усилий по улучшению поиска видео, включая поиск с помощью человека, а также алгоритм написания, который распознает, что находится внутри видео, означали полную переработку усилий по поиску.
Общепризнано, что преобразование речи в текст возможно, хотя недавно Томас Уайлд, новый генеральный директор Everyzing, признал, что Everyzing работает 70% времени, когда есть музыка, окружающий шум или более одного человека говорят. Если доступен стиль выпуска новостей (один человек говорит четко, без постороннего шума), это может возрасти до 93%. (С Саммита веб-видео, Сан-Хосе, Калифорния, 27 июня 2007 г.).
Около 40 фонем существует на каждом языке, из них около 400 - на всех разговорных языках. Вместо того, чтобы применять алгоритм текстового поиска после завершения преобразования речи в текст, некоторые системы используют алгоритм фонетического поиска для поиска результатов в пределах произнесенного слова. Другие работают, буквально слушая весь подкаст и создавая транскрипцию текста, используя сложный процесс преобразования речи в текст. После создания текстового файла в нем можно искать любое количество поисковых слов и фраз.
Общепризнано, что визуальный поиск видео не работает должным образом и что ни одна компания не использует его публично. Исследователи из Калифорнийского университета в Сан-Диего и Университета Карнеги-Меллона работали над проблемой визуального поиска более 15 лет и признались на конференции «Будущее поиска» в Калифорнийском университете в Беркли весной 2007 года, что до того момента, как эта задача станет жизнеспособной даже в простых поиск.
Поиск, на который не влияет хостинг видео, где результаты не зависят от того, где находится видео:
Результаты поиска изменены или подозрительны из-за того, что большой размер размещенного видео получает приоритет в результатах поиска:
Процесс работы поисковых систем (на английском языке)