Система поиска видео

редактировать

A Система поиска видео - это поисковая система в Интернете, которая сканирует Интернет для видео контента. Некоторые поисковые системы видео анализируют контент, размещенный на внешнем сервере, в то время как другие позволяют загружать контент и размещать его на своих серверах. Некоторые движки также позволяют пользователям выполнять поиск по типу видеоформата и по длине клипа. Результаты поиска видео обычно сопровождаются просмотром видео в виде эскиза.

Поисковые машины по видео - это компьютерные программы, разработанные для поиска видео, хранящихся на цифровых устройствах, либо через Интернет-серверы, либо в устройствах хранения на том же компьютере. Эти поиски могут выполняться с помощью аудиовизуальной индексации, которая может извлекать информацию из аудиовизуального материала и записывать ее в виде метаданных, которые будут отслеживаться поисковыми системами.

Содержание

  • 1 Утилита
  • 2 Критерий поиска
    • 2.1 Метаданные
      • 2.1.1 Внутренние метаданные
      • 2.1.2 Внешние метаданные
        • 2.1.2.1 Название и описание
        • 2.1. 2.2 Имя файла
        • 2.1.2.3 Теги
        • 2.1.2.4 Транскрипция и субтитры
    • 2.2 Распознавание речи
    • 2.3 Распознавание текста
    • 2.4 Анализ кадра
  • 3 Критерий ранжирования
    • 3.1 Порядок по релевантности
    • 3.2 Сортировать по дате загрузки
    • 3.3 Сортировать по количеству просмотров
    • 3.4 Сортировать по длине
    • 3.5 Сортировать по рейтингу пользователя
  • 4 Интерфейса
    • 4.1 Интернет
      • 4.1.1 Хранилища с поисковик видео
      • 4.1.2 Репозитории поисковиков видео
    • 4.2 Частная сеть
  • 5 Дизайн и алгоритмы
  • 6 Поисковые системы видео
    • 6.1 Агностический поиск
    • 6.2 Неагностический поиск
  • 7 См. также
  • 8 Ссылки
  • 9 Внешние ссылки

Утилита

Основное применение этих поисковых систем - это увеличение объема создания аудиовизуального контента и необходимость управления им должным образом. Оцифровка аудиовизуальных архивов и создание Интернета привели к тому, что в больших базах данных хранится большое количество видеофайлов, восстановление которых может быть очень затруднено из-за огромных объемов данных и наличия семантического разрыва.

Критерий поиска

Критерий поиска, используемый каждой поисковой системой, зависит от ее характера и цели поиска.

Метаданные

Метаданные - это информация о фактах. Это может быть информация об авторе видео, дате создания, продолжительности и всей информации, которую можно извлечь и включить в те же файлы. Интернет часто используется на языке под названием XML для кодирования метаданных, который очень хорошо работает через Интернет и читается людьми. Таким образом, с помощью этой информации, содержащейся в этих файлах, проще всего найти интересующие нас данные.

В видео есть два типа метаданных, которые мы можем интегрировать в сам видеокод и внешние метаданные со страницы, на которой находится видео. В обоих случаях мы оптимизируем их, чтобы сделать их идеальными при индексировании.

Внутренние метаданные

Все видеоформаты включают собственные метаданные. Возможны название, описание, качество кодирования или транскрипция контента. Для просмотра этих данных существуют такие программы, как FLV MetaData Injector, Sorenson Squeeze или Castfire. У каждого есть свои утилиты и особые характеристики.

Преобразование из одного формата в другой может привести к потере большей части этих данных, поэтому проверьте правильность информации о новом формате. Поэтому рекомендуется иметь видео в нескольких форматах, чтобы все поисковые роботы могли его найти и проиндексировать.

Внешние метаданные

В большинстве случаев должны применяться те же механизмы, что и при позиционировании изображения или текстового контента.

Название и описание

Они являются наиболее важными факторами при позиционировании видео, поскольку содержат большую часть необходимой информации. Заголовки должны быть четко описательными и удалять все бесполезные слова или фразы.

Имя файла

Оно должно быть описательным, включая ключевые слова, которые описывают видео без необходимости видеть их заголовок или описание. В идеале разделяйте слова тире «-».

Теги

На странице, где находится видео, должен быть список ключевых слов, связанных с микроформатом «rel-tag». Эти слова будут использоваться поисковыми системами как основа для систематизации информации.

Транскрипция и субтитры

Хотя и не полностью стандартные, существуют два формата, в которых информация хранится в указанном временном компоненте: один для субтитров, а другой - для транскриптов, которые также можно использовать для субтитров.. Форматы - SRT или SUB для субтитров и TTXT для стенограмм.

Распознавание речи

Распознавание речи состоит из расшифровки речи звуковой дорожки видео, создавая текстовый файл. Таким образом и с помощью экстрактора фраз можно легко найти интересующий видеоконтент. Некоторые поисковые системы, помимо использования распознавания речи для поиска видео, также используют его для нахождения определенной точки мультимедийного файла, в которой находится определенное слово или фраза, и переходят непосредственно к этой точке. Гауди (Google Audio Indexing), проект, разработанный Google Labs, использует технологию распознавания голоса для определения точного момента произнесения одного или нескольких слов в аудио, позволяя пользователю перейти непосредственно к точному моменту. что слова были сказаны. Если поисковый запрос совпадает с некоторыми видео с YouTube, позиции обозначаются желтыми маркерами, и необходимо навести курсор мыши, чтобы прочитать расшифрованный текст.

Распознавание текста

Распознавание текста может быть очень полезным для распознавания символов в видео через «хироны». Как и в случае с распознавателями речи, существуют поисковые системы, которые позволяют (посредством распознавания символов) воспроизводить видео с определенной точки.

TalkMiner, пример поиска определенных фрагментов из видео с помощью распознавания текста, анализирует каждое видео раз в секунду в поисках идентифицирующих признаков слайда, таких как его форма и статический характер, фиксирует изображение слайда и использует оптическое распознавание символов (OCR) для обнаружения слов на слайдах. Затем эти слова индексируются в поисковой системе TalkMiner, которая в настоящее время предлагает пользователям более 20 000 видео из таких учреждений, как Стэнфордский университет, Калифорнийский университет в Беркли и TED.

Анализ кадра

С помощью визуальных дескрипторов мы можем анализировать кадры видео и извлекать информацию, которая может быть оценена как метаданные. Описания создаются автоматически и могут описывать различные аспекты кадров, такие как цвет, текстура, форма, движение и ситуация.

Критерий ранжирования

Полезность поисковой системы зависит от релевантности возвращенного набора результатов. Хотя могут быть миллионы видеороликов, содержащих определенное слово или фразу, некоторые видеоролики могут быть более актуальными, популярными или иметь больший авторитет, чем другие. Такой порядок имеет прямое отношение к поисковой оптимизации.

Большинство поисковых систем используют разные методы для классификации результатов и предоставления лучшего видео в первых результатах. Однако большинство программ позволяет сортировать результаты по нескольким критериям.

Упорядочить по релевантности

Этот критерий более неоднозначен и менее объективен, но иногда он наиболее близок к тому, что мы хотим; полностью зависит от поисковика и алгоритма, выбранного владельцем. Вот почему это всегда обсуждалось, а теперь, когда результаты поиска так прочно укоренились в нашем обществе, они обсуждались еще больше. Этот тип управления часто зависит от количества появлений искомого слова, количества его просмотров, количества страниц, ссылающихся на этот контент, и оценок, выставленных пользователями, которые его видели.

Упорядочить по дате загрузки

Этот критерий полностью основан на временной шкале. Результаты можно отсортировать по старшинству в хранилище.

Упорядочить по количеству просмотров

Это может дать нам представление о популярности каждого видео.

Упорядочить по длине

Это длина видео, которая может дать представление о том, какое это видео.

Упорядочить по рейтингу пользователей

Обычной практикой в ​​репозиториях является предоставление пользователям возможности оценивать видео, чтобы качественный и релевантный контент занимал высокое место в списке результатов, становящихся заметнее. Эта практика тесно связана с виртуальными сообществами.

Интерфейсы

Мы можем выделить два основных типа интерфейсов: некоторые из них представляют собой веб-страницы, размещенные на серверах, к которым осуществляется доступ через Интернет и поиск по сети, а другие - компьютерные программы, выполняющие поиск в частная сеть.

Интернет

В интерфейсах Интернета мы можем найти репозитории, в которых размещаются видеофайлы, которые включают поисковую систему, которая выполняет поиск только в собственных базах данных, и программы поиска видео без репозитория, которые ищут в источниках внешнего программного обеспечения.

Хранилища со средством поиска видео

Обеспечивает размещение в видеофайлах, хранящихся на его серверах, и обычно имеет встроенную поисковую систему, которая выполняет поиск по видео, загруженным пользователями. Одними из первых веб-репозиториев или, по крайней мере, самыми известными являются порталы Vimeo, Dailymotion и YouTube.

Их поиск часто основан на чтении тегов метаданных, заголовков и описаний, которые пользователи присваивают своим видео. Критерий распределения и порядка результатов этих поисков обычно выбирается между датой загрузки файла, количеством просмотров или тем, что они называют релевантностью. Тем не менее, критерий сортировки в настоящее время является основным оружием этих сайтов, потому что позиционирование видео важно с точки зрения продвижения.

Репозитории искателей видео

Это веб-сайты, специализирующиеся на поиске видео в сети или в определенных заранее выбранных репозиториях. Они работают с помощью веб-пауков, которые проверяют сеть автоматически, чтобы создавать копии посещенных веб-сайтов, которые затем индексируются поисковыми системами, чтобы они могли обеспечивать более быстрый поиск.

Частная сеть

Схема работы

Иногда поисковая система выполняет поиск только в аудиовизуальных файлах, хранящихся на компьютере или, как это происходит в телевизорах, на частном сервере, к которому пользователи получают доступ через локальную сеть. Эти средства поиска обычно представляют собой программное обеспечение или многофункциональные Интернет-приложения с очень специфическими параметрами поиска для максимальной скорости и эффективности при представлении результатов. Обычно они используются для больших баз данных и поэтому ориентированы на удовлетворение потребностей телевизионных компаний. Примером такого типа программного обеспечения может быть Digition Suite, который, помимо того, что является эталоном для такого рода интерфейсов, очень близок нам в отношении системы хранения и поиска файлов из Corporació Catalana de Mitjans Audiovisuals.

Этот конкретный пакет и, возможно, его самая сильная сторона, заключается в том, что он объединяет весь процесс создания, индексации, хранения, поиска, редактирования и восстановления. После того, как у нас есть оцифрованный аудиовизуальный контент, он индексируется с помощью различных методов разного уровня в зависимости от важности контента и хранится. Пользователь, когда он хочет получить конкретный файл, должен заполнить поля поиска, такие как название программы, дата выпуска, действующие персонажи или имя производителя, и робот начинает поиск. Как только появятся результаты и они будут упорядочены в соответствии с предпочтениями, пользователь может воспроизводить видео низкого качества, чтобы работать как можно быстрее. Когда он находит желаемый контент, он загружается с хорошим разрешением, редактируется и воспроизводится.

Дизайн и алгоритмы

Поиск видео медленно развивался благодаря нескольким основным форматам поиска, которые существуют сегодня и все используют ключевые слова. Ключевые слова для каждого поиска можно найти в названии медиа, любом тексте, прикрепленном к медиа, и связанных с контентом веб-страницах, также определяемых авторами и пользователями размещенных на видео ресурсов.

Некоторые поиски видео выполняются с использованием поиска, выполняемого человеком, другие создают технологические системы, которые работают автоматически, чтобы обнаруживать, что находится в видео, и соответствовать потребностям искателей. Много усилий по улучшению поиска видео, включая поиск с помощью человека, а также алгоритм написания, который распознает, что находится внутри видео, означали полную переработку усилий по поиску.

Общепризнано, что преобразование речи в текст возможно, хотя недавно Томас Уайлд, новый генеральный директор Everyzing, признал, что Everyzing работает 70% времени, когда есть музыка, окружающий шум или более одного человека говорят. Если доступен стиль выпуска новостей (один человек говорит четко, без постороннего шума), это может возрасти до 93%. (С Саммита веб-видео, Сан-Хосе, Калифорния, 27 июня 2007 г.).

Около 40 фонем существует на каждом языке, из них около 400 - на всех разговорных языках. Вместо того, чтобы применять алгоритм текстового поиска после завершения преобразования речи в текст, некоторые системы используют алгоритм фонетического поиска для поиска результатов в пределах произнесенного слова. Другие работают, буквально слушая весь подкаст и создавая транскрипцию текста, используя сложный процесс преобразования речи в текст. После создания текстового файла в нем можно искать любое количество поисковых слов и фраз.

Общепризнано, что визуальный поиск видео не работает должным образом и что ни одна компания не использует его публично. Исследователи из Калифорнийского университета в Сан-Диего и Университета Карнеги-Меллона работали над проблемой визуального поиска более 15 лет и признались на конференции «Будущее поиска» в Калифорнийском университете в Беркли весной 2007 года, что до того момента, как эта задача станет жизнеспособной даже в простых поиск.

Поисковые системы видео

Агностический поиск

Поиск, на который не влияет хостинг видео, где результаты не зависят от того, где находится видео:

  • blinkx был запущен в 2004 году и использует распознавание речи и визуальный анализ для обработки паучкового видео, а не полагается только на метаданные. blinkx утверждает, что имеет самый большой архив видео в сети и размещает свою коллекцию примерно в 26 000 000 часов контента.
  • CastTV - это система поиска видео по всему Интернету, основанная в 2006 году и финансируемая Draper Фишер Юрветсон, Рон Конвей и Марк Андриссен.
  • Munax выпустили свою первую версию поисковой системы по всему контенту в 2005 году, которая обеспечивает поиск видео по всей стране и по всему миру..
  • Picsearch Поиск видео лицензирован для поисковых порталов с 2006 года. Picsearch - поставщик поисковых технологий, обеспечивающий поиск изображений, видео и аудио для более чем 100 основных поисковых систем по всему миру.

Неагностический поиск

Результаты поиска изменены или подозрительны из-за того, что большой размер размещенного видео получает приоритет в результатах поиска:

  • AOL Видео предлагает систему поиска видео, которую можно использовать для поиска видео, расположенного на популярные видеоресурсы в Интернете. В декабре 2005 года AOL приобрела Truveo Video Search.
  • Поиск видео Bing - это поисковая система, работающая на Bing, а также используемая Yahoo! Поиск видео.
  • Google Videos - это система поиска видео от Google.
  • Tencent Video, предлагающая поиск видео от Tencent.

См. Также

Ссылки

  1. ^(на английском языке) SEO by Google central веб-мастер
  2. ^(на каталанском языке) Оцифровывай или умри (Алисия Конеса) Архивировано 8 июля 2011 г. на Wayback Machine
  3. ^(на каталонском) Digition Suite от Activa Multimedia

Внешние ссылки

Процесс работы поисковых систем (на английском языке)
Последняя правка сделана 2021-06-18 12:59:05
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте