Гипотеза эффективного кодирования

редактировать

Гипотеза эффективного кодирования была предложена Хорасом Барлоу в 1961 году в качестве теоретического модель сенсорного кодирования в мозге. Внутри мозга нейроны общаются друг с другом, посылая электрические импульсы, называемые потенциалами действия или пиками. Одна из целей сенсорной нейробиологии - расшифровать значение этих всплесков, чтобы понять, как мозг представляет и обрабатывает информацию о внешнем мире. Барлоу предположил, что всплески в сенсорной системе формируют нейронный код для эффективного представления сенсорной информации. Под эффективным Барлоу подразумевается, что код минимизирует количество всплесков, необходимых для передачи заданного сигнала. Это в некоторой степени аналогично передаче информации через Интернет, где для передачи данного изображения могут использоваться различные форматы файлов. Для разных форматов файлов требуется разное количество битов для представления одного и того же изображения при заданном уровне искажения, и некоторые из них лучше подходят для представления определенных классов изображений, чем другие. Согласно этой модели, мозг использует код, который подходит для представления визуальной и звуковой информации, представляющей естественную среду организма.

Меченый нейрон
Содержание
  • 1 Эффективное кодирование и теория информации
  • 2 Ограничения на зрительную систему
  • 3 Нейронная система, основанная на эволюции
  • 4 Естественные образы и статистика
  • 5 Гипотезы для проверка гипотезы эффективного кодирования
  • 6 Методологические подходы для проверки гипотез
    • 6.1 Примеры этих подходов
  • 7 Расширения
  • 8 Критика
  • 9 Биомедицинские приложения
  • 10 Ссылки
Эффективное кодирование и теория информации

На развитие гипотезы Барлоу повлияла теория информации, представленная Клодом Шенноном всего за десять лет до этого. Теория информации обеспечивает математическую основу для анализа систем связи. Он формально определяет такие понятия, как информация, пропускная способность канала и избыточность. Модель Барлоу рассматривает сенсорный путь как канал связи, где нейрональные импульсы являются эффективным кодом для представления сенсорных сигналов. Пиковый код направлен на максимальное увеличение доступной пропускной способности канала путем минимизации избыточности между репрезентативными блоками. Х. Барлоу был не первым, кто представил эту идею: она уже появилась в статье 1954 года, написанной Ф. Атнивом.

Ключевым предсказанием гипотезы эффективного кодирования является то, что сенсорная обработка в мозге должна быть адаптирован к естественным раздражителям. Нейроны в зрительной (или слуховой) системе должны быть оптимизированы для кодирования изображений (или звуков), характерных для тех, что встречаются в природе. Исследователи показали, что фильтры, оптимизированные для кодирования естественных изображений, приводят к фильтрам, которые напоминают воспринимающие поля простых ячеек в V1. В слуховой области оптимизация сети для кодирования естественных звуков приводит к фильтрам, которые напоминают импульсную характеристику кохлеарных фильтров, обнаруженных в внутреннем ухе.

Ограничения на зрительную систему

Из-за ограничений на Для визуальной системы, такой как количество нейронов и метаболическая энергия, необходимая для «нейронной активности», система визуальной обработки должна иметь эффективную стратегию для передачи как можно большего количества информации. Информация должна сжиматься, поскольку она перемещается от сетчатки обратно в зрительную кору. В то время как рецепторы сетчатки могут получать информацию со скоростью 10 ^ 9 бит / с, зрительный нерв, который состоит из 1 миллиона ганглиозных клеток, передающих со скоростью 1 бит / с, имеет только передачу пропускная способность 10 ^ 6 бит / с. Происходит дальнейшее сокращение, которое ограничивает общую передачу до 40 бит / с, что приводит к слепоте по невнимательности. Таким образом, гипотеза утверждает, что нейроны должны кодировать информацию настолько эффективно, насколько это возможно, чтобы максимизировать нейронные ресурсы. Например, было показано, что визуальные данные могут быть сжаты до 20 раз без заметной потери информации.

Имеются данные, свидетельствующие о том, что наша система визуальной обработки задействована в выборе снизу вверх. Например, слепота по невнимательности предполагает, что удаление данных должно происходить на ранней стадии зрительного пути. Этот восходящий подход позволяет нам быстрее реагировать на неожиданные и важные события и часто управляется выбором с вниманием. Это также придает нашей визуальной системе свойство целенаправленности. Многие предположили, что зрительная система способна работать эффективно, разбивая изображения на отдельные компоненты. Кроме того, утверждалось, что визуальная система использует преимущество избыточности входных данных, чтобы передавать как можно больше информации при использовании наименьшего количества ресурсов.

Нейронная система, основанная на эволюции

Симончелли и Ольсхаузен выделяет три основных концепции, которые, как предполагается, участвуют в развитии системной нейробиологии:

  1. у организма есть определенные задачи, которые нужно выполнять
  2. нейроны имеют возможности и ограничения
  3. организм находится в в конкретной среде.

Одно предположение, использованное при проверке гипотезы эффективного кодирования, состоит в том, что нейроны должны быть эволюционно и эволюционно адаптированы к естественным сигналам в их среде. Идея состоит в том, что системы восприятия будут быстрее всего реагировать на «раздражители окружающей среды». Зрительная система должна исключать любую избыточность в сенсорном вводе.

Естественные образы и статистика

Центральным элементом гипотезы Барлоу является теория информации, которая применима к нейробиология утверждает, что эффективно кодирующая нейронная система «должна соответствовать статистике сигналов, которые они представляют». Следовательно, важно иметь возможность определять статистику естественных изображений, которые создают эти сигналы. Исследователи изучили различные компоненты естественных изображений, включая контраст яркости, цвет и то, как изображения регистрируются с течением времени. Они могут анализировать свойства естественных сцен с помощью цифровых камер, спектрофотометров и дальномеров.

Исследователи изучают, как контрасты яркости пространственно распределены на изображении: контрасты яркости сильно коррелируют с чем ближе расстояние между ними и меньше они коррелированы, чем дальше друг от друга пиксели. Независимый компонентный анализ (ICA) - это система с алгоритмом , которая пытается «линейно преобразовать данные (сенсорные) входные данные в независимые выходы (синаптические токи) ». ICA устраняет избыточность за счет декорреляции пикселей в естественном изображении. Таким образом, отдельные компоненты, составляющие естественное изображение, визуализируются статистически независимыми. Однако исследователи считали, что ICA ограничена, поскольку предполагает, что нейронная реакция является линейной, и поэтому недостаточно описывает сложность естественных изображений. Они утверждают, что, несмотря на то, что предполагается в рамках ICA, компоненты естественного изображения имеют «структуру более высокого порядка», которая включает корреляции между компонентами. Вместо этого исследователи разработали анализ независимых во времени (TICA), который лучше отражает сложные корреляции, возникающие между компонентами естественного изображения. Кроме того, «иерархическая ковариационная модель», разработанная Карклином и Левицки, расширяет методы разреженного кодирования и может представлять дополнительные компоненты естественных изображений, такие как «расположение объекта, масштаб и текстура».

Хроматические спектры в том виде, в котором они исходят от естественного света, а также отражаются от «природных материалов», могут быть легко охарактеризованы с помощью анализа основных компонентов (PCA). Поскольку конусы поглощают определенное количество фотонов из естественного изображения, исследователи могут использовать отклики конусов как способ описания естественного изображения. Исследователи обнаружили, что три класса рецепторов колбочек в сетчатке могут точно кодировать естественные изображения и что цвет декоррелирован уже в LGN. Время также было смоделировано: естественные изображения со временем трансформируются, и мы можем использовать эти преобразования, чтобы увидеть, как визуальный ввод изменяется с течением времени.

Падегогический обзор эффективного кодирования при визуальной обработке --- эффективное пространственное кодирование, цветовое кодирование, временное кодирование / кодирование движения, стереокодирование и их комбинация --- находятся в главе 3 книги «Понимание зрения: теория, модели и данные». В нем объясняется, как эффективно реализуется кодирование, когда входной шум создает Уменьшение избыточности уже не адекватно, и насколько эффективное кодирование в разных ситуациях связано друг с другом или отличается друг от друга.

Гипотезы для проверки гипотезы эффективного кодирования

Если нейроны кодируют в соответствии с гипотезой эффективного кодирования, то отдельные нейроны должны выражать свою полную выходную способность. Перед проверкой этой гипотезы необходимо определить, что считается нейронным ответом. Симончелли и Ольсхаузен предполагают, что эффективному нейрону нужно дать максимальное значение ответа, чтобы мы могли измерить, является ли нейрон эффективным. соответствие максимальному уровню. Во-вторых, совокупность нейронов не должна быть избыточной при передаче сигналов и должна быть статистически независимой. Если гипотеза эффективного кодирования верна, исследователи должны заметить, что в ответах нейронов имеется разреженность: то есть только несколько нейронов одновременно должны срабатывать для ввода.

Методологические подходы к проверке гипотез

Один из подходов - разработать модель для ранней сенсорной обработки на основе статистики естественного изображения, а затем сравнить эту предсказанную модель с тем, как реальные нейроны фактически реагируют на естественное изображение. Второй подход состоит в том, чтобы измерить реакцию нейронной системы на естественную среду и проанализировать результаты, чтобы увидеть, есть ли какие-либо статистические свойства этой реакции.

Примеры этих подходов

1. Подход на основе прогнозируемой модели

В одном исследовании Doi et al. в 2012 году исследователи создали модель прогнозируемой реакции ганглиозных клеток сетчатки, которая будет основана на статистике используемых естественных изображений, с учетом шума и биологических ограничений. Затем они сравнили фактическую передачу информации, наблюдаемую в реальных ганглиозных клетках сетчатки, с этой оптимальной моделью, чтобы определить эффективность. Они обнаружили, что передача информации в ганглиозных клетках сетчатки имела общую эффективность около 80%, и пришли к выводу, что «функциональная связь между колбочками и ганглиозными клетками сетчатки проявляет уникальную пространственную структуру... совместимую с эффективностью кодирования.

В исследовании, проведенном ван Хатереном и Рудерманом в 1998 году, ICA использовалась для анализа видеопоследовательностей и сравнения того, как компьютер анализировал независимые компоненты изображения, с данными для визуальной обработки, полученными от кошки в DeAngelis et al. 1993. Исследователи описали независимые компоненты, полученные из видеопоследовательности, как «основные строительные блоки сигнала», а фильтр независимых компонентов (ICF) измеряет «степень присутствия каждого строительного блока». Они выдвинули гипотезу, что если простые ячейки организованы так, чтобы выбрать «базовую структуру» изображений с течением времени, тогда ячейки должны действовать как фильтры независимых компонентов. Они обнаружили, что ICF, определенные компьютером, были аналогичны «рецептивные поля ", которые наблюдались в реальных нейронах.

Расположение первичной зрительной коры справа

2. Анализ реальной нейронной системы в ответ на естественные изображения

В отчете в Science от 2000 года Уильям Э. Винье и Джек Галлант описали серию экспериментов, используемых для проверки элементов гипотезы эффективного кодирования., включая теорию о том, что неклассическое рецептивное поле (nCRF) декоррелирует проекции из первичной зрительной коры. Чтобы проверить это, они взяли записи нейронов V1 у бодрствующих макак во время «свободного просмотра естественных изображений и условий», имитирующих условия естественного зрения. Исследователи предположили, что V1 использует разреженный код, который минимально избыточен и «метаболически более эффективен». Они также выдвинули гипотезу о том, что взаимодействия между классическим рецептивным полем (CRF) и nCRF производят этот образец разреженного кодирования во время просмотра этих естественных сцен. Чтобы проверить это, они создали пути сканирования глаз, а также извлекли участки, размер которых варьировался от 1 до 4 диаметров CRF. Они обнаружили, что разреженность кода увеличивается с размером патча. Более крупные участки охватывают большую часть нИРК, что указывает на то, что взаимодействия между этими двумя областями создают разреженный код. Кроме того, по мере увеличения размера стимула увеличивалась и разреженность. Это говорит о том, что V1 использует разреженный код, когда естественные изображения охватывают все поле зрения . CRF был определен как круглая область, окружающая места, где стимулы вызывали потенциалы действия. Они также протестировали, чтобы увидеть, увеличивает ли стимуляция nCRF независимость ответов от нейронов V1 путем случайного выбора пар нейронов. Они обнаружили, что действительно нейроны были сильнее разделены при стимуляции nCRF. В заключение, эксперименты Винье и Галланта показали, что V1 использует разреженный код, используя как CRF, так и nCRF при просмотре естественных изображений, причем nCRF демонстрирует определенный декоррелирующий эффект на нейроны, который может повысить их эффективность за счет увеличения количества независимой информации. они несут. Они предполагают, что клетки могут представлять отдельные компоненты данной естественной сцены, которые могут способствовать распознаванию образов

Другое исследование, проведенное Baddeley et al. показали, что распределение скорости возбуждения нейронов V1 визуальной области кошки и инферотемпоральных (IT) нейронов обезьяны было экспоненциальным в естественных условиях, что подразумевает оптимальную передачу информации для фиксированной средней скорости возбуждения. Последующее исследование IT-нейронов обезьян обнаружило, что только меньшая их часть хорошо описывалась экспоненциальным распределением возбуждений. Де Полавьеха позже утверждал, что это расхождение связано с тем, что экспоненциальное решение верно только для случая отсутствия шума, и показал, что, принимая во внимание шум, можно учесть наблюдаемые результаты.

A В исследовании Дэна, Аттика и Рида в 1996 году использовались естественные образы для проверки гипотезы о том, что на ранней стадии зрительного пути входящие зрительные сигналы будут декоррелированы для оптимизации эффективности. Эту декорреляцию можно наблюдать как «побеление» временных и пространственных спектров мощности нейронных сигналов ». Исследователи показали фильмы с естественным изображением перед кошками и использовали многоэлектродную матрицу для записи нейронных сигналов. Это было достигнуто за счет преломления глаз кошек и последующей установки им контактных линз. Они обнаружили, что в LGN естественные изображения были декоррелированы, и пришли к выводу, что «ранний зрительный путь специально адаптирован для эффективного кодирование естественной визуальной информации в процессе эволюции и / или развития ".

Расширения

Одним из следствий гипотезы эффективного кодирования является то, что нейронное кодирование зависит от статистики сенсорных сигналов. Эти статистические данные являются функцией не только окружающей среды (например, статистика естественной среды), но и поведения организма (например, того, как он перемещается в этой среде). Однако восприятие и поведение тесно взаимосвязаны в цикл восприятие-действие. Например, процесс зрения включает в себя различные виды движений глаз. Расширение гипотезы эффективного кодирования, называемое активное эффективное кодирование (AEC), расширяет эффективное кодирование до активного восприятия. Он предполагает, что биологические агенты оптимизируют не только свое нейронное кодирование, но и свое поведение, чтобы внести свой вклад в эффективное сенсорное представление окружающей среды. В соответствии с этим были предложены модели развития активного бинокулярного зрения и активного визуального отслеживания.

. Мозг имеет ограниченные ресурсы для обработки информации, в зрении это проявляется как узкое место зрительного внимания. Узкое место заставляет мозг выбирать только небольшую часть входной визуальной информации для дальнейшей обработки, поскольку простого эффективного кодирования информации уже недостаточно. Последующая теория была развита на экзогенном выборе внимания визуальной входной информации для дальнейшей обработки, руководствуясь восходящей картой заметности в первичной зрительной коре.

Критика

Исследователям следует подумать о том, как используется визуальная информация : Гипотеза не объясняет, как используется информация из визуальной сцены, что является основной целью визуальной системы. Кажется необходимым понять, почему мы обрабатываем статистику изображений из среды, потому что это может иметь отношение к тому, как эта информация в конечном итоге обрабатывается. Однако некоторые исследователи могут рассматривать несоответствие цели зрения в теории Барлоу как преимущество для планирования экспериментов.

Некоторые эксперименты показывают корреляцию между нейронами : при одновременном рассмотрении нескольких нейронов записи «показывают корреляцию, синхронизацию., или другие формы статистической зависимости между нейронами ». Однако уместно отметить, что в большинстве этих экспериментов не использовались естественные стимулы, чтобы вызвать эти ответы: это может не соответствовать непосредственно гипотезе эффективного кодирования, поскольку эта гипотеза касается статистики естественных изображений. В своей обзорной статье Симончелли отмечает, что, возможно, мы можем интерпретировать избыточность в гипотезе эффективного кодирования несколько иначе: он утверждает, что статистическая зависимость может быть уменьшена на «последовательных этапах обработки», а не только в одной области сенсорный путь

Наблюдаемая избыточность : сравнение количества ганглиозных клеток сетчатки с количеством нейронов в первичной зрительной коре показывает увеличение количества сенсорных нейронов в коре по сравнению с сетчаткой. Симончелли отмечает, что один из основных аргументов критиков заключается в том, что выше на сенсорном пути находится большее количество нейронов, которые обрабатывают сенсорную информацию, так что это должно, по-видимому, производить избыточность. Однако это наблюдение может быть не полностью релевантным, потому что нейроны имеют разное нейронное кодирование. В своем обзоре Симончелли отмечает, что «нейроны коры имеют более низкую частоту возбуждения и могут использовать другую форму кода по сравнению с нейронами сетчатки». Корковые нейроны также могут иметь способность кодировать информацию в течение более длительных периодов времени, чем их ретинальные аналоги. Эксперименты, проведенные в слуховой системе, подтвердили, что избыточность уменьшается.

Трудно проверить : оценка теоретико-информационных величин требует огромных объемов данных и, таким образом, непрактична для экспериментальной проверки. Кроме того, известно, что информационные оценки необъективны. Тем не менее, некоторый экспериментальный успех был достигнут.

Необходимы четко определенные критерии того, что нужно измерять : эта критика иллюстрирует один из самых фундаментальных вопросов гипотезы. Здесь сделаны предположения об определениях как входов, так и выходов системы. Входы в визуальную систему полностью не определены, но предполагается, что они заключены в коллекцию естественных изображений. Выходные данные должны быть определены для проверки гипотезы, но здесь также может иметь место изменчивость, основанная на выборе того, какой тип нейронов измерять, где они расположены, и какой тип ответов, таких как частота импульсов или время всплесков, выбирается для измерения..

Как учитывать шум : Некоторые утверждают, что эксперименты, игнорирующие шум или другие физические ограничения системы, слишком упрощены. Однако некоторым исследователям удалось включить эти элементы в свой анализ, создав более сложные системы.

Биомедицинские приложения
Кохлеарный имплант

Возможные применения гипотезы эффективного кодирования включают кохлеарный имплант дизайн. Эти нейропротезные устройства стимулируют слуховой нерв с помощью электрических импульсов, которые позволяют частично слышать людям с нарушениями слуха или даже глухим. Имплантаты считаются успешными, эффективными и единственными в использовании в настоящее время. Использование частотно-пространственного сопоставления в эффективном алгоритме кодирования может принести пользу при использовании кохлеарных имплантатов в будущем. Изменения в дизайне, основанные на этой гипотезе, могут повысить разборчивость речи у пациентов с нарушениями слуха. Исследование с использованием вокодированной речи, обработанной различными фильтрами, показало, что люди имели более высокую точность в расшифровке речи, когда она обрабатывалась с использованием фильтра с эффективным кодом, в отличие от кохлеотропного фильтра или линейного фильтра. Это показывает, что эффективное кодирование данных о шуме дает преимущества для восприятия и предоставляет слушателям больше информации. Необходимы дополнительные исследования, чтобы применить текущие результаты к медицински значимым изменениям конструкции кохлеарного имплантата.

Ссылки
Последняя правка сделана 2021-05-18 08:52:02
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте