Модель Рескорла – Вагнера

редактировать

Модель Рескорла – Вагнера (« RW ») - это модель классической обусловленности, в которой обучение концептуализируется в терминах ассоциаций между условными (CS) и безусловными (US) стимулами. Сильная ассоциация CS-US означает, по сути, что CS сигнализирует или предсказывает США. Можно сказать, что до кондиционирования субъект удивлен США, но после кондиционирования субъект больше не удивляется, потому что CS предсказывает приход США. Модель разделяет процессы кондиционирования на дискретные испытания, во время которых стимулы могут либо присутствовать, либо отсутствовать. Сила предсказания США в испытании может быть представлена ​​как сумма ассоциативных сил всех CS, присутствующих во время испытания. Эта особенность модели представляет собой значительный прогресс по сравнению с предыдущими моделями и позволяет напрямую объяснить важные экспериментальные явления, в первую очередь эффект блокировки. Неудачи модели привели к модификациям, альтернативным моделям и многим дополнительным выводам. Модель оказала некоторое влияние на неврологию в последние годы, поскольку исследования показали, что фазовая активность дофаминовых нейронов в мезостриатальных проекциях DA в среднем мозге кодирует тип ошибки прогнозирования, подробно описанный в модели.

Модель Рескорла – Вагнера была создана психологами Йельского университета Робертом А. Рескорла и Алланом Р. Вагнером в 1972 году.

Содержание

  • 1 Основные допущения модели
  • 2 Уравнение
  • 3 Пересмотренная модель RW Ван Хамма и Вассермана (1994)
  • 4 Некоторые недостатки модели RW
  • 5 Успех и популярность
  • 6 Ссылки
  • 7 Внешние ссылки

Основные допущения модели

  1. Изменение ассоциации между CS и US, которое происходит, когда они объединяются, зависит от того, насколько сильно США прогнозируются в этом испытании - то есть, неофициально, насколько "удивлен" организм США. Величина этого «неожиданности» зависит от суммарной ассоциативной силы всех сигналов, присутствующих во время этого испытания. Напротив, в предыдущих моделях изменение ассоциативной силы основывалось только на текущем значении CS.
  2. Ассоциативная сила CS представлена ​​одним числом. Ассоциация возбуждающая, если число положительное, и тормозящая, если оно отрицательное.
  3. Ассоциативная сила стимула напрямую выражается поведением, которое он вызывает / подавляет.
  4. Выпуклость из CS (альфа в уравнении) и сила США (бета) являются постоянными и не изменяются в процессе обучения.
  5. Только текущая ассоциативная сила сигнала определяет его влияние на поведение и объем обучения, которое он поддерживает. Не имеет значения, как было получено это значение прочности, будь то простое кондиционирование, восстановление или иное.

Первые два предположения были новыми в модели Рескорла – Вагнера. Последние три предположения присутствовали в предыдущих моделях и менее важны для новых предсказаний модели RW.

Уравнение

Δ V Икс п + 1 знак равно α Икс β ( λ - V т о т ) {\ displaystyle \ Delta V_ {X} ^ {n + 1} = \ alpha _ {X} \ beta (\ lambda -V_ {tot})}

и

V Икс п + 1 знак равно V Икс п + Δ V Икс п + 1 {\ Displaystyle V_ {X} ^ {n + 1} = V_ {X} ^ {n} + \ Delta V_ {X} ^ {n + 1}}

куда

  • Δ V Икс {\ displaystyle \ Delta V_ {X}} представляет собой изменение силы связи между CS, обозначенным "X", и США в одном испытании.
  • α {\ displaystyle \ alpha} - заметность X (ограниченная 0 и 1)
  • β {\ displaystyle \ beta} - это параметр скорости для США (ограниченный 0 и 1), иногда называемый его значением ассоциации
  • λ {\ displaystyle \ lambda} это максимально возможное кондиционирование для США
  • V Икс {\ displaystyle V_ {X}} - текущая ассоциативная сила X
  • V т о т {\ displaystyle V_ {tot}} это общая ассоциативная сила всех имеющихся стимулов, то есть X плюс любые другие

Пересмотренная модель RW Ван Хамма и Вассермана (1994)

Ван Хамм и Вассерман расширили исходную модель Рескорла-Вагнера (RW) и в 1994 году ввели новый фактор в свою пересмотренную модель RW: они предположили, что не только условные стимулы, физически присутствующие в данном испытании, могут претерпевать изменения в их ассоциативной силе, ассоциативная ценность CS также может быть изменена за счет ассоциации внутри соединения с CS, присутствующим в этом испытании. Взаимосвязь внутри соединения устанавливается, если две CS представлены вместе во время тренировки (сложный стимул). Если одна из двух компонентных CS впоследствии будет представлена ​​отдельно, то предполагается, что активируется также представление другой (ранее спаренной) CS. Ван Хамм и Вассерман предполагают, что стимулы, косвенно активируемые через внутрикомпонентные ассоциации, обладают отрицательным параметром обучения - таким образом можно объяснить феномен ретроспективной переоценки.

Рассмотрим следующий пример, экспериментальную парадигму под названием «обратная блокировка», указывающая на ретроспективную переоценку, где AB - сложный стимул A + B:

  • Этап 1: AB – США
  • Этап 2: Австралия – США

Тестовые испытания: Группа 1, которая получала испытания как фазы 1, так и фазы 2, вызывает более слабый условный ответ (CR) на B по сравнению с контрольной группой, которая получала только испытания фазы 1.

Исходная модель RW не может учесть этот эффект. Но пересмотренная модель может: На Фазе 2 стимул B косвенно активируется через внутрисоставную ассоциацию с A. Но вместо положительного параметра обучения (обычно называемого альфа), когда он физически присутствует, во время фазы 2 B имеет отрицательный параметр обучения.. Таким образом, во время второй фазы ассоциативная сила B снижается, тогда как значение A увеличивается из-за его положительного параметра обучения.

Таким образом, пересмотренная модель RW может объяснить, почему CR, вызванный B после тренировки с обратной блокировкой, слабее по сравнению с кондиционированием только AB.

Некоторые провалы модели RW

Спонтанное восстановление после исчезновения и восстановление после исчезновения, вызванное обработкой напоминанием (восстановление)
Это хорошо установленное наблюдение, что интервал тайм-аута после завершения вымирания приводит к частичному восстановлению после вымирания, т. Е. Ранее угашенная реакция или ответ повторяются, но обычно на более низком уровне, чем до обучения вымиранию. Восстановление относится к явлению, при котором воздействие США только в результате обучения после завершения вымирания приводит к частичному восстановлению после исчезновения. Модель RW не может объяснить эти явления.
Прекращение действия ранее кондиционированного ингибитора
Модель RW предсказывает, что повторное предъявление одного лишь условного ингибитора (CS с отрицательной ассоциативной силой) приводит к угасанию этого стимула (снижению его отрицательной ассоциативной ценности). Это ложное предсказание. Напротив, эксперименты показывают, что многократное введение одного только условного ингибитора даже увеличивает его ингибирующий потенциал.
Облегченное повторное приобретение после исчезновения
Одно из предположений модели состоит в том, что история обусловливания CS не оказывает никакого влияния на его текущий статус - важно только его текущее ассоциативное значение. Вопреки этому предположению, многие эксперименты показывают, что стимулы, которые сначала были обусловлены, а затем погашены, легче восстановить (т. Е. Требуется меньше испытаний).
Исключительность возбуждения и торможения
Модель RW также предполагает, что возбуждение и торможение являются чертами противника. Стимул может иметь либо возбуждающий потенциал (положительная ассоциативная сила), либо тормозной потенциал (отрицательная ассоциативная сила), но не оба сразу. Напротив, иногда наблюдается, что стимулы могут иметь оба качества. Одним из примеров является обратное возбуждающее кондиционирование, при котором CS обратно соединяется с US (US – CS вместо CS – US). Обычно это заставляет CS стать условным возбудителем. Стимул также обладает тормозящими свойствами, что может быть доказано тестом на задержку усвоения. Этот тест используется для оценки ингибирующего потенциала стимула, так как наблюдается замедление возбуждающего кондиционирования с помощью ранее кондиционированного ингибитора. Обратно обусловленный раздражитель проходит этот тест и, таким образом, кажется, обладает как возбуждающими, так и тормозящими свойствами.
Сочетание нового стимула с условным ингибитором
Предполагается, что условный ингибитор имеет отрицательную ассоциативную ценность. Представляя ингибитору новый стимул (т. Е. Его ассоциативная сила равна нулю), модель предсказывает, что новый сигнал должен стать условным возбудителем. В экспериментальных ситуациях это не так. Прогнозы модели основаны на ее основном термине (лямбда-V). Поскольку суммарная ассоциативная сила всех стимулов (V), присутствующих в испытании, отрицательна (ноль + ингибирующий потенциал), а лямбда равна нулю (нет US), результирующее изменение ассоциативной силы будет положительным, что делает новый сигнал условным. возбудитель.
CS-эффект предэкспозиции
Эффект предэкспозиции CS (также называемый латентным торможением ) - это хорошо установленное наблюдение, согласно которому кондиционирование после воздействия стимула, позже используемого в качестве CS в кондиционировании, замедляется. Модель RW не предсказывает никакого эффекта от представления нового стимула без США.
Кондиционирование высшего порядка
В кондиционировании более высокого порядка ранее кондиционированный CS соединяется с новым сигналом (т.е. сначала CS1 – US, затем CS2 – CS1). Обычно это заставляет новую реплику CS2 вызывать схожие реакции с CS1. Модель не может объяснить это явление, поскольку во время испытаний CS2 – CS1 УЗИ отсутствует. Но разрешив CS1 действовать аналогично США, можно согласовать модель с этим эффектом.
Сенсорная предварительная подготовка
Сенсорное прекондиционирование означает сначала соединение двух новых сигналов (CS1 – CS2), а затем соединение одного из них с US (CS2 – US). Это превращает CS1 и CS2 в условные возбудители. Модель RW не может объяснить это, так как во время фазы CS1 – CS2 оба стимула имеют ассоциативное значение, равное нулю, и лямбда также равна нулю (нет УЗ), что не приводит к изменению ассоциативной силы стимулов.

Успех и популярность

Модель Рескорла – Вагнера своим успехом обязана нескольким факторам, в том числе

  • у него относительно мало свободных параметров и независимых переменных
  • он может генерировать четкие и порядковые прогнозы
  • он сделал ряд успешных прогнозов
  • выраженная в терминах «предсказание» и «неожиданность», модель имеет интуитивно понятную привлекательность.
  • он породил множество исследований, включая множество новых открытий и альтернативных теорий.

Рекомендации

внешняя ссылка

Последняя правка сделана 2023-03-21 06:50:59
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте