Условие операнта

редактировать

Условие операнта

Угасание

Подкрепление. Повысить поведение

Наказание. Понизить поведение

Положительное подкрепление . Добавить аппетитный стимул. после правильного поведения

Отрицательное подкрепление

Положительное наказание . Добавить вредный стимул. после поведения

Отрицательное наказание . Удалить аппетитный стимул. после

Побег . Удалить вредный стимул. после правильного поведения

Активное избегание . Поведение избегает вредного стимула

Оперантное кондиционирование (также называемый инструментальным кондиционированием ) - это тип процесса ассоциативного обучения, посредством которого сила поведения путем подкрепления или наказания. Это также процедура, которая используется для такого обучения.

Хотя и оперант, и классическое обусловливание связаны с поведением, контролируемым стимулами окружающей среды, они различаются по природе. При оперантном стимулирует стимулы, которые стимулируют поведение, которое награждается или наказывает, контролирует это поведение. Например, ребенок может научиться открывать коробку, чтобы положить внутрь сладости, или научиться не прикасаться к горячей плите; в оперантном выражении ящик и печь являются «различными раздражителями». Оперантное поведение называется «добровольным». Ответы находятся под контролем организма и являются операторами. Например, ребенок может оказаться перед выбором: открыть коробку или погладить щенка.

Напротив, классическая обусловленность включает непроизвольное поведение, основанное на стимулах с биологически значимыми событиями. Ответы находятся под контролем стимулов. Например, вид сладостей может вызвать у ребенка слюноотделение, или звук хлопка двери может сигнализировать рассерженному родителю, заставляя ребенка дрожать. Слюноотделение и дрожь не видь; они не подкрепляются своими последствиями, и они не «выбираются» добровольно.

Однако оба вида обучения могут влиять на поведение. Классически стимулированные стимулы - например, изображение конфет на коробке - могут усилить оперантную обусловленность, побуждая ребенка подойти и коробку. Исследования показали, что это благоприятное явление в тех случаях, когда оперантное поведение подвержено ошибкам.

В исследованиях обучения животных в 20-м веке преобладали анализы этих двух видов обучения, и они все еще остаются в основе анализа поведения. Они также применялись при изучении социальной психологии, помогая прояснить эффекты, такие как эффект ложного консенсуса.

Содержание

1 Историческая справка
- 1.1 Закон действия Торндайка
- 1.2 Б. Ф. Скиннер
2 Концепции и процедуры
- 2.1 Истоки оперантного поведения: оперантная изменчивость
- 2.2 Модификация оперантного поведения: подкрепление и наказание
  - 2.2.1 График подкрепления
  - 2.2.2 Факторы, влияющие на эффективность подкрепления и наказания
  - 2.2.3 Формирование
  - 2.2.4 Неконтролируемое подкрепление
- 2.3 Стимул-контроль оперантного поведения
  - 2.3.1 Дискриминация, обобщение и контекст
- 2.4 Поведенческие последовательность: условное подкрепление и связывание
- 2.5.2. Избегание и избегание
  - 2.5.1 Дискриминационное обучение избеганию
  - 2.5.2 Свободно-оперантное обучение избеганию
  - 2.5.3 Двухпроцессная теория избегания
  - 2.5.4 Теория оперантов или «однофакторной»
- 2.6 Накопление оперантов
3 Нейробиологические корреляты
4 Вопросы о законе эффекта
5 Применение
- 5.1 Зависимость и зависимость
- 5.2 Дрессировка животных
- 5.3 Прикладной анализ поведения
- 5.4 Поведение ребенка - обучение родителей мен еджменту
- 5.5 Экономика
- 5.6 Азартные игры - планирование с переменным снабжением
- 5.7 Военная психология
- 5.8 Теория подталкивания
- 5.9 Похвала
- 5.10 Психологические манипуляции
- 5.11 Травматическая связь
- 5.12 Видеоигры
- 5.13 Культура страха на рабочем месте
6 См. Также
7 Ссылки
8 Внешние ссылки

Историческая справка

Эдвард Ли Торндайк в 1912 году

Закон действия Торндайка

Оперантное вызвливание, иногда называемое инструментальным обучением, был впервые тщательно изучен Эдвардом Л. Торндайком (1874–1949), который наблюдал за поведением кошек, пытающихся вырваться из самодельных коробок-головоломок. Кошка могла выбраться из ящика, просто потянув за шнур или толкнув шест, но когда ее сначала сдерживали, кошкам требовалось много времени, чтобы выбраться. При повторных испытаниях неэффективные ответы успешные реже - чаще, поэтому кошки убегали все и быстрее. Торндайк обобщил это открытие в своем законе эффекта, который гласит, что поведение, имеющее удовлетворительные последствия, имеет тенденцию повторяться, а те, которые приводят к неприятным последствиям, с меньшей вероятностью повторяются. Некоторые последствия усиливают поведение, а некоторые - ослабляют. Построив график времени побега в зависимости от номера испытания, Торндайк создал первое известное животное кривые обучения с помощью этой процедуры.

Люди, похоже, усваивают множество простых форм поведения посредством процесса, изученного Торндайком, который теперь называется оперантом. кондиционирование. То есть ответы сохраняются, когда они вызывают успешный результат, и они отбрасываются, когда они этого не делают, или когда они вызывают отвращение. Обычно это происходит без планирования какого-либо «учителя», но оперантное обусловливание использовалось родителями в обучении детей на протяжении тысяч лет.

Б. Ф. Скиннер

Б.Ф. Скиннер на факультете психологии Гарварда, около 1950 г.

Б.Ф. Снера (1904–1990) называют отцом оперантного обусловливания, и его работы часто цитируются в связи с этой темой. Его книга 1938 года «Поведение организмов: экспериментальный анализ» положила начало его пожизненному изучению оперантного обусловливания и его применение к поведению человека и животных. Следуя идеям Эрнста Маха, Скиннер отверг ссылку Торндайка на ненаблюдаемые психические состояния, такие как удовлетворение, построив свой анализ на наблюдаемом поведении и его столь же наблюдаемых последствиях.

Скиннер считал, что классическое обусловливание было слишком упрощенным для описания чего-то столь сложного, как человеческое поведение. По его мнению, оперантное кондиционирование лучше человеческого поведения, поскольку оно исследует причины и следствия преднамеренного поведения.

Чтобы реализовать свой эмпирический подход, Скиннер изобрел оперантную камеру кондиционирования, или «ящик Скиннера», в котором такие предметы, как голуби и крысы, изолировались и могли подвергаться каждому контролируемым раздражителям. В отличие от коробки-головоломки Торндайка, такая компоновка позволяла испытуемым дать два повторяющихся ответа, и частота таких ответов стала основным поведенческим критерием Скиннера. Другое изобретение, кумулятивный регистратор, дает графическую запись, по которой можно оценить эти показатели отклика. Эти записи были первичными данными, которые Скиннер и его коллеги использовали для изучения влияния схемрепления на скорость реакции. График подкрепления можно определить как «любую, доставляющую подкрепление организму в соответствии с четко определенным правилами». Эффекты расписания стали, в свою очередь, вызвать выводы, на основе которых С помощью Сканнер разработал свою концепцию оперантного обусловливания. Он также опирался на многие менее формальные наблюдения за поведением людей и животных.

Многие из работ Скиннера посвящены применению оперантного обусловливания к человеческому поведению. В 1948 году он опубликовал Уолден Два, вымышленный рассказ о мирном, счастливом, продуктивном сообществе, организованном вокруг его принципов кондиционирования. В 1957 году Скиннер опубликовал Вербальное поведение, который распространил принципы оперантного обусловливания на язык, форму человеческого поведения, которая ранее совершенно иначе анализировалась лингвистами и другими. Скиннер определил новые функциональные отношения, такие как «мандаты» и «такты», чтобы уловить некоторые основы языка, но он не ввел никаких новых принципов, рассматривая вербальное поведение как любое другое поведение, контролируемое его последствиями, которые включают реакцию аудитории говорящего.

Концепции и процедуры

Истоки оперантного поведения: изменчивость оперантов

Оперантное поведение называется «испускаемым»; то есть изначально он не вызывается каким-либо конкретным стимулом. Таким образом, можно спросить, почему это вообще происходит. Ответ на этот вопрос подобен ответу Дарвина на вопрос о происхождении «новой» телесной структуры, а именно вариации и отбора. Точно так же поведение человека меняется от момента к моменту, как вызывающие движения, величина приложенной или время реакции. Вариации, которые приводят к подкреплению, усиливаются, и если подкрепление постоянное, поведение тенденций остается стабильным. Однако поведенческая изменчивость сама по себе может быть изменена путем манипулирования определенными переменными.

Изменение оперантного поведения: подкрепление и наказание

Подкрепление и наказание используемых инструментов, с помощью которых модифицируется оперантное поведение. Эти термины рассматриваются по их влиянию на поведение. Либо может быть положительным, либо отрицательным.

Положительное подкрепление и отрицательное подкрепление увеличивает вероятность поведения, которому они следуют, в то время как положительное наказание и отрицательное наказание снижают вероятность поведения что они следуют.

Другая процедура называется «вымирание».

Вымирание происходит, когда ранее закрепленное поведение больше не подкрепляется ни положительным, ни отрицательным подкреплением. Во время вымирания такое поведение становится менее вероятным. Случайное подкрепление может привести к еще более длительной задержке до угасания поведения из-за фактора обучения, когда для использования используется подкрепление фактор обучения по сравнению с подкреплением, даваемым при каждой возможности перед исчезновением.

Всего существует пять последствий.

Позитивное подкрепление происходит, когда поведение (ответ) вызывает или за поведением следует другой стимулирующий стимул, который увеличивает такое поведение. Например, если крыса в ящике Скиннера получает пищу, когда она нажимает на рычаг, скорость ее соответствующего возрастает. Эта процедура обычно называется просто подкреплением.
Отрицательное подкрепление (также известное как побег) происходит, когда за поведением (реакцией) следует удаление отвращающего стимула, тем самым увеличивая исходный частота поведения. В эксперименте с ящиком Скиннера отвращающим стимулом может быть постоянный громкий шум внутри ящика; отрицательное подкрепление происходит, когда крыательное нажимает на рычаг, чтобы выключить шум.
Положительное наказание (также называемое «наказанием случайной стимуляцией») происходит, когда за поведением (реакцией) следует аверсивный стимул. Пример: боль от порки, которая часто приводит к уменьшению этого поведения. Положительное наказание - термин, сбивающий с толку, поэтому обычно называют «наказанием».
Отрицательное наказание (штраф) (также называемое «наказанием условным отказом») происходит, когда поведение (ответ) сопровождает снятием лица. Пример: отнятие у ребенка игрушки после нежелательного поведения с его стороны, что бы привело к нарушению нежелательного поведения.
Вымирание происходит, когда поведение (реакция), которое ранее было подкреплено, является больше не эффективен. Пример: крысы дают еду много раз за сначала на рычаг, пока экспериментатор не перестанет выдавать еду в качестве награды. Крыса обычно нажимала на рычаг реже и останавливалась. В таком случае крепие на рычаг будет считаться «погашенным».

Важно отметить, что актеры (например, крыса) не регистрируются как подкрепленные, наказанные или погашенные; это действия которые подкрепляются, наказываются или исключаются. Подкрепление, наказание и исчезновение - это не термины, использование которых ограничено лабораторией. Естественно вызывающие последствия также могут усиливать, наказывать или подавлять поведение и не всегда планируются выполняются специально.

Графики армирования

Графики армирования - это правила, управляющие доставкой арматуры. В правилах указывается либо время, когда подкрепление должно быть доступно, либо количество ответов, необходимо сделать, либо и то, и другое. Возможны многие правила, но следующие самые частые и часто используемые.

График с фиксированным интервалом: подкрепление происходит после первого ответа по истечении фиксированного времени после предыдущего подкрепления. Этот график дает образец ответа «остановка бега»; То есть после тренировки по этому графику обычно делает паузу после подкрепления, а затем начинает быстро реагировать по мере приближения времени следующего подкрепления.
График с переменным интервалом: подкрепление происходит после первой генерации времени истекло с предыдущего подкрепления. Этот график обычно дает стабильную скорость реакции, которая изменяется в зависимости от среднего времени между подкреплениями.
График с фиксированным подкреплением: подкрепление происходит после того, как фиксированное количество ответов было произведено с момента предыдущего подкрепления. Организм, тренированный по этому графику, обычно делает паузу на некоторое время после подкрепления, а затем реагирует с высокой скоростью. Если требование ответа низкое, паузы может не быть; если потребность в реакции высока, организм может вообще перестать отвечать.
График с переменным изменением: подкрепление происходит после того, как с текущего момента подкрепления было дано переменное количество ответов. Этот график обычно дает очень высокую постоянную скорость ответа.
Непрерывное подкрепление: подкрепление происходит после каждого ответа. Организмы обычно реагируют на это быстро, насколько это возможно.

Факторы, которые изменяют эффективность подкрепления и наказания

Эффективность подкрепления и наказания может быть снижена. изменилось.

Насыщение / депривация : если человек получил достаточно этого стимула, чтобы удовлетворить его / ее аппетит. Противоположный эффект, если человек лишится этого стимула: тогда эффективность воздействия возрастет. Субъект полным желудком не будет чувствовать себя таким мотивированным, как голодный.
Непосредственность : Немедленное последствие более эффективно, чем отсроченное. Если дать собаке угощение для сидения в течение пяти секунд, собака будет учиться быстрее, чем если бы угощение было дано через тридцать секунд.
Непредвиденные обстоятельства : Чтобы быть эффективным, поощрение должно происходить последовательность после реакций а не при других случаях. Обучение может быть медленнее, если подкрепление носит прерывистый характер, то есть только некоторые экземпляры одного и того же ответа. Периодически подкрепляемые ответы обычно гаснут медленнее, чем ответы, которые всегда подкреплялись.
Размер : Размер или количество стимула часто влияет на его силу в качестве подкрепления. Люди и животные занимаются анализом затрат и выгод. Если рычажный пресс дает десять пищевых гранул, можно быстрее, чем пресс дает одну гранулу. Куча четвертей из игрового автомата заставит игрока нажать на рычаг дольше, чем одна четверть.

Большинство этих факторов выполняют биологические функции. Например, процесс насыщения помогает организму поддерживать стабильную внутреннюю среду (гомеостаз ). Например, когда организм лишен сахара, сахара вкус является эффективным усилителем. Когда уровень сахара в крови в организме является менее большим уровнем, вкус сахара становится или эффективным даже неприятным.

Формирование

Формирование - это метод кондиционирования, широко используемый при дрессировке животных и в обучении невербальных людей. Это зависит от оперантной изменчивости и подкрепления, как описано выше. Тренер начинает определение желаемого конечного (или «целевого») поведения. Затем дрессировщик выбирает поведение, которое животное или человек уже испускает с некоторой вероятностью. Затем форма этого поведения постепенно изменяется в ходе последовательных испытаний, усиливая поведение, которое все больше и больше приближается к целевому. Когда целевое поведение, наконец, проявляется, его можно усилить и поддерживать с помощью графика подкрепления.

Неконтролируемое подкрепление

Неконтролируемое подкрепление - это доставка подкрепляющих стимулов независимо от поведения организма. Неконтролируемое подкрепление может использоваться в попытке уменьшить нежелательное целевое поведение путем усиления множества альтернативных ответов при одновременном гашении целевого ответа. Поскольку никакое измеряемое поведение не идентифицируется как усиливающееся, существует разногласие по поводу использования термина неконтролируемое «подкрепление».

Стимул-контроль оперантного поведения

Хотя изначально оперантное поведение испускается без идентифицированного При обращении к конкретному стимулу во время оперантного обуславливания операторы попадают под контроль стимулов, которые присутствуют при подкреплении поведения. Такие стимулы называются «различительными стимулами». Результатом является так называемая «трехчленная непредвиденная ситуация ». То есть различающие стимулы создают повод для реакций, которые производят вознаграждение или наказание. Пример: крысу можно приучить нажимать на рычаг, только когда загорается свет; собака спешит на кухню, когда слышит стук своего пакета с едой; ребенок тянется за конфетой, когда видит ее на столе.

Дискриминация, обобщение и контекст

Большая часть поведения находится под контролем стимулов. Можно выделить несколько аспектов этого:

Дискриминация обычно возникает, когда ответ усиливается только при наличии определенного стимула. Например, голубя можно кормить за то, что он клюет на красный свет, а не на зеленый; как следствие, он клюет красное и перестает клевать зеленый. Было изучено множество сложных комбинаций раздражителей и других условий; например, организм может быть усилен по интервальному графику в присутствии одного стимула и по графику соотношений в присутствии другого.
Обобщение - это тенденция реагировать на стимулы, которые похожи на ранее обученный различительный стимул. Например, обученный клевать «красный» голубь может также клевать «розовый», хотя обычно менее сильно.
Контекст относится к стимулам, которые постоянно присутствуют в ситуации, например, стены, столы, стулья и т. д. в комнате или внутри камеры кондиционирования. Контекстные стимулы могут управлять поведением, как и различающие стимулы, хотя обычно в более слабой степени. Поведение, усвоенное в одном контексте, может отсутствовать или изменяться в другом. Это может вызвать трудности для поведенческой терапии, потому что поведение, усвоенное в терапевтических условиях, может не проявляться в других ситуациях.

Поведенческие последовательности: условное подкрепление и цепочка

Большую часть поведения нелегко описать в терминах индивидуальных реакций. усилены один за другим. Объем оперантного анализа расширяется за счет идеи поведенческих цепочек, которые представляют собой последовательности ответов, связанных вместе трехчленными условностями, определенными выше. Цепочка основана на экспериментально продемонстрированном факте, что различительный стимул не только создает повод для последующего поведения, но также можетусилить поведение, которое ему предшествует. То есть различающий раздражитель также является «условным подкреплением». Например, свет, который задает повод для использования, может быть использован для усиления «поворота» в присутствии шума. В результате получается последовательность «шум - разворот - свет - разъемие рычага - еда». Можно построить гораздо более длинные цепочки, добавив больше стимулов и ответов.

Бегство и избегание

В обучении избеганию поведение завершает (отталкивающий) стимул. Например, защита глаз от солнечного света прекращает (отталкивающую) стимуляцию яркого света в глазах. (Это примерное подкрепления, определенного выше.) Поведение, которое поддерживается за счет стимула, называется «избеганием», как, например, надевание солнцезащитных очков передом на улицу. Поведение избегания порождает так называемый «парадокс избегания», поскольку можно спросить, как стимула может служить подкреплением? К этому вопросу обращается несколько теорий избегания (см. Ниже).

Обычно используются два типа экспериментальных настроек: дискриминируемое и свободное оперантное обучение избеганию.

Обучение дискриминированному избеганию

Эксперимент дифференцированного исключения включает серию испытаний, в которых используется нейтральное стимулом, таким как свет, следует отталкивающий стимул, такой как шок. Предотвращает действие стимула, препятствующее нарушению действия стимула. В ранних испытаниях субъект не реагирует до тех пор, пока не сработает отталкивающий стимул, поэтому эти ранние испытания называются испытаниями «побега». По мере обучения действует воздействие на нейтральный стимул, таким образом, предотвращает возникновение отталкивающего стимула. Такие испытания называются «испытаниями избегания». Говорят, что этот эксперимент включает классическое обусловливание, потому что нейтральный CS (условный раздражитель) сочетается с отталкивающим US (безусловный раздражитель); эта идея лежит в основе двухфакторной теории обучения избеганию, описанной ниже.

Обучение расширению свободных оперантов

При избегании свободных оперантов субъект периодически получает отталкивающий стимул (часто электрический шок), если не происходит оперантный ответ; ответ задерживает начало шока. В этой ситуации, в отличие от дискриминированного избегания, предшествующий стимул не сигнализирует о шоке. Два важных временных интервала определяют скорость обучения избеганию. Это первый интервал S-S (шок-шок). Это время между последовательными ударами при реакции. Второй интервал - это интервал R-S (ответ-шок). Это определяет время, которое оперантный ответивает начало следующего разряда. Обратите внимание, что каждый раз, когда субъект выполняет оперантный ответ, интервал R-S без шока начинается заново.

Двухпроцессная теория избегания

Эта теория использовалась теория предложена для объяснения дискриминированного обучения избеганию, в котором учится исключение отталкивающего стимула, избегая сигнала для этого стимула. Речь идет о двух процессах: классическое кондиционирование с последующим оперантным условием реакции побега:

а) Классическое кондиционирование страха. Первоначально организм испытывает сочетание CS с аверсивным УЗИ. Теория предполагает, что это соединение вызывает ассоциацию между CS и США посредством классической обусловленности, из-за отталкивающей природы США, CS вызывает условную эмоциональную реакцию (CER) - «страх». б) Усиление оперантной реакции уменьшения страха. В результате первого процесса CS теперь сигнализирует о страхе; эта неприятная эмоциональная реакция служит для мотивации оперантных ответов, а ответы, завершающие CS, усиливаются прекращением страха. Обратите внимание, что в теории не говорится, что система «избегает» США в смысле его ожидания, а скорее, что организм «избегает» отвращающего состояния, вызванного CS. Некоторые экспериментальные данные, похоже, противоречат теории двух факторов. Например, избегающее поведение часто угасает очень медленно, даже когда первоначальное соединение CS-US больше не возникает, поэтому можно ожидать, что реакция страха исчезнет (см. Классическое кондиционирование ). Кроме того, животные, которые не показаны, часто демонстрируют мало свидетельств страха, предполагая, что бегство от страха не требуется для поддержания поведения того избегания.

Оперантная или теория «однофакторной»

Некоторые теоретики предполагают, что поведение избегания может быть просто особым случаем оперантного поведения, поддерживаемого его последствиями. С этой точки идея «последствий» расширена, чтобы включить чувствительность к структуре событий. Таким образом, при избегании следствия замедления скорости аверсивной стимуляции. Действительно, экспериментальные данные свидетельствуют о том, что «пропущенный шок» воспринимается как стимул и может действовать как подкрепление. Когнитивные теории избегания продвигают эту идею на шаг вперед. Например, крыса предполагает «ожидать» шока, если она не нажимает на рычаг, и «не ожидает шока», если нажимает на него, и поведение избегания усиливается, если эти ожидания подтверждаются.

Накопление оперантов

Накопление оперантов относится к наблюдению, что крысы, подкрепленные определенным образом, могут пищевым гранулам накапливаться в пищевом лотке вместо того, чтобы извлекать эти гранулы. В этой процедуре извлечения гранул всегдавало одининутный период исчезновения, в течение которого не было никаких дополнительных пищевых гранул, но те, которые были накоплены ранее, могли быть потреблены. Это открытие, по-видимому, противоречит обычному выводу о том, что крысы ведут себя импульсивно в ситуации, когда есть выбор между меньшим пищевым объектом сразу и большим пищевым объектом после некоторой задержки. См. графики подкрепления.

Нейробиологические корреляты

Первые научные исследования, в которых идентифицировали нейроны, которые реагировали так, что предполагалось, что они кодируют условные стимулы, были получены в результате работы Махлона делонга и Р.Т. Ричардсон. Они показали, что нейроны coreus basalis, которые выделяют ацетилхолин широко по всей коре головного мозга, активируются вскоре после условного стимула или после первичного вознаграждения, если не было условного вознаграждения стимул существует. Эти нейроны одинаково активны в отношении положительных и отрицательных подкреплений, и было показано, что они связаны с нейропластичностью во многих кортикальных областях. Также существуют доказательства того, что дофамин активируется в одно и то же время. Существует множество доказательств того, что дофамин участвует как в подкрепляющем, так и в аверсивном обучении. Дофаминовые пути гораздо более плотно проецируются на области лобной коры. Холинергические проекции напротив, плотные даже в задних областях коры, таких как первичная зрительная кора. Исследование пациентов с болезнью Паркинсона, состоянием, приписываемым недостаточному действию дофамина, иллюстрирует роль дофамина в положительном подкреплении. Исследование показало, что пациенты, не принимавшие лекарства, с большей готовностью учились с неприятными последствиями, чем с положительным подкреплением. Пациенты, которые принимали лекарства, показали обратное: положительное подкрепление оказалось более эффективным обучением при высокой активности дофамина.

Предполагается, что в основе подкрепления лежит нейрохимический процесс с участием дофамина. Когда активирует усиливающий стимул возбуждает, активируются дофаминовые пути в мозге. Эта сеть путей «высвобождает короткий импульс дофамина на многие дендриты, тем самым транслируя глобальный сигнал подкрепления на постсинаптические нейроны ». Это позволяет недавно активированным синапсам увеличивать свою чувствительность к эфферентным (проводящим наружу) сигналам, тем самым увеличивая вероятность возникновения недавних факторов, предшествовавших подкреплению. Эти реакции статистически наиболее вероятно были поведением, ответственным за успешное достижение подкрепления. Способность к применению подкрепления либо менее эффективное, либо менее эффективное (последовательное).

Вопросы о законе эффекта

Ряд наблюдений, кажется, показывают, что оперантное поведение может быть установлено без подкрепления в смысле, определенном выше. Наиболее цитируемым является феномен автоформирования (иногда называемый «отслеживанием знаков»), при котором за стимулом многократно следует подкрепление, и, как следствие, животное начинает реагировать на стимул. Например, загорается клавиша, предложенный ответ. Когда это повторяется несколько раз, голубь начинает клевать ключ, даже если еда приходит независимо от того, клюет птица или нет. Точно так же крысы начинают в руки небольшие предметы, например рычаг, когда пища оказывается поблизости. Поразительно, но ведет к уменьшению количества (тренировка бездействия). Другим очевидным оперантным поведением, которое проявляется без подкрепления, является контрозагрузка.

Эти и другие наблюдения, по-видимому, противоречат закону эффект, и они побудили некоторые исследователи предлагают новые концепции оперантного воздействия (например) Более общий взгляд состоит в том, что автоформирование - это пример классического кондиционирования ; Фактически процедура автоформирования одним из наиболее распространенных способов измерения классической обусловленности. Эта точка зрения, на многие виды поведения могут влиять как классические случайности (стимул-реакция), так и оперантные случайности (реакция-подкрепление), и задача экспериментатора в том, чтобы вызвать, как они взаимодействуют.

Приложения

Подкрепление и наказание повсеместно используются в человеческих взаимодействиях, и было предложено и реализовано очень много приложений оперантных принципов. Ниже приведены некоторые примеры.

Зависимость и зависимость

Положительное и отрицательное подкрепление играет центральную роль в развитии и поддержании зависимости и наркотической зависимости. Наркотик, вызывающий привыкание, по своей сути полезен ; то есть, он действует как первичный положительный фактор подкрепления употребления наркотиков. Система вознаграждения мозга придает ему значимость стимула (т. Е. «Желаемый» или «желаемый»), поэтому по мере развития зависимости лишение наркотика приводит к влечению. Кроме того, стимулы, связанные с употреблением наркотиков - например, вид шприца и место использования становятся связанными с интенсивным подкреплением, вызываемым наркотиком. Эти ранее нейтральные стимулируют несколько свойств: их появление может вызвать тягу, и они могут стать условными положительными подкреплениями дальнейшего употребления. Таким образом, зависимый человек сталкивается с одним из этих наркотических сигналов, тяга к соответствующему наркотику может появиться снова. Например, агентства по борьбе с наркотиками ранее использовали плакаты с изображениями принадлежностей для наркотиков как попытку показать опасность употребления наркотиков. Однако такие плакаты больше не используются из-за эффекта значимости стимула, вызывающего рецидив при виде стимулов, изображенных на плакатах.

У наркозависимых лиц отрицательное подкрепление возникает, когда препарат вводится самостоятельно, чтобы облегчить или «избежать» симптомов физической зависимости (например, тремор и потливость) и / или психологическая зависимость (например, ангедония, беспокойство, раздражительность и беспокойство), возникающие во время состояния отмены наркотиков.

Дрессировка животных

Дрессировщики и владельцы домашних животных применяли принципы и методы оперантного кондиционирования задолго до того, как эти идеи были названы и изучены, и дрессировка животных по-прежнему является одним из самых ярких и убедительных примеров оперантного контроля. Из концепций и процедур, описанных в этой статье, наиболее заметными являются следующие: (а) наличие первичного подкрепления (например, мешок собачьих вкусняшек); (б) использование вторичного подкрепления (например, щелчок кликера сразу после желаемого ответа, а затем дающий вкус); (c) случайность, гарантирующая, что подкрепление (например, кликер) следует желаемому поведению, а не чему-то еще; (г) формирование, как в постепенном обучении собаки прыгать все выше и выше; (д) периодическое подкрепление, например, при постепенном уменьшении частоты подкрепления, чтобы вызвать устойчивое поведение без насыщения; (е) цепочка, где сложное поведение постепенно строится из более мелких единиц.

Пример дрессировки животных из Морского мира, связанный с оперантным условием

Дрессировка животных оказывает влияние на положительное и отрицательное подкрепление. График подкреплений может сыграть большую роль в дрессировке животных.

Прикладной анализ поведения

Прикладной анализ поведения - дисциплина, начатая Б. Ф. Скиннер, который применяет принципы обусловливания к модификации социально значимого человеческого поведения. В нем используются основные концепции теории кондиционирования, включая условный стимул (S), различительный стимул (S), ответ (R) и подкрепляющий стимул (S или S для подкрепления, иногда S для отвращающих стимулов). Условный стимул контролирует поведение, развиваемое респондентом (классическое), например эмоциональные реакции. Три других термина вместе образуют «трехчленную случайность» Скиннера: различающий стимул дает повод для реакций, ведущих к подкреплению. Исследователи пришли к выводу, что следующий протокол эффективен при использовании инструментов оперантного кондиционирования для изменения человеческого поведения:

Государственная цель Разъяснить, какие именно изменения должны быть осуществлены. Например, «снизить вес на 30 фунтов».
Наблюдать за поведением. Следить за поведением, чтобы можно было видеть, возникли желаемые эффекты. Например, ведите таблицу ежедневных весов.
Поддерживайте желаемое поведение Например, поздравьте человека с потерей веса. У людей запись поведения может служить подкреплением. Например, когда участник видит закономерность потери веса, это может быть продолжению поведенческой программы похудания. Однако люди могут воспринимать подкрепление, которое задумывалось как положительное, как отрицательное, и наоборот. Например, она может действовать как отрицательное заболевание. экономика токенов, is система обмена, в которой токены выдаются в качестве вознаграждения за желаемое поведение. Позже жетоны можно обменять на желаемый приз или награды, такие как власть, престиж, товары или услуги.
Уменьшите стимулы к нежелательному предложению Например, уберите конфеты и жирные закуски с кухонных полок

Специалисты по прикладному анализу поведения (ABA) применяют эти процедуры, а также их множество вариантов и усовершенствований для решения различных социальных значимых форм поведения и вопросов. Во время практикующих врачи используют оперантные методы для выработки конструктивного, социального приемлемого поведения, которое заменяет аберрантное поведение. Методы ABA были эффективно применены к таким образом, как ранние интенсивные поведенческие вмешательства для детей с расстройством аутистического поведения (РАС), исследования принципов, влияющих на преступное поведение, профилактика сохранение, сохранение природных ресурсов, образование, геронтология, здоровье и физические упражнения, промышленная безопасность, овладение языка, мусор, процедуры медицинские, воспитание детей, психотерапия, использование ремней безопасности, тяжелые психические расстройства, спорт, токсикомания, фобии, педиатрические нарушения питания и управление зоопарком и уход за животными. Некоторые из этих приложений ниже.

Поведение ребенка - обучение родителей управления

Обеспечение положительного подкрепления правильного поведения. Как правило, поощряют поведение с помощью поощрений (например, похвалы, улыбки и объятия). Кроме того, родители учатся выбирать простое поведение в качестве первоначального акцента и вознаграждают за каждый маленький, который их ребенок делает для достижения большей цели (эта концепция называется «последовательные приближения»).

Экономика

И психологи, и экономисты заинтересовались применением оперантных концепций и открытий к поведению людей на рынке. Примером может служить анализ потребительского спроса, индексированного по количеству приобретенного товара. В экономике степень, в которой цена влияет на потребление, называется «эластичностью спроса по цене». Некоторые товары более эластичны, чем другие; например, изменение цен на продукты питания может иметь большое влияние на потребляемые изменения. С точки зрения оперантного анализа такие эффекты могут быть интерпретированы с точки зрения мотивации потребителей и относительных ценностей товаров как подкрепляющих факторов.

Азартные игры - планирование с переменным источником

Как было сказано ранее в статье, график с переменным использованием дает подкрепление после выдачи непредсказуемого числа ответов. Этот график обычно быстрое и настойчивое реагирование. Игровые автоматы рассчитываются по графику с переменным расчетом ставок. Выплаты с переменным приводом от игровых автоматов и других форм азартных игр часто встречаются как фактор, лежащий в зависимости от азартных игр.

Военная психология

Люди обладают врожденным сопротивлением убийству и не хотят действовать прямо и агрессивно по отношению к представителям своего вида, даже ради спасения жизни. Это сопротивление убийству приводило к тому, что пехота была эффективной неэффективной на протяжении всей истории действий.

Этот феномен не был понят до S.L.A. Маршалл (бригадный генерал и военный историк) провел интервью с пехотой Второй мировой войны сразу после боевого столкновения. В известной и противоречивой книге Маршалла «Люди против огня» говорится, что только 15% солдат стреляли из винтовок с целью убить в бою. После принятия Маршалла армией США в 1946 году, Управление исследованиями кадровых ресурсов армии США началорять новые протоколы обучения, которые напоминают методы оперантного кондиционирования. Последующее применение таких методов увеличило процент солдат, способных убивать, примерно до 50% в Корее и более 90% во Вьетнаме. Революции в обучении включаются замену всплывающих стрельбищ трехмерными всплывающими целями в форме человека, которые разрушались при попадании. Это обеспечило немедленную обратную связь и послужило положительным подкреплением поведения солдата. Другие улучшения методах военной подготовки включают курс стрельбы по времени; более реалистичное обучение; частые повторы; похвала начальства; награды за меткую стрельбу; и групповое признание. Отриц подкрепление включает подотчетность сверстников или требование пересдать курсы. Современные условия военной подготовки средний реакция на боевое давление путем тщательного реального мозга с использованием основного Павловского классического кондиционирования и Скиннеровского оперантного кондиционирования (обе бихевиоризм ).

Современное обучение меткой стрельбы является таким прекрасным примером бихевиоризма, что оно годами использовалось во вводном курсе психологии, преподаваемом всем курсантам в Военной академии США в Вест-Пойнте, как классический пример оперантной условности во время визита в Вест-Пойнт Б. Ф. Скиннер определил современную военную стрельбу как почти идеальное применение оперантной обусловленности.

Подполковник Дэйв Гроссман заявляет об оперантной обусловленности и военной подготовке в США, что:

Вполне возможно, что никто специально не садился за то, чтобы использовать методы оперантного обусловливания или модификации поведения для обучения солдат в этой области... Но с точки зрения психолога, который также является историком и профессионалом. солдат, для меня становится все более очевидным, что это было достигнуто.

Теория подталкивания

Теория подталкивания (или подталкивания) - это в поведенческой концепции науки, политическая теория и экономика, в которой установлена, что косвенные предложения попытаться добиться ненасильственного соблюдения могут повлиять на мотивы, стимулы и решение создание групп и отдельных лиц, по крайней мере, так же эффективно, если не более эффективно, чем прямое указание, законодательство или правоприменение.

Похвала

Концепция похвалы как средства поведенческого подкрепления уходит корнями в модель оперантного обусловливания Б.Ф. Скиннера. Через это призму похвалы как средство положительного подкрепления, которое вызывает наблюдаемое поведение повышается за счет случайной похвалы за такое поведение. Убедитесь, что мы используем данные исследования эффективности использования позитивного поведения, особенно в исследовании того, как учителя и использует данные исследования для улучшения поведения и успеваемости, а также в исследовании труда. Также было показано, что похвала усиливает позитивное поведение у соседних людей, которые не хвалят (например, у одноклассника получателя похвалы) через косвенное подкрепление. Похвала может быть более или менее эффективным в изменении поведения в зависимости от ее формы, содержания и подачи. Чтобы похвала повлияла на положительное изменение поведения, она должна зависеть от положительного поведения (т.е. вводить только после того, как целевое поведение реализовано), должно указывать особенности поведения, должно быть усилено, и должно быть искренней и искренней.

Признавая эффект похвалы как позитивную стратегию подкрепления, многочисленные поведенческие и когнитивные поведенческие вмешательства, включая использование похвалы в свои протоколы. Стратегическое использование похвалы признано практикой, основанной на фактах, как в управлении классом, так и в программах обучения родителей, хотя в исследованиях вмешательства похвала часто относится к более широкой категории положительного подкрепления, которая включает такие стратегии, как стратегическое и поведенческое вознаграждение.

Было проведено несколько исследований влияния когнитивно-поведенческой терапии и оперантно-поведенческой терапии на различные медицинские состояния. Когда пациенты разработали когнитивные и поведенческие методы, которые изменили их поведение, отношения и эмоции; их болевой синдром уменьшился. Результаты этих исследований показали влияние когнитивных функций на восприятие боли, представленное воздействие объяснило общую эффективность когнитивно-поведенческой терапии (КПТ) и оперантно-поведенческой терапии (ОБТ).

Психологические манипуляции

Брайкер определил следующие способы, которыми манипуляторы управляют своими жертвами:

Положительное подкрепление : включает похвалу, поверхностное очарование, поверхностное сочувствие (крокодиловы слезы ), чрезмерные извинения, деньги, одобренные подарки, внимание, выражения лица, такие как вынужденный смех или улыбка, и публичные признание.
Отрицательное подкрепление : может вызвать удаление одного из отрицательных действий
Прерывистое или частичное подкрепление : Частичное или периодическое отрицательное подкрепление может создать эффективную атмосферу страха и сомнений. Частичное или периодическое положительное подкрепление может побудить жертву упорствовать - например, в большинстве форм азартных игр, вероятно, будет выигрывать время от времени, но в целом все равно теряет деньги.
Наказание : включает нытье, крики, молчание, запугивание, угрозы, ругань, эмоциональный шантаж, чувство вины, дуться, плакать и играть жертву.
Травматическое однократное обучение: использование словесных оскорблений, взрывного гнева или другого пугающего поведения для определения доминирования или превосходства ; вызвать у или научить избегать расстройства, столкновение с манипулятором или противоречий с ним.

Травматическая связь

Травматическая связь в результате продолжающихся циклов жестокого обращения, в котором периодическое усиление вознаграждения и ограничения создают сильные эмоциональные связи, устойчивые к изменениям.

Другой источник указывает, что «Необходимые условия для травмирующих связей таковы, что один человек должен доминировать над другими, и уровень жестокого обращения постоянно возрастает, а спадает. Отношения характеризуются периодами снисходительного, сострадательного и даже ласкового поведения доминирующего человека, перемежающихся периодических эпизодами жестокого обращения. Чтобы сохранить преимущество, обидчик манипулирует поведением жертвы и ограничивает ее возможности, чтобы сохранить дисбаланс сил. Любая угроза равновесия доминирования и подчинения может быть встречена нарастающим циклом наказания, различными методами от бурного запугивания до яростных вспышек насилия. Виктимизатор также изолирует жертву от других источников поддержки, что снижает вероятность обнаружения и вмешательства, снижает способность жертвы получать уравновешивающую обратную связь с самореферентной реакцией и усиливает чувство односторонней зависимости... Чувствуете себя ведущим в своей работе. Они также могут столкнуться с различными неприятными социальными и правовыми последствиями своими эмоциональными последствиями, совершенными агрессивными действиями, даже если они сами были реципиентами агрессии. '.

Видеоигры

Большинство видеоигр построены на основе цикла принуждения, добавляя тип положительного подкрепления через график со скоростью к держите игрока в игре. Это может привести к патологии зависимости от видеоигр.

В рамках тенденции монетизации видеоигр в течение 2010-х годов в некоторых играх предлагались лутбоксы в качестве награды. или как предметы, приобретаемые за реальные деньги. Ящики содержат случайный набор игровых предметов. Эта практика была привязана к тем же методам, которые используются в игровых автоматах и других игровых устройствах для выплаты вознаграждения, поскольку она следует графику с переменной ставкой. В то время как общее мнение, что лутбоксы представляют собой форму азартных игр, такая практика классифицируется только в некоторых странах. Однако методы использования этих предметов в рынке азартных игр для азартных игр в Интернете или торговли за реальные деньги рынок азартных игр, который проходит юридическую оценку. 59>

Культура страха на рабочем месте

Эшфорт обсудил ранее деструктивные стороны лидерства и определил то, что он назвал мелкими тиранами : лидерами, придерживающимся тиранического стиля управления, что приводит к атмосфере страха на рабочем месте. Частичное или периодическое отрицательное подкрепление может создать эффективную атмосферу страха и сомнения. Когда сотрудники понимают, что с хулиганами можно мириться, это может создать атмосферу страха.

Индивидуальные различия в чувствительности к вознаграждению, наказанию и мотивация изучалась в соответствии с элементами теории чувствительности к подкреплению, а также применялась к производительности на рабочем месте.

Одной из многих значительных причин, связанных с воздействием, является практика защитной медицины. Прабху рассматривает статью Коула и обсуждает, как реакции двух групп нейрохирургов являются классическим оперантным поведением. Одна группа практикует в обычном режиме с ограничениями по медицинским искам, а другая группа без ограничений. Группа нейрохирургов была анонимно опрошена об их образцах практики. Врачи изменили свою практику в ответ на отрицательный отзыв (боязнь судебного процесса) в группе, которая практиковала в штате, где нет ограничений на медицинские судебные процессы.

См. Также

Психологический портал

Оскорбление власти и контроль
Тестирование на животных
Поведенческий контраст
Бихевиоризм (раздел психологии, относящийся к методологическому и радикальному бихевиоризму)
Модификация поведения (старое выражение для ABA; изменяет поведение либо через последствия, не включает использование затопления - также называемого терапией длительного воздействия )
кнутом и пряником
уходом за ребенком
когнитивизмом (психологией) (теория внутренних механизмов без привязки к поведению)
Тесты потребительского спроса (животные)
Педагогическая психология
Образовательная технология
Экспериментальный анализ поведения (экспериментальные исследования принципы в оперантном и респондентном обусловливании)
Экспозиционная терапия (также называемая десенсибилизация)
Ступенчатая экспозиционная терапия (также называемая система тическая десенсибилизация )
Привыкание
Ежи Конорски
Приобретенное трудолюбие
Закон соответствие
Отрицательный (положительный) контрастный эффект
Радикальный бихевиоризм (концептуальная теория анализа поведения, которая расширяет бихевиоризм, чтобы также охватывать личные события (мысли и чувства) как формы поведения)
подкрепление
Павловско-инструментальный перенос
Предпочтение тесты (животные)
Принцип Премака
Сенсибилизация
Социальная обусловленность
Общество количественного анализа поведения
Спонтанное выздоровление

Литература

{78} Александр Б.К. (2010) Зависимость: Вид из Крысиного парка, получено из Зависимость: Вид из Крысиного парка (2010)

Внешние ссылки

Ищите оператора в Викисловарь, бесплатный словарь.

Викискладе есть материалы, связанные со статьей оперантного кондиционирования.