Подкрепление

редактировать

Применено последствие, которое усилит будущее поведение организма

Использование блока Скиннера для изменения поведения мыши субъекта

В поведенческой психологии, подкрепление - это последствие, которое будет усиливать будущее поведение организма всякий раз, когда этому поведению предшествует определенный предшествующий стимул. Этот усиливающий эффект может быть измерен как более высокая частота поведения (например, более частое нажатие на рычаг), более длительная (например, нажатие на рычаг в течение более длительных периодов времени), большая величина (например, нажатие на рычаг с большей силой), или более короткое время ожидания (например, более быстрое нажатие на рычаг после предшествующего стимула). Есть два типа подкрепления, известные как положительное подкрепление и отрицательное подкрепление; положительное - это когда вознаграждение предлагается за проявление желаемого поведения, а отрицательное - это устранение нежелательного элемента в среде людей всякий раз, когда желаемое поведение достигается. Вознаграждающие стимулы, которые связаны с «желанием» и «симпатией» (желанием и удовольствием, соответственно) и аппетитным поведением, действуют как положительные подкрепления ; обратное утверждение также верно: положительные подкрепления обеспечивают желаемый стимул. Подкрепление не требует от человека сознательного восприятия эффекта, вызванного стимулом. Таким образом, подкрепление происходит только в том случае, если наблюдается заметное усиление поведения. Однако существует и отрицательное подкрепление, которое характеризуется устранением нежелательного стимула. Смена чьей-либо работы может послужить отрицательным подкреплением для человека, страдающего проблемами со спиной, например, смена рабочего места на офисную должность.

В большинстве случаев термин «подкрепление» относится к улучшению поведения, но этот термин также иногда используется для обозначения улучшения памяти; например, «подкрепление после тренировки» относится к предоставлению стимула (такого как еда) после учебного сеанса в попытке увеличить сохраняемую широту, детализацию и продолжительность отдельных воспоминаний или только что сформированной общей памяти. Стимул, улучшающий память, также может быть стимулом, эффекты которого являются прямо, а не только косвенно эмоциональными, как в случае с феноменом «флэш-память », в котором эмоционально очень интенсивный стимул может стимулировать память о наборе обстоятельства ситуации выходят далеко за рамки тех обстоятельств, которые вызвали эмоционально значимый стимул, например, когда люди подходящего возраста могут вспомнить, где они были и что они делали, когда узнали об убийстве Джона Ф. Кеннеди или террористических атак 11 сентября 2001 г..

Усиление является важной частью оперантного или инструментального кондиционирования.

Содержание

1 Терминология
2 Введение
3 Краткая история
4 Оперантное обусловливание
- 4.1 Положительное подкрепление
- 4.2 Отрицательное подкрепление
- 4.3 Угасание
- 4.4 Подкрепление против наказания
- 4.5 Дальнейшие идеи и концепции
- 4.6 Первичные подкрепления
- 4.7 Вторичные подкрепления
- 4.8 Другой повод условия силового воздействия
5 Естественные и искусственные
6 Периодические графики усиления
- 6.1 Простые графики
  - 6.1.1 Эффекты различных типов простых графиков
- 6.2 Составные графики
- 6.3 Наложенные графики
- 6.4 Параллельные расписания
7 Формирование
8 Объединение
9 Убедительное общение и теория подкрепления
10 Математические модели
11 Критика
- 11.1 История терминов
12 Приложения
- 12.1 Зависимость и зависимость
- 12.2 Дрессировка животных
- 12.3 Поведение детей - обучение родителей менеджменту
- 12.4 Экономика
- 12.5 Азартные игры - планирование с переменным соотношением
- 12.6 Теория подталкивания
- 12.7 Похвала
- 12.8 Психологические манипуляции
- 12.9 Травматическая привязанность
- 12.10 Видеоигры
- 12.11 Культура страха на рабочем месте
13 См. также
14 Ссылки
15 Дополнительная литература
16 Внешние ссылки

Терминология

Глоссарий наркомании и зависимости
зависимость - биопсихосоциальное расстройство, характеризующееся компульсивно стремление достичь желаемого эффекта, такого как интоксикация, несмотря на вред и неблагоприятные последствия для себя и других аддиктивное поведение - поведение, которое одновременно вознаграждает и укрепляет наркотик, вызывающий привыкание - лекарство, которое одновременно поощряет и усиливает зависимость - адаптивное состояние, связанное с синдромом отмены после прекращения многократного воздействия стимула (например, приема лекарства) лекарственная сенсибилизация или обратная толерантность - нарастающий эффект лекарственного средства, возникающий в результате многократного приема данной дозы отмена препарата - симптомы, возникающие после прекращения повторного употребления наркотиков физическая зависимость - зависимость, которая включает стойкие физические - соматические симптомы отмены (например, усталость и алкогольный делирий ) психологическая зависимость - зависимость, которая включает эмоционально-мотивационные симптомы отмены (например, дисфория и ангедония ) усиливающие стимулы - стимулы, которые увеличивают вероятность повторения поведения в паре с ними вознаграждение стимулы - стимулы, которые мозг интерпретирует как положительные и желательные по своей природе или как нечто приближающееся к сенсибилизации - усиленный ответ на стимул, возникающий в результате его многократного воздействия расстройство, связанное с употреблением психоактивных веществ - состояние, при котором употребление психоактивных веществ приводит к клинически и функционально значимым нарушениям или стрессу толерантность - уменьшение эффекта лекарственного средства в результате повторного введения в данной дозе
v t

Глоссарий наркомании и зависимости

зависимость - биопсихосоциальное расстройство, характеризующееся компульсивно стремление достичь желаемого эффекта, такого как интоксикация, несмотря на вред и неблагоприятные последствия для себя и других
аддиктивное поведение - поведение, которое одновременно вознаграждает и укрепляет
наркотик, вызывающий привыкание - лекарство, которое одновременно поощряет и усиливает
зависимость - адаптивное состояние, связанное с синдромом отмены после прекращения многократного воздействия стимула (например, приема лекарства)
лекарственная сенсибилизация или обратная толерантность - нарастающий эффект лекарственного средства, возникающий в результате многократного приема данной дозы
отмена препарата - симптомы, возникающие после прекращения повторного употребления наркотиков
физическая зависимость - зависимость, которая включает стойкие физические - соматические симптомы отмены (например, усталость и алкогольный делирий )
психологическая зависимость - зависимость, которая включает эмоционально-мотивационные симптомы отмены (например, дисфория и ангедония )
усиливающие стимулы - стимулы, которые увеличивают вероятность повторения поведения в паре с ними
вознаграждение стимулы - стимулы, которые мозг интерпретирует как положительные и желательные по своей природе или как нечто приближающееся к
сенсибилизации - усиленный ответ на стимул, возникающий в результате его многократного воздействия
расстройство, связанное с употреблением психоактивных веществ - состояние, при котором употребление психоактивных веществ приводит к клинически и функционально значимым нарушениям или стрессу
толерантность - уменьшение эффекта лекарственного средства в результате повторного введения в данной дозе

В науках о поведении термины «положительный» и «отрицательный» относятся, если они используются в их строгом техническом смысле, к природе действия, выполняемого обусловливает, а не оценку отвечающего операнта этого действия и его последствий. «Положительные» действия - это те, которые добавляют фактор, приятный или неприятный, к окружающей среде, тогда как «отрицательные» действия - это те, которые удаляют или удерживают от окружающей среды фактор любого типа. В свою очередь, строгое значение «подкрепления» относится только к обусловливанию, основанному на вознаграждении; введение неприятных факторов и устранение или удержание приятных факторов вместо этого упоминается как «наказание», которое при использовании в его строгом смысле, таким образом, противоречит «подкреплению». Таким образом, «положительное подкрепление» относится к добавлению приятного фактора, «положительное наказание» относится к добавлению неприятного фактора, «отрицательное подкрепление» относится к устранению или сдерживанию неприятного фактора, а «отрицательное наказание» относится к устранение или удержание приятного фактора.

Это использование противоречит некоторым нетехническим употреблениям четырех комбинаций терминов, особенно в случае термина «отрицательное подкрепление», которое часто используется для обозначения того, что технический язык описал бы как «положительное наказание». "в том, что нетехническое использование интерпретирует" подкрепление "как включающее в себя вознаграждение и наказание, а" отрицательное "- как относящееся к оценке вводимого фактора отвечающим оперантом. Напротив, в техническом жаргоне используется термин «негативное подкрепление» для описания поощрения данного поведения путем создания сценария, в котором неприятный фактор присутствует или будет присутствовать, но участие в поведении приводит либо к побегу от этого фактора, либо к предотвращению его возникновения., как в экспериментах Мартина Селигмана , связанных с обучением собак методам предотвращения поражения электрическим током.

Введение

BF Скиннер был известным и влиятельным исследователем, сформулировавшим многие теоретические конструкции подкрепления и бихевиоризма. Скиннер определил подкрепления в соответствии с изменением силы реакции (скорости реакции), а не более субъективными критериями, такими как то, что кому-то доставляет удовольствие или что ценно. Соответственно, действия, еда или предметы, которые считаются приятными или доставляющими удовольствие, не обязательно могут быть подкрепляющими (поскольку они не вызывают усиления предшествующей реакции). Стимулы, обстановка и действия подходят под определение подкрепления только в том случае, если поведение, которое непосредственно предшествует потенциальному подкреплению, усиливается в аналогичных ситуациях в будущем; например, ребенок, который получает файл cookie, когда он или она просит его. Если частота «запросов cookie» увеличивается, cookie может рассматриваться как усиливающее «поведение запроса cookie». Однако, если "поведение при запросе файлов cookie" не увеличивает, файл cookie не может считаться подкрепляющим.

Единственный критерий, определяющий, является ли стимул подкрепляющим, - это изменение вероятности поведения после введения этого потенциального подкрепления. Другие теории могут фокусироваться на дополнительных факторах, например, ожидал ли человек, что поведение приведет к заданному результату, но в поведенческой теории подкрепление определяется повышенной вероятностью ответа.

Исследование армирования дало огромное количество воспроизводимых экспериментальных результатов. Подкрепление является центральным понятием и процедурой в специальном обучении, прикладном анализе поведения и экспериментальном анализе поведения и является ключевым понятием в некоторых медицинских и психофармакологические модели, в частности зависимость, зависимость и принуждение.

Краткая история

Лабораторные исследования подкрепления обычно датируются работами из Эдвард Торндайк, известный своими экспериментами с кошками, убегающими из ящиков с головоломками. Ряд других продолжили это исследование, в частности Б.Ф. Скиннер, который опубликовал свою основополагающую работу по этой теме в «Поведение организмов» в 1938 году и развил это исследование во многих последующих публикациях. В частности, Скиннер утверждал, что положительное подкрепление превосходит наказание в формировании поведения. Хотя наказание может показаться полной противоположностью подкрепления, Скиннер утверждал, что они сильно различаются, говоря, что положительное подкрепление приводит к длительным модификациям поведения (долгосрочным), тогда как наказание меняет поведение только временно (кратковременно) и имеет много вредных побочных эффектов. Впоследствии многие исследователи расширили наше понимание подкрепления и поставили под сомнение некоторые выводы Скиннера. Например, Азрин и Хольц определили наказание как «следствие поведения, которое снижает вероятность такого поведения в будущем», и некоторые исследования показали, что положительное подкрепление и наказание одинаково эффективны в изменении поведения. Исследования эффектов положительного подкрепления, отрицательного подкрепления и наказания продолжаются и сегодня, поскольку эти концепции являются фундаментальными для теории обучения и применимы ко многим практическим приложениям этой теории.

Оперантное кондиционирование

Угасание

Подкрепление. Повышение поведения

Наказание. Понижение поведения

Позитивное подкрепление . Добавить аппетитный стимул. правильное поведение

отрицательное подкрепление

положительное наказание . добавить вредный стимул. следующее поведение

отрицательное наказание . удалить аппетитный стимул. следующее поведение

Побег . Удалите вредный стимул. после правильного поведения

Активное избегание . Поведение избегает вредного стимула

Термин оперантное кондиционирование был введен Б.Ф. Скиннером, чтобы указать, что в его эксперименте Согласно парадигме, организм может свободно воздействовать на окружающую среду. В этой парадигме экспериментатор не может вызвать желаемый ответ; экспериментатор ждет ответа (который испускает организм), а затем доставляется потенциальное подкрепление. В парадигме классического кондиционирования экспериментатор запускает (вызывает) желаемый ответ, предъявляя вызывающий рефлекс стимул, Безусловный стимул (UCS), который он объединяет (предшествует) с нейтральным стимулом, Условным стимулом (CS).

Усиление - это основной термин оперантного обусловливания. Для аспекта наказания оперантного обусловливания - см. наказание (психология).

Положительное подкрепление

Положительное подкрепление происходит, когда желаемое событие или стимул представляется как следствие поведения. и вероятность того, что такое поведение проявится в аналогичной среде, увеличивается.

Пример: всякий раз, когда крыса нажимает кнопку, она получает угощение. Если крыса начинает нажимать кнопку чаще, лакомство усиливает это поведение.
Пример: отец дает своей дочери конфеты, когда она убирает свои игрушки. Если частота сбора игрушек увеличивается, конфеты являются положительным стимулом (для усиления поведения уборки).
Пример: компания вводит программу вознаграждений, в которой сотрудники получают призы в зависимости от количества проданные товары. Призы, которые получают сотрудники, являются положительным подкреплением, если они увеличивают продажи.
Пример: учитель хвалит своего ученика, когда он получает хорошую оценку. Похвала, которую получает ученик, является положительным подкреплением в случае повышения его оценок.

Методика High Probability Instruction (HPI) - это бихевиорист, основанный на идее положительного подкрепления.

Отрицательное подкрепление

Отрицательное подкрепление возникает, когда скорость поведения увеличивается из-за того, что отвращающее событие или стимул удалено или предотвращено.

Пример: ребенок убирает свою комнату, и после этого родитель перестает «ныть» или постоянно просит ребенка сделать это. Здесь ворчание служит для негативного усиления поведения уборки, потому что ребенок хочет устранить этот неприятный стимул ворчания.
Пример: у компании есть политика, согласно которой, если сотрудник завершит свою работу к пятнице, они могут в субботу выходной. Рабочая суббота - это отрицательное подкрепление, продуктивность сотрудников будет увеличиваться, поскольку они избегают отрицательного подкрепления.

Вымирание

Вымирание может быть преднамеренным или непреднамеренным и происходит, когда нежелательное поведение игнорируется.

Пример (предполагаемый): мальчик игнорирует хулиганов, высмеивающих его. Обидчики не получают реакции от ребенка и теряют интерес к издевательствам над ним.
Пример (непреднамеренный): работник не получил никакого признания за его сверхурочную тяжелую работу. Затем он перестает усердно работать.
Пример (предполагаемый): кошка продолжала мяукать в поисках еды ночью. Владельцы не стали кормить кошку, поэтому кошка перестала мяукать всю ночь.

Подкрепление против наказания

Подкрепления служат для усиления поведения, тогда как каратели служат для ослабления поведения; таким образом, положительные подкрепления - это стимулы, над достижением которых субъект будет работать, а отрицательные подкрепления - это стимулы, от которых субъект будет стремиться избавиться или закончить. В таблице ниже показано добавление и вычитание стимулов (приятных или отталкивающих) по отношению к подкреплению и наказанию.

	Вознаграждение (приятный) стимул	Отвратительный (неприятный) стимул
Добавление / представление	Положительное подкрепление	Позитивное наказание
Удаление / принятие В гостях	Негативное наказание	Негативное подкрепление

Например, предложение сладкого ребенка, если он убирает свою комнату, является положительным подкреплением. Шлепать ребенка, если он разбивает окно, - это положительное наказание. Отрицательное наказание - отобрать у ребенка игрушки за плохое поведение. Давать ребенку перерыв в работе, если он хорошо справляется с тестом, является отрицательным подкреплением. «Положительное и отрицательное» не несут в этом смысле значения «хорошее и плохое».

Дальнейшие идеи и концепции

Отличить позитивное от негативного может быть сложно и не всегда необходимо; сосредоточение внимания на том, что удаляется или добавляется, и как это удаляется или добавляется, будет определять характер подкрепления.
Отрицательное подкрепление не является наказанием. Эти два, как объяснено выше, отличаются увеличением (отрицательное подкрепление) или уменьшением (наказание) будущей вероятности ответа. При отрицательном подкреплении стимул, удаляемый после реакции, является отталкивающим стимулом; если этот стимул был представлен в зависимости от ответа, он также может действовать как положительный каратель.
Форма стимула отделена от его функции с точки зрения того, будет ли он усиливать или наказывать поведение. Событие, которое может наказывать за поведение одних, может служить подкреплением поведения других. Пример: ребенок неоднократно подвергается задержанию за поведение в школе, но частота плохого поведения увеличивается. Таким образом, задержание может быть подкреплением (может быть положительным или отрицательным); возможно, ребенок теперь получает индивидуальное внимание от учителя, или, возможно, они теперь избегают ходить домой, где они часто подвергаются насилию.
Некоторое подкрепление может быть одновременно положительным и отрицательным, например, наркоман, принимающий наркотики для добавленная эйфория (позитивное чувство) и устранение симптомов отмены (что было бы негативным чувством). Или, в теплой комнате, поток внешнего воздуха служит положительным подкреплением, потому что он приятно прохладен, и отрицательным подкреплением, потому что он удаляет неприятный горячий воздух.
В деловом мире подкрепление необходимо для повышения производительности. Сотрудников постоянно мотивирует возможность получить положительный стимул, например повышение по службе или премию. Сотрудниками также движет отрицательное подкрепление. Это можно увидеть, когда сотрудникам предлагается выходной по субботам, если они завершают еженедельную рабочую нагрузку к пятнице.
Хотя отрицательное подкрепление имеет положительный эффект в краткосрочной перспективе для рабочего места (т. Е. Поощряет финансово выгодные действия), чрезмерно зависимость от отрицательного подкрепления мешает работникам действовать творчески, активно, обеспечивая рост в долгосрочной перспективе.
Как положительное, так и отрицательное подкрепление усиливают поведение. Большинство людей, особенно дети, научатся следовать инструкциям, сочетая положительное и отрицательное подкрепление.
Ограниченные ресурсы могут привести к тому, что человек не сможет обеспечить постоянное подкрепление.

Первичные подкрепления

A первичный подкрепление, иногда называемое безусловным подкреплением, - это стимул, который не требует сочетания с другим стимулом для того, чтобы действовать как подкрепление, и, скорее всего, получил эту функцию в результате эволюции и своей роли в выживание вида. Примеры основных подкреплений включают пищу, воду и секс. Некоторые первичные подкрепления, такие как определенные лекарства, могут имитировать эффекты других основных подкреплений. Хотя эти первичные подкрепления довольно стабильны в течение жизни и у разных людей, усиливающая ценность различных основных подкреплений варьируется в зависимости от множества факторов (например, генетики, опыта). Таким образом, один человек может предпочесть один вид пищи, а другой - избегать его. Или один человек может есть много, а другой - очень мало. Таким образом, несмотря на то, что пища является основным подкреплением для обоих людей, ценность пищи как подкрепления у них разная.

Вторичное подкрепление

A вторичное подкрепление, иногда называемое условным подкреплением, - это стимул или ситуация, которая приобрела свою функцию подкрепления после соединения со стимулом, который действует как подкрепление. Этот стимул может быть основным или другим условным стимулом (например, деньгами). Примером вторичного подкрепления может служить звук щелчка, который используется в тренировке с щелчком. Звук кликера ассоциируется с похвалой или угощением, и впоследствии звук кликера может выступать в качестве поощрения. Другой распространенный пример - звук людей, хлопающих в ладоши - в том, чтобы слышать этот звук, нет ничего положительного, но мы узнали, что он ассоциируется с похвалой и вознаграждением.

Пытаясь различить первичные и вторичные подкрепления на примере людей, используйте «тест пещерного человека». Если стимул - это то, что пещерный человек естественным образом сочтет желательным (например, леденец), то он является основным подкреплением. С другой стороны, если пещерный человек не отреагирует на это (например, долларовая купюра), это вторичное подкрепление. Как и в случае с первичными подкреплениями, организм может испытывать насыщение и лишение вторичных подкреплений.

Другие термины подкрепления

Обобщенное подкрепление - это условное подкрепление, которое приобрело подкрепляющую функцию в сочетании со многими другими подкрепляющими элементами и функционирует как подкрепление при большом количестве мотивирующих операций. (Одним из примеров этого являются деньги, потому что они сочетаются со многими другими подкрепляющими элементами.)
В выборке подкрепления потенциально подкрепляющий, но незнакомый стимул предъявляется организму без учета какого-либо предшествующего поведения.
Социально-опосредованное подкрепление (прямое подкрепление) включает предоставление подкрепления, которое требует поведения другого организма.
Принцип Премака - это особый случай подкрепления, разработанный Дэвидом Премаком., в котором говорится, что наиболее предпочтительное действие может эффективно использоваться в качестве подкрепления для менее предпочтительного действия.
Иерархия подкрепления - это список действий, в котором наиболее желательные последствия ранжируются в порядке убывания. может служить подкреплением. Иерархия подкрепления может использоваться для определения относительной частоты и желательности различных действий и часто применяется при применении принципа Премака.
Случайные результаты с большей вероятностью будут подкреплять поведение, чем непредвиденные реакции. Случайные результаты - это те, которые напрямую связаны с причинным поведением, например, включение света зависит от щелчка переключателя. Обратите внимание, что случайные результаты не являются необходимыми для демонстрации подкрепления, но предполагаемая случайность может улучшить обучение.
Смежные стимулы - это стимулы, тесно связанные во времени и пространстве с конкретным поведением. Они сокращают время, необходимое для изучения поведения, увеличивая его сопротивление до исчезновения. Если дать собаке кусок еды сразу после того, как она села, это больше связано с поведением (и, следовательно, с большей вероятностью подкрепит), чем задержка в несколько минут в доставке еды вслед за поведением.
Неконтролируемое подкрепление относится к доставке, не зависящей от реакции стимулов, идентифицированных как подкрепление некоторых форм поведения этого организма. Однако это обычно влечет за собой привязанную ко времени доставку стимулов, идентифицированных как поддержание аберрантного поведения, что снижает скорость целевого поведения. Поскольку никакое измеряемое поведение не идентифицируется как усиливающееся, существует разногласие по поводу использования термина «непредвиденное« подкрепление ».

Естественное и искусственное

В своей статье 1967 года« Произвольное и естественное подкрепление »Чарльз Ферстер предложил классифицировать подкрепление на события, которые увеличивают частоту операнта как естественное следствие самого поведения, и события, которые, как предполагается, влияют на частоту из-за их потребности в посредничестве человека, например, в экономике токенов где субъекты «награждаются» за определенное поведение произвольным токеном, имеющим оборотную ценность. В 1970 году Баер и Вольф придумали название для использования естественных усилителей, названных «ловушками поведения». Поведенческая ловушка требует только простой реакции, чтобы попасть в ловушку, но после попадания в ловушку невозможно сопротивляться, вызывая общее изменение поведения. Это использование поведенческой ловушки, которая увеличивает репертуар человека, подвергая его естественному усилению этого поведения. Поведенческие ловушки обладают четырьмя характеристиками:

Они «наживлены» практически непреодолимыми подкреплениями, которые «заманивают» ученика в ловушку
Чтобы попасть в ловушку, требуется лишь легкая реакция, уже включенная в репертуар
Взаимосвязанные обстоятельства подкрепления внутри ловушки мотивируют человека приобретать, расширять и поддерживать целевые академические / социальные навыки
Они могут оставаться эффективными в течение долгих периодов времени, потому что человек демонстрирует мало, если вообще показывает, эффекты насыщения

Как видно из вышеизложенного, искусственное подкрепление на самом деле создается для создания или развития навыков, и, в общем, важно, чтобы либо вводилась поведенческая ловушка, чтобы «захватить» навык и использовать естественные усиление для поддержания или увеличения. Эта поведенческая ловушка может быть просто социальной ситуацией, которая обычно возникает в результате определенного поведения, если оно соответствует определенному критерию (например, если вы используете съедобные подкрепления, чтобы научить человека здороваться и улыбаться людям, когда они их встречают, после этого навык, естественное подкрепление для других людей улыбаются, и более дружеское общение естественным образом укрепит навык, и еда может исчезнуть).

Периодические графики подкрепления

Многое из поведения не подкрепляется каждый раз, когда оно испускается, и образец прерывистого подкрепления сильно влияет на то, как быстро изучается оперантный ответ, какова его скорость в любой момент времени и как долго он продолжается, когда подкрепление прекращается. Самыми простыми правилами, контролирующими подкрепление, являются непрерывное подкрепление, когда подкрепляется каждый ответ, и угашение, когда подкрепление не происходит. Между этими крайностями более сложные «графики подкрепления» определяют правила, которые определяют, как и когда за ответом последует подкрепление.

Определенные графики подкрепления надежно вызывают определенные паттерны реакции, независимо от исследуемых видов (включая людей в некоторых условиях). Однако количественные свойства поведения в рамках данного расписания зависят от параметров расписания, а иногда и от других факторов, не связанных с расписанием. Упорядоченность и предсказуемость поведения в соответствии с графиками подкрепления были доказательством для Б.Ф. Скиннер утверждает, что, используя оперантное обусловливание, он мог получить «контроль над поведением», что сделало теоретические споры современной сравнительной психологии устаревшими. Надежность контроля расписания подтверждает идею о том, что радикальный бихевиорист экспериментальный анализ поведения может быть основой для психологии, которая не имеет отношения к ментальным или когнитивным процессам.. Надежность расписаний также привела к развитию прикладного анализа поведения как средства контроля или изменения поведения.

Многие из более простых возможностей и некоторые из более сложных были подробно исследованы Скиннером с использованием голубей, но новые расписания продолжают определяться и исследоваться.

Простые графики

Диаграмма, демонстрирующая различную скорость реакции четырех простых графиков подкрепления, каждая штриховка обозначает данное подкрепление

График соотношения - подкрепление зависит только от числа ответов, выполненных организмом.
Непрерывное подкрепление (CRF) - график подкрепления, в котором за каждым появлением инструментальной реакции (желаемой реакции) следует подкрепление.
- Пример лаборатории: каждый раз, когда крыса нажимает на брусок, она получает шарик с едой.
- Пример из реальной жизни: каждый раз, когда собака испражняется, ее хозяин угощает ее; Каждый раз, когда человек кладет 1 доллар в автомат с конфетами и нажимает кнопки, он получает шоколадный батончик.

В простых расписаниях есть одно правило, определяющее, когда один тип поощрения доставляется для определенного ответа.

Фиксированное соотношение (FR) - расписания доставляют подкрепление после каждого n-го ответа. Расписание FR 1 является синонимом расписания CRF.
- Пример: FR 2 = подкрепляется каждая секунда желаемой реакции субъекта.
- Лабораторный пример: FR 5 = поведение крысы при нажатии на планку подкрепляется пищей после каждых 5 нажатий на планку в течение Коробка Скиннера.
- Реальный пример: FR 10 = Продавец подержанных автомобилей получает бонус в размере 1000 долларов за каждые 10 проданных автомобилей.
График переменного соотношения (VR) - усиливается в среднем каждый n-й ответ, но не всегда на n-м ответе.
- Лабораторный пример: VR 4 = первая гранула доставлена на прессе с давлением 2 бар, вторая гранула доставлена на прессе с давлением 6 бар, третья таблетка пресса на 4 бара (2 + 6 + 4 = 12; 12/3 = нажатие на 4 стержня для получения гранулы).
- Пример из реальной жизни: игровые автоматы (поскольку, хотя вероятность выиграть джекпот постоянна, количество нажатий на рычаг, необходимое для получения джекпота, является переменной).
Фиксированный интервал (FI) - усиливается через n промежутков времени.
- Пример: FI 1-s = усиление, предусмотренное для первой реакции через 1 секунду.
- Лабораторный пример: FI 15-s = поведение крысы при нажатии на планку усиливается для первого нажатия на планку после С момента последнего подкрепления прошло 15 секунд.
- Реальный пример: FI 30 мин = 30-минутный цикл стиральной машины.
Переменный интервал (VI) - усилен в среднем n количество времени, но не всегда точно n количество времени.
- Пример: VI 4-min = первая гранула доставляется через 2 минуты, вторая доставляется через 6 минут, третья доставляется через 4 минуты (2 + 6 + 4 = 12; 12/3 = 4). Армирование доставляется в среднем через 4 минуты.
- Лабораторный пример: VI 10-s = поведение крысы при нажатии на планку усиливается при первом нажатии на планку после прохождения в среднем 10 секунд с момента последнего армирования.
- Пример из реальной жизни: VI 30-min = Отправляясь на рыбалку - вы можете поймать рыбу через 10 минут, затем подождать час, а затем подождать 20 минут.
Фиксированное время ( FT) - Обеспечивает подкрепляющий стимул в фиксированное время с момента последней доставки подкрепления, независимо от того, ответил субъект или нет. Другими словами, это безусловный график.
- Лабораторный пример: FT 5-s = крыса получает пищу каждые 5 секунд независимо от поведения.
- Реальный пример: FT 30-d = человек получает ежемесячный чек независимо от поведения между проверками
Переменное время (VT) - Обеспечивает подкрепление в среднем переменное время с момента последнего подкрепления, независимо от того, ответил субъект или нет.

Простые расписания используются во многих процедурах дифференциального подкрепления:

Дифференциальное подкрепление альтернативного поведения (DRA) - процедура обуславливания, в которой нежелательная реакция снижается путем помещения ее на исчезновение или, что реже, предусматривается условное наказание с одновременным обеспечением контингента подкрепления. на желаемый ответ. Примером может служить учитель, который обслуживает ученика только тогда, когда он поднимает руку, и игнорирует ученика, когда он или она кричит.
Дифференциальное подкрепление другого поведения (DRO) - также известные как процедуры обучения бездействию, инструментальная процедура кондиционирования, в которой положительное подкрепление периодически доставляется только в том случае, если участник делает что-то, кроме целевой реакции. Примером может служить усиление любого действия рукой, кроме ковыряния в носу.
Дифференциальное подкрепление несовместимого поведения (DRI) - используется для уменьшения частого поведения без наказания путем усиления несовместимого ответа. Примером может служить усиление хлопков для уменьшения ковыряния в носу
Дифференциальное усиление низкой скорости ответа (DRL) - используется для поощрения низкой скорости реакции. Это похоже на интервальный график, за исключением того, что преждевременные ответы сбрасывают время, необходимое между поведением.
- Лабораторный пример: DRL 10-s = крыса получает подкрепление для первого ответа через 10 секунд, но если крыса отвечает раньше, чем через 10 секунд, подкрепления нет, и крыса должна ждать 10 секунд после этого преждевременного родов. ответ без другого ответа до нажатия ползунка приведет к усилению.
- Пример из реальной жизни: «Если вы попросите у меня картофельные чипсы не чаще, чем раз в 10 минут, я дам их вам. Если вы попросите чаще я не дам вам ничего. "
Дифференциальное подкрепление высокой скорости (DRH) - Используется для увеличения высокой скорости реакции. Это похоже на расписание с интервалом, за исключением того, что в интервале требуется минимальное количество ответов, чтобы получить подкрепление.
- Лабораторный пример: DRH 10-s / FR 15 = крыса должна нажать на планку 15 раз с шагом в 10 секунд, чтобы получить подкрепление.
- Пример из реальной жизни: «Если Лэнс Армстронг собирается выиграть Тур де Франс, он должен крутить педали x раз в течение y-часового забега ».

Влияние различных типов простых графиков

Исправлено соотношение: активность замедляется после доставки подкрепления, затем скорость реакции увеличивается до следующей доставки подкрепления (пауза после подкрепления).
Переменное соотношение: быстрая, устойчивая скорость ответа; наиболее устойчив к исчезновению.
Фиксированный интервал: количество ответов возрастает к концу интервала; плохая устойчивость к исчезновению.
Переменный интервал: стабильные результаты активности, хорошая устойчивость к исчезновению.
Графики соотношения дают более высокую скорость реакции, чем интервальные графики, когда скорости подкрепления в остальном схожи.
Переменные графики дают более высокие показатели и большую устойчивость к вымиранию, чем большинство фиксированных графиков. Это также известно как эффект угасания частичного подкрепления (PREE).
График с переменным соотношением дает как самую высокую скорость реакции, так и самое большое сопротивление исчезновению (например, поведение игроков в игровых автоматах ).
Фиксированные расписания производят «паузы после подкрепления» (PRP), когда ответы на короткое время прекращаются сразу после подкрепления, хотя пауза является функцией предстоящего требования ответа, а не предыдущего подкрепления.
- PRP расписания с фиксированным интервалом часто сопровождается ускоряющейся скоростью реакции в форме гребешка, в то время как расписания с фиксированным соотношением дают более «угловой» ответ.
  - гребешок с фиксированным интервалом: паттерн реагирования, который развивается с фиксированным интервальным графиком подкрепления, производительность на фиксированном интервале отражает точность субъектом определения времени.
Организмы, чьи графики подкрепления "истончены" (то есть требуют большего количества ответов или большего ожидания перед армированием) может возникнуть "относительная деформация" при слишком быстром разбавлении. Это приводит к поведению, аналогичному тому, что было во время вымирания.
- Деформация соотношения: нарушение реакции, которое происходит, когда требование фиксированного соотношения отклика увеличивается слишком быстро.
- Прогон соотношения: высокая и устойчивая скорость отклика, которая выполняет каждое требование соотношения. Обычно более высокое соотношение приводит к более длительным паузам после армирования.
Графики частичного армирования более устойчивы к исчезновению Ион, чем графики непрерывного армирования.
- Графики соотношений более устойчивы, чем графики интервалов, а графики переменных более устойчивы, чем фиксированные.
- Мгновенные изменения значения подкрепления приводят к динамическим изменениям в поведении.

Составные графики

Составные расписания объединяют два или более разных простых расписания тем или иным образом, используя одно и то же подкрепление для одного и того же поведения. Есть много возможностей; Среди наиболее часто используемых:

Альтернативные расписания - Тип составного расписания, в котором действуют два или более простых расписания, и в зависимости от того, какой из расписаний выполняется первым, приводит к подкреплению.
Конъюнктивные расписания - A сложный график подкрепления, в котором два или более простых расписания действуют независимо друг от друга, а требования ко всем простым расписаниям должны выполняться для подкрепления.
Множественные расписания - Два или более расписания чередуются во времени, с стимул, указывающий, что действует. Подкрепление доставляется, если требование ответа выполняется во время действия расписания.
- Пример: FR4 при свистке и FI6 при звонке.
Смешанные расписания - Любое из двух или более расписаний может выполняться без стимула, указывающего, какой из них действует. Подкрепление доставляется, если требование ответа выполняется во время действия расписания.
- Пример: FI6, а затем VR3 без какого-либо стимула, предупреждающего об изменении расписания.
Одновременное управление двумя расписаниями подкрепления Параллельные расписания - сложная процедура подкрепления, в которой участник может выбрать любой из двух или более простых расписаний армирования, доступных одновременно. Организмы могут свободно переключаться между вариантами ответа в любое время.
- Пример из реальной жизни: смена каналов на телевидении.
График подкрепления в параллельной цепи - Сложная процедура подкрепления, в которой участнику разрешается выбирать во время первого звена, какой из нескольких простых графики подкрепления будут действовать во второй ссылке. После того, как выбор сделан, отклоненные альтернативы становятся недоступными до начала следующего испытания.
Взаимосвязанные расписания - Единое расписание с двумя компонентами, где прогресс в одном компоненте влияет на прогресс в другом компоненте. Например, во взаимосвязанном расписании FR 60 FI 120 с каждый ответ вычитает время из компонента интервала, так что каждый ответ «равен» удалению двух секунд из расписания FI.
Связанные расписания - Выполняется подкрепление после того, как два или более последовательных расписания были завершены, со стимулом, указывающим, когда одно расписание было завершено, а следующее началось
- Пример: В расписании FR 10 при наличии красного светового сигнала голубь клюет зеленый диск 10 раз; затем желтый свет указывает на то, что расписание FR 3 активно; после того, как голубь 3 раза клюнет желтый диск, загорится зеленый свет, указывающий, что действует 6-секундный график VI; если бы это было последнее расписание в цепочке, голубь был бы усилен за клевание зеленого диска по расписанию VI 6 с; однако все требования расписания в цепочке должны быть выполнены до того, как будет предоставлено подкрепление.
Тандемные расписания - подкрепление происходит, когда два или более последовательных требования расписания были выполнены, без стимула, указывающего, когда расписание было выполнено и следующее началось.
- Пример: VR 10, после его завершения расписание изменяется без предупреждения на FR 10, после этого оно изменяется без предупреждения на FR 16 и т. Д. В конце серии расписаний подкрепление наконец дано.
Графики высшего порядка - выполнение одного графика подкрепляется вторым графиком; например в FR2 (FI10 секунд) два последовательных расписания с фиксированными интервалами требуют завершения до того, как ответ будет усилен.

Наложенные расписания

Термин психология наложенные расписания подкрепления относится к структуре вознаграждений где одновременно действуют два и более простых графика армирования. Подкрепления могут быть положительными, отрицательными или и тем, и другим. Примером может служить человек, который приходит домой после долгого рабочего дня. Поведение при открытии входной двери вознаграждается большим поцелуем в губы супругом человека и разрывом штанов от энтузиазма прыгающей семейной собаки. Другой пример наложенных графиков подкрепления - это голубь в экспериментальной клетке, клюющий кнопку. Клевки доставляют бункер зерна каждый 20-й клевок и доступ к воде после каждых 200 клевков.

Наложенные графики подкрепления - это тип составного графика, который развился из первоначальной работы над простыми графиками подкрепления Б.Ф. Скиннер и его коллеги (Скиннер и Ферстер, 1957). Они продемонстрировали, что подкрепления можно доставлять по расписанию, а также что организмы по-разному ведут себя в разных расписаниях. Вместо поощрения, такого как еда или вода, которое доставляется каждый раз как следствие какого-либо поведения, поощрение может быть доставлено после нескольких случаев такого поведения. Например, от голубя может потребоваться десять раз клевать кнопочный переключатель, прежде чем появится еда. Это «график соотношений». Кроме того, поощрение может быть доставлено по истечении определенного промежутка времени после целевого поведения. Примером может служить крыса , которой дают корм в виде гранул сразу после первого ответа, который происходит по прошествии двух минут с момента последнего нажатия на рычаг. Это называется «интервальным расписанием».

Кроме того, графики соотношений могут обеспечивать подкрепление после фиксированного или переменного количества действий отдельного организма. Точно так же интервальные графики могут обеспечивать подкрепление через фиксированные или переменные интервалы времени после единственной реакции организма. Индивидуальное поведение, как правило, вызывает частоту реакции, которая различается в зависимости от того, как создается график подкрепления. Многие последующие исследования, проведенные во многих лабораториях, изучали влияние на поведение подкреплений по расписанию.

Если организму предлагается возможность выбирать между двумя или более простыми схемами подкрепления одновременно, структура подкрепления называется «параллельным графиком подкрепления». Брехнер (1974, 1977) ввел концепцию наложенных графиков подкрепления в попытке создать лабораторную аналогию социальных ловушек, например, когда люди чрезмерно собирают свои рыболовства или сносить их тропические леса. Брехнер создал ситуацию, когда простые схемы подкрепления накладывались друг на друга. Другими словами, один ответ или группа ответов организма приводили к множеству последствий. Параллельные графики подкрепления можно рассматривать как графики «или», а наложенные графики подкрепления можно рассматривать как графики «и». Брехнер и Линдер (1981) и Брехнер (1987) расширили концепцию, чтобы описать, как наложенные графики и аналогия социальной ловушки могут быть использованы для анализа того, как энергия течет через системы..

Наложенные графики подкрепления имеют множество реальных применений, помимо создания социальных ловушек. Можно создать множество различных человеческих индивидуальных и социальных ситуаций, наложив простые графики подкрепления. Например, человек может одновременно иметь табачную и алкогольную зависимость. Можно создать или смоделировать еще более сложные ситуации, наложив два или более параллельных расписания. Например, у старшеклассника может быть выбор между поступлением в Стэнфордский университет или Калифорнийский университет в Лос-Анджелесе, и в то же время у него есть выбор пойти в армию или военно-воздушные силы, и одновременно выбрать работу в интернет-компании или работа в софтверной компании. Это структура армирования из трех наложенных параллельных графиков армирования.

Наложенные графики подкрепления могут создать три классические конфликтные ситуации (конфликт подхода-подхода, конфликт подхода-избегания и конфликт избегания-избегания), описанных Куртом Левином (1935) и может операционализировать другие ситуации Левина, проанализированные его анализом силового поля. Другими примерами использования наложенных графиков подкрепления в качестве аналитического инструмента являются его применение к непредвиденным обстоятельствам, связанным с контролем арендной платы (Brechner, 2003), и проблема сброса токсичных отходов в ливневую канализационную систему округа Лос-Анджелес (Brechner, 2010).

Параллельные расписания

В оперантной обусловленности параллельные расписания подкрепления - это графики подкрепления, которые одновременно доступны животному-субъекту или участнику-человеку, так что субъект или участник может ответить по любому расписанию. Например, в задаче с двумя вариантами принудительного выбора, голубь в коробке Скиннера сталкивается с двумя клевыми ключами; Ответы на клевание могут быть вызваны любым из них, и пищевое подкрепление может следовать за клювом любого. Графики армирования клювов на два ключа могут быть разными. Они могут быть независимыми или могут быть связаны, так что поведение по одному ключу влияет на вероятность подкрепления по другому.

Нет необходимости, чтобы ответы в двух графиках были физически разными. В альтернативном способе организации параллельных расписаний, введенном Финдли в 1958 году, оба расписания размещаются на одной клавише или другом устройстве ответа, и субъект может реагировать на вторую клавишу, чтобы переключаться между расписаниями. В такой «параллельной» процедуре Финдли стимул (например, цвет основного ключа) сигнализирует о том, какое расписание действует.

Параллельные расписания часто вызывают быстрое переключение клавиш. Чтобы предотвратить это, обычно вводится «задержка переключения»: каждое расписание деактивируется на короткий период после того, как субъект переключается на него.

Когда действуют оба параллельных расписания, между относительной скоростью отклика в двух расписаниях и относительной скоростью подкрепления, которую они обеспечивают, обнаруживается количественная взаимосвязь, известная как закон соответствия ; это впервые заметил Р.Дж. Herrnstein в 1961 году. Закон соответствия - это правило для инструментального поведения, которое гласит, что относительная скорость реакции на конкретную альтернативу реакции равна относительной скорости подкрепления для этой реакции (скорость поведения = скорость подкрепления). Животные и люди имеют тенденцию предпочитать выбор в расписании.

Формирование

Формирование - это усиление последовательных приближений к желаемой инструментальной реакции. Например, при обучении крысы нажимать на рычаг сначала усиливается простой поворот к рычагу. Тогда только поворот и шаг к нему усиливается. Результаты одного набора поведений запускают процесс формирования следующего набора поведений, а результаты этого набора подготавливают процесс формирования следующего набора и так далее. По мере того, как обучение прогрессирует, усиленная реакция становится все больше похожей на желаемое поведение; каждое последующее поведение становится более близким к окончательному поведению.

Цепочка

Цепочка включает в себя соединение дискретных поведений в серию, так что каждый результат каждого поведения является одновременно подкреплением (или следствием) для предыдущего поведения и стимулы (или антецедент) для следующего поведения. Есть много способов обучения цепочке, например прямая цепочка (начиная с первого поведения в цепочке), обратная цепочка (начиная с последнего поведения) и полная цепочка задач (в которой все поведение обучается от начала до конца, а точнее чем как последовательность шагов). Пример - открытие запертой двери. Сначала вставляется ключ, потом поворачивается, потом открывается дверь.

Прямая цепочка научит субъекта сначала вставлять ключ. Как только эта задача будет освоена, их просят вставить ключ и учат его поворачивать. Как только эта задача будет освоена, их просят выполнить первые два, а затем учат открывать дверь. При обратной цепочке учитель сначала вставляет и поворачивает ключ, а затем испытуемого учат открывать дверь. Как только это усвоено, учитель вставляет ключ, и испытуемого учат его поворачивать, а затем открывает дверь в качестве следующего шага. Наконец, испытуемого учат вставлять ключ, и они поворачиваются и открывают дверь. Как только первый шаг освоен, вся задача усвоена. Полная цепочка задач предполагает обучение всей задаче как единой серии с подсказками на всех этапах. Подсказки блекнут (уменьшаются) на каждом шаге по мере освоения.

Убедительное общение и теория подкрепления

Убедительное общение: Убеждение влияет на то, как он думает, действует и чувствует. Навык убеждения рассказывает о том, как люди понимают заботу, положение и потребности людей. Убеждение можно разделить на неформальное убеждение и формальное убеждение.
Неформальное убеждение: Это говорит о том, как человек взаимодействует с коллегами и клиентами. Неформальное убеждение можно использовать в команде, в записках, а также в электронных письмах.
Формальное убеждение: Этот тип убеждения используется при написании письма клиента, предложения, а также для формального представления любому клиент или коллеги.
Процесс убеждения: Убеждение касается того, как вы влияете на людей своими навыками, опытом, знаниями, лидерством, качествами и возможностями команды. Убеждение - это интерактивный процесс, при котором работа выполняется другими. Вот примеры, для которых вы можете использовать навыки убеждения в реальном времени. Собеседование: вы сможете доказать свои лучшие таланты, навыки и опыт. Клиенты: направлять ваших клиентов для достижения целей или задач. Заметки: чтобы выразить свои идеи и взгляды коллегам по улучшению работы. Идентификация сопротивления и позитивное отношение - жизненно важные роли убеждения.

Убеждение - это форма человеческого взаимодействия. Это происходит, когда один человек ожидает определенного ответа от одного или нескольких других лиц и намеренно стремится обеспечить ответ с помощью коммуникации. Коммуникатор должен понимать, что разные группы имеют разные ценности.

В ситуациях инструментального обучения, которые связаны с оперантным поведением, убедительный коммуникатор представляет свое сообщение, а затем ждет, пока получатель даст правильный ответ. Как только получатель ответит, коммуникатор попытается исправить ответ соответствующим вознаграждением или подкреплением.

В условных обучающих ситуациях, когда есть поведение респондента, коммуникатор представляет свое сообщение, чтобы выявить ответ, который он хочет от получателя, и стимул, который первоначально служил для того, чтобы вызвать ответ, затем становится подкрепляющим или вознаграждающим элементом в формировании условий.

Математические модели

Много работы было проделано в построение математической модели армирования. Эта модель известна как MPR, сокращение от математических принципов армирования. Питер Киллин сделал ключевые открытия в этой области, изучая голубей.

Критика

Стандартное определение поведенческого подкрепления подвергалось критике как круговое, поскольку оно кажется утверждают, что сила реакции увеличивается за счет подкрепления, и определяет подкрепление как нечто, что увеличивает силу реакции (т. е. сила реакции увеличивается за счет того, что увеличивает силу реакции). Однако правильное использование подкрепления состоит в том, что что-то является подкреплением из-за своего воздействия на поведение, а не наоборот. Он становится круговым, если кто-то говорит, что определенный стимул усиливает поведение, потому что он является подкреплением, и не объясняет, почему стимул оказывает такой эффект на поведение. Были предложены другие определения, такие как F.D. «Конструктивное поведение Шеффилда, зависящее от реакции», но они широко не используются в психологии.

Все чаще понимание роли, которую играют подкрепления, уходит от «усиливающего» эффекта к «сигнальному». То есть мнение о том, что подкрепления усиливают реакцию, потому что они сигнализируют о поведении, которое может привести к подкреплению. Хотя в большинстве практических приложений эффект любого данного подкрепления будет одинаковым, независимо от того, является ли подкрепление сигналом или укрепляющим, этот подход помогает объяснить ряд поведенческих явлений, включая модели реагирования на периодические графики подкрепления (гребешки с фиксированным интервалом) и эффект дифференциальных исходов.

История терминов

В 1920-х годах русский физиолог Иван Павлов, возможно, был первым, кто использовал слово «подкрепление» в отношении поведения, но ( согласно Динсмур ) он использовал его приблизительное русское родственное слово умеренно, и даже тогда это относилось к усилению уже усвоенной, но ослабляющей реакции. Он не использовал его, как сегодня, для выбора и укрепления новых моделей поведения. Введение Павлова слова «вымирание» примерно соответствует сегодняшнему психологическому употреблению.

В популярном использовании положительное подкрепление часто используется как синоним вознаграждения, при этом люди (а не поведение), таким образом, «подкрепляются», но это противоречит последовательному техническому использованию этого термина, поскольку это измерение поведения, а не человека, которое усиливается. Отрицательное подкрепление часто используется непрофессионалами и даже социологами вне психологии как синоним наказания. Это противоречит современному техническому использованию, но именно Б.Ф. Скиннер, который первым использовал это в своей книге 1938 года. К 1953 году, однако, он вслед за другими использовал слово «наказание» и использовал отрицательное подкрепление для устранения отвратительных стимулов.

Есть некоторые в области анализа поведения, которые предположили, что термины «положительный» и «отрицательный» составляют ненужное различие при обсуждении подкрепления, поскольку часто неясно, удаляются ли стимулы или предъявляются. Например, Ивата задает вопрос: «... является ли изменение температуры более точным проявлением холода (тепла) или отводом тепла (холода)?» Таким образом, подкрепление может быть концептуализировано как состояние до изменения, замененное условием после изменения, которое усиливает поведение, которое последовало за изменением условий стимула.

Приложения

Подкрепление и наказание повсеместно используются в человеческих социальных взаимодействиях, и было предложено и реализовано очень много приложений оперантных принципов. Ниже приведены несколько примеров.

Зависимость и зависимость

Положительное и отрицательное подкрепление играют центральную роль в развитии и поддержании зависимости и наркотической зависимости. Наркотик, вызывающий привыкание, сам по себе полезен ; то есть он функционирует как первичное положительное подкрепление употребления наркотиков. Система вознаграждения мозга придает ему значимость стимула (т. Е. «Желательно» или «желательно»), так что по мере развития зависимости лишение наркотика приводит к влечению. Кроме того, стимулы, связанные с употреблением наркотиков - например, вид шприца и место использования - становятся связанными с интенсивным подкреплением, вызываемым наркотиком. Эти ранее нейтральные стимулы приобретают несколько свойств: их появление может вызывать тягу, и они могут стать условными положительными подкреплениями дальнейшего употребления. Таким образом, если зависимый человек сталкивается с одним из этих наркотических сигналов, тяга к соответствующему наркотику может появиться снова. Например, агентства по борьбе с наркотиками ранее использовали плакаты с изображением принадлежностей для употребления наркотиков как попытку показать опасность употребления наркотиков. Однако такие плакаты больше не используются из-за эффекта значимости стимула, вызывающего рецидив при виде стимулов, изображенных на плакатах.

У лиц, зависимых от наркотиков, отрицательное подкрепление возникает, когда препарат вводится самостоятельно, чтобы облегчить или «избежать» симптомов физической зависимости (например, тремор и потоотделение) и / или психологическая зависимость (например, ангедония, беспокойство, раздражительность и беспокойство), возникающие во время состояния отмены наркотиков.

Дрессировка животных

Цыпленок катается на скейтборде

Дрессировщики и владельцы домашних животных применяли принципы и методы оперантного кондиционирования задолго до того, как эти идеи были названы и изучены, и дрессировка животных по-прежнему является одним из самых ясных и убедительных примеры оперантного управления. Из концепций и процедур, описанных в этой статье, наиболее заметными являются следующие: наличие немедленного подкрепления (например, вездесущий мешок собачьих вкусняшек); случайность, гарантирующая, что подкрепление следует желаемому поведению, а не чему-то еще; использование вторичного подкрепления, например, при прозвоне кликера сразу после желаемого ответа; формирование, как в постепенном приучении собаки прыгать все выше и выше; периодическое подкрепление, уменьшающее частоту этих вкусняшек, чтобы вызвать стойкое поведение без насыщения; цепочка, при которой сложное поведение постепенно складывается.

Поведение ребенка - обучение родителей управлению

Обеспечение положительного подкрепления правильного поведения ребенка является основным направлением обучения родителей управлению. Как правило, родители учатся поощрять соответствующее поведение с помощью социальных поощрений (например, похвалы, улыбки и объятия), а также конкретных поощрений (например, наклеек или указаний на более крупное вознаграждение в рамках системы поощрений, созданной совместно с ребенком). Кроме того, родители учатся выбирать простое поведение в качестве первоначального акцента и вознаграждают за каждый из маленьких шагов, которые их ребенок делает для достижения большей цели (эта концепция называется «последовательные приближения»). Они также могут использовать косвенные вознаграждения, такие как диаграммы прогресса. Положительное подкрепление в классе может быть полезно для успеха учащихся. Применяя позитивное подкрепление к ученикам, очень важно сделать его индивидуальным для нужд этого ученика. Таким образом, ученик понимает, почему он получает похвалу, он может принять ее и, в конечном итоге, научиться продолжать действие, которое было заработано положительным подкреплением. Например, использование поощрений или дополнительных перерывов может относиться к некоторым студентам больше, в то время как другие могут согласиться с принуждением, получив стикеры или отметки с похвалой.

Экономика

И психологи, и экономисты заинтересовались применением оперантных концепций и открытий к поведению людей на рынке. Примером может служить анализ потребительского спроса, индексированного по количеству приобретенного товара. В экономике степень влияния цены на потребление называется «ценовой эластичностью спроса». Некоторые товары более эластичны, чем другие; например, изменение цен на определенные продукты питания может иметь большое влияние на покупаемое количество, в то время как бензин и другие предметы первой необходимости могут меньше зависеть от изменений цен. С точки зрения оперантного анализа, такие эффекты могут быть интерпретированы с точки зрения мотивации потребителей и относительной ценности товаров как подкрепляющих факторов.

Азартные игры - планирование с переменным соотношением

Как было сказано ранее в этой статье, график с переменным соотношением дает подкрепление после выдачи непредсказуемого числа ответов. Этот график обычно обеспечивает быструю и настойчивую реакцию. Игровые автоматы окупаются по графике соотношения переменного, и они производят именно такого рода упорного рычага таскания поведения игроков. Поскольку автоматы запрограммированы на выплату меньше денег, чем они получают, постоянный пользователь игрового автомата неизменно проигрывает в долгосрочной перспективе. Игровые автоматы и, следовательно, усиление с переменным коэффициентом часто называют фактором, лежащим в основе игровой зависимости.

Теория подталкивания

Теория подталкивания (или подталкивание) - это концепция в науке о поведении, политическая теория и экономика, в которых утверждается, что положительное подкрепление и косвенные внушения с целью достижения ненасильственного подчинения могут влиять на мотивы, стимулы и принятие решений группами и отдельными лицами, по крайней мере, так же эффективно, если не более эффективно, чем прямое указание, законодательство или правоприменение.

Похвала

Концепция похвалы как средства поведенческого подкрепления у людей уходит корнями в модель оперантного обусловливания Б.Ф. Скиннера. Через эту призму похвала рассматривается как средство положительного подкрепления, при котором наблюдаемое поведение повышается за счет случайной похвалы за такое поведение. Сотни исследований продемонстрировали эффективность похвалы в поощрении позитивного поведения, особенно в исследовании того, как учителя и родители используют похвалу в отношении ребенка для улучшения поведения и успеваемости, а также в исследовании производительности труда. Также было продемонстрировано, что похвала усиливает позитивное поведение у соседних людей, которых не хвалят (например, у одноклассника получателя похвалы) через косвенное подкрепление. Похвала может быть более или менее эффективной в изменении поведения в зависимости от ее формы, содержания и подачи. Для того чтобы похвала повлияла на позитивное изменение поведения, она должна зависеть от позитивного поведения (т. Е. Вводиться только после того, как целевое поведение реализовано), должна указывать особенности поведения, которое должно быть усилено, и должна быть искренней и искренней.

Признавая эффект похвалы как позитивную стратегию подкрепления, многочисленные поведенческие и когнитивные поведенческие вмешательства включали использование похвалы в свои протоколы. Стратегическое использование похвалы признано практикой, основанной на фактах, как в управлении классом, так и в программах обучения родителей, хотя в исследованиях вмешательства похвала часто относят к более широкой категории положительного подкрепления, которая включает такие стратегии, как стратегическое внимание и поведенческое вознаграждение.

Психологические манипуляции

Брайкер выявил следующие способы, которыми манипуляторы контролируют своих жертв:

Положительное подкрепление : включает похвалу, поверхностное очарование, поверхностное сочувствие (крокодиловы слезы ), чрезмерные извинения, деньги, одобрение, подарки, внимание, выражения лица, такие как вынужденный смех или улыбка, и публичные признание.
Отрицательное подкрепление : может включать удаление одного из негативных ситуаций
Прерывистое или частичное подкрепление : Частичное или периодическое отрицательное подкрепление может создать эффективную атмосферу страха и сомнений. Частичное или периодическое положительное подкрепление может побудить жертву упорствовать - например, в большинстве форм азартных игр игрок, вероятно, будет выигрывать время от времени, но в целом все равно теряет деньги.
Наказание : включает придирки, крики, молчание, запугивание, угрозы, ругань, эмоциональный шантаж, чувство вины, дуться, плакать и играть жертву.
Травматическое однократное обучение: использование словесных оскорблений, взрывного гнева или другого пугающего поведения для установления доминирования или превосходства; даже один случай такого поведения может вызвать у или научить жертву избегать расстройства, столкновения или противоречия с манипулятором.

Травматическая связь

Травматическая связь возникает в результате продолжающихся циклов жестокого обращения, при котором периодическое усиление вознаграждения и наказания создает сильные эмоциональные связи, устойчивые к изменениям.

Другой источник указал, что «Необходимыми условиями для травмирующих связей являются следующие: один человек должен доминировать над другим, и уровень жестокого обращения постоянно возрастает, а затем спадает. Отношения характеризуются периодами снисходительного, сострадательного и даже ласкового поведения доминирующего человека, перемежающихся периодическими эпизодами жестокого обращения. Чтобы сохранить преимущество, обидчик манипулирует поведением жертвы и ограничивает ее возможности, чтобы сохранить дисбаланс сил. Любая угроза равновесию доминирования и подчинения может быть встречена нарастающим циклом наказания, варьирующимся от бурного запугивания до яростных вспышек насилия. Виктимизатор также изолирует жертву от других источников поддержки, что снижает вероятность обнаружения и вмешательства, ухудшает способность жертвы получать уравновешивающую обратную связь с самореферентной реакцией и усиливает чувство односторонней зависимости... Травматические эффекты этих оскорбительных отношений может включать в себя нарушение способности жертвы к точной самооценке, ведущее к чувству личной неадекватности и подчиненному чувству зависимости от доминирующего человека. Жертвы также могут столкнуться с различными неприятными социальными и правовыми последствиями своей эмоциональной и поведенческой связи с кем-то, кто совершил агрессивные действия, даже если они сами были реципиентами агрессии.

Видеоигры

Большинство видеоигр построено вокруг некоторого типа цикла принуждения, добавляя тип положительного подкрепления через график с переменной скоростью, чтобы игрок продолжал играть в игру, хотя это также может привести к к зависимости от видеоигр.

В рамках тенденции монетизации видеоигр в 2010-х годах в некоторых играх предлагались «ящики с добычей» в качестве вознаграждения или которые можно было приобрести за реальные фонды, которые предлагали случайный выбор игровых предметов, распределенных по редкости. Эта практика была привязана к тем же методам, которые используются в игровых автоматах и других игровых устройствах для выплаты вознаграждений, поскольку она следует графику с переменной ставкой. В то время как общее мнение, что лутбоксы являются формой азартных игр, такая практика классифицируется как азартные игры только в некоторых странах и является законной. Однако методы использования этих предметов в качестве виртуальной валюты для азартных онлайн-игр или торговли за реальные деньги создали рынок азартных игр, который проходит юридическую оценку.

Культура страха на рабочем месте

Эшфорт обсудил потенциально деструктивные стороны лидерства и определил то, что он назвал мелкими тиранами : лидерами, которые придерживаются тиранического стиля управления, что создает атмосферу страха в рабочее место. Частичное или периодическое негативное подкрепление может создать эффективную атмосферу страха и сомнения. Когда сотрудники понимают, что хулиганы терпимы, это может вызвать атмосферу страха.

Индивидуальные различия в чувствительности к вознаграждению, наказанию и мотивация изучалась в соответствии с предпосылками теории чувствительности к подкреплению, а также применялась к производительности на рабочем месте.

См. также

Ссылки

Дополнительная литература

Внешние ссылки