В поведенческой психологии, подкрепление - это последствие, которое будет усиливать будущее поведение организма всякий раз, когда этому поведению предшествует определенный предшествующий стимул. Этот усиливающий эффект может быть измерен как более высокая частота поведения (например, более частое нажатие на рычаг), более длительная (например, нажатие на рычаг в течение более длительных периодов времени), большая величина (например, нажатие на рычаг с большей силой), или более короткое время ожидания (например, более быстрое нажатие на рычаг после предшествующего стимула). Есть два типа подкрепления, известные как положительное подкрепление и отрицательное подкрепление; положительное - это когда вознаграждение предлагается за проявление желаемого поведения, а отрицательное - это устранение нежелательного элемента в среде людей всякий раз, когда желаемое поведение достигается. Вознаграждающие стимулы, которые связаны с «желанием» и «симпатией» (желанием и удовольствием, соответственно) и аппетитным поведением, действуют как положительные подкрепления ; обратное утверждение также верно: положительные подкрепления обеспечивают желаемый стимул. Подкрепление не требует от человека сознательного восприятия эффекта, вызванного стимулом. Таким образом, подкрепление происходит только в том случае, если наблюдается заметное усиление поведения. Однако существует и отрицательное подкрепление, которое характеризуется устранением нежелательного стимула. Смена чьей-либо работы может послужить отрицательным подкреплением для человека, страдающего проблемами со спиной, например, смена рабочего места на офисную должность.
В большинстве случаев термин «подкрепление» относится к улучшению поведения, но этот термин также иногда используется для обозначения улучшения памяти; например, «подкрепление после тренировки» относится к предоставлению стимула (такого как еда) после учебного сеанса в попытке увеличить сохраняемую широту, детализацию и продолжительность отдельных воспоминаний или только что сформированной общей памяти. Стимул, улучшающий память, также может быть стимулом, эффекты которого являются прямо, а не только косвенно эмоциональными, как в случае с феноменом «флэш-память », в котором эмоционально очень интенсивный стимул может стимулировать память о наборе обстоятельства ситуации выходят далеко за рамки тех обстоятельств, которые вызвали эмоционально значимый стимул, например, когда люди подходящего возраста могут вспомнить, где они были и что они делали, когда узнали об убийстве Джона Ф. Кеннеди или террористических атак 11 сентября 2001 г..
Усиление является важной частью оперантного или инструментального кондиционирования.
Глоссарий наркомании и зависимости | |
---|---|
| |
|
В науках о поведении термины «положительный» и «отрицательный» относятся, если они используются в их строгом техническом смысле, к природе действия, выполняемого обусловливает, а не оценку отвечающего операнта этого действия и его последствий. «Положительные» действия - это те, которые добавляют фактор, приятный или неприятный, к окружающей среде, тогда как «отрицательные» действия - это те, которые удаляют или удерживают от окружающей среды фактор любого типа. В свою очередь, строгое значение «подкрепления» относится только к обусловливанию, основанному на вознаграждении; введение неприятных факторов и устранение или удержание приятных факторов вместо этого упоминается как «наказание», которое при использовании в его строгом смысле, таким образом, противоречит «подкреплению». Таким образом, «положительное подкрепление» относится к добавлению приятного фактора, «положительное наказание» относится к добавлению неприятного фактора, «отрицательное подкрепление» относится к устранению или сдерживанию неприятного фактора, а «отрицательное наказание» относится к устранение или удержание приятного фактора.
Это использование противоречит некоторым нетехническим употреблениям четырех комбинаций терминов, особенно в случае термина «отрицательное подкрепление», которое часто используется для обозначения того, что технический язык описал бы как «положительное наказание». "в том, что нетехническое использование интерпретирует" подкрепление "как включающее в себя вознаграждение и наказание, а" отрицательное "- как относящееся к оценке вводимого фактора отвечающим оперантом. Напротив, в техническом жаргоне используется термин «негативное подкрепление» для описания поощрения данного поведения путем создания сценария, в котором неприятный фактор присутствует или будет присутствовать, но участие в поведении приводит либо к побегу от этого фактора, либо к предотвращению его возникновения., как в экспериментах Мартина Селигмана , связанных с обучением собак методам предотвращения поражения электрическим током.
BF Скиннер был известным и влиятельным исследователем, сформулировавшим многие теоретические конструкции подкрепления и бихевиоризма. Скиннер определил подкрепления в соответствии с изменением силы реакции (скорости реакции), а не более субъективными критериями, такими как то, что кому-то доставляет удовольствие или что ценно. Соответственно, действия, еда или предметы, которые считаются приятными или доставляющими удовольствие, не обязательно могут быть подкрепляющими (поскольку они не вызывают усиления предшествующей реакции). Стимулы, обстановка и действия подходят под определение подкрепления только в том случае, если поведение, которое непосредственно предшествует потенциальному подкреплению, усиливается в аналогичных ситуациях в будущем; например, ребенок, который получает файл cookie, когда он или она просит его. Если частота «запросов cookie» увеличивается, cookie может рассматриваться как усиливающее «поведение запроса cookie». Однако, если "поведение при запросе файлов cookie" не увеличивает, файл cookie не может считаться подкрепляющим.
Единственный критерий, определяющий, является ли стимул подкрепляющим, - это изменение вероятности поведения после введения этого потенциального подкрепления. Другие теории могут фокусироваться на дополнительных факторах, например, ожидал ли человек, что поведение приведет к заданному результату, но в поведенческой теории подкрепление определяется повышенной вероятностью ответа.
Исследование армирования дало огромное количество воспроизводимых экспериментальных результатов. Подкрепление является центральным понятием и процедурой в специальном обучении, прикладном анализе поведения и экспериментальном анализе поведения и является ключевым понятием в некоторых медицинских и психофармакологические модели, в частности зависимость, зависимость и принуждение.
Лабораторные исследования подкрепления обычно датируются работами из Эдвард Торндайк, известный своими экспериментами с кошками, убегающими из ящиков с головоломками. Ряд других продолжили это исследование, в частности Б.Ф. Скиннер, который опубликовал свою основополагающую работу по этой теме в «Поведение организмов» в 1938 году и развил это исследование во многих последующих публикациях. В частности, Скиннер утверждал, что положительное подкрепление превосходит наказание в формировании поведения. Хотя наказание может показаться полной противоположностью подкрепления, Скиннер утверждал, что они сильно различаются, говоря, что положительное подкрепление приводит к длительным модификациям поведения (долгосрочным), тогда как наказание меняет поведение только временно (кратковременно) и имеет много вредных побочных эффектов. Впоследствии многие исследователи расширили наше понимание подкрепления и поставили под сомнение некоторые выводы Скиннера. Например, Азрин и Хольц определили наказание как «следствие поведения, которое снижает вероятность такого поведения в будущем», и некоторые исследования показали, что положительное подкрепление и наказание одинаково эффективны в изменении поведения. Исследования эффектов положительного подкрепления, отрицательного подкрепления и наказания продолжаются и сегодня, поскольку эти концепции являются фундаментальными для теории обучения и применимы ко многим практическим приложениям этой теории.
Оперантное кондиционирование | Угасание | ||||||||||||||||||||||||||||||
Подкрепление. Повышение поведения | Наказание. Понижение поведения | ||||||||||||||||||||||||||||||
Позитивное подкрепление . Добавить аппетитный стимул. правильное поведение | отрицательное подкрепление | положительное наказание . добавить вредный стимул. следующее поведение | отрицательное наказание . удалить аппетитный стимул. следующее поведение | ||||||||||||||||||||||||||||
Побег . Удалите вредный стимул. после правильного поведения | Активное избегание . Поведение избегает вредного стимула | ||||||||||||||||||||||||||||||
Термин оперантное кондиционирование был введен Б.Ф. Скиннером, чтобы указать, что в его эксперименте Согласно парадигме, организм может свободно воздействовать на окружающую среду. В этой парадигме экспериментатор не может вызвать желаемый ответ; экспериментатор ждет ответа (который испускает организм), а затем доставляется потенциальное подкрепление. В парадигме классического кондиционирования экспериментатор запускает (вызывает) желаемый ответ, предъявляя вызывающий рефлекс стимул, Безусловный стимул (UCS), который он объединяет (предшествует) с нейтральным стимулом, Условным стимулом (CS).
Усиление - это основной термин оперантного обусловливания. Для аспекта наказания оперантного обусловливания - см. наказание (психология).
Положительное подкрепление происходит, когда желаемое событие или стимул представляется как следствие поведения. и вероятность того, что такое поведение проявится в аналогичной среде, увеличивается.
Методика High Probability Instruction (HPI) - это бихевиорист, основанный на идее положительного подкрепления.
Отрицательное подкрепление возникает, когда скорость поведения увеличивается из-за того, что отвращающее событие или стимул удалено или предотвращено.
Вымирание может быть преднамеренным или непреднамеренным и происходит, когда нежелательное поведение игнорируется.
Подкрепления служат для усиления поведения, тогда как каратели служат для ослабления поведения; таким образом, положительные подкрепления - это стимулы, над достижением которых субъект будет работать, а отрицательные подкрепления - это стимулы, от которых субъект будет стремиться избавиться или закончить. В таблице ниже показано добавление и вычитание стимулов (приятных или отталкивающих) по отношению к подкреплению и наказанию.
Вознаграждение (приятный) стимул | Отвратительный (неприятный) стимул | |
---|---|---|
Добавление / представление | Положительное подкрепление | Позитивное наказание |
Удаление / принятие В гостях | Негативное наказание | Негативное подкрепление |
Например, предложение сладкого ребенка, если он убирает свою комнату, является положительным подкреплением. Шлепать ребенка, если он разбивает окно, - это положительное наказание. Отрицательное наказание - отобрать у ребенка игрушки за плохое поведение. Давать ребенку перерыв в работе, если он хорошо справляется с тестом, является отрицательным подкреплением. «Положительное и отрицательное» не несут в этом смысле значения «хорошее и плохое».
A первичный подкрепление, иногда называемое безусловным подкреплением, - это стимул, который не требует сочетания с другим стимулом для того, чтобы действовать как подкрепление, и, скорее всего, получил эту функцию в результате эволюции и своей роли в выживание вида. Примеры основных подкреплений включают пищу, воду и секс. Некоторые первичные подкрепления, такие как определенные лекарства, могут имитировать эффекты других основных подкреплений. Хотя эти первичные подкрепления довольно стабильны в течение жизни и у разных людей, усиливающая ценность различных основных подкреплений варьируется в зависимости от множества факторов (например, генетики, опыта). Таким образом, один человек может предпочесть один вид пищи, а другой - избегать его. Или один человек может есть много, а другой - очень мало. Таким образом, несмотря на то, что пища является основным подкреплением для обоих людей, ценность пищи как подкрепления у них разная.
A вторичное подкрепление, иногда называемое условным подкреплением, - это стимул или ситуация, которая приобрела свою функцию подкрепления после соединения со стимулом, который действует как подкрепление. Этот стимул может быть основным или другим условным стимулом (например, деньгами). Примером вторичного подкрепления может служить звук щелчка, который используется в тренировке с щелчком. Звук кликера ассоциируется с похвалой или угощением, и впоследствии звук кликера может выступать в качестве поощрения. Другой распространенный пример - звук людей, хлопающих в ладоши - в том, чтобы слышать этот звук, нет ничего положительного, но мы узнали, что он ассоциируется с похвалой и вознаграждением.
Пытаясь различить первичные и вторичные подкрепления на примере людей, используйте «тест пещерного человека». Если стимул - это то, что пещерный человек естественным образом сочтет желательным (например, леденец), то он является основным подкреплением. С другой стороны, если пещерный человек не отреагирует на это (например, долларовая купюра), это вторичное подкрепление. Как и в случае с первичными подкреплениями, организм может испытывать насыщение и лишение вторичных подкреплений.
В своей статье 1967 года« Произвольное и естественное подкрепление »Чарльз Ферстер предложил классифицировать подкрепление на события, которые увеличивают частоту операнта как естественное следствие самого поведения, и события, которые, как предполагается, влияют на частоту из-за их потребности в посредничестве человека, например, в экономике токенов где субъекты «награждаются» за определенное поведение произвольным токеном, имеющим оборотную ценность. В 1970 году Баер и Вольф придумали название для использования естественных усилителей, названных «ловушками поведения». Поведенческая ловушка требует только простой реакции, чтобы попасть в ловушку, но после попадания в ловушку невозможно сопротивляться, вызывая общее изменение поведения. Это использование поведенческой ловушки, которая увеличивает репертуар человека, подвергая его естественному усилению этого поведения. Поведенческие ловушки обладают четырьмя характеристиками:
Как видно из вышеизложенного, искусственное подкрепление на самом деле создается для создания или развития навыков, и, в общем, важно, чтобы либо вводилась поведенческая ловушка, чтобы «захватить» навык и использовать естественные усиление для поддержания или увеличения. Эта поведенческая ловушка может быть просто социальной ситуацией, которая обычно возникает в результате определенного поведения, если оно соответствует определенному критерию (например, если вы используете съедобные подкрепления, чтобы научить человека здороваться и улыбаться людям, когда они их встречают, после этого навык, естественное подкрепление для других людей улыбаются, и более дружеское общение естественным образом укрепит навык, и еда может исчезнуть).
Многое из поведения не подкрепляется каждый раз, когда оно испускается, и образец прерывистого подкрепления сильно влияет на то, как быстро изучается оперантный ответ, какова его скорость в любой момент времени и как долго он продолжается, когда подкрепление прекращается. Самыми простыми правилами, контролирующими подкрепление, являются непрерывное подкрепление, когда подкрепляется каждый ответ, и угашение, когда подкрепление не происходит. Между этими крайностями более сложные «графики подкрепления» определяют правила, которые определяют, как и когда за ответом последует подкрепление.
Определенные графики подкрепления надежно вызывают определенные паттерны реакции, независимо от исследуемых видов (включая людей в некоторых условиях). Однако количественные свойства поведения в рамках данного расписания зависят от параметров расписания, а иногда и от других факторов, не связанных с расписанием. Упорядоченность и предсказуемость поведения в соответствии с графиками подкрепления были доказательством для Б.Ф. Скиннер утверждает, что, используя оперантное обусловливание, он мог получить «контроль над поведением», что сделало теоретические споры современной сравнительной психологии устаревшими. Надежность контроля расписания подтверждает идею о том, что радикальный бихевиорист экспериментальный анализ поведения может быть основой для психологии, которая не имеет отношения к ментальным или когнитивным процессам.. Надежность расписаний также привела к развитию прикладного анализа поведения как средства контроля или изменения поведения.
Многие из более простых возможностей и некоторые из более сложных были подробно исследованы Скиннером с использованием голубей, но новые расписания продолжают определяться и исследоваться.
В простых расписаниях есть одно правило, определяющее, когда один тип поощрения доставляется для определенного ответа.
Простые расписания используются во многих процедурах дифференциального подкрепления:
Составные расписания объединяют два или более разных простых расписания тем или иным образом, используя одно и то же подкрепление для одного и того же поведения. Есть много возможностей; Среди наиболее часто используемых:
Термин психология наложенные расписания подкрепления относится к структуре вознаграждений где одновременно действуют два и более простых графика армирования. Подкрепления могут быть положительными, отрицательными или и тем, и другим. Примером может служить человек, который приходит домой после долгого рабочего дня. Поведение при открытии входной двери вознаграждается большим поцелуем в губы супругом человека и разрывом штанов от энтузиазма прыгающей семейной собаки. Другой пример наложенных графиков подкрепления - это голубь в экспериментальной клетке, клюющий кнопку. Клевки доставляют бункер зерна каждый 20-й клевок и доступ к воде после каждых 200 клевков.
Наложенные графики подкрепления - это тип составного графика, который развился из первоначальной работы над простыми графиками подкрепления Б.Ф. Скиннер и его коллеги (Скиннер и Ферстер, 1957). Они продемонстрировали, что подкрепления можно доставлять по расписанию, а также что организмы по-разному ведут себя в разных расписаниях. Вместо поощрения, такого как еда или вода, которое доставляется каждый раз как следствие какого-либо поведения, поощрение может быть доставлено после нескольких случаев такого поведения. Например, от голубя может потребоваться десять раз клевать кнопочный переключатель, прежде чем появится еда. Это «график соотношений». Кроме того, поощрение может быть доставлено по истечении определенного промежутка времени после целевого поведения. Примером может служить крыса , которой дают корм в виде гранул сразу после первого ответа, который происходит по прошествии двух минут с момента последнего нажатия на рычаг. Это называется «интервальным расписанием».
Кроме того, графики соотношений могут обеспечивать подкрепление после фиксированного или переменного количества действий отдельного организма. Точно так же интервальные графики могут обеспечивать подкрепление через фиксированные или переменные интервалы времени после единственной реакции организма. Индивидуальное поведение, как правило, вызывает частоту реакции, которая различается в зависимости от того, как создается график подкрепления. Многие последующие исследования, проведенные во многих лабораториях, изучали влияние на поведение подкреплений по расписанию.
Если организму предлагается возможность выбирать между двумя или более простыми схемами подкрепления одновременно, структура подкрепления называется «параллельным графиком подкрепления». Брехнер (1974, 1977) ввел концепцию наложенных графиков подкрепления в попытке создать лабораторную аналогию социальных ловушек, например, когда люди чрезмерно собирают свои рыболовства или сносить их тропические леса. Брехнер создал ситуацию, когда простые схемы подкрепления накладывались друг на друга. Другими словами, один ответ или группа ответов организма приводили к множеству последствий. Параллельные графики подкрепления можно рассматривать как графики «или», а наложенные графики подкрепления можно рассматривать как графики «и». Брехнер и Линдер (1981) и Брехнер (1987) расширили концепцию, чтобы описать, как наложенные графики и аналогия социальной ловушки могут быть использованы для анализа того, как энергия течет через системы..
Наложенные графики подкрепления имеют множество реальных применений, помимо создания социальных ловушек. Можно создать множество различных человеческих индивидуальных и социальных ситуаций, наложив простые графики подкрепления. Например, человек может одновременно иметь табачную и алкогольную зависимость. Можно создать или смоделировать еще более сложные ситуации, наложив два или более параллельных расписания. Например, у старшеклассника может быть выбор между поступлением в Стэнфордский университет или Калифорнийский университет в Лос-Анджелесе, и в то же время у него есть выбор пойти в армию или военно-воздушные силы, и одновременно выбрать работу в интернет-компании или работа в софтверной компании. Это структура армирования из трех наложенных параллельных графиков армирования.
Наложенные графики подкрепления могут создать три классические конфликтные ситуации (конфликт подхода-подхода, конфликт подхода-избегания и конфликт избегания-избегания), описанных Куртом Левином (1935) и может операционализировать другие ситуации Левина, проанализированные его анализом силового поля. Другими примерами использования наложенных графиков подкрепления в качестве аналитического инструмента являются его применение к непредвиденным обстоятельствам, связанным с контролем арендной платы (Brechner, 2003), и проблема сброса токсичных отходов в ливневую канализационную систему округа Лос-Анджелес (Brechner, 2010).
В оперантной обусловленности параллельные расписания подкрепления - это графики подкрепления, которые одновременно доступны животному-субъекту или участнику-человеку, так что субъект или участник может ответить по любому расписанию. Например, в задаче с двумя вариантами принудительного выбора, голубь в коробке Скиннера сталкивается с двумя клевыми ключами; Ответы на клевание могут быть вызваны любым из них, и пищевое подкрепление может следовать за клювом любого. Графики армирования клювов на два ключа могут быть разными. Они могут быть независимыми или могут быть связаны, так что поведение по одному ключу влияет на вероятность подкрепления по другому.
Нет необходимости, чтобы ответы в двух графиках были физически разными. В альтернативном способе организации параллельных расписаний, введенном Финдли в 1958 году, оба расписания размещаются на одной клавише или другом устройстве ответа, и субъект может реагировать на вторую клавишу, чтобы переключаться между расписаниями. В такой «параллельной» процедуре Финдли стимул (например, цвет основного ключа) сигнализирует о том, какое расписание действует.
Параллельные расписания часто вызывают быстрое переключение клавиш. Чтобы предотвратить это, обычно вводится «задержка переключения»: каждое расписание деактивируется на короткий период после того, как субъект переключается на него.
Когда действуют оба параллельных расписания, между относительной скоростью отклика в двух расписаниях и относительной скоростью подкрепления, которую они обеспечивают, обнаруживается количественная взаимосвязь, известная как закон соответствия ; это впервые заметил Р.Дж. Herrnstein в 1961 году. Закон соответствия - это правило для инструментального поведения, которое гласит, что относительная скорость реакции на конкретную альтернативу реакции равна относительной скорости подкрепления для этой реакции (скорость поведения = скорость подкрепления). Животные и люди имеют тенденцию предпочитать выбор в расписании.
Формирование - это усиление последовательных приближений к желаемой инструментальной реакции. Например, при обучении крысы нажимать на рычаг сначала усиливается простой поворот к рычагу. Тогда только поворот и шаг к нему усиливается. Результаты одного набора поведений запускают процесс формирования следующего набора поведений, а результаты этого набора подготавливают процесс формирования следующего набора и так далее. По мере того, как обучение прогрессирует, усиленная реакция становится все больше похожей на желаемое поведение; каждое последующее поведение становится более близким к окончательному поведению.
Цепочка включает в себя соединение дискретных поведений в серию, так что каждый результат каждого поведения является одновременно подкреплением (или следствием) для предыдущего поведения и стимулы (или антецедент) для следующего поведения. Есть много способов обучения цепочке, например прямая цепочка (начиная с первого поведения в цепочке), обратная цепочка (начиная с последнего поведения) и полная цепочка задач (в которой все поведение обучается от начала до конца, а точнее чем как последовательность шагов). Пример - открытие запертой двери. Сначала вставляется ключ, потом поворачивается, потом открывается дверь.
Прямая цепочка научит субъекта сначала вставлять ключ. Как только эта задача будет освоена, их просят вставить ключ и учат его поворачивать. Как только эта задача будет освоена, их просят выполнить первые два, а затем учат открывать дверь. При обратной цепочке учитель сначала вставляет и поворачивает ключ, а затем испытуемого учат открывать дверь. Как только это усвоено, учитель вставляет ключ, и испытуемого учат его поворачивать, а затем открывает дверь в качестве следующего шага. Наконец, испытуемого учат вставлять ключ, и они поворачиваются и открывают дверь. Как только первый шаг освоен, вся задача усвоена. Полная цепочка задач предполагает обучение всей задаче как единой серии с подсказками на всех этапах. Подсказки блекнут (уменьшаются) на каждом шаге по мере освоения.
Убеждение - это форма человеческого взаимодействия. Это происходит, когда один человек ожидает определенного ответа от одного или нескольких других лиц и намеренно стремится обеспечить ответ с помощью коммуникации. Коммуникатор должен понимать, что разные группы имеют разные ценности.
В ситуациях инструментального обучения, которые связаны с оперантным поведением, убедительный коммуникатор представляет свое сообщение, а затем ждет, пока получатель даст правильный ответ. Как только получатель ответит, коммуникатор попытается исправить ответ соответствующим вознаграждением или подкреплением.
В условных обучающих ситуациях, когда есть поведение респондента, коммуникатор представляет свое сообщение, чтобы выявить ответ, который он хочет от получателя, и стимул, который первоначально служил для того, чтобы вызвать ответ, затем становится подкрепляющим или вознаграждающим элементом в формировании условий.
Много работы было проделано в построение математической модели армирования. Эта модель известна как MPR, сокращение от математических принципов армирования. Питер Киллин сделал ключевые открытия в этой области, изучая голубей.
Стандартное определение поведенческого подкрепления подвергалось критике как круговое, поскольку оно кажется утверждают, что сила реакции увеличивается за счет подкрепления, и определяет подкрепление как нечто, что увеличивает силу реакции (т. е. сила реакции увеличивается за счет того, что увеличивает силу реакции). Однако правильное использование подкрепления состоит в том, что что-то является подкреплением из-за своего воздействия на поведение, а не наоборот. Он становится круговым, если кто-то говорит, что определенный стимул усиливает поведение, потому что он является подкреплением, и не объясняет, почему стимул оказывает такой эффект на поведение. Были предложены другие определения, такие как F.D. «Конструктивное поведение Шеффилда, зависящее от реакции», но они широко не используются в психологии.
Все чаще понимание роли, которую играют подкрепления, уходит от «усиливающего» эффекта к «сигнальному». То есть мнение о том, что подкрепления усиливают реакцию, потому что они сигнализируют о поведении, которое может привести к подкреплению. Хотя в большинстве практических приложений эффект любого данного подкрепления будет одинаковым, независимо от того, является ли подкрепление сигналом или укрепляющим, этот подход помогает объяснить ряд поведенческих явлений, включая модели реагирования на периодические графики подкрепления (гребешки с фиксированным интервалом) и эффект дифференциальных исходов.
В 1920-х годах русский физиолог Иван Павлов, возможно, был первым, кто использовал слово «подкрепление» в отношении поведения, но ( согласно Динсмур ) он использовал его приблизительное русское родственное слово умеренно, и даже тогда это относилось к усилению уже усвоенной, но ослабляющей реакции. Он не использовал его, как сегодня, для выбора и укрепления новых моделей поведения. Введение Павлова слова «вымирание» примерно соответствует сегодняшнему психологическому употреблению.
В популярном использовании положительное подкрепление часто используется как синоним вознаграждения, при этом люди (а не поведение), таким образом, «подкрепляются», но это противоречит последовательному техническому использованию этого термина, поскольку это измерение поведения, а не человека, которое усиливается. Отрицательное подкрепление часто используется непрофессионалами и даже социологами вне психологии как синоним наказания. Это противоречит современному техническому использованию, но именно Б.Ф. Скиннер, который первым использовал это в своей книге 1938 года. К 1953 году, однако, он вслед за другими использовал слово «наказание» и использовал отрицательное подкрепление для устранения отвратительных стимулов.
Есть некоторые в области анализа поведения, которые предположили, что термины «положительный» и «отрицательный» составляют ненужное различие при обсуждении подкрепления, поскольку часто неясно, удаляются ли стимулы или предъявляются. Например, Ивата задает вопрос: «... является ли изменение температуры более точным проявлением холода (тепла) или отводом тепла (холода)?» Таким образом, подкрепление может быть концептуализировано как состояние до изменения, замененное условием после изменения, которое усиливает поведение, которое последовало за изменением условий стимула.
Подкрепление и наказание повсеместно используются в человеческих социальных взаимодействиях, и было предложено и реализовано очень много приложений оперантных принципов. Ниже приведены несколько примеров.
Положительное и отрицательное подкрепление играют центральную роль в развитии и поддержании зависимости и наркотической зависимости. Наркотик, вызывающий привыкание, сам по себе полезен ; то есть он функционирует как первичное положительное подкрепление употребления наркотиков. Система вознаграждения мозга придает ему значимость стимула (т. Е. «Желательно» или «желательно»), так что по мере развития зависимости лишение наркотика приводит к влечению. Кроме того, стимулы, связанные с употреблением наркотиков - например, вид шприца и место использования - становятся связанными с интенсивным подкреплением, вызываемым наркотиком. Эти ранее нейтральные стимулы приобретают несколько свойств: их появление может вызывать тягу, и они могут стать условными положительными подкреплениями дальнейшего употребления. Таким образом, если зависимый человек сталкивается с одним из этих наркотических сигналов, тяга к соответствующему наркотику может появиться снова. Например, агентства по борьбе с наркотиками ранее использовали плакаты с изображением принадлежностей для употребления наркотиков как попытку показать опасность употребления наркотиков. Однако такие плакаты больше не используются из-за эффекта значимости стимула, вызывающего рецидив при виде стимулов, изображенных на плакатах.
У лиц, зависимых от наркотиков, отрицательное подкрепление возникает, когда препарат вводится самостоятельно, чтобы облегчить или «избежать» симптомов физической зависимости (например, тремор и потоотделение) и / или психологическая зависимость (например, ангедония, беспокойство, раздражительность и беспокойство), возникающие во время состояния отмены наркотиков.
Дрессировщики и владельцы домашних животных применяли принципы и методы оперантного кондиционирования задолго до того, как эти идеи были названы и изучены, и дрессировка животных по-прежнему является одним из самых ясных и убедительных примеры оперантного управления. Из концепций и процедур, описанных в этой статье, наиболее заметными являются следующие: наличие немедленного подкрепления (например, вездесущий мешок собачьих вкусняшек); случайность, гарантирующая, что подкрепление следует желаемому поведению, а не чему-то еще; использование вторичного подкрепления, например, при прозвоне кликера сразу после желаемого ответа; формирование, как в постепенном приучении собаки прыгать все выше и выше; периодическое подкрепление, уменьшающее частоту этих вкусняшек, чтобы вызвать стойкое поведение без насыщения; цепочка, при которой сложное поведение постепенно складывается.
Обеспечение положительного подкрепления правильного поведения ребенка является основным направлением обучения родителей управлению. Как правило, родители учатся поощрять соответствующее поведение с помощью социальных поощрений (например, похвалы, улыбки и объятия), а также конкретных поощрений (например, наклеек или указаний на более крупное вознаграждение в рамках системы поощрений, созданной совместно с ребенком). Кроме того, родители учатся выбирать простое поведение в качестве первоначального акцента и вознаграждают за каждый из маленьких шагов, которые их ребенок делает для достижения большей цели (эта концепция называется «последовательные приближения»). Они также могут использовать косвенные вознаграждения, такие как диаграммы прогресса. Положительное подкрепление в классе может быть полезно для успеха учащихся. Применяя позитивное подкрепление к ученикам, очень важно сделать его индивидуальным для нужд этого ученика. Таким образом, ученик понимает, почему он получает похвалу, он может принять ее и, в конечном итоге, научиться продолжать действие, которое было заработано положительным подкреплением. Например, использование поощрений или дополнительных перерывов может относиться к некоторым студентам больше, в то время как другие могут согласиться с принуждением, получив стикеры или отметки с похвалой.
И психологи, и экономисты заинтересовались применением оперантных концепций и открытий к поведению людей на рынке. Примером может служить анализ потребительского спроса, индексированного по количеству приобретенного товара. В экономике степень влияния цены на потребление называется «ценовой эластичностью спроса». Некоторые товары более эластичны, чем другие; например, изменение цен на определенные продукты питания может иметь большое влияние на покупаемое количество, в то время как бензин и другие предметы первой необходимости могут меньше зависеть от изменений цен. С точки зрения оперантного анализа, такие эффекты могут быть интерпретированы с точки зрения мотивации потребителей и относительной ценности товаров как подкрепляющих факторов.
Как было сказано ранее в этой статье, график с переменным соотношением дает подкрепление после выдачи непредсказуемого числа ответов. Этот график обычно обеспечивает быструю и настойчивую реакцию. Игровые автоматы окупаются по графике соотношения переменного, и они производят именно такого рода упорного рычага таскания поведения игроков. Поскольку автоматы запрограммированы на выплату меньше денег, чем они получают, постоянный пользователь игрового автомата неизменно проигрывает в долгосрочной перспективе. Игровые автоматы и, следовательно, усиление с переменным коэффициентом часто называют фактором, лежащим в основе игровой зависимости.
Теория подталкивания (или подталкивание) - это концепция в науке о поведении, политическая теория и экономика, в которых утверждается, что положительное подкрепление и косвенные внушения с целью достижения ненасильственного подчинения могут влиять на мотивы, стимулы и принятие решений группами и отдельными лицами, по крайней мере, так же эффективно, если не более эффективно, чем прямое указание, законодательство или правоприменение.
Концепция похвалы как средства поведенческого подкрепления у людей уходит корнями в модель оперантного обусловливания Б.Ф. Скиннера. Через эту призму похвала рассматривается как средство положительного подкрепления, при котором наблюдаемое поведение повышается за счет случайной похвалы за такое поведение. Сотни исследований продемонстрировали эффективность похвалы в поощрении позитивного поведения, особенно в исследовании того, как учителя и родители используют похвалу в отношении ребенка для улучшения поведения и успеваемости, а также в исследовании производительности труда. Также было продемонстрировано, что похвала усиливает позитивное поведение у соседних людей, которых не хвалят (например, у одноклассника получателя похвалы) через косвенное подкрепление. Похвала может быть более или менее эффективной в изменении поведения в зависимости от ее формы, содержания и подачи. Для того чтобы похвала повлияла на позитивное изменение поведения, она должна зависеть от позитивного поведения (т. Е. Вводиться только после того, как целевое поведение реализовано), должна указывать особенности поведения, которое должно быть усилено, и должна быть искренней и искренней.
Признавая эффект похвалы как позитивную стратегию подкрепления, многочисленные поведенческие и когнитивные поведенческие вмешательства включали использование похвалы в свои протоколы. Стратегическое использование похвалы признано практикой, основанной на фактах, как в управлении классом, так и в программах обучения родителей, хотя в исследованиях вмешательства похвала часто относят к более широкой категории положительного подкрепления, которая включает такие стратегии, как стратегическое внимание и поведенческое вознаграждение.
Брайкер выявил следующие способы, которыми манипуляторы контролируют своих жертв:
Травматическая связь возникает в результате продолжающихся циклов жестокого обращения, при котором периодическое усиление вознаграждения и наказания создает сильные эмоциональные связи, устойчивые к изменениям.
Другой источник указал, что «Необходимыми условиями для травмирующих связей являются следующие: один человек должен доминировать над другим, и уровень жестокого обращения постоянно возрастает, а затем спадает. Отношения характеризуются периодами снисходительного, сострадательного и даже ласкового поведения доминирующего человека, перемежающихся периодическими эпизодами жестокого обращения. Чтобы сохранить преимущество, обидчик манипулирует поведением жертвы и ограничивает ее возможности, чтобы сохранить дисбаланс сил. Любая угроза равновесию доминирования и подчинения может быть встречена нарастающим циклом наказания, варьирующимся от бурного запугивания до яростных вспышек насилия. Виктимизатор также изолирует жертву от других источников поддержки, что снижает вероятность обнаружения и вмешательства, ухудшает способность жертвы получать уравновешивающую обратную связь с самореферентной реакцией и усиливает чувство односторонней зависимости... Травматические эффекты этих оскорбительных отношений может включать в себя нарушение способности жертвы к точной самооценке, ведущее к чувству личной неадекватности и подчиненному чувству зависимости от доминирующего человека. Жертвы также могут столкнуться с различными неприятными социальными и правовыми последствиями своей эмоциональной и поведенческой связи с кем-то, кто совершил агрессивные действия, даже если они сами были реципиентами агрессии.
Большинство видеоигр построено вокруг некоторого типа цикла принуждения, добавляя тип положительного подкрепления через график с переменной скоростью, чтобы игрок продолжал играть в игру, хотя это также может привести к к зависимости от видеоигр.
В рамках тенденции монетизации видеоигр в 2010-х годах в некоторых играх предлагались «ящики с добычей» в качестве вознаграждения или которые можно было приобрести за реальные фонды, которые предлагали случайный выбор игровых предметов, распределенных по редкости. Эта практика была привязана к тем же методам, которые используются в игровых автоматах и других игровых устройствах для выплаты вознаграждений, поскольку она следует графику с переменной ставкой. В то время как общее мнение, что лутбоксы являются формой азартных игр, такая практика классифицируется как азартные игры только в некоторых странах и является законной. Однако методы использования этих предметов в качестве виртуальной валюты для азартных онлайн-игр или торговли за реальные деньги создали рынок азартных игр, который проходит юридическую оценку.
Эшфорт обсудил потенциально деструктивные стороны лидерства и определил то, что он назвал мелкими тиранами : лидерами, которые придерживаются тиранического стиля управления, что создает атмосферу страха в рабочее место. Частичное или периодическое негативное подкрепление может создать эффективную атмосферу страха и сомнения. Когда сотрудники понимают, что хулиганы терпимы, это может вызвать атмосферу страха.
Индивидуальные различия в чувствительности к вознаграждению, наказанию и мотивация изучалась в соответствии с предпосылками теории чувствительности к подкреплению, а также применялась к производительности на рабочем месте.