Формирование - это парадигма обусловливания, используемая в основном в экспериментальном анализе поведения. Используемый метод - дифференциальное армирование из последовательных приближений . Он был введен Б. Ф. Скиннер с голубями и распространен на собак, дельфинов, людей и другие виды. При формировании форма существующей реакции постепенно изменяется в ходе последовательных испытаний в сторону желаемого целевого поведения за счет усиления определенных сегментов поведения. Скиннер объяснил формирование формы следующим образом:
Сначала мы даем птицу корм, когда она слегка поворачивается в направлении точки из любой части клетки. Это увеличивает частоту такого поведения. Затем мы удерживаем подкрепление до тех пор, пока не будет сделано небольшое движение к точке. Это снова меняет общее распределение поведения без создания новой единицы. Мы продолжаем укреплять позиции, последовательно приближаясь к точке, затем подкрепляя только тогда, когда голова немного сдвинута вперед, и, наконец, только когда клюв действительно соприкасается с точкой.... Первоначальная вероятность ответа в его окончательной форме очень мала; в некоторых случаях может даже быть нулевым. Таким образом, мы можем построить сложные операторы, которые иначе никогда бы не появились в репертуаре организма. Усиливая серию последовательных приближений, мы доводим редкий ответ до очень высокой вероятности за короткое время.... Полный акт поворота к точке из любой точки коробки, ходьбы к ней, поднятия головы и удара по точке может показаться функционально согласованной единицей поведения; но он построен путем непрерывного процесса дифференцированного подкрепления из недифференцированного поведения, точно так же, как скульптор вылепляет свою фигуру из куска глины.
Усиленные последовательные приближения - это все более точные приближения к ответу, желаемому тренером, «целевому» ответу. По мере обучения тренер перестает усиливать менее точные приближения. Например, при обучении крысы нажимать на рычаг могут быть усилены следующие последовательные приближения:
Тренинг начнет с усиления все поведения в первой категории, здесь обращаются к рычагу. Когда животное регулярно выполняет эту реакцию (повороты), дрессировщик ограничивает подкрепление реакциями второй категории (движение вперед), затем третьей и так далее, переходя к каждому более точному приближению по мере того, как животное изучает тот, который в настоящее время подкреплен. Таким образом, отклик постепенно приближается к желаемому поведению, пока, наконец, не будет установлен целевой отклик (нажатие рычага). Поначалу крыса вряд ли нажмет на рычаг; в конце концов давит быстро.
Формирование иногда не удается. Часто цитируемый пример - попытка Мэриан и Келлер Бреланд (ученики Б.Ф. Скиннера) сформировать свинью и енота, чтобы положить монету в копилку, используя пищу в качестве подкрепления. Вместо того, чтобы научиться класть монету, свинья стала укоренять ее в земле, а енот «мыл» и растирал монеты. То есть животные обращались с монетой так же, как они относились к продуктам питания, которые они готовили к употреблению, что называется поведением «получение пищи». В случае с енотом он смог научиться класть одну монету в коробку, чтобы получить пищевое вознаграждение, но когда непредвиденные обстоятельства были изменены таким образом, что для получения награды требовалось две монеты, енот не мог выучить новое, более сложное правило. После того, что можно охарактеризовать как выражение разочарования, енот прибегает к базовым привычкам «добывать пищу», обычным для его вида. Эти результаты показывают ограничение когнитивных способностей енота даже для представления о возможности того, что две монеты можно обменять на еду, независимо от существующих непредвиденных обстоятельств, связанных с автоформированием. С тех пор, как были опубликованы наблюдения Бреланда, было сообщено о многих других примерах необученной реакции на естественные стимулы; во многих контекстах стимулы называются «знаковыми стимулами», а связанное с ними поведение называется «отслеживанием знаков».
Формирование используется при обучении оперантных реакций лабораторных животных, а в прикладном анализе поведения для изменения поведения человека или животных, которое считается быть неадаптивным или дисфункциональным. Он также играет важную роль в дрессировке коммерческих животных. Формирование помогает в «различении», то есть способности различать стимулы, которые усиливаются и не подкрепляются, и в «обобщении», то есть применении реакции, полученной в одной ситуации, к другой, но схожей ситуации.
Шейпинг также можно использовать в реабилитационном центре. Например, тренировка на брусьях может приближаться к ходьбе с ходунком. Или шейпинг может научить пациентов, как увеличить время между посещениями туалета.
Автоформирование (иногда называемое отслеживанием знаков ) - это любая из множества экспериментальных процедур, используемых для изучения классического кондиционирования. При автоформировании, в отличие от шейпинга, награда приходит независимо от поведения животного. В своей простейшей форме автоформирование очень похоже на процедуру кондиционирования слюны Павлова с использованием собак. В самой известной методике Павлова короткий звуковой сигнал надежно предшествовал подаче пищи собакам. У собак естественно и безоговорочно выделялось слюноотделение (безусловный ответ ) на данную им пищу (безусловный стимул ), но в результате обучения условно выделялось слюноотделение (условный ответ ) на тон (условный раздражитель ), предсказывающий еду. При автоматическом формировании свет надежно включается незадолго до того, как животным дают корм. Животные естественно, безусловно, проявляют завершающую реакцию на даваемую им пищу, но благодаря обучению, условно, стали выполнять те же самые согласованные действия, направленные на условный раздражитель, предсказывающий пищу.
Автоформирование представляет собой интересную головоломку для Б.Ф. Утверждение Скиннера о том, что нужно использовать формирование как метод обучения голубя клевать ключ. В конце концов, если животное может формировать себя, зачем использовать трудоемкий процесс формирования? Автоформирование также противоречит принципу подкрепления Скиннера. Во время автоформирования еда приходит независимо от поведения животного. Если имело место подкрепление, случайное поведение должно возрасти, потому что оно должно было быть вознаграждено случайной едой. Тем не менее, у голубей надежно развивается клевание клавиш, даже если такое поведение никогда не было вознаграждено.
Но наиболее четкое свидетельство того, что автоформирование находится под контролем Павлова, а не Скиннера, было найдено с помощью процедуры пропуска. В этой процедуре корм обычно назначается для доставки после каждого предъявления стимула (часто вспышки света), за исключением случаев, когда животное действительно выполняет завершающуюся реакцию на раздражитель, и в этом случае пища не предоставляется. Здесь, если бы поведение находилось под инструментальным контролем, животное перестало бы пытаться потреблять стимул, поскольку это поведение сопровождается отказом от еды. Но животные упорствуют в попытках потребить условный раздражитель в течение тысяч попыток (феномен, известный как отрицательная автоматическая поддержка ), неспособные прекратить свою поведенческую реакцию на условный раздражитель, даже если он мешает им получить вознаграждение.