Болезни Военный билет Призыв

Научение: классическое vs. оперантное. Инструментальное, или оперантное, обусловливание

Психотерапия. Учебное пособие Коллектив авторов

Инструментальное, или оперантное, обусловливание

Не все виды научения можно объяснить классическим обусловливанием. При классическом обусловливании условный и безусловный стимулы предшествуют условной реакции. Но условные связи могут также возникать между реакциями и стимулами, которые следуют за ними, другими словами, между поведением и его последствиями. Например, собака научается «служить», чтобы получить угощение; ребенок научается говорить «пожалуйста», чтобы получить конфетку. Эти реакции являются инструментами для получения какой-то награды. Инструментальное обусловливание – это процедура научения, при которой реакции приводят к награждению или желаемому эффекту.

Принципы инструментального научения открыл американский психолог Э. Трондайк примерно в то время, когда И. П. Павлов проводил эксперименты в России. Животное, обычно голодная кошка, помещалась в специальную клетку, названную «загадкой», и должна была научиться какой-то реакции – например, наступить на маленький рычаг, для того чтобы открыть дверь и выйти наружу. Когда кошке это удавалось, она награждалась пищей и вновь возвращалась в ящик. После нескольких проб кошка спокойно подходила к рычагу, нажимала на него лапой, выходила через открытую дверь и ела.

Формирование реакции происходило путем проб и ошибок, как результат выбора нужного эталона поведения и последующего его закрепления. Научение, согласно Трондайку, управляется законом эффекта. Согласно этому закону, поведение контролируется его результатами и последствиями. Поведение, которое приводит к достижению положительного результата, удовлетворению, закрепляется, и наоборот: не приводящее к положительному результату стирается или ослабляется.

Спустя несколько десятилетий после опубликований работ Трондайка, другой американский психолог, Б. Скиннер, развил его идеи. Б. Скиннер подчеркивал, что при инструментальном обусловливании животное оперирует со средой, производит какое-нибудь движение, воздействует на среду. Поэтому процесс научения этим реакциям он назвал оперантным обусловливанием.

Для изучения оперантного обусловливания Б. Скиннер изобрел экспериментальную камеру, получившую название «скиннеровского ящика». Камера полностью контролируется. Она звуко– и светонепроницаема, в ней поддерживается постоянная температура. Она содержит приспособление, которым животное может оперировать, чтобы получить вознаграждение. Например, крыса, нажимая на рычаг, получает пищу из тонкой трубочки. Скиннеровский ящик позволил изучать отношения между реакцией и ее последствиями и анализировать, как эти последствия влияют на поведение.

Оперантное обусловливание подчеркивает, что поведение есть функция его последствий. Поведение усиливается позитивным или негативным подкреплением; оно ослабляется наказанием.

Позитивное подкрепление – это предъявление стимулов, которые усиливают реакцию. Иными словами, это – награждение. Примером может служить учитель, который хвалит ребенка за прилежную учебу.

Негативное подкрепление – это процесс усиления поведения путем изъятия, удаления негативных стимулов, таких, как боль, скука, избыток тепла или холода и т. п. Примером может служить прием таблетки анальгина при головной боли. Другой пример: пациент, испытывающий страх в метро, может избежать этого переживания, оставшись дома.

Наказание . И позитивное, и негативное подкрепление усиливает частоту реакции. Наказание уменьшает частоту реакции. Часто путают наказание и негативное подкрепление, они совершенно различны. Подкрепление усиливает поведение, а наказание ослабляет его. Если ток выключается, когда крыса нажимает на рычаг, – это негативное подкрепление; оно увеличивает вероятность того, что крыса нажмет на педаль, когда ток снова включат. Но если ток включается, когда крыса нажимает на рычаг, то это наказание; менее вероятно, что крыса снова нажмет на рычаг.

Дискриминационное научение имеет место тогда, когда реакция награждается (или наказывается) в одной ситуации, но не награждается (не наказывается) в другой. В таком случае говорят, что реакция (поведение) находится под «контролем стимула». Этот процесс особенно важен в объяснении гибкости поведения в различных социальных ситуациях. Дискриминация (различение) стимулов позволяет научиться тому, что является подходящим (подкрепляемым) и неподходящим (неподкрепляемым) в данной ситуации. Например, ворчливая жена вряд ли будет бранить мужа в присутствии гостей.

Генерализация состоит в том, что поведение обнаруживается в иных ситуациях, а не только в тех, в которых оно было приобретено. Например, терапевт может помочь пациенту стать более уверенным и экспрессивным во время терапии. Но цель терапии в том, чтобы пациент стал более уверенным в реальных жизненных ситуациях, другими словами, очень важно, чтобы произошла генерализация.

При сравнении классических и оперантных условных рефлексов видно, что, во-первых, классическое обусловливание требует повторного парного предъявления нейтрального стимула (звонок) и стимула, вызывающего врожденную, безусловную реакцию (пища). Обеспечение такого предъявления достигается участием экспериментатора. В экспериментах же с оперантным обусловливанием животное само осуществляет перебор стереотипов поведения, и выбор стереотипа, приводящего к достижению результата, протекает активнее. Во-вторых, оперантные рефлексы контролируются их результатом; в экспериментах же с классическим обусловливанием появление условной реакции контролируется предъявлением предшествующего стимула. В реальной жизни большая часть обучения осуществляется по законам формирования оперантных условных рефлексов.

Из книги Пробуждение: преодоление препятствий к реализации возможностей человека автора Тарт Чарльз

8. ОБУСЛОВЛИВАНИЕ Одним из наиболее фундаментальных психологических процессов является обусловливание. Хотя мы обычно считаем, что обусловливание свойственно только низшим организмам, оно очень распространено в нашей повседневной жизни, даже если оно и не

Из книги Теории личности автора Хьелл Ларри

КЛАССИЧЕСКОЕ ОБУСЛОВЛИВАНИЕ Психологи различают две формы обусловливания в зависимости от того, какой из процессов обусловливания при этом задействован.Классическое, или павловское, обусловливание было впервые продемонстрировано Иваном Павловым в 1927 году. Когда

Из книги Психология развития [Методы исследования] автора Миллер Скотт

ЧЕЛОВЕЧЕСКОЕ ОБУСЛОВЛИВАНИЕ Но какое же отношение обусловливание имеет к человеческим существам? К вашей жизни?Я однажды попытался объяснить большую важность обусловливания в человеческом развитии моим слушателям в одной из программ «Тренинга повышения осознавания».

Из книги Социальное влияние автора Зимбардо Филип Джордж

Респондентное и оперантное поведение При рассмотрении скиннеровского подхода к личности следует различать две разновидности поведения: респондентное и оперантное. Чтобы лучше понять принципы скиннеровского оперантного научения, мы сначала обсудим респондентное

Из книги Психология автора Робинсон Дейв

Из книги 40 исследований, которые потрясли психологию автора Хок Роджер Р.

Инструментальное научение и подкрепление Когда наше поведение является инструментом изменения элементов внешнего окружения, мы обнаруживаем взаимосвязь между специфической реакцией и ее последствиями. В процессе инструментального (иначе оперантного) научения именно

Из книги Мне очень нравится курить… но я бросаю! автора Иопп Андреас

Из книги Без революций. Работаем над собой, оставаясь в гармонии автора Стивенс Майкл

ГЛАВА 3. НАУЧЕНИЕ И ОБУСЛОВЛИВАНИЕ В той области психологии, которая занимается научением и обусловливанием, проведено множество исследований с целью выяснить, как обучаются животные и люди. Ряд выдающихся психологов, имена которых широко известны за пределами наук о

Из книги Психология. Люди, концепции, эксперименты автора Клейнман Пол

Обусловливание – психическая зависимость Никотин делает нас зависимыми не только физически, перестраивая систему нейромедиаторов в мозге, он заботится и о том, чтобы у нас вырабатывалась условная реакция на многие ситуации. Под влиянием никотина мы «учимся» прочно

Из книги Психотерапия. Учебное пособие автора Коллектив авторов

Обусловливание религиозных взглядов на смерть Если мы хотим понять, почему имеем то восприятие смерти, которое имеем, и приспособить его так, чтобы оно служило нашей цели, следует избавиться от эго-я, которое такое восприятие определяет. Мы уже выяснили, как агрессивные

Из книги автора

Оперантное обусловливание и «Ящик Скиннера» Самым важным итогом научной деятельности Фредерика Скиннера стала концепция оперантного обусловливания (научения), которая заключается в том, что научение какой-либо форме поведения происходит либо методом вознаграждения,

Из книги автора

Классическое обусловливание Основы классического обусловливания были созданы в начале XX в. И. П. Павловым. В опытах И. П. Павлова условный стимул (звонок) сочетается с безусловным стимулом (кормление собаки), между ними устанавливается связь таким образом, что прежде

Теория-инструментального, или оперантного, обусловливания связана с именами Э. Л. Торндайка (Е. L. Thorndike) и Б. Ф. Скиннера (В. F. Skinner). Скиннер и Торндайк - виднейшие представители бихевиоризма - показали, что воздействие окружающей среды определяет поведение человека. Они рассматривают в качестве главного фактора формирования человеческого поведения культуру, содержание которой выражается в определенном наборе комплексов подкреплений. С их помощью можно создавать и модифицировать человеческое поведение в нужном направлении. На таком понимании основаны методы модификации поведения, использующиеся не только в психотерапевтической практике, но и, например, при воспитательных воздействиях.

Термины «инструментальное научение» и «оперант- ное обусловливание» означают, что реакция организма, которая формируется по методу проб и ошибок, является инструментом для получения поощрения и предполагает оперирование средой, то есть поведение есть функция его последствий. Согласно принципу оперантного обусловливания, поведение контролируется его результатом и последствиями. Модификация поведения осуществляется за счет влияния на его результаты и последствия. В соответствии со схемой оперантного обусловливания экспериментатор, наблюдая поведение, фиксирует случайные проявления желательной, «правильной», реакции и сразу же подкрепляет ее. Таким образом, стимул следует после поведенческой реакции, используется прямое подкрепление через поощрение и наказание. Результатом подобного научения является оперантное научение, или оперант. В этом случае подкрепляется не стимул, а реакция организма, именно она вызывает подкрепляющий стимул, поэтому такое научение обозначается как научение типа R. Оперантное, или инструментальное, поведение (поведение типа R) - это поведение, вызванное подкреплением, следующим за поведением. Скиннер, подчеркивая различия между респондентным и оперантным поведением, указывает, что респондентное поведение вызвано стимулом, предшествующим поведению, а оперантное поведение - стимулом, следующим за поведением. Иными словами, в классическом обусловливании стимул предшествует поведенческой реакции, а в оперантном - следует за ней.

Необходимо обратить внимание на соотношение таких понятий, как позитивное и негативное подкрепление и наказание, различать наказание и негативное подкрепление. Позитивное или негативное подкрепление усиливает поведение, наказание - ослабляет. Позитивное подкрепление основано на предъявлении стимулов (наград), которые усиливают поведенческую реакцию. Негативное подкрепление заключается в усилении поведения за счет удаления негативных стимулов. То есть всякое подкрепление (и позитивное, и негативное) усиливает частоту реакции и поведение, наказание же, напротив, уменьшает частоту реакции, ослабляет поведение. (Например, позитивное подкрепление: животное находит выход из лабиринта и получает пищу; негативное подкрепление: животное находит выход из лабиринта, где действует электрический ток, и ток выключают; наказание: животное в лабиринте упирается в тупик, и ток включают. Таким образом, первые два вида воздействия экспериментатора усиливают реакцию, поскольку являются подкреплением, а третий - уменьшает, являясь наказанием.)

Для различения стимула классического условного рефлекса и стимула оперантного условного рефлекса Скиннер предложил обозначать первый как Sd (дискриминантный стимул), а второй - как Sr (респондент- ный стимул). Дискриминантный стимул по времени предшествует определенной поведенческой реакции, респондентами стимул, подкрепляющий определенную поведенческую реакцию, следует за ней.

Итак, сравнительные характеристики классического и оперантного обусловливания:

Классическое обусловливание S-R. Научение типа S. Классическая парадигма Павлова. Реакция возникает только в ответ на воздействие какого-либо стимула. Стимул предшествует реакции. Подкрепление связано со стимулом. Респондентное поведение - поведение, вызванное определенным стимулом, ему предшествующим.

Оперантное обусловливание R-S. Научение типа R. Оперантная парадигма Скиннера. Желательная реакция может появиться спонтанно. Стимул следует за поведенческой реакцией. Подкрепление связано с реакцией. Оперантное поведение - поведение, вызванное подкреплением, за ним следующим.

(operant conditioning) Термин О. о. применительно к научению используется в двух значениях. В более узком смысле с ним связывается набор процедур, использующихся при изучении процессов инструментального обусловливания. В более широком и более фундаментальном смысле термином О. о. обозначается общий теорет. подход, к-рый использует эти процедуры и связанные с ними понятия для анализа всего спектра поведения животных и чел. Оперантные процедуры Отличительные особенности процедур О. о. можно проиллюстрировать на следующем примере. Крысу помещают в тускло освещенную небольшую клетку, находящуюся в поглощающей звуки и изолированной от внешних источников света комнате. Из одной стены этой совершенно пустой клетки выступает небольшой рычаг, и когда крыса нажимает этот рычаг, в находящуюся рядом с ним чашку падает небольшой шарик пищи. Такое устройство часто называют ящиком Скиннера по имени психолога Б. Ф. Скиннера, к-рый его впервые сконструировал. Этот пример иллюстрирует одну отличительную особенность, к-рая позволяет наиболее четко отделить оперантные процедуры от др. процедур инструментального обусловливания. Интересующее нас поведение может многократно воспроизводиться обучающимся субъектом. В отличие от процедур, связанных с дискретными попытками, таких, как научение в лабиринте, в к-ром поведение состоит из серии отдельных эпизодов, реагирование в оперантных процедурах не прерывается извне и является свободным. В связи с возможностью повторного реагирования следует отметить две вытекающие отсюда особенности процедур О. о. Во-первых, реагирование измеряется скоростью появления реакции или ее частотой. Частота реагирования рассматривается в качестве аппроксимации осн. показателя силы реакции - ее вероятности. Наклон кривой, вычерчиваемой по совокупным данным наблюдений, служит прямой мерой частоты реагирования в каждый данный момент времени. Во-вторых, предоставление возможности повторного реагирования позволяет манипулировать взаимосвязями между различными качественными характеристиками реакции (напр., количеством ее повторений или длительностью) и критическим событием, поддерживающим эту реакцию (напр., появлением пищи). Правило, к-рое описывает характеристики реакции, необходимые для возникновения критического события, называется режимом подкрепления. Различные режимы подкрепления вызывают различные паттерны реагирования. Высокая частота реагирования и сложность мн. режимов подкрепления при проведении экспериментов по О. о. требуют обычно использования автоматического оборудования, включая компьютеры. Оперантная теория В более широком значении О. о. является одним из подразделов биологии, занимающимся идентификацией средовых детерминант поведения при помощи методов эксперим. анализа. Предполагается, что поведение животных и чел. имеет свои первопричины в окружающей среде. Родовая среда обитания индивида (особи) воздействует на его (ее) поведение через посредство генетических механизмов, действие к-рых суммируется принципом естественного отбора. Этими предшествующими формами поведения занимается эволюционная биология. Прошлое и настоящее окружения индивида (особи) воздействуют на его (ее) поведение через посредство нейрохимических механизмов (до сих пор практически неизученных), действие к-рых суммируется принципом подкрепления. Анализом этих воздействий индивидуальной среды на поведение как раз и занимается О. о. И принцип естественного отбора, и принцип подкрепления предполагают, что будущее поведение м. б. понято путем изучения последствий прошлого поведения. В случае естественного отбора отбираются те формы поведения (и структуры), к-рые повышают репродуктивную способность. В случае подкрепления усиливаются те формы поведения, за к-рыми наступают критические события и для к-рых был изобретен специальный термин - подкрепления. Когда средовые детерминанты идентифицированы и описаны их функциональные связи с поведением, в окружение могут вводиться изменения, к-рые могут влиять на направление изменений текущего поведения, подобно тому как генная инженерия может влиять на ход эволюции. Из базового допущения о том, что поведение всех организмов, включая людей, в конечном счете формируется средой, вытекает ряд методологических следствий. Во-первых, так как люди и животные на протяжении своей эволюции сталкивались с родовой (видовой) средой обитания, к-рая "отбирала" их за способность к модификации поведения в пределах отпущенного им жизненного цикла (т. е. за способность к научению), общая функциональная формулировка принципа подкрепления, по-видимому, выводится из изучения любого широко представленного биолог. вида. Во-вторых, поскольку изменение в поведении возникает в рез-те контакта организма со своей средой и поскольку родовая (видовая) и индивидуальная среды могут варьировать от одного организма к др. даже при максимально контролируемых условиях, процесс изменения должен изучаться на одном организме. Выводы, осн. на усредненных групп. рез-тах, могут заслонять и искажать поведенческие процессы, протекающие у отдельного индивида (особи). В-третьих, с учетом того, что рано или поздно будет получено нейрохимическое описание механизмов, лежащих в основе изменений поведения, и в надежде на свою способность воспользоваться этим знанием, О. о. стремится к анализу поведения как продукта одних только предшествующих воздействий среды, без обращения к постулированным на основе логического вывода процессам или структурам. Считается, что теорет. конструкты этого типа отвлекают от задачи эксперим. анализа и квалифицируются как объяснения по форме, но не по существу, поскольку они часто приводят к ошибкам гипостазирования (приписывания отвлеченным сущностям самостоятельного существования) и логической замкнутости. О. о. пытается разложить взаимодействие между организмом и его средой на последовательность или ситуацию из трех элементов. Рез-том успешного эксперим. анализа является идентификация, с одной стороны, средовых событий (сигнальных, или различительных стимулов), обусловливающих возникновение данного поведения (операнта), и, с др. стороны, средовых событий (подкрепляющих стимулов, или подкреплений), необходимых для приобретения и сохранения этого поведения. Поведение, к-рое требуется для появления подкрепления, называют оперантом, подчеркивая то обстоятельство, что оно действует на складывающуюся в дальнейшем среду, чтобы вызвать определенные последствия. Наконец, изменения в средовом контроле поведения, возникающие в рез-те О. о., не обязательно ограничиваются характеристиками конкретного стимула и реакции, выявленными в ходе первоначального эксперим. анализа. Как рез-тат О. о., эти изменения чаще всего затрагивают класс стимулов, к-рые контролируют класс реакций. См. также Модификация поведения, Оперантное поведение, Режимы подкрепления Дж. У. Донахью

Определения, значения слова в других словарях:

Психотерапевтическая энциклопедия

Теория инструментального, или О. о. связана с именами Торндайка (Thorndike E. L.) и Скиннера (Skinner В. F.). В отличие от принципа классического обусловливания (S->R), они разработали принцип О. о. (R->S), согласно которому поведение контролируется его результатами и...

ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ

Теория инструментального, или О. о. связана с именами Торндайка (Thorndike E. L.) и Скиннера (Skinner В. F.). В отличие от принципа классического обусловливания (S->R), они разработали принцип О. о. (R->S), согласно которому поведение контролируется его результатами и последствиями. Основной путь воздействия на поведение, исходя из этой формулы, - влияние на его результаты.
Для различения стимула классического условного рефлекса и стимула инструментального условного рефлекса Скиннер предложил обозначать первый как Sd (дискриминантный стимул), а второй - Sr (pecпондентный стимул). Sd - стимул, по времени предшествующий определенной поведенческой реакции, Sr - стимул, подкрепляющий определенную поведенческую реакцию и по времени следующий за ней. Хотя в повседневной жизни эти стимулы часто совмещены в одном объекте, они могут быть разделены путем анализа с целью систематизации и определения последовательности мер воздействия на модифицируемое поведение. При использовании оперантных методов управление результатами поведения осуществляется для воздействия на само поведение. Поэтому здесь очень важен этап функционального анализа или поведенческой диагностики. Задача этого этапа состоит в определении подкрепляющей значимости окружающих пациента объектов, установлении иерархии их подкрепляющей силы. Это делается путем прямого наблюдения за поведением человека и установления связи между частотой и интенсивностью проявляемого поведения (зависимая переменная) и имеющимися в это время объектами и событиями, происходящими в окружении (независимая переменная).
Оперантные методы могут быть использованы для решения ряда задач.
1. Формирование нового стереотипа поведения, которого до этого не было в репертуаре поведенческих реакций человека (например, кооперативное поведение ребенка, поведение самоутверждающего типа у пассивного ребенка и т. д.). Для решения этой задачи может быть использовано несколько стратегий выработки нового поведения.
Под шейпингом понимается поэтапное моделирование сложного поведения, которое не было свойственно ранее индивиду. В цепи последовательных воздействий важным является первый элемент, который, хотя и отдаленно, связан с конечной целью шейпинга, однако с большой степенью вероятности направляет поведение в нужное русло. Этот первый элемент должен быть точно дифференцирован, а критерии оценки его достижения четко определены. Для облегчения проявления первого элемента желательного стереотипа должно быть выбрано условие, которое может быть достигнуто быстрее и легче всего. Для этого используется разнообразное варьирующее подкрепление, от материальных предметов до социального подкрепления (одобрение, похвала и др.). Например, при обучении ребенка навыкам самостоятельного одевания первым элементом может быть привлечение его внимания к одежде.
В случае «сцепления» используется представление о поведенческом стереотипе как о цепи отдельных поведенческих актов, при этом конечный результат каждого акта является дискриминантным стимулом, запускающим новый поведенческий акт. При реализации стратегии сцепления следует начинать с формирования и закрепления последнего поведенческого акта, находящегося ближе всего к самому концу цепи, к цели. Рассмотрение сложного поведения как цепи последовательных поведенческих актов позволяет понять, какая часть цепи хорошо сформирована, а какая должна быть создана с помощью шейпинга. Тренинг должен продолжаться до того момента, пока желательное поведение всей цепи не осуществляется с помощью обычных подкрепляющих стимулов.
Фейдинг - это постепенное уменьшение величины подкрепляющих стимулов. При достаточно прочно сформированном стереотипе пациент должен реагировать на минимальное подкрепление прежним образом. Фейдинг играет важную роль при переходе от тренировок с психотерапевтом к тренировкам в повседневном окружении, когда подкрепляющие стимулы исходят от других людей, замещающих психотерапевта.
Побуждение является вариантом вербального или невербального подкрепления, который повышает у обучающегося уровень внимания и фокусировки на желательном стереотипе поведения. Подкрепление может выражаться в демонстрации этого поведения, прямых инструкциях, центрированных или на нужных действиях, или на объекте действия и т. д.
2. Закрепление уже имеющегося в репертуаре индивида желательного стереотипа поведения. Для решения этой задачи может использоваться положительное подкрепление, отрицательное подкрепление, контроль стимула.
3. Уменьшение или угашение нежелательного стереотипа поведения. Достигается с помощью методик наказания, угашения, насыщения.
4. Лишение всех положительных подкреплений.
5. Оценка ответа.
См. также БИХЕВИОРИЗМ , ПОВЕДЕНЧЕСКАЯ ПСИХОТЕРАПИЯ , ПОЛОЖИТЕЛЬНОЕ И ОТРИЦАТЕЛЬНОЕ ПОДКРЕПЛЕНИЕ .


Психотерапевтическая энциклопедия. - С.-Пб.: Питер . Б. Д. Карвасарский . 2000 .

Смотреть что такое "ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ" в других словарях:

    оперантное обусловливание - термин, введенный американским психологом Б. Ф. Скиннером для обозначения особого пути образования условных связей (см. условный рефлекс). В отличие от классического (павловского) пути, названного Скиннером респондентным, при О. о. животное… … Большая психологическая энциклопедия

    Форма научения. Характеризуется тем, что подкрепляется то спонтанное поведение, которое признается желательным. Синоним инструментальное научение, operant conditioning … Психологический словарь

    ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ - Вид обусловливания, при котором оперантная реакция помещается под контроль стимула. Операцией, с помощью которой происходит такое обусловливание, является предъявление подкрепления непосредственно после реакции организма. Этот операциональный… …

    Оперантное обусловливание - – стратегии научения, при которых человек или животное должны реагировать на раздражитель, чтобы получить подкрепление. Подкрепление повышает вероятность того, что данный вид поведения повторится. Оперантное обусловливание ведет свое начало от… … Словарь-справочник по социальной работе

    Оперантное обусловливание - обозначение особого пути образования условных связей). В отличие от классического (павловского) пути, названного Скиннером респондентным, при О. о. животное сначала производит какое нибудь движение (спонтанное или инициированное… … Энциклопедический словарь по психологии и педагогике

    Оперантное обусловливание - (operant conditioning) процесс научения, при котором поведение, приносящее удовлетворительные последствия или вознаграждения, будет, скорее всего, повторено … Общая психология: глоссарий

    Оперантное обусловливание - (operant conditioning). ТТип обусловливания, которое имеет место, когда организм получает подкрепление (вознаграждение или наказание) за произвольно получаемую реакцию. В этом случае происходит научение только тому, что подкрепляется … Психология развития. Словарь по книге

    Термин О. о. применительно к научению используется в двух значениях. В более узком смысле с ним связывается набор процедур, использующихся при изучении процессов инструментального обусловливания. В более широком и более фундаментальном смысле… … Психологическая энциклопедия

    РАЗЛИЧИТЕЛЬНОЕ ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ - См. различение (1) … Толковый словарь по психологии

    ОБУСЛОВЛИВАНИЕ - Общий термин для группы эмпирических понятий особенно тех. которые означают условия, при которых происходит ассоциативное научение. Часто в этой группе выделяются два отдельных тита: классическое обусловливание (или тип S. или реактивный, или… … Толковый словарь по психологии

Теория-инструментального, или оперантного, обусловливания связана с именами Э. Л. Торндайка (Е. L. Thorn-dike) и Б. Ф. Скиннера (В. Е Skinner). Скиннер и Торн-дайк - виднейшие представители бихевиоризма - показали, что воздействие окружающей среды определяет поведение человека. Они рассматривают в качестве главного фактора формирования человеческого поведения культуру, содержание которой выражается в определенном наборе комплексов подкреплений. С их помощью можно создавать и модифицировать человеческое поведение в нужном направлении. На таком понимании основаны методы модификации поведения, использующиеся не только в психотерапевтической практике, но и, например, при воспитательных воздействиях.

Термины «инструментальное научение» и «оперант-ное обусловливание» означают, что реакция организма, которая формируется по методу проб и ошибок, является инструментом для получения поощрения и предполагает оперирование средой, то есть поведение есть функция его последствий. Согласно принципу оперантного обусловливания, поведение контролируется его результатом и последствиями. Модификация поведения осуществляется за счет влияния на его результаты и последствия. В соответствии со схемой оперантного обусловливания экспериментатор, наблюдая поведение, фиксирует случайные проявления желательной, «правильной», реакции и сразу же подкрепляет ее. Таким образом, стимул следует после поведенческой реакции, используется прямое подкрепление через поощрение и наказание. Результатом подобного научения является оперантное научение, или оперант. В этом случае подкрепляется не стимул, а реакция организма, именно она вызывает подкрепляющий стимул, поэтому такое научение обозначается как научение типа R. Оперантное, или инструментальное, поведение (поведение типа R) - это поведение, вызванное подкреплением, следующим за поведением. Скиннер, подчеркивая различия между респондентным и оперантным поведением, указывает, что респондентное поведение вызвано стимулом, предшествующим поведению, а оперантное поведение - стимулом, следующим за поведением. Иными словами, в классическом обусловливании стимул предшествует поведенческой реакции, а в оперантном - следует за ней.

Необходимо обратить внимание на соотношение таких понятий, как позитивное и негативное подкрепление и наказание, различать наказание и негативное подкрепление. Позитивное или негативное подкрепление усиливает поведение, наказание - ослабляет. Позитивное подкрепление основано на предъявлении стимулов (наград), которые усиливают поведенческую реакцию. Негативное подкрепление заключается в усилении поведения за счет удаления негативных стимулов. То есть всякое подкрепление (и позитивное, и негативное) усиливает частоту реакции и поведение, наказание же, напротив, уменьшает частоту реакции, ослабляет поведение. (Например, позитивное подкрепление: животное находит выход из лабиринта и получает пищу; негативное подкрепление: животное находит выход из лабиринта, где действует электрический ток, и ток выключают; наказание: животное в лабиринте упирается в тупик, и ток включают. Таким образом, первые два вида воздействия экспериментатора усиливают реакцию, поскольку являются подкреплением, а третий - уменьшает, являясь наказанием.)

Для различения стимула классического условного рефлекса и стимула оперантного условного рефлекса Скиннер предложил обозначать первый как Sd (дискри-минантный стимул), а второй - как Sr (респондент-ный стимул). Дискриминантный стимул по времени предшествует определенной поведенческой реакции, респондентами стимул, подкрепляющий определенную поведенческую реакцию, следует за ней.

Итак, сравнительные характеристики классического и оперантного обусловливания:
Классическое обусловливание S-R. Научение типа S. Классическая парадигма Павлова. Реакция возникает только в ответ на воздействие какого-либо стимула. Стимул предшествует реакции. Подкрепление связано со стимулом. Респондентное поведение - поведение, вызванное определенным стимулом, ему предшествующим.

Оперантное обусловливание R-S. Научение типа R. Оперантная парадигма Скиннера. Желательная реакция может появиться спонтанно. Стимул следует за поведенческой реакцией. Подкрепление связано с реакцией. Оперантное поведение - поведение, вызванное подкреплением, за ним следующим.