• Наказание
  • Подкрепление

    В школе классических условных рефлексов подкреплением считается безусловное воздействие на животное, связанное во времени с условным сигналом. Причем подкреплением может быть любая вызванная деятельность организма.

    В случае наличия подкрепления условный рефлекс называют положительным (подкрепляемым), а в случае отсутствия безусловного воздействия — отрицательным или тормозным (неподкрепляемым). При таком подходе болевое воздействие служит положительным подкреплением оборонительному поведению.

    Любое поведение определяется своими последствиями. В зависимости от того, будут ли эти последствия приятными, безразличными или неприятными, животное проявит себя по-разному: повторит данный поведенческий акт, не придаст ему никакого значения, постарается избегать его повторения в дальнейшем. В любом случае животное стремится к получению положительного подкрепления, поскольку момент его получения всегда положительно эмоционален. Отрицательного подкрепления животное старается избежать, поскольку оно вызывает негативные эмоции. Как уже упоминалось, само эмоциональное состояние может иметь выраженный подкрепляющий характер.

    В настоящее время считается, что термин «отрицательное подкрепление» несколько некорректен, так как всякое подкрепление, по определению, оказывает положительное действие. Видимо, правильнее было бы в обоих случаях говорить не об отрицательном, а об аверсивном (болевом) подкреплении.

    С точки зрения мотивированного поведения подкреплением считается любое событие, увеличивающее, уменьшающее или исключающее вероятность удовлетворения имеющейся на данный момент потребности. Событие, связанное с ее удовлетворением, и сам факт удовлетворения — это положительное подкрепление, факт неудовлетворения — отрицательное. Такой подход объясняет существование форм научения без выраженного подкрепления, например импринтинга или латентного научения.

    Событие, регулярно предшествующее факту подкрепления, несет информацию о его наступлении и, по законам развития условных рефлексов, само становится подкреплением. Его называют условным. Различают положительное и отрицательное условное подкрепление (известные всем «Хорошо!» и «Фу!»).

    По мере тренированности свойства условного подкрепления может приобретать команда, а при инструментальных рефлексах — действия животного или даже данные обстановочной афферентации, потому что, чаще или реже, их результатом бывает подкрепление. Чтобы условное подкрепление не потеряло своего сигнального значения, время от времени необходимо его подтверждать непосредственным воздействием на животное — так называемым натуральным подкреплением.

    Особое значение имеет время подкрепления: закрепляется только поведение, непосредственно предшествующее подкреплению. В оперантном научении считается, что разрыв между нужной формой поведения и фактом подкрепления не должен составлять более 10 с. Если этот разрыв больше, научение может не состояться.

    Школой И. П. Павлова были описаны так называемые отставленные рефлексы, когда разрыв между действием условного раздражителя и подкрепления составлял минуты и десятки минут. Выработка этих рефлексов была возможна только в специфических условиях павловской «башни молчания», но и при этом была отмечена закономерность: чем дольше действия животного не подкрепляются, тем медленнее вырабатывается условно-рефлекторная реакция. В реальных условиях избежать этого помогает использование условного подкрепления.

    Частичное подкрепление условных сигналов (до 50%, а по некоторым данным — до 33—25% случаев), не затрудняет выработку условного рефлекса, но значительно замедляет его угашение при последующей отмене подкрепления. Но при свободном выборе режима положительного подкрепления животные выбирают ускоренный. Возможно, общее число случаев подкрепления важно только для упрочения реакции до навыка, однако вариационный (вариабельный) режим подкрепления значительно закрепляет отработанный навык.

    Значимость подкрепления, т. е. его влияние на модификацию поведения, определяется его величиной, и при условии свободы выбора животные выбирают большую. Однако величина подкрепления не всегда окупает энергетические затраты, связанные с его получением. В любом случае она должна быть такой, чтобы вызвать безусловную реакцию животного.

    Следует всегда помнить об относительности биологической значимости подкрепления. Для сытого животного вряд ли значимым будет пищевое подкрепление. Некоторые собаки безразличны к ласковым словам или поглаживаниям, следовательно, такие действия хозяина не воспринимаются ими как подкрепление. Для одних животных сильный подкрепляющий фактор — игра, а для других — возможность свободы и физической активности. Одни собаки воспринимают рывок поводком средней силы как значимое отрицательное подкрепление, а другие не обращают на это внимание и продолжают тянуть.

    Относительность подкрепления связана и с потребностью, испытываемой организмом. Если ваша собака очень хочет погнаться за кошкой, то ваш кусочек сыра вряд ли будет подкреплением команде подхода.

    Значимость подкрепления определяется и значимостью связанной с ним потребности. Например, витальные потребности более значимы, чем потребности саморазвития. А в опытах по изучению влияния различных видов подкрепления на реакции экстраполяции оказалось, что при подкреплении самостимуляцией положительных зон мозга крысы оказались способны не только многократно решить простую задачу, но и успешно справиться с усложненным ее вариантом, тогда как при пищевом подкреплении они этого сделать не могли.

    Говоря о значимости подкрепления, следует еще иметь в виду индивидуальные особенности животного и его ранний опыт. Как уже упоминалось, для животных, пребывавших в условиях ранней сенсорной депривации, отрицательное подкрепление более значимо, чем для животных, выращенных в нормальной или обогащенной среде. Кроме того, значимость подкрепления определяется величиной базовой для него потребности. Кстати, при отработке какого-либо действия использование подкреплений, ориентированных к различным потребностям, способствует более быстрому научению.

    Как при реактивном (классическом), так и при оперантном научении приобретенная реакция сохраняется лишь до тех пор, пока ее поддерживают безусловным раздражителем (в первом случае) или специальным подкреплением (во втором случае). Если же эти подкрепляющие факторы перестают действовать, то выработанное на их основе поведение быстро угасает и после нескольких попыток прекращается вовсе. Важно отметить, что речь здесь идет именно об угасании, а не об исчезновении или «стирании следов». Дело в том, что если снова начать использовать безусловный раздражитель или подкрепляющий фактор, то прежнее поведение почти сразу же восстанавливается.

    Наказание

    Наказание — чисто человеческое понятие, и оно пригодно для человечества, но привнесение этого понятия в дрессировку вызывает ряд отрицательных последствий.

    1. Наказание неизбежно (в отличие от отрицательного подкрепления), поэтому оно не влияет на модификацию поведения. Наказание учит только как не попадаться или как принимать такую позу подчинения, которая снижает его интенсивность или исключает его.

    Цель дрессировки — не в применении наказания, как, впрочем, и отрицательного подкрепления, а в создании таких возможностей для животного, в которых оно могло бы избежать их, изменив поведение.

    2. Как правило, наказание используется после того, как поведенческий акт уже завершен. По физиологическому действию его можно отнести к отсроченному отрицательному (аверсивному) подкреплению, а, как известно, чем больше отсрочено подкрепление, тем с большим трудом модифицируется поведение.

    3. «По мне, если наказание помогло прекратить нежелательное поведение, то такое воздействие служит мощным подкреплением для наказывающего, и в дальнейшем наказывающий будет стремиться к наказанию» — это мнение К. Прайор.

    4. Наказывающий может быть бессознательно заинтересован не в исправлении поведения, а в получении доказательств своего лидерства, так как наказание способствует сохранению и упрочнению доминирующего положения наказывающего.

    Можно сформировать поведение, используя только отрицательное подкрепление, как это характерно для классической дрессировки, при этом образуются типичные оборонительные рефлексы. В такой ситуации животные будут стремиться избегать тех мест, где они получили отрицательное подкрепление, а команды исполнять с неохотой, так как они с большой долей вероятности могут стать предвестниками болевых или неприятных ощущений.

    Избыток отрицательного подкрепления снижает скорость научения, у животных со слабой нервной системой может вызвать невроз, а у щенков — робость, трусость и неуверенность в себе.






     

    Главная | В избранное | Наш E-MAIL | Добавить материал | Нашёл ошибку | Другие сайты | Наверх