Зоопсихология. Элементарное мышление животных - Учебное пособие (Зорина З. А)

3.2. классификация форм индивидуально-приспособительной деятельности

Формы обучения животных весьма разнообразны и обычно их подразделяют на три основные категории: неассоциативное обучение, ассоциативное обучение и когнитивные процессы. О. Меннинг (1982) и Д. Дьюсбери включали в свои классификации также и «инсайт-обучение» (см. 3.4.5). Приводим систематизированный перечень этих фено­менов (по данным разных авторов).

Класификация включает некоторые сведения об элементах рассу­дочной деятельности, которым посвящена основная часть пособия. Ряд авторов выделяют в своих книгах раздел «Complex cognition», который соответствует разделу «Когнитивные процессы» настоящей главы, а также содержанию ряда следующих глав, где рассматривается формирова­ние у животных понятий, усвоение языков-посредников и т.д.

Для изучения механизмов обучения нередко используют различ­ные модели, в том числе так называемые клеточные аналоги обучения или процесс посттетанической потенциации (см. гл. 9 и, например: Шеперд, 1987).

Классификация форм обучения и когнитивных процессов, [составлена нами на основе классификаций О. Меннинга (Manning, Dawkins, 1992), — Д. Дьюсбери (1981), Р. Томаса (Thomas, 1996), Дж. Пирса (Реагсе, 1998) и др.].

Неассоциативное обучение:

— привыкание.

Ассоциативное обучение:

— классические условные рефлексы;

— инструментальные условные рефлексы.

Когнитивные процессы:

— латентное обучение;

— выбор по образцу;

— обучение, основанное на представлениях о:

пространстве;

порядке стимулов;

времени;*

числе.

* Обширный экспериментальный материал по восприятию и оценке живот­ными параметров времени в книге не затронут, поскольку эти вопросы практи­чески не имеют прямой связи с проблемой мышления животных.

 

Элементарное мышление.*

* Классификация видов мышления животных рассматривается в главе 4.

 

Далее рассматриваются основные формы обучения, приведенные в схеме классификации.

3.2.1. Неассоциативное обучение (привыкание)

Неассоциативное обучение (привыкание) заключается в ослаблении реакции при повторных предъявлениях раздражителя.

Изначально любой раздражитель (стимул), действующий на орга­ны чувств животного, вызывает у него соответствующую ответную реакцию: поворот головы в сторону света или звука, отдергивание конечности и др., у моллюсков — втягивание жабр и т.д. При повтор­ном систематическом предъявлении того же стимула реакция посте­пенно ослабевает и может исчезнуть совсем, т.е. происходит привыка­ние к раздражителю. Так, например, только что установленное в ого­роде чучело распугивает птиц, однако с течением времени их страх ослабевает и они перестают реагировать на этот предмет.

Привыкание — наиболее примитивная форма обучения, отчетливо выраженная даже у низших организмов — беспозвоночных животных. Его успешно исследуют на имеющих простую нервную систему кишечно-полостных, червях, моллюсках, насекомых. Для изучения привыкания используются также модельные системы — так называемые клеточные аналоги привыкания или срезы мозга.

Более строго привыкание определяют как снижение вероятности появления реакции или уменьшение интенсивности при неоднократ­ном повторении вызывающего ее раздражителя. Ослабление ответной реакции можно считать истинным привыканием только в том случае, когда оно обусловлено изменениями в ЦНС, а не адаптацией рецеп­торов или утомлением.

Применение какого-либо нового стимула прекращает процесс привыкания к прежнему раздражителю, и угасшая было реакция на исходный раздражитель полностью восстанавливается. Для привыка­ния характерно и так называемое спонтанное восстановление, если действие стимула временно прекращается. Более подробные сведения о свойствах процесса привыкания можно найти в учебниках Кэнделла (1987), Шеперда (1987) и Эккерта и др. (1991).

3.2.2. Ассоциативное обучение

При ассоциативном обучении в ЦНС формируется временная связь между двумя стимулами, один из которых изначально был для животного безразличен, а другой выполнял роль вознаграждения или наказания.

Формирование этой связи обнаруживается в виде изменений в поведении животного, которые в зависимости от своей «структуры» называются либо классическими, либо инструментальными условны­ми рефлексами.

3.2.2.1. Основные характеристики условнорефлекторной деятельности

В 1902 году, анализируя нервную регуляцию процесса пищеваре­ния у собак, И.П.Павлов обнаружил так называемое «психическое слюноотделение». Феномен заключался в выделении у животного слю­ны, которая стекала в пробирку через фистулу на щеке еще до попа­дания пищи в рот, т.е. заранее, «в опережающем режиме», как только собаку приводили в экспериментальную комнату и помещали в спе­циальный станок (рис. 3.1).

Таким же образом повторное сочетание любого нейтрального для животного раздражения (например, звонка) с кормлением вызывает выделение слюны еще до того, как собака получит пищу.

И. П. Павлов назвал звонок условным сигналом (УС), пищу — безус­ловным раздражителем (или стимулом), реакцию животного (слю­ноотделение) в ответ на предъявление пищи — безусловным реф­лексом (БР), а в ответ на звонок — условным рефлексом (УР).

Рис. 3.1. Схема установки по выработке слюнных условных рефлексов в экспериментах И. П. Павлова.

Через фистулу в щеке слюна поступает в устройство, измеряющее ее объем. Перед животным имеется панель, где расположены источники нейтральных раздражителей (света и звука), которые могут стать УС.

Принцип образования условного рефлекса состоит в следующем: действие какого-либо нейтрального (или индифферентного) для животного раздражителя совместно со стимулом, вызываю­щим у него определенную реакцию (например, отдергивание ко­нечности при болевой стимуляции), приводит к тому, что посте­пенно этот ранее нейтральный стимул начинает вызывать такую же реакцию.

Предъявление безусловного стимула вслед за условным в процес­се выработки УР называется его подкреплением. Если при выработке УР применяется подкрепление, соответствующее имеющейся у жи­вотного мотивации (например, пищевое подкрепление в состоянии голода), то оно называется положительным и вырабатываемый УР также называется положительным. Можно выработать УР и с приме­нением отрицательного подкрепления (наказания), т.е. такого воздей­ствия, которого животное стремится избежать. В эксперименте в каче­стве отрицательного подкрепления чаще всего применяют удар элек­трического тока, вызывающий отдергивание конечности или перебегание в безопасное отделение камеры. Используют также дей­ствие воздушной струи, направленной на роговицу глаза и вызываю­щей мигание. Динамика реакций мигательной перепонки кролика при выработке такого УР показана на рис. 3.2А.

Подкрепление, которое используется для выработки УР, оказы­вается эффективным, если оно применяется в период достаточно силь­ного мотивационного возбуждения. Так, удар воздушной струи, направ­ленной на роговицу глаза, может стать отрицательным подкреплени­ем, только если он действительно неприятен животному.

Слюнной и мигательный УР относятся к категории классических («павловских») условных рефлексов (см. также 3.2.2.2).

Рис. 3.2. Изменения условной реакции мигания у кролика.

Безусловный стимул — струя воздуха, направленная на роговицу; услов­ный — звук; А — его угашение; Б — генерализация ответа при использова­нии в качестве УС тонов разных частот. По оси ординат — доля УР (в \%), по оси абсцисс — число предъявлений (А) и частота тона (Б).

На основе изучения слюнных УР у собак И. П. Павлов сформулиро­вал основные общие правила образования УР:

условный сигнал должен предшествовать безусловному раздра­жению, но не наоборот;

действие условного и безусловного раздражителей должно ча­стично перекрываться во времени;

сочетание условного и безусловного раздражителей должно повторяться многократно.

Эти правила приложимы не только к классическим, но и к инст­рументальным (см. ниже) УР. И формирование, и проявления уже выработанных слюнных УР у собак в значительной степени чувстви­тельны к влиянию посторонних раздражителей. В лаборатории И. П. Пав­лова было обнаружено, что любой посторонний и достаточно силь­ный стимул, подействовавший в течение эксперимента, уменьшает условнорефлекторное слюноотделение у собаки, как бы «отвлекает» ее. Павлов объяснял это явление на основе своего понимания меха­низма формирования УР: вмешательство постороннего стимула вы­зывает в коре головного мозга собаки сильный очаг возбуждения, который в силу природы условнорефлекторных связей подавляет уже сформированный УР, «индуцируя» торможение участка коры, ответ­ственного за этот УР. Такое торможение И. П. Павлов назвал внешним.

Помимо внешнего торможения в лаборатории Павлова было описа­но и внутреннее торможение. Одно из проявлений этого процесса мож­но наблюдать в опытах, когда предъявление УС перестает сопровож­даться подкреплением. Отмена подкрепления ведет к постепенному ис­чезновению внешних проявлений УР, к его угашению (ход угашения мигательного УР у кролика представлен графически на рис. 3.2Б). Однако этот УР не разрушается, не исчезает и при возобновлении подкрепления восстанавливается. Для восстановления требуется значительно меньшее число сочетаний УС с подкреплением, чем при первоначальном обуче­нии. По Павлову, отмена подкрепления не разрушает УР, а лишь подав­ляет его в связи с формированием очага внутреннего торможения.

Следует отметить, что для проявления условной связи между двумя сти­мулами подкрепление не всегда необходимо. В работах И. П. Павлова было пока­зано, что и сами УС в определенных условиях могут действовать как подкреп­ление. Можно провести опыт, в котором какой-либо УС (УС-1) всегда сочета­ется с подкреплением и вызывает, например, слюноотделение. Затем некий второй УС (УС-2) многократно применяется вместе с УС-1 (без сочетания с безусловным раздражением). Если после этого применить только УС-2, мож­но убедиться, что он также вызывает условную реакцию. Это явление было названо условным рефлексом второго порядка.

Несколько отличается от описанного другой опыт, который также пока­зывает, что для формирования УР подача подкрепления не всегда обязатель­на. Если два УС предъявлять животному совместно (УС-1 + УС-2) много раз еще до применения безусловного стимула, а затем предлагать только сочета­ние УС-1 и безусловного раздражения, то условная реакция проявится при даче одного лишь УС-2. Таким образом, хотя УС-2 никогда сам по себе не подкреплялся, между УС-1 и УС-2 сформировалась связь, которая позволила проявиться условной реакции при действии только УС-2. Процесс формиро­вания связи между индифферентными раздражителями иногда называют сен­сорным предобуславливанием (sensory preconditioning, Мак-Фарленд, 1987). Вряд ли это можно считать правильным, потому что обнаружить наличие подобной связи можно лишь с помощью соответствующего тестирования — путем вы­явления реакции на второй индифферентный стимул.

На основе огромного опыта изучения условных рефлексов у собак И. П. Павлов и его ученики создали учение о высшей нервной деятельности.

Оно базировалось на ряде постулатов, которые довольно хорошо соответствовали накопленным к тому времени экспериментальным данным. Концепция Павлова содержала следующие положения:

высшая нервная деятельность (т.е. образование условных реф­лексов) есть результат взаимодействия двух основных нервных процессов — возбуждения и торможения;

при действии УС в коре головного мозга формируется очаг воз­буждения;

из этого очага возбуждение иррадиирует (распространяется) по коре; внешнее проявление иррадиации возбуждения — про­цесс генерализации, т.е. появление УР не только на данный сти­мул, но и на близкие к нему по параметрам раздражители (на­пример, не только на звуковой тон определенной высоты, ко­торый использовался при обучении, но и на другие звуки близких диапазонов) (см. рис. 3.2);

свойством генерализации обладает и тормозный процесс;

очаги возбуждения и торможения обладают свойством отри­цательной индукции, благодаря которому на периферии очага возбуждения в коре появляется очаг торможения (таким же свойством обладают очаги торможения);

процессы возбуждения и торможения взаимодействуют на ос­нове не только их иррадиации, но и концентрации; если ирра­диации нервных процессов соответствует явление генерализа­ции, то концентрация процесса возбуждения проявляется в формировании дифференцированных условных рефлексов (см. 3.3);

формирование УР заключается в образовании связи между двумя очагами возбуждения, вызванными условным и безусловным раздражителями.

Фундаментальное значение открытия И. П. Павловым услов­ных рефлексов заключается в том, что такой вид психической активности, как ассоциативное обучение, стал предметом экспе­риментальных физиологических исследований (ранее психологи изучали его только на основе интроспективных заключений).

Павловская концепция физиологии высшей нервной деятельнос­ти логично описывала полученные в тот период и теми методами экс­периментальные данные. Она сыграла большую роль в науке, объяс­няя механизм формирования целого ряда сложных поведенческих ре­акций. Однако постепенно, с расширением методической базы, а также с переходом к экспериментам на других животных, стала очевидной ее ограниченная применимость для объяснения многих фактов, прежде всего потому, что упомянутые закономерности нервных процессов далеко не всегда подтверждались прямыми нейрофизиологическими исследованиями функций головного мозга. Так, например, представ­ления об иррадиации и концентрации нервных процессов не подтвер­дились при использовании в качестве моделей других УР. В настоящее время отдельные ученые продолжают использовать положения павловской концепции при трактовке результатов изучения высшей не­рвной деятельности, получаемых традиционными методами павлов­ской школы. В этом нет ничего парадоксального, так как в любой теории, прошедшей проверку временем, основная идея сохраняется.

Сущность павловского учения составляет идея об условных реф­лексах как элементарной единице приспособительной деятельно­сти. Методологический подход к изучению высшей нервной дея­тельности базируется на четырех принципах: детерминизм, анализ и синтез, приуроченность функции к структуре.

Ассоциативное обучение, включающее классические и инструмен­тальные условные рефлексы, интенсивно исследовалось на протяже­нии всего XX века. Рассмотрим более подробно основные типы услов­ных рефлексов.

3.2.2.2. Классические условные рефлексы

Условнорефлекторное слюноотделение, которому уделялось основ­ное внимание в лаборатории Павлова, относится к классическим УР.

При выработке классического УР последовательность событий в опыте никак не зависит от поведения животного. Она устанавливается либо экспериментатором, либо специальной программой, в соответ­ствии с которой включаются те или иные стимулы, в ответ на них можно наблюдать образование условных реакций.

В настоящее время в связи с использованием разнообразных экс­периментальных животных (не только традиционных собак), а также благодаря разнообразным методам регистрации изучаемых реакций на смену павловской методике классических слюнных УР пришли дру­гие, более удобные лабораторные модели, которые продолжают быть предметом многочисленных исследований (см. также Мак-Фарленд, 1987; Реаrсе, 1998).

Разнообразные классические условнорефлекторные реакции можно на­блюдать в экспериментах на животных, если проводить полиграфическую реги­страцию ряда физиологических процессов организма (ЭКГ, ЭЭГ, плетизмограмму и др.). Как и в случае слюнного рефлекса, сочетание положительного (например, пищевого) безусловного раздражения с нейтральным приведет к тому, что последний начнет вызывать изменения в вегетативных функциях организма, которые до этого провоцировались только непосредственно са­мим безусловным воздействием. Полиграфическая регистрация обычно ис­пользуется при изучении отрицательных (аверсивных) классических УР. Много работ такого рода проводится также для оценки реактивности нервной систе­мы к действию стрессорных агентов и ее стрессоустойчивости.

В настоящее время классические УР наиболее часто исследуют на моделях, использующих вкусовое отвращение и реакцию третьего века (мигательной перепонки).

Было, например, обнаружено, что классические УР образуются с разной скоростью в зависимоссти от того, какие физиологические системы вовлече­ны в их формирование. Так, УР избегания пищевого яда у крыс (как правило, используют хлорид лития) формируется легко, если введение его в организм сочетается с предложением животному пищи определенного вкуса. Однако УР избегания яда формируется с трудом или не образуется совсем, если его введение сочетается, например, со звуковым раздражением. На схеме (рис. 3.3) показано, как авторы (Garcia et al., 1970) представляют себе гипотетический механизм формирования такого УР вкусового отвращения. Вкусовой стимул, сочетающийся с пищевым отравлением, ведет к образованию УР вкусового отвращения. При сочетании звука с ударом тока образуется УР на боль. В то же время иное сочетание, например вкусового и болевого стимулов, не ведет к образованию УР.

Классический УР — сокращение мигательной перепонки при действии тактильного или звукового УС — обычно изучают на кроликах. При действии на роговицу глаза безусловного раздражителя — воздушной струи (или слабо­го удара тока) — мигательная перепонка сокращается. Это сокращение можно регистрировать специальным прибором и оценивать его интенсивность. Если безусловное раздражение сочетать с каким-либо нейтральным стимулом, например звуком, то после нескольких сочетаний мигательная перепонка будет сокращаться уже при изолированном действии этого звука, который стано­вится условным сигналом (см. рис. 3.2).

Стимулы

Последствия

рвота

боль

Сладкий вкус

формирование УР вкусового отвраще­ния

УР не формируется

Щелчок

УР не формируется

формирование обо­ронительного УР

 

Рис. 3.3. Схема, показывающая избирательность ассоциаций между УС и подкреплением при формировании классических УР.

 

3.2.2.3. Инструментальные условные рефлексы (или обучение методом проб и ошибок)

Начало исследований инструментальных УР связано с именем Э. Торндайка (см. 2.4.1), хотя их анализ проводился и в лаборатории И. П. Павлова.

В лаборатории И. П. Павлова «классические» УР носили название услов­ных рефлексов 1-го рода, а инструментальные — условных рефлексов 2-го ро­да. В монографии Ю. Конорски (1969) на большом экспериментальном мате­риале дается анализ сходства и различия между ними.

В опытах с «проблемными ящиками» Торндайк наблюдал, как по­саженная в ящик кошка ищет выход, пытаясь открыть дверцу разны­ми способами (рис. 3.4А) (для этого нужно было нажать на задвижку или потянуть за пружину). Кошка сначала совершает много разных действий (проб), которые в своем большинстве бывают неверными (ошибки), пока случайно не откроет ящик. При последующих пробах она выходит из ящика все быстрее и быстрее. Конструкция устройства была подсказана Торндайку К. Ллойдом-Морганом, наблюдавшим, как его собака манипулирует с задвижкой калитки, чтобы «улизнуть» из дома (рис. 3.5). Такое обучение Торндайк и назвал «методом проб и ошибок». В дальнейшем обучение животного подобным действиям по­лучило название инструментальных (или оперантных) УР.

Торндайк первым предложил количественную оценку динамики обучения животного инструментальному навыку. Для этого он ввел так называемые «кривые научения», примеры которых приведены на рис. 3.4Б.

Между классическими и инструментальными УР существуют оп­ределенные различия.

Рис. 3.4. Инструментальные УР.

А — один из вариантов «проблемного ящика», предложенный Э. Торндайком для исследования способности животного к решению задачи методом «проб и ошибок»; Б — примеры кривых научения при использовании этого метода. По оси ординат — время, затраченное на решение задачи, по оси абсцисс — последовательные предъявления теста.

При классических УР временная связь между условным сигналом и безусловной реакцией возникает непроизвольно при действии бе­зусловного раздражителя (подкрепления).

При инструментальных УР подкрепление, например пища, дает­ся только после того, как животное совершает определенное действие, которое не имеет прямой связи с безусловным раздражителем.

В классическом УР выделение слюны происходит в ответ на контакт пищи с рецепторами полости рта, и эта реакция может стать условнорефлекторной. В отличие от этого при выработке инструмен­тального УР пищевое подкрепление изначально никак не связано ни с протягиванием лапы, ни с побежкой в лабиринте. Однако мы мо­жем давать животному пищу сразу после того, как оно сделало такое движение, и вскоре животное будет его совершать, чтобы получить подкрепление.

К категории инструментальных УР относится формирование на­выка нажатия на рычаг (или клевания кнопки, как на рис. 3.6) для получения порции пищи. После работ Б.Скиннера этот УР стал ос­новным в исследованиях бихевиористов (анализ связей «стимул-реак­ция»). К инструментальным УР относится также обучение подопыт­ного животного находить путь к пище или избегать неприятных сти­мулов в лабиринте. Инструментальным УР является и реакция избегания — навык переходить в тот отсек экспериментальной каме­ры, где отсутствует болевое подкрепление (рис. 3.7).

Включению тока предшествует включение УС — звука или света. Чтобы избежать болевого воздействия, животное перебегает в другую половину камеры. По прошествии небольшого периода времени (как правило, его длину варьируют, чтобы не вырабатывать у животного УР на время) ток включают в той половине камеры, куда оно перед этим перебежало. УР считается вы­полненным, если животное перебегает в безопасную половину камеры во время действия УС и до включения тока.

Рис. 3.5. Рисунок, сделанный по фотографии «исторического» эпизода. Собака К. Ллойд-Моргана научилась открывать задвижку калитки, получая тем самым возможность «обрести свободу». Эта ситуация счи­тается прототипом торндайковского «проблемного ящика».

Рис. 3.6. Камера Б. Скиннера для обучения голубей.

В верхней части левой стенки камеры размещены 3 диска-«ключа». Они раз­личаются не только по положению, но и по цвету лампочки, которая загора­ется за каждым из них. В кормушку (ниже) подают подкрепление. Клевание ключа (или, например, каждое 5-е клевание) автоматически подает зерно в кормушку.

Рис. 3.7. Челночные камеры для исследования у лабораторных крыс и мышей реакции активного избегания.

А — современная установка для изучения условной реакции активного избе­гания, которая обычно состоит из 4 челночных камер с автоматизированным управлением и выводом результатов на экран монитора; Б — отдельная чел­ночная камера.

 

Обширные исследования, выполненные сторонниками идей би­хевиоризма, привели к появлению целого ряда новых терминов и по­нятий и созданию специфического языка для описания закономерно­стей процесса обучения, обнаруженных только благодаря применен­ным ими подходам. Многие термины сначала использовались как чисто технические — для объективного описания данных (знакомство с ними может помочь при чтении научных статей бихевиористов). К таким терминам, в частности, относятся:

оперантное поведение — спонтанные действия, не вызванные каким-либо очевидным стимулом;

реактивное поведение — всякое поведение, которое совершается в ответ на определенный стимул;

« режим подкрепления (reinforcement schedule): соотношение числа реак­ций (например, нажатий на рычаг) и вознаграждений (например, кусочков пищи; подробнее см. ниже);

постоянный (или переменный) интервал (fixed or variable interval) — вознаграждение дается через определенные интервалы времени, в период которых животное может осуществлять двигательные реак­ции (эти интервалы могут быть постоянными иди варьировать по длительности), но по истечении этого интервала подкрепляется только первая реакция;

фиксированное (или переменное) соотношение (fixed ratio or variable ratio) — подкрепление дается животному только после того, как оно произведет какое-то количество реакций (нажатий или клеваний. Можно давать подкрепление только после определенного числа ре­акций (фиксированное соотношение) или это число может каким-то образом варьировать (переменное соотношение);

смежность (contiguity) — этим термином обозначают постулируемое возникновение связей между стимулами и возникающими на их ос­нове реакциями, а также совпадение УС с реакцией животного или УС с подкреплением, которое необходимо для возникновения УР;

ключ (cue) — обычно это либо рычаг, на который нажимает крыса, либо освещенный кружок, по которому наносит удар клювом голубь (этот термин, обычный для работ бихевиористов, не следует путать с термином «ключевой стимул», принятым в этологии для обозначе­ния видоспецифических стимулов, вызывающих инстинктивные ре­акции (см. 2.11).

На рис. 3.6 схематически изображена камера для выработки инст­рументальных УР у голубей. Скиннер считал, что любое поведение, относящееся к категории «оперантное», можно эффективно модифи­цировать, если при его выполнении давать животному подкрепление. Именно такой подход он предложил как эффективный способ анали­за поведения. Если для выработки классических УР необходимы соче­тания условных сигналов и подкрепления, то при методике свободного оперантного поведения, предложенной Скиннером, экспериментатор сопровождает подкреплением выполнение животным только опреде­ленного, намеченного им действия.

Например, крысу можно обучить нажимать на рычаг, если сначала со­провождать подкреплением любые ее действия в той части камеры, где она находится. Постепенно крыса обучается держаться вблизи рычага, и тогда подкрепление дают только, если она касается рычага мордой или лапой (для этого иногда на рычаг даже кладут пищу). Через некоторое время подкрепле­ние дается только после выполнения четких движений — нажатий (одного или нескольких) лапой на рычаг.

Такое постепенное видоизменение поведения животного в ре­зультате вмешательства экспериментатора называется методом после­довательного приближения или формированием (shaping) поведения.

Деление условных рефлексов на классические и инструменталь­ные, удобное методически, не означает, что они имеют совершенно разную природу. В их основе лежат сходные нейрофизиологические механизмы, а любое «чисто» инструментальное действие животного всегда сопровождается реакцией, которая относится к классическим УР. И наоборот, в любом «чисто» классическом УР можно обнаружить двигательный компонент, который по своим свойствам относится к инструментальным (Борукаев, 1982).

О связи классических и инструментальных УР свидетельствует также «самоформирование» условной реакции (autoshaping). Например, если голодного голубя поместить в камеру Скиннера и в течение 5 с осве­щать ключ для клевания с интервалом в 1 мин, а после прекращения освещения давать порцию пищи, то голубь сначала не обращает вни­мания на ключ. Однако после нескольких таких сеансов формируется инструментальная реакция, и он быстро начинает клевать ключ не­зависимо от освещения. Постепенно голубь научается клевать ключ только при его освещении, т.е. реакция становится более точной — она самоформируется. В данном случае она очень близка к классичес­кому УР, поскольку голубь клюет ключ как бы вместо зерна, даже в отсутствие подкрепления.

С помощью метода «последовательного приближения» у животных удается сформировать не только клевание ключа при его освещении, но и самые разнообразные, сложные и иногда неожиданные навыки. В опытах Скиннера голуби «играли» в пинг-понг, а крысы могли под­тянуть к себе с помощью бечевки бильярдный шар, взять его в перед­ние лапы и засунуть в трубку, расположенную на 5 см выше пола клетки (описание экспериментов П. Эпштейна, посвященных форми­рованию сложных навыков у голубей, будет дано в гл. 4.8). Метод пос­ледовательного приближения составляет основу дрессировки цирко­вых и служебных животных.

Примером продуктивного использования принципов бихевиориз­ма, и в частности роли метода последовательного приближения в фор­мировании поведения, является работа знаменитой американской дрес­сировщицы дельфинов и психолога К. Прайор (1995).

Тезис Скиннера о том, что любые движения, на которые способно животное данного вида, равновероятно можно использовать для инст­рументального научения, был достаточно обоснованно подвергнут со­мнению в работе его коллег — К. и М. Бреландов (Breland, Breland, 1961). Некоторые виды животных при обучении манипуляциям с предметами производят «заданные» экспериментатором действия только после вы­полнения некоторых врожденных (инстинктивных) действий либо со­всем не могут им научиться. Так, например, обучая енота нажимать на рычаг, Бреланды заметили, что нажатию предшествует видоспецифи-ческое движение лап — «полоскание», характерное для этого вида при добыче пищи из ручья (за что енота и называют «полоскун»). На основа­нии таких наблюдений возникло представление о предрасположеннос­ти к обучению (подробнее см.: Зорина и др., 1999).

Образование инструментальных УР по механизму «последовательного приближения» играет важную роль в организации пове­дения животных не только в эксперименте, но и в естественных условиях.

Обучение по методу последовательного приближения может про­исходить самым неожиданным образом. Об этом, в частности, свиде­тельствует получившая широкую известность в начале XX века исто­рия «умного Ганса». Это был конь, который демонстрировал способ­ность «считать», «складывать», «извлекать корни», отвечать на вопросы и т.п. (рис. 3.8). Столь «разумное» поведение объяснялось тем, что конь научился замечать малоуловимые движения дрессировщика, которые тот непроизвольно совершал, видя, что конь вот-вот даст правиль­ный ответ. Ориентируясь на эти условные сигналы, конь в нужный момент прекращал стучать копытом.

Рис. 3.8. Инструментальные условные рефлексы у дрессированной лоша­ди «умного Ганса». На фотографии видно, как ударами копыта по специальной доске Ганс сигнализировал «правильный» ответ (по Н.Н. Ладыгиной-Котс, 1914).

 

В начале XX века (1900-1904) барон В. фон Остен, убежденный в огром­ных умственных способностях лошадей, обучал нескольких из них различе­нию цветов, азбуке и «счету». Узнавание каждой буквы или цифры лошадь обозначала соответствующим числом ударов копыта. Друг фон Остена худож­ник Редлих обучил таким же образом свою собаку. Наиболее способным уче­ником оказался орловский рысак Ганс, который производил достаточно слож­ные арифметические подсчеты, отвечал на разнообразные вопросы, а иногда высказывался по собственной инициативе. Так, супруги Н. Н. и А. Ф. Котc, специально приехавшие для знакомства с ним в 1913 году, рассказывали, что после нескольких относительно коротких ответов на вопросы Ганс заявил: «В поле я встретил милую госпожу Краль, которая меня кормила».

Поведение его было столь впечатляющим, что вводило в заблуждение не только публику, но даже членов специальных комиссий, включая Н. Н. Ладыгину-Котс. Предполагали, что хозяин подает коню некие скрытые сигналы (как дрессировщик — цирковым животным), однако его обследовали 13 эк­спертов (комиссия психолога К. Штумпфа) и не обнаружили никакого об­мана. Они засвидетельствовали, что Ганс действительно «считает» и никаких скрытых сигналов ему не подают. И лишь много позднее наблюдатели посте­пенно заметили, что Ганс отвечает только на те вопросы, ответ на которые знает сам экспериментатор. Специальный анализ, проведенный психологом О. Пфунгстом, показал, что животное реагирует на мельчайшие непроизвольные (идеомоторные) движения экспериментатора, например на откло­нения корпуса на 2 мм, микродвижения бровей, мимику и т.п. Эта невольная подача сигналов происходила, по-видимому, из-за эмоционального напря­жения человека, по мере того как число ударов копытом приближалось к искомому. Даже картонный щит, которым пробовал отгородиться от Ганса экспериментатор, не помогал: животное все равно улавливало какие-то толь­ко ему понятные знаки для определения правильного ответа.

Для проверки своего предположения Пфунгcт специально научил Ганса реагировать на микродвижения, которые он совершал уже сознательно, и продемонстрировал комиссии механизм и природу «математических способ­ностей» этой лошади.

История «умного Ганса» оставила заметный след в развитии науки о поведении животных:

* она показала, сколь сложное поведение могло быть результа­том обучения методом проб и ошибок;

* продемонстрировала справедливость «канона Ллойда-Моргана» (см. 2.3) и актуальность его применения, поскольку в основе поведения этой «мыслящей лошади» лежали чисто условнореф-лекторные, а не связанные с мышлением механизмы;

* впервые привлекла внимание к проблеме чистоты эксперимента с точки зрения возможности неосознанного влияния экспери­ментатора на его результаты;

* заставила по-новому взглянуть на возможности восприятия жи­вотных: способность уловить едва заметные движения человека свидетельствовала об их большой наблюдательности и способ­ности концентрировать внимание.