Зоопсихология. Элементарное мышление животных - Учебное пособие (Зорина З. А)

3.3. дифференцировочные условные рефлексы

Перестав подкреплять выполнение условной реакции, можно не только «угасить» УР, но и «усовершенствовать» его, т.е. добиться, что условная реакция будет осуществляться точно на данный и только на данный стимул, а близкие по своим физическим свойствам раздражи­тели ее не вызовут. Как известно, в начале формирования УР живот­ное реагирует не только на строго конкретный условный стимул, на­пример звук определенной частоты, но и на сходные с ним звуки, хотя и не полностью ему идентичные, например звуки близких частот (см. рис. 3.2Б). Эта стадия выработки УР называется генерализацией. Далее исследователь продолжает подкреплять (пищей или избавлени­ем от опасности) условную реакцию только на определенный сигнал и не подкрепляет ответов на сходные, и в результате они постепенно угасают. Таким способом животное обучают различать — дифференци­ровать — весьма похожие сигналы.

В основе формирования дифференцировочных УР лежит дифференцировочное торможение— один из видов внутреннего торможения.

Процедура такого «совершенствования» сигнального значения условных раздражителей была названа И. П. Павловым дифференци-ровкой, или выработкой дифференцировочных условных рефлексов (см. также рис. 3.2).

Выработка дифференцировочных УР (разными методами) успешно ис­пользуется для оценки сенсорных способностей (т.е. возможностей органов чувств) животных разных таксономических групп (см., например: Дьюсбери, 1981; Реаrcе, 1998). Так, выработав у животного УР дифференцирование (раз­личение) двух цветовых стимулов, можно, выравнивая их другие параметры (например, яркость), изучать механизмы восприятия цвета. При этом если животное, в силу особенностей органов чувств, не воспринимает различий между двумя зрительными стимулами (цветами спектра), то выработать у него устойчивую дифференцировку такой пары стимулов невозможно.

Методики выработки дифференцировочных УР весьма многочис­ленны и разнообразны по процедуре эксперимента. Перечислим ос­новные параметры, по которым различаются такие методики.

1. Порядок предъявления стимулов может быть последователь­ным или одновременным. При последовательном предъявлении голубь должен научиться клевать кнопку (диск) в ответ на сти­мул А и воздерживаться от реакции при включении стимула Б (методика go— no go). Выработка дифференцировки, таким об­разом, состоит в торможении реакции на второй стимул. При одновременном предъявлении конкретной пары стимулов жи­вотное учится различать (дифференцировать) стимулы по их абсолютным признакам. Например, при дифференцировке сти­мулов по их конфигурации животному одновременно показы­вают две фигуры — круг и квадрат, и подкрепляют выбор од­ной из них, например круга. Это наиболее распространенный вид дифференцировочных УР. Выработка и упрочение такой реакции требует, как правило, многих десятков сочетаний.

2. Животному предлагают сделать выбор стимулов: альтернатив­ный или множественный.

3. Предъявление стимулов может осуществляться в соответствии с двумя режимами: повторением одной пары стимулов до дости­жения критерия и чередованием нескольких пар стимулов при систематическом варьировании второстепенных параметров.

Рассмотрим некоторые методы более подробно.

При систематическом варьировании второстепенных параметров стимулов можно оценивать способность животных различать не толь­ко данную конкретную пару раздражителей, но и их «обобщен­ные» (отвлеченные) признаки, совпадающие у многих пар.

Например, животных можно обучить различать не конкретные круг и квадрат, а любые круги и квадраты независимо от их размера, цвета, ориентации и т.п. С этой целью в процессе обучения каждый сле­дующий раз им предлагают новую пару стимулов (новые круг и квад­рат). Новая пара отличается от остальных по всем второстепенным признакам стимулов — цвету, форме, размерам, ориентации и т.п., но сходна по их основному параметру — геометрической форме, раз­личения которой и предполагается добиться. В результате такой трени­ровки у животного постепенно происходит обобщение основного при­знака и отвлечение от второстепенных. В приведенном примере обоб­щается признак «круг» (подробнее см. гл. 5).

Данный режим оказался весьма эффективным для выработки дифференцировочного УР на обобщенный признак «мерность», когда животное училось выбирать любую объемную (трехмерную) фигуру и не реагировать на плоские (двумерные) фигуры (см. 4.6.3). В таких опытах с собаками, обезьянами и воронами у одной группы животных каж­дого вида вырабатывали УР выбора любой объемной (трехмерной) фигуры, а у второй группы — любой плоской (двумерной). Каждый раз животному предъявляли новую пару стимулов из набора, изобра­женного на рис. 4.15 (всего 30 пар), причем плоская фигура всегда представляла собой фронтальную проекцию объемной.

Может возникнуть предположение, что задача по выработке таких дифференцировок для животных очень сложна, однако с ней справ­ляются не только приматы, но и хищные млекопитающие (Дашевский, Детлаф, 1974), а также птицы — врановые и даже голуби (Крушинский и др., 1981). При этом животным всех указанных видов тре­бовалось примерно столько же сочетаний, как и при выработке дифференцировки с одной парой стимулов. После такой серии обуче­ния они способны выбирать любую новую объемную (или плоскую) фигуру без дополнительной тренировки.

При систематическом варьировании второстепенных признаков стимулов можно исследовать не только способность животных к обучению, но и более сложную форму их высшей нервной дея­тельности — способность к обобщению, которая составляет одно из важнейших свойств довербального мышления животных (гл. 5).

Как уже упоминалось, животные с разным уровнем структурно-функциональной организации мозга практически не различаются по способности к простым формам условнорефлекторного обучения. Об­разование отдельных дифференцировочных УР в этом плане не со­ставляет исключения. Однако благодаря использованию дифферен­цировочных УР в качестве элементарных единиц обучения и созда­нию их разнообразных комбинаций было разработано несколько экспериментальных процедур, которые называют «сложными фор­мами обучения», или серийным обучением (serial learning). Появление этих методов было связано со стремлением специалистов все же вы­явить какие-то различия в способностях у животных разных таксоно­мических групп с разным уровнем организации мозга (см. 8.1). Наи­более важные из этих методов:

последовательные переделки сигнального значения дифферен­цировочных стимулов;

формирование установки на обучение;

формирование «систем» дифференцировочных УР.

3.3.1. Последовательные переделки сигнального значения дифференцировочных стимулов

Переделка сигнального значения условных раздражителей (ее ча­сто называют переделкой дифференцировки) — это разновидность дифференцированного обучения.

После достижения определенного, выбранного экспериментатором критерия выработки различения (например, 80\% правильных реше­ний) условия получения подкрепления меняются на противополож­ные: теперь реакция на стимул, ранее подкреплявшийся, перестает сопровождаться пищей, а реакцию на стимул, на который животное только что научилось не реагировать, начинают подкреплять.

Американский исследователь М. Биттерман (1973) предложил про­водить такие переделки многократно. Эта процедура получила назва­ние метода последовательных (или обратимых) переделок (discrimination reversal learning). Автор исходил из того, что после многократных смен сигнального значения стимулов у животных может сформироваться единая стратегия (или правило) и они не будут каждый раз обучаться совершенно заново.

Опыты проводились на разных видах позвоночных. При каждой следующей переделке число ошибок снижалось, и в конце концов наступал момент, когда при очередной смене сигнального значения стимулов животное уже со второй пробы начинало выбирать «пра­вильно» без дополнительного обучения.

Снижение числа проб, необходимого для очередной переделки реакции, происходит тем быстрее, чем выше уровень эволюционного развития данного животного.

3.3.2. Формирование «установки на обучение»

Метод формирования «установки на обучение» (object learning-set formation) разработал американский исследователь Г. Харлоу (Harlow, 1949; 1958). Согласно классическому варианту этой методики, живот­ное (в опытах Харлоу макака-резуса) обучают простой дифференцировке — выбору одного из двух стимулов: игрушек или мелких пред­метов обихода. По достижении определенного критерия выработки дифференцировки начинают следующую серию: животному предлагают два новых стимула, ничем не похожих на первые. По завершении второй стадии обучения формируют третью дифференцировку и т.д. После выработки 100—150 таких реакции (их число зависит от уровня организации данного вида и может доходить до 1500 у крыс и голу­бей, занимая многие месяцы) животное уже при втором предъявле­нии новой пары стимулов действует не наугад, не методом проб и оши­бок, а в соответствии с усвоенным им ранее правилом, которое при­нято называть установкой. Оно запоминает результат первой пробы и далее реагирует в соответствии с этой «установкой».

Правило состоит в том, чтобы «выбирать тот же предмет, что и в первой пробе, если его выбор сопровождался подкреплением, или другой, если подкрепление получено не было (в дальнейшем эта стратегия получила название "win-stay, lose-shiff")».

Принято считать, что при обучении с использованием метода последовательных переделок и при формировании установки проис­ходят сходные процессы, так что первый можно считать частным слу­чаем формирования установки.

Впоследствии было создано несколько модификаций исходной методики. Например, Д. Уоррен (Warren, 1977) в своих опытах не вырабатывал каждую дифференцировку до достижения критерия обученности, а предъявлял каж­дую пару определенное число раз и затем предлагал следующую. Именно этот вариант был использован рядом авторов для сравнения обучаемости разных видов приматов (Passingham, 1982; Rumbaugh et al., 1987, 2000).

Методом формирования установки на обучение впервые была получена широкая сравнительная характеристика обучаемости живот­ных разных систематических групп, которая в определенной степени коррелировала с показателями организации мозга. Вместе с тем, как и данные М. Биттермана, эти результаты свидетельствовали о суще­ствовании у животных каких-то процессов, выходящих за рамки про­стого образования дифференцировочных УР. Считают, что в ходе та­кой процедуры животное «учится учиться». Оно освобождается от свя­зи «стимул-реакция» и переходит от ассоциативного обучения к инсайт -подобному обучению с одной пробы (Harlow, 1958). При этом, по мнению Р. Бирна (Byrue, 1998), у животного должна сформиро­ваться характеристика подкрепляемого стимула в какой-то отвлечен­ной форме, т.е. должно сформироваться абстрактное правило. Человек выразил бы это правило, как «выбирай подкрепляемое» вместо того, чтобы запоминать каждый раз целый список стимулов (например, красный мяч «+», блюдце «—»; штопор «+», свисток «—» и т.д.).

Аналогичной точки зрения придерживается Л. А. Фирсов. Он счи­тает, что этот вид обучения по своей сути и по лежащим в его основе механизмам близок к процессу обобщения (подробнее см. гл. 5), и с какого-то момента «первичное» обучение — выработка конкретной дифференцировки — сопровождается «вторичным» обучением — не­кими когнитивными процессами, при которых выявляется общее пра­вило решения многих однотипных задач.

То же мнение разделяет английский специалист по теории обуче­ния Н. Макинтош (Mackintosh, 2000): в основе формирования уста­новки на обучение лежит переход от простых ассоциативных механиз­мов (образования УР и дифференцировок) к когнитивным, т.е. к про­цессам, основанным на формировании представлений об общем правиле решения серии однотипных задач. По его образному выражению, жи­вотные «переходят от заучивания наизусть к заучиванию по смыслу».

Данные, полученные с помощью метода последовательных пе­ределок и метода формирования «установки», впервые создали основу для широкой сравнительной характеристики обучаемости животных и показали, что в процессе такого обучения наряду с ассоциативными участвуют механизмы другого уровня — когни­тивные (см. 8.1 и 3.4).

3.3.3. Формирование «систем» дифференцировочных условных рефлексов

В работах Л. Г. Воронина (1984) показано, что при комбинации отдельных УР возникают новые свойства, не сводимые к свойствам суммы исходных рефлексов. Происходит образование так называемых систем дифференцировочных УР, или просто «систем». Такие системы Л. Г. Воронин считал целостными функциональными единицами, из которых складывается психическая деятельность.

У животного вырабатывают несколько дифференцировочных УР, объединенных в систему таким образом, что выполнение одного УР зависит от усвоения другого.

Одна из таких процедур составляет необходимый этап в изучении способности к транзитивному заключению — форме дедуктивного мышления, свойственной и животным, и человеку.

Программа эксперимента по выработке систем дифференцировок состоит в следующем. Животное учится дифференцировать несколько пар раздражителей (как правило, цветовых стимулов). При выработке дифференцировки каждой следующей пары стимулов производится смена сигнального значения части из них в соответствии с определенным пра­вилом: стимул, бывший положительным в паре А— В+ (где «В+» — подкрепляемый стимул, а «А—» — неподкрепляемый), становится от­рицательным в паре В— С+. В процессе обучения животное должно ус­воить информацию о том, что значения стимулов В, С, D могут быть как положительными (В+, С+, D+), так и отрицательными (В—, С—, D ), в зависимости от пары, в которой они в данный момент предъяв­ляются. Стимулы А— и F+ , т.е. первый и последний в последователь­ности, остаются во всех комбинациях только положительным (F) или только отрицательным (А). Высокая доля правильных выборов при чередовании всех пар стимулов, когда животное выбирает, напри­мер, стимул С в паре В- С+, но не реагирует на него в паре С- D+, свидетельствует, что оно усвоило принцип данной системы. Такую систему дифференцировок успешно усваивают дети, начиная с 4 лет (Bryant, Trabasso, 1971), взрослые шимпанзе (Gillan, 1981; Boysen, Berntson, 1995), а также голуби и вороны (Зорина и др., 1989). Меж­видовые различия в динамике и успешности формирования такой си­стемы дифференцировок у этих видов птиц оказались незначительны­ми и недостоверными. В то же время при обратимых последовательных переделках и формировании установки на обучение голуби существенно отставали как от врановых, так и от приматов.

Метод выработки дифференцировочных УР в разных его ком­бинациях является одним из ведущих в физиологии ВНД и используется как инструмент для исследования целого ряда проблем.

К этим проблемам, помимо оценки возможностей органов чувств животных разных видов, относится изучение следующих более слож­ных когнитивных способностей:

к обобщению;

к транзитивному заключению;

к формированию установки на обучение.

Такие экспериментальные исследования будут подробнее рассмот­рены ниже.