Научение без подкрепления

И. П. Павлов посвятил изучению условных рефлексов многие годы своей творческой жизни.

Тем не менее он признавал, что рефлекторная теория не в состоянии объяснить многие поведенческие явления животных. В отдельных ситуациях животные приобретают личный опыт, используя механизмы, которые лежат за пределами схемы образования классического или инструментального условного рефлекса.

В ряде случаев животные приобретают сложные индивидуальные адаптации, не получая при этом положительного или отрицательного подкрепления. Сюда можно отнести такие явления, как латентное научение, условно-рефлекторное избегание стимулов, имитационное поведение, инсайт, отсроченные реакции, игровое самообучение.

Латентное научение. Этот тип научения был обнаружен при изучении поведения животных в лабиринте. Оказалось, что крысы исследуют лабиринт без всякого подкрепления: из любопытства. Предварительно ознакомившиеся с лабиринтом животные быстрее научаются решать задачи с подкреплением. Данный тип научения имеет широкое распространение среди животных с развитым чувством «хоуминга». Под этим термином подразумевают способность животных находить путь к своему дому. Хоуминг характерен для многих насекомых (пчел, муравьев, ос, шмелей), птиц (например, почтовых голубей) и млекопитающих (лошадей, собак, в меньшей мере кошек). Все эти животные, попав в незнакомую среду, изучают обстановки без всякого подкрепления. Они создают в голове своеобразные схемы местности — когнитивные карты, — на основании которых оптимизируют свое поведение при возвращении домой.

Условно-рефлекторное избегание неблагоприятных стимулов. У всех видов животных можно наблюдать врожденное свойство избегать контактов с отрицательными стимулами. Но чтобы оно возникло, животному требуется некоторый опыт (личный или коллективный). Так, синантропные животные после первого же знакомства с отравленными приманками тщательным образом избегают контакта с ними и даже мест, в которых отрава была разложена, а для крыс личный опыт контактирования с неблагоприятным фактором необязателен. Им достаточно иметь контакт с животными, пострадавшими от этого стимула.

Условно-рефлекторное избегание неблагоприятных факторов можно наблюдать у многих животных. Например, собака автора миттелыпнауцер до конца жизни (до 15-летнего возраста) проявляла реакцию избегания жаб, ос и пчел, хотя имела единичный опыт контактирования с этими животными в щенячьем возрасте.

Между классическим условным рефлексом и реакцией избегания существует большая разница. В случае с избеганием приманки условный раздражитель (приманка) и отрицательное подкрепление (признаки токсикоза, включающие плохое самочувствие) разобщены во времени и пространстве. Другой характерной чертой условно-рефлекторного избегания является то, что условно-рефлекторное избегание не нуждается в периодическом подкреплении и не подвержено угасательному торможению.

Явление условно-рефлекторного избегания без подкрепления широко распространено в природе. Но оно часто остается незамеченным, поскольку реакция избегания проявляется в форме кажущегося отсутствия внимания к потенциальному источнику опасности.

Имитационное научение. Данный тип научения включает два вида приобретения новых поведенческих паттернов. В раннем онтогенезе широкое распространение получило явление подражания, о чем уже упоминалось выше. Особо развиты способности к подражанию у певчих птиц, врановых, а также у попугаев.

Не лишены этого свойства и млекопитающие. Однако помимо подражания, у представителей класса млекопитающих проявляется другая форма имитационного научения. Она получила название викарного научения. Под этим термином принято понимать копирование животными сложных поведенческих явлений, которые обеспечивают достижение определенной цели. Причем зачастую викарное научение представляет собой самый эффективный способ решения задачи в конкретной обстановке. Типичным и наиболее ярким примером викарного научения можно считать имитацию орудийной деятельности у высших приматов. Скажем, если один шимпанзе освоил использование палки для добывания бананов, то другая обезьяна наверняка начнет повторять действия более смышленого соплеменника.

Не лишены способностей к викарному научению и собаки. Эту способность используют дрессировщики для научения животных сложным формам поведения. Молодую собаку посылают выполнять задачу следом за более опытной. Так быстро научают собак преодолевать полосу препятствий. Некоторые собаки научаются следовой работе по этой схеме.

Отсроченные реакции. При наличии хорошей памяти и сильной мотивации животные решают сложные задачи без немедленного подкрепления. Особенно успешно этим способом решаются задачи, связанные с поиском спрятанного на виду у животного лакомства. Животное видит, куда прячут приманку, но не имеет возможности сразу же ее отыскать. Животному позволяют это сделать спустя некоторое время. Животные хорошо помнят, где прятали приманку, и при первой же возможности направляются именно в это место. Если в отсутствие животного приманку перепрятать, то у обезьян это вызывает недовольство и протест.

Собаки в такой ситуации ведут себя более уравновешенно. Они начинают искать лакомство в других местах. Все эти опыты свидетельствуют о том, что у животных длительное время сохраняется представление о лакомстве и месте, в котором оно было спрятано.

Собаки обладают долгосрочной, длящейся годами памятью на захороненные приманки. Автор со своей собакой некоторое время жил в деревне. Собака принесла домой со скотомогильника телячью бедренную кость. Кость испускала сильный неприятный запах, поэтому была отобрана у собаки и закопана в огороде. За процедурой захоронения лакомой находки с тоской через оконное стекло наблюдала собака. Затем собаку увезли в город. На следующее лето собаку вновь привезли в деревню. Первым делом, которое сделал миттелыннауцер по приезде спустя 12 месяцев, был поход в огород за закопанной костью.

Игровое самообучение. У всех животных заложены программы научения за счет самообучения. Эти программы позволяют интегрировать в единые биологически целенаправленные поведенческие акты врожденные способности и приобретаемые навыки. Игра, в которой многократно повторяются одни и те же действия животного, приводит к оптимизации локомоций молодняка. Котенок, играя с полуживой мышью, научается правильным приемам захвата и умерщвления жертвы. Молодые обезьяны через игры с предметами научаются орудийным навыкам. Молодые петушки периодически совершают движения, характерные для взрослых петухов: подскакивают на месте, принимают угрожающие позы, атакуют воображаемого противника шпорами. Во всех этих случаях животные самообучаются в игре. Процесс научения протекает без подкрепления.

У животных со сложной перцептивной психикой исследователи наблюдают и такое явление, как инсайт, или озарение. Под этим явлением понимают способ решения сложной задачи без запускающего рефлекс раздражителя. Инсайт — внезапное решение задачи без предварительных проб и ошибок.

В проблемной ситуации животные некоторое время не совершают никаких действий, однако вскоре демонстрируют поведенческие адаптации на основе своего прошлого опыта, который они никогда в создавшейся проблемной ситуации еще не применяли. Так, шимпанзе в опытах Келера доставали банан при помощи соединенных вместе палок. Собаки также могут демонстрировать озарение в проблемных ситуациях.

Литературные свидетельства инсайта немногочисленны и относятся исключительно к высшим позвоночным с тонкой психикой — приматам, в меньшей степени к собакам, китообразным. Нейрофизиологические механизмы инсайта остаются неясными. Не исключено, что научение типа инсайт сопряжено с условно-рефлекторной деятельностью высокого порядка. Однако проследить эти связи очень сложно: экспериментальное моделирование этого сложного процесса пока невозможно.

На определенной стадии своего развития животные становятся способными улавливать причинно-следственные отношения между явлениями окружающей среды, т. е. для животных характерна рассудочная деятельность. От условного рефлекса рассудочная деятельность отличается тем, что животное не только отвечает на действие раздражителя, но и предвидит несколько вариантов ответа. Причем реакции могут иметь отсроченный или даже упреждающий характер.

Одним из первых исследователей, кто не просто осмелился заявить о зачатках разума у животных, но попытался представить экспериментальные доказательства его наличия у животных, был профессор Московского Государственного университета Л. В. Крушинский. Изучая поведение служебных собак, он пришел к заключению, что по мере развития личного опыта в процессе онтогенеза у многих собак возникают поведенческие реакции, которые не укладываются в рамки инстинктивного поведения и не поддаются объяснению с традиционных позиций научения. Поведение животных лишь для удобства изучения подразделяют на врожденное и приобретенное. На уровне системной организации поведенческого акта эти разные по происхождению адаптации тесно переплетаются, а на их основе возникает нечто новое.

Норма реакции — это степень изменчивости той или иной составляющей элементарного поведенческого акта, которая задается генотипом животного.

Величина нормы реакции (ее пределы) зависит от уровня эволюционной организации животного, особенностей среды обитания и от генотипа особи.

Л. В. Крушинский считал, что свидетельством зачатков рассудочной деятельности может быть способность животных к экстраполяции своих действий в связи с движением корма. Л. В. Крушинский исходил из того, что так называемые экстраполяционные рефлексы отражают способности животных к выявлению причинно-следственных отношений между отдельными стимулами, а также стимулами и внешней средой, т. е. служат доказательством элементарной рассудочной деятельности.

В экспериментах использовались животные с разным уровнем развития психики: голуби, утки, куры, вороны, сороки, кролики. Все эти животные демонстрировали разный уровень способностей предугадывать (экстраполировать) наступление события. Эта способность отсутствовала у голубей и была хорошо развита у врановых птиц. Кролики демонстрировали одинаковые с курами способности к экстраполяции событий.

Ученый заключил, что «при помощи экстраполяционных рефлексов, осуществляющихся в результате быстро образующихся ассоциаций между раздражителями и внешней средой, достигается возможность элементарного предусмотрения наступления события будущего не только в относительно стабильных, «привычных» для животного условиях, но и в среде с многообразными изменениями отношений между раздражителями».

До Л. В. Крушинского предположения о наличии элементов рассудочной деятельности высказывали и другие исследователи. Так, Н. Н. Ладыгина-Котс воспитывала в своей семье вместе с собственным ребенком детеныша шимпанзе того же возраста. Она констатировала у обезьяны наличие поведенческих явлений, необъяснимых с позиции рефлекторной теории. Обезьяна проявляла способности к анализу информации и принятию решений на основе рассудочной деятельности. Эти выводы подтверждались в экспериментах на обезьянах, которые проводил и W. Н. Thorpe.

Рассудочную деятельность у животных допускал и такой авторитетный исследователь поведения и психики животных, как J. Konorski.

При анализе орудийной деятельности обезьян И. П. Павлов писал: «когда обезьяна строит свою вышку, чтобы достать плод, то это условным рефлексом назвать нельзя. Это есть случай образования знания, уловления постоянной связи между вещами… то, что лежит в основе всей научной деятельности, законов причинности и т. д.».

Таким образом, абсолютно нет оснований говорить о том, что рассудочная деятельность — привилегия только лишь вида Homo sapiens. Животные с тонкой психикой имеют высокоадаптивные поведенческие проявления не в последнюю очередь благодаря наличию элементов рассудочной деятельности.