"Карен Прайор. He рычите на собаку! (О дрессировке животных и людей)" - читать интересную книгу автора

подкрепления за правильные догадки, так как только они являются
"подходящими". Если бы при составлении картинки-загадки можно было вставить
в одну ячейку несколько кусочков, то положительного подкрепления за
правильный выбор, который является обязательной обратной связью в любой
ситуации выбора, не получалось бы.

Долговременные программы поведения

В дополнение к вариативному режиму подкреплений можно ввести и
закрепленный, при котором субъект знает, что он должен работать
определенное время или выполнить определенный комплекс поведенческих
реакций за каждое подкрепление. Например, подкрепляя каждый шестой прыжок,
можно сделать так, что дельфин будет прыгать шесть раз подряд, и вскоре
получим стабильные серии из шести прыжков. Трудность работы с фиксированным
режимом подкрепления состоит в том, что первые ответы в сериях не
подкрепляются и возникает тенденция к уменьшению затрачиваемых на них
усилий. У прыгающего дельфина со временем все прыжки, кроме последнего,
который действительно подкрепляется, уменьшаются. Это отрицательное влияние
фиксированного режима подкреплений является важным фактором во многих видах
человеческой деятельности - например на заводском конвейере. Чтобы получить
подкрепление, необходимо работать в течение определенного времени, но так
как подкрепление дается в фиксированном режиме, независимо от качества
выполнения, человек совершенно естественно стремится делать то наименьшее
количество работы, которое позволяет не выпасть из игры, особенно низкая
производительность может быть в начальный период работы. Зарплата по
пятницам является фиксированным подкреплением, делающим понедельник тяжелым
днем. У дельфинов поддержать поведение поможет случайное подкрепление
первого или второго прыжка, помимо шестого. У людей могут быть эффективны
различные виды прогрессивных оплат или других подкреплений (например,
награды), тесно связанные с качеством и количеством продукции и выдаваемые
неодновременно с обычным подкреплением. Применяя либо фиксированный, либо
вариативный режимы подкрепления можно оттренировать чрезвычайно длинные
цепи поведенческих реакций. Можно добиться того, что цыпленок будет клевать
кнопку сто и более раз за каждое зернышко пшеницы. Для людей также можно
привести много примеров отставленного вознаграждения. Один психолог шутит,
что самым длительным режимом неподкрепляемого поведения в человеческой
жизни является учеба в школе. При режимах подкрепления с чрезвычайно
длительными интервалами иногда создаются ситуации, которые не приносят
организму полезного результата. Для цыпленка это определяется обменными
процессами: когда на клевание кнопки он начинает тратить больше энергии,
чем может восстановить при получении пшеничного зерна, поведение начинает
угасать - цена работы падает так низко, что ее просто становится незачем
делать. Конечно, так часто бывает и с людьми. Другое явление, встречающееся
при очень длительных интервалах между подкреплениями, - замедленный старт.
Начав клевать, цыпленок совершает эти действия с постоянной частотой, так
как каждый удар приближает его к подкреплению, но было отмечено, что по
мере того, как увеличиваются интервалы между подкреплениями, он стремится
"отложить" начало реакции на более длительный срок. Это и называется
"отсроченное начало поведения с долговременной программой" и очень
распространено в жизни людей. В любой долгосрочной задаче, начиная с уплаты