Обучение с подкреплением

Основаэтой теории по разным источникам известна как модификация поведения, теорияподкрепления, оперантное обусловливание, бихевиоризм, психология поведения ит.д.; это тот раздел психологии, который принес мировую известностьБ.Ф.Скиннеру, профессору Гарвардского университета.
Обучениес подкреплением — это вовсе не система наград и наказаний; современные тренерыдаже не используют этих терминов. Награды и наказания приходят обычно послетого, как действие совершено, часто спустя длительное время, как, например, вуголовном суде. Они могут повлиять, а могут и не повлиять на будущее поведение,но они, безусловно, не могут воздействовать на уже совершенное действие.Подкрепление — будь то “положительное”, то, к чему надо стремиться, например,улыбка или ласка, или “отрицательное” — то, чего надо избегать, подобно рывкуповодка или нахмуренным бровям — происходит именно во время поведения, накоторое надо воздействовать. Подкрепление изменяет поведение только тогда,когда дается в правильно выбранный момент.
Обучающиемашины и программированные учебники, разработанные на основе Скиннеровскойтеории, были первыми попытками разбить обучение на этапы и поощрятьобучающегося за правильные ответы. Эти ранние механизмы были неуклюжими, ноименно они были предвестниками компьютерного обучения, которое оказалось нетолько высокоэффективным, благодаря совершенству выбора времени подкреплениякомпьютером, но и внесло в процесс обучения веселые нотки в связи с забавнымхарактером подкрепления (фейерверки, танцующие роботы). Программы подкрепления,использующие жетоны и талоны, которые можно накопить и обменять на конфеты,сигареты или какие-то льготы, были установлены в психиатрических лечебницах инекоторых других учреждениях.
Тренировкас подкреплением не разрешает всех проблем — она не увеличит ваш счет в банке,не спасет от неудачной женитьбы, не поможет в случаях тяжелых заболеванийпсихики. Некоторые ситуации, например, плач ребенка, не имеет отношения к проблеметренировки и требуют других методов разрешения. Некоторые типы поведениячеловека и животных имеют генетические компоненты, которые трудно илиневозможно изменить тренировкой. Ряд проблем просто не стоит того, чтобытратить время на тренировку. Но во многих случаях, когда жизнь бросает человекувызов, ставит задачи и посылает неприятности, правильное использованиеподкрепления может оказаться полезным.
Что такое положительное подкрепление
Положительноеподкрепление — это событие, совпадающее с каким-либо действием и ведущее кувеличению вероятности повторного совершения этого действия.
Запомнитеэто положение. В нем заложен секрет успешного обучения.
Существуютдва вида подкрепления: положительное и отрицательное. Положительноеподкрепление — это нечто, желаемое субъектом: пища, ласка или похвала.Негативное подкрепление — это то, чего субъект хотел бы избежать: шлепок,нахмуривание бровей, неприятный звук (предупреждающий зуммер в машинах, которыйраздается, если вы забыли пристегнуть ремень безопасности, — это отрицательноеподкрепление).
Поведение,которое уже встречается, вне зависимости от того, насколько оно спорадично,всегда можно усилить с помощью положительного подкрепления.
Поведение,которое уже встречается, вне зависимости от того, насколько оно спорадично,всегда можно усилить с помощью положительного подкрепления. Если вы зоветещенка, и он подходит к вам, а вы его ласкаете, то в дальнейшем подход щенка назов становится все более и более надежным даже безо всякого другого обучения.Предположим, что вы хотите, чтобы кто-то позвонил вам — ваш отпрыск, родительили любимый. Если он или она не звонит, то тогда уж ничего не поделаешь. Самоеглавное в обучении с подкреплением то, что вы не можете подкрепить поведение,которое не встречается. С другой стороны, если вы всегда проявляете радость,когда любимые вам звонят, то это значит, что их поведение положительноподкрепляется, вероятность частоты их звонков, очевидно, увеличится. Конечно,если вы примените отрицательное подкрепление — “Почему ты не позвонил, почему ядолжна тебе звонить, ты мне никогда не звонишь” и т.д., замечания, которыевызывают раздражение, — вы создаете ситуацию, при которой звонящий избегаетнеприятностей тем, что не звонит; фактически вы обучаете их не звонить.
Подкреплениеотносительно, не абсолютно. Дождь является положительным подкреплением дляуток, отрицательным для кошек, довольно безразличен, по крайней мере во влажнуюпогоду, для коров. Пища не является положительным подкреплением, если вы сыты.Улыбки и похвалы могут быть непригодными в качестве подкрепления, если субъектхочет вывести вас из. себя. В качестве подкрепления надо выбирать нечтожелаемое субъектом.
Положительноеподкрепление приносит пользу и при взаимоотношениях между людьми. Оно лежит воснове искусства делать подарки: точно угадать, что будет иметь подкрепляющеедействие (правильный выбор является подкреплением и для делающего подарок).
Время подачи подкрепления
Запоздалоеподкрепление является наибольшим недочетом начинающего дрессировщика. Собакасадится, но к тому времени, когда хозяин говорит: “Хорошая собака”, собака ужеснова стоит. За что, думает животное, его хвалят? За то, что оно встает. Если увас возникают трудности в дрессировке, первый вопрос, который надо себе задать,не запаздывает ли ваше подкрепление.
Мывсегда слишком запаздываем подкрепляя друг друга. “Послушай, дорогая, вчеравечером ты выглядела замечательно”, — звучит совсем не так, как та же фраза,сказанная вовремя. Отсрочка подкрепления может даже оказать вредное воздействие(“А что, разве я сейчас не выгляжу замечательно?”). Мы свято верим, что силаслов перекроет ошибки во времени подкрепления.
Слишкомраннее подкрепление тоже неэффективно. Это называется взяточничеством.
Мнекажется, что иногда и детей мы подкрепляем слишком рано, находясь под ложнымвпечатлением, будто мы их подбадриваем (“Молодец, хорошо, ты уже почти всесделала правильно”). Возможно, при этом мы подкрепляем попытки. Но существуетразница между попыткой сделать что-то и выполнением этого. Причитания типа “яне могу” иногда отражают фактическое положение вещей, но они могут являться ипризнаками того, что часто подкреплялись просто попытки. Вообще, подкреплениеповедения, которое еще не совершилось, — подарками, обещаниями, комплиментамиили чем-нибудь в этом роде — ни капельки не подкрепляет это поведение. Есличто-то и подкрепляется, так это поведение, совершающееся в данное время:вероятнее всего — выпрашивание подкрепления.
Величина подкрепления
Недавайте сразу много…
Основноеправило дрессировщика заключается в том, что если вы собираетесь провести вдень одно занятие, то можете рассчитывать на хорошую работу животного примерноза четверть его дневного рациона, остальное дается после окончания работы. Еслиже вам надо провести три или четыре занятия в день, то дневную порцию пищи надоразделить примерно на восемьдесят частей и за один сеанс давать двадцать илитридцать. Восемьдесят подкреплений, видимо, являются максимумом, способнымзаинтересовать субъекта в течение дня. (Может быть, поэтому слайдовая кассетасодержит восемьдесят слайдов; по крайней мере, когда лектор проситдемонстратора показать вторую кассету слайдов, я тяжело вздыхаю.)
Большой куш
Однимиз наиболее полезных приемов пищевого или какого-либо другого подкрепления длячеловека и животных является получение куша. Это награда, которая во много,иногда в 10 раз больше обыкновенного подкрепления и являющаяся сюрпризом длясубъекта. В рекламном агентстве, где я когда-то работала, бывали официальныевечера на Рождество, а также неофициальные праздники по поводу окончаниябольшой работы или заполучения нового клиента. Но у председателя правления былаеще привычка устраивать в год один-два абсолютно неожиданных вечера. Внезапно всередине дня он проносился по всем комнатам конторы, крича, чтоб все кончалиработу. Коммутаторы выключались, появлялась процессия поставщиков провизии,музыканты, буфетчики, шампанское, копченая семга, и все это только для нас ибезо всякой особенной причины. Это было неожиданным кушем для пятидесятичеловек. Я думаю, что это очень способствовало поднятию духа коллектива.
Условное подкрепление
Нашажизнь изобилует условными подкреплениями. Нам нравится слышать, как звониттелефон или видеть набитый почтовый ящик, даже если половина звонковнеинтересна и большая часть корреспонденции — утиль, потому что множествослучаев научили нас связывать звонок или конверт с хорошим. Нам нравитсярождественская музыка, и мы ненавидим запах зубного кабинета. Мы храним,окружающие нас вещи — картины, посуду, трофеи — не потому, что они красивы илиполезны, а потому, что они напоминают нам о временах, когда мы были счастливы,или о людях, которых мы любили. Они представляют собой условные подкрепления.
Условныеподкрепления приобретают чрезвычайную силу. Так как информация “Ты прав” самапо себе представляет Ценность, она не обязательно должна сопровождатьсяпервичным подкреплением. Фактически использование пищи, ласки или чего-нибудь вэтом роде можно практически свести к нулю, а условное подкрепление будетприносить прекрасные результаты. Я видела, как морские млекопитающие долгоработали после насыщения за условные подкрепления, а лошади и собаки работаютпо часу и более с маленьким или безо всякого безусловного подкрепления. Людиконечно же тоже могут бесконечно работать за деньги, являющиеся ничем иным какусловным подкреплением, обозначением вещей, которые на них можно купить,особенно люди, которые уже заработали гораздо больше денег, чем они когда-либосмогут действительно потратить, и, следовательно, пристрастившиеся к условному подкреплению.
Действиеусловного подкрепления можно усилить, сочетая его с несколькими безусловнымиподкреплениями. В данный момент субъект может не хотеть, скажем, есть, но еслитот же подкрепляющий звук или слово были умышленно связаны еще и с водой или другимипотребностями или приятными моментами, он сохраняет свое действие и в этомслучае. Быть может, причина того, что деньги оказывают на нас такоеподкрепляющее действие, кроется в том, что они могут связываться практически счем угодно. Это чрезвычайно обобщенное условное подкрепление.
Кактолько вы выработали условное подкрепление, вы Должны пользоваться имосторожно, не разбрасывать без толку, иначе его сила уменьшится. Существуетмножество реальных событий, заслуживающих похвалы, подкрепления, которым щедрообмениваются в счастливых семьях. Однако фальшивая или незначимая наградавскоре вызывает негодование даже у маленьких детей и теряет всякую силу вкачестве подкрепления.
Режимы подкрепления
Бытуетнеправильный взгляд, что если вы начали вырабатывать поведение с помощьюположительного подкрепления, то должны продолжать его применение на протяжениивсей дельнейшей жизни субъекта, если этого не будет, то поведение исчезнет. Этоневерно: постоянное подкрепление необходимо только на стадиях обучения. Вы можетенесколько раз вознаградить годовалого ребенка за пользование горшком, но кактолько поведение заучено, предмет обучения сам о себе позаботится. Мы даем илидолжны давать начинающему множество подкреплений — обучение ребенка езде навелосипеде идет под настоящий поток: “Правильно, крепче держи руль, у тебяполучилось, хорошо!” Но вы будете выглядеть довольно глупо (а ребенок решит,что вы сошли с ума), если вы будете продолжать хвалить его после того как навыкустановился.
Длятого чтобы поддерживать уже выученное поведение на определенном уровненадежности, не только не надо подкреплять его все время, а даже, наоборот,следует прекратить регулярные подкрепления и перейти на эпизодическоеиспользование подкрепления, подаваемого в случайном и непредсказуемом порядке.
Этои есть то, что психологи называют вариабельным режимом подкрепления.Вариабельный режим гораздо более эффективен для поддержания поведения, чемпостоянный, предсказуемый. Один психолог объяснил это мне так: если у васмашина новая и всегда хорошо заводилась, а однажды, когда вы сели в нее,повернули ключ, она не завелась, то вы, может быть, и попробуете завести ее ещенесколько раз, но скоро решите, что что-нибудь не в порядке, и позвоните вгараж. Поведение, состоящее в поворачивании ключа, при отсутствии ожидаемогонемедленного подкрепления быстро угаснет. С другой стороны, если у вас вместомашины старая консервная банка, которая еще ни разу не заводилась с первойпопытки, и каждый раз требуется целая вечность для того, чтобы привести ее вдвижение, вы можете продолжать попытки ее завести в течение получаса; вашеповедение по поворачиванию ключа происходит в низковероятностном режимеподкрепления и поэтому сильнейшим образом поддерживается.
Действенностьвариативного подкрепления лежит в основе всех азартных игр. Если каждый раз,опустив в автомат 5 центов, будете получать десять, то скоро вы потеряете кэтому интерес. Да, вы будете делать деньги, но какой это нудный способ! Людямнравится играть с автоматом именно потому, что невозможно предугадать заранее,то ли ничего не получишь, то ли какую-то мелочь, то ли сразу кучу денег, и.когда именно будет это подкрепление (это может быть только один самый первыйраз). Почему одни люди втягиваются в азартную игру, а другие могут поиграть ибросить, это уже другой вопрос, но для тех, кто попался на крючок, этим крючкомстал вариативный режим положительного подкрепления.
Чемдлительнее интервалы между подкреплениями в вариативном режиме, тем сильнее онстимулирует поведение. Однако режимы с длительными интервалами работают противвас, когда вы пытаетесь угасить поведение. Если поведение не подкреплятьсовсем, то скоро появится тенденция к его угасанию; но если оно все-таки времяот времени подкрепляется — неважно сколь эпизодично — одна сигарета, однарюмка, одна поблажка ворчуну или нытику — и поведение вместо того, чтобыугашаться, может быть значительно усилено режимом с длительными интерваламимежду подкреплениями.
Всемвстречались люди, которые непонятным образом привязаны к супругам или любовникам,которые с ними плохо обращаются. Мы привыкли думать, что так бывает только сженщинами — она чувствует влечение к тому, кто груб, невнимателен, эгоистичен идаже жесток, она его все равно любит, — но это случается и с мужчинами. Каждый,знает людей, которые после развода или другого рода утраты одного негодяянаходят другого, в точности похожего на предыдущего.
Являютсяли эти люди вечными жертвами по каким-либо глубоким психологическим причинам?Возможно. Но, может быть, они — жертвы режима с длительными интервалами междуподкреплениями? Если вы вступили в связь с очаровательным, обаятельным,интересным в сексуальном плане, веселым и внимательным человеком, а затем онстановится все более несговорчивым, даже обидчивым, но все же время от временипроявляет свои хорошие качества, вы станете жить ради этих все более редкихмоментов, когда вы получаете это прекрасное подкрепление: полное очарования,обаяния, привлекательности и веселья внимание. И парадоксально с точки зренияздравого смысла, но закономерно с точки зрения теории обучения, что чем реже инепредсказуемей становятся такие моменты, тем сильнее становится ихподкрепляющий эффект, и тем дольше ваша линия поведения будет сохраняться.Кроме того, легко понять, почему человек, однажды оказавшийся в такихотношениях, часто ищет их повторения: ему может казаться, что вовзаимоотношениях с нормальным человеком, который сдержан и доброжелателенбольшую часть времени, не хватает остроты того редкого, страстно желаемого ипотому вдвойне действенного -подкрепления.
Посмотритена ситуацию с точки зрения человека, управляющего поведением: я могу держать ее(его) в безоговорочном подчинении, так, чтобы она (он) делала все, что язахочу, ради моего удобства и спокойствия, до тех пор пока я даю ей (ему) все,что она (он) хочет… изредка. Это один из способов, которыми сутенеры держат вповиновении своих девочек. Конечно, это крепкие путы, но однажды жертваосознает, что сила “очарования” по крайней мере отчасти зависит от режимаподкрепления, и спокойно уйдет от этого типа отношений и поищет что-то другое.
Исключения из правила вариативногоподкрепления
Лишьв одном случае не следует прибегать к вариативному режиму подкрепления, послетого как поведение заучено, — это когда оно направлено на решение своего родаголоволомки или теста. При одном из видов дрессировки собака должна выбирать изнескольких разнородных предметов тот, который побывал в руках у хозяина ихранит его запах. При этом необходимо каждый раз говорить собаке, что онавыбрала правильно, чтобы в следующий раз она знала, что надо делать. В тестахна различение, — скажем, идентификация более высокого из двух звуков —необходимо подкреплять каждый правильный ответ испытуемого, чтобы он былпостоянно информирован о том, какую задачу он решает (подойдет, конечно, иусловное подкрепление). Когда мы отгадываем кроссворд или составляемкартинку-загадку, мы получаем подкрепления за правильные догадки, так кактолько они являются “подходящими”. Если бы при составлении картинки-загадкиможно было вставить в одну ячейку несколько кусочков, то положительногоподкрепления за правильный выбор, который является обязательной обратной связьюв любой ситуации выбора, не получалось бы.
Долговременные программы поведения
Вдополнение к вариативному режиму подкреплений можно ввести и закрепленный, прикотором субъект знает, что он должен работать определенное время или выполнитьопределенный комплекс поведенческих реакций за каждое подкрепление. Например,подкрепляя каждый шестой прыжок, можно сделать так, что дельфин будет прыгатьшесть раз подряд, и вскоре получим стабильные серии из шести прыжков. Трудностьработы с фиксированным режимом подкрепления состоит в том, что первые ответы всериях не подкрепляются и возникает тенденция к уменьшению затрачиваемых на нихусилий. У прыгающего дельфина со временем все прыжки, кроме последнего, которыйдействительно подкрепляется, уменьшаются. Это отрицательное влияниефиксированного режима подкреплений является важным фактором во многих видахчеловеческой деятельности — например на заводском конвейере. Чтобы получитьподкрепление, необходимо работать в течение определенного времени, но так какподкрепление дается в фиксированном режиме, независимо от качества выполнения,человек совершенно естественно стремится делать то наименьшее количествоработы, которое позволяет не выпасть из игры, особенно низкаяпроизводительность может быть в начальный период работы. Зарплата по пятницамявляется фиксированным подкреплением, делающим понедельник тяжелым днем. Удельфинов поддержать поведение поможет случайное подкрепление, первого иливторого прыжка, помимо шестого. У людей могут быть эффективны различные видыпрогрессивных оплат или других подкреплений (например, награды), тесносвязанные с качеством и количеством продукции и выдаваемые неодновременно собычным подкреплением.
Применяялибо фиксированный, либо вариативный режимы подкрепления можно оттренироватьчрезвычайно длинные цепи поведенческих реакций. Можно добиться того, чтоцыпленок будет клевать кнопку сто и более раз за каждое зернышко пшеницы. Длялюдей также можно привести много примеров отставленного вознаграждения. Одинпсихолог шутит, что самым длительным режимом неподкрепляемого поведения вчеловеческой жизни является учеба в школе.
Прирежимах подкрепления с чрезвычайно длительными интервалами иногда создаютсяситуации, которые не приносят организму полезного результата. Для цыпленка этоопределяется обменными процессами: когда на клевание кнопки он начинает тратитьбольше энергии, чем может восстановить при получении пшеничного зерна,поведение начинает угасать — цена работы падает так низко, что ее простостановится незачем делать. Конечно, так часто бывает и с людьми.
Другоеявление, встречающееся при очень длительных интервалах между подкреплениями, —замедленный старт. Начав клевать, цыпленок совершает эти действия с постояннойчастотой, так как каждый удар приближает его к подкреплению, но было отмечено,что по мере того, как увеличиваются интервалы между подкреплениями, онстремится “отложить” начало реакции на более длительный срок. Это и.называется“отсроченное начало поведения с долговременной программой” и оченьраспространено в жизни людей. В любой долгосрочной задаче, начиная с уплатыподоходного налога и кончая уборкой гаража, можно придумать бесконечноеколичество причин для того, чтобы не начать дело безотлагательно. Написаниечего-либо, иногда даже просто письма, тоже поведение с долгосрочной программой.Когда оно уже начато, все идет прекрасно. Но так трудно заставить себя сесть иначать! Феномен отстроченного начала.
Одиниз способов преодоления феномена отсроченного начала заключается в том, чтобывводить какое-либо подкрепление именно за старт. Я успешно применяла этот приеми в самовоспитании. В течение нескольких лет один или два раза в неделю япосещала вечерние занятия, что требовало много времени — три часа занятий и почасу на дорогу в один конец. Каждый раз, когда приближалось 5 часов, появлялосьсильнейшее искушение не ездить. Но потом я обнаружила, что, если я разобьюпоездку — первую часть дела — на пять этапов: путь до станции метро, посадка впоезд, пересадка на другой, автобус до университета и,, наконец, восхождение полестнице до аудитории, и подкреплю каждое из этих начальных поведений после еговыполнения маленьким кусочком шоколада, который я очень люблю, но обычно не ем,я стала способна вытащить себя из дома, а через несколько недель была всостоянии проделать весь путь на занятия без шоколада и без внутренней борьбы.
Суеверия: случайные подкрепления
Вреальной жизни подкрепления возникают на каждом шагу и часто представляют собойлишь случайное стечение обстоятельств. Один биолог, изучавший ястребов,заметил, что если ястреб поймал под каким-либо кустом мышь, то в течениенедели, а иногда и больше, он будет ежедневно проверять этот куст; вероятностьего полета именно над этим местом обусловлена силой подкрепления. Попробуйтепройти мимо мусорной корзины, тщательно к ней не приглядываясь, если накануненашли в ней пять долларов.
Случайноеподкрепление полезно для, ястреба; вообще можно сказать, что поведение животныхэволюционировало так, что каждый вид обладает возможностью извлекать пользу излюбого подкрепления. Однако многие случайные подкрепления не сопровождаютсяполезным результатом, но тем не менее могут оказать сильное влияние на поведение.Когда поведение не связано с последующими событиями, но в мозгу субъектасвязывается с ними в качестве необходимого условия их осуществления, говорят осуеверном поведении. Пример этого — человек, грызущий карандаш. Если во времяэкзамена вам случится взять в рот карандаш и тут же вам придет в головуправильный ответ или хорошая мысль, то такое подкрепление может изменить вашеповедение: хорошие мысли пришли, когда грыз карандаш,. таким образом, этодействие подкрепляется. Когда я училась в колледже, у меня не было ни одногокарандаша, не покрытого отметинами от зубов, — на особенно трудных экзаменах яиногда перегрызла карандаш пополам. Я была уверена, что это помогало мнедумать. В действительности же это было всего лишь случайно обусловленноеповедение.
Тоже самое можно сказать о ношении определенной одежды или совершении некогоритуала перед тем как взяться за какое-либо -цело. Я видела одного бейсболиста,который совершал девятичленную цепочку действий каждый раз, когда готовилсяподать мяч: дотрагивался до кепки, касался мячом перчатки, сдвигал кепкувперед, тер ухо, сдвигал кепку назад, шаркал ногой и т.д. В трудные моменты онмог повторить все девять действий дважды, никогда не нарушая их порядок. Этапоследовательность действий совершалась очень быстро, комментаторы никогда неостанавливались на ней — но тем не менее она представляет собой сложноесуеверное поведение.
Поэтомугораздо лучше, как только поведение начинает формироваться, начинатьразнообразить варианты условий, которые не представляются вам важными, чтобы невозникло какого-либо случайного обусловливания, которое впоследствии будет ваммешать.
Болеевсего следите, чтобы не образовывались случайные временные связи. Как животное,так и люди очень хорошо чувствуют временные интервалы.
Интересно,что суеверное поведение не исчезает, если вы просто указываете на егонеэффективность; будучи очень сильно заученным, оно соответственно сильнооберегается. Попробуйте поговорить с врачом 6 его привычке использоватьнеэффективное или даже вредное лечение, и вы получите отпор в соответствующихвыражениях; я уверена,, что и тот бейсболист с девятиступенчатьм суевернымвыражением нервного возбуждения будет яростно противиться всякому, ктопредложит ему играть в мяч, скажем, без кепки, до которой он четыреждыдотрагивается.
Единственныйспособ избавиться от суеверного поведения — это убедиться, что оно не связано сподкреплением.
Чего можно добиться с помощьюположительного подкрепления
Новыйадминистратор одного грозного босса прикинул, что из его работы может являтьсяподкреплением для босса — например принесение бумаг на подпись, — и старалсякак можно чаще приурочить это дело ко времени, когда босс не был в ярости. Боссстал спокойнее и, подписывая бумаги, стал даже отпускать шутки.
Организованное подкрепление
Чтобыгрупповое поведение стало подкреплением, 250 человек, составлявших группу,просили аплодировать каждому выступавшему независимо от того, понравилась ли имречь иди нет. Таким образом, с самого начала застенчивые были ободрены, смелыевознаграждены, и все выступления, как проникновенные, так и бессодержательныеполучили признание группы.
Поначалуаплодисменты были не более чем обязанностью. Но скоро они стали действительнокоммуникативным средством, выражающим не степень удовольствия, как в театре, аоттенки чувств и значений. Например, в нашей группе, а я полагаю, что такоебывает в каждой подобной группе, был заядлый спорщик, который часто подвергалсомнению то, что говорил тренер. Когда это произошло в третий или четвертыйраз, тренер вступил с ним в спор. Всем было ясно, что с точки зрения логикилюбитель споров на этот раз был в общем-то прав. Но поскольку спор тянулся итянулся, всем остальным в аудитории было все равно, кто прав. Все 249 человекжелали только одного: чтобы он замолчал и сел на место.
Правилаигры, то есть формирующие правила, не позволяли нам протестовать или сказатьему, чтобы он замолчал. Но постепенно всеобщее молчание дошло до его сознания.Мы видели, что он начинает понимать, что никому нет дела до того, что он прав.Может быть, н& всегда надо доказывать свою правоту. Мало-помалу онпогрузился в молчание и сел. Группа немедленно разразилась целой бурейаплодисментов, выражавших сочувствие и понимание наряду с сердечным облегчением— очень мощное положительное подкрепление озарения, которое пришло к спорщику.
Случаиобучения такого типа, в которых важную роль играют поведенческие аспекты, а несловесное выражение, безумно трудно объяснить постороннему. Эрхард, подобноучителю дзен, часто прибегает к афоризмам; в случае описанного выше спорщикаговорится так: “Когда ты прав, с тебя требуется только одно — быть правым”. Этозначит, что не обязательно нравиться или вызывать другие приятные чувства:только быть правым. Если бы мне пришлось привести этот афоризм на вечеринке, накоторой кто-нибудь распинается, человек, окончивший курсы, посмеялся бы, да илюбой хороший современный тренер посмеялся бы, но большинство присутствующихрешило бы, что я не в своем уме или пьяна. Озарение при тренировке не требуетсловесного выражения.
Что такое процесс выработки
Процессвыработки возможен потому, что поведение живых существ вариабельно. Что быживое существо ни делало, в одних случаях оно выполняет это более энергично,чем обычно, а в других случаях — наоборот. Неважно, сколь сложно и трудно тоокончательное поведение, которое вы хотите выработать, вы всегда можете,установить ряд последовательных целей, найти какое-либо поведение, котороеосуществляется уже сейчас, и использовать его как первый шаг. Мы все хорошознакомы с выработкой поведения, являясь участниками или объектами этогопроцесса. Попросту говоря, большая часть воспитания ребенка — процесс выработкиповедения. Обучение различным физическим навыкам — от тенниса до печатанья намашинке — представляет из себя в основном выработку поведения. Мы находимся впроцессе выработки или, по крайней мере, стараемся что-либо выработать всякийраз, когда упражняемся в чем-либо, начиная от публичного выступления, кончаяигрой на фортепьяно. Мы находимся в процессе выработки и тогда, когда пытаемсяизменить свое поведение — бросить курить, быть менее застенчивым, лучшераспоряжаться деньгами.
Хорошоспланированная программа выработки может свести до минимума необходимуютренировку и сделать значимым каждый момент практических занятий тем самымчрезвычайно ускоряя совершенствование И наконец, в спорте, музыке и другихтворческих устремлениях вы можете захотеть развить не только стабильноевыполнение навыка, но и выполнение на том наивысшем уровне, который доступенвам или тому, кого вы обучаете В этом случае правильное использование законовнаправленной выработки может быть решающим.
Способы и приемы или закономерности
Естьдва аспекта выработки: первый способ и приемы, то есть последовательностьшагов, необходимых для выработки типа поведения, и второй — закономерности илиправила, предписывающие, как, когда и почему эти типы поведения должныподкрепляться
Большинствотренеров, большинство книг о тренировке и большинство тех, кто обучаеттренеров, имеет дело почти исключительно со способом или приемом. “Возьмите вруки клюшку для гольфа как показано на рисунке”, “Подведите прицел винтовки поднужное место мишени”, “Никогда не наклоняйтесь в горах”, “Взбивайте яйцаметаллическим венчиком по часовой стрелке” Это прекрасно. Эти приемы обычно складываютсягодами при участии многих людей, путем проб и ошибок, и поэтому они оптимальны.В самом деле вы будете более уверенно сидеть на лошади, если пятки у васопущены, а мяч для гольфа будет послан вами дальше, если вы хорошенькоотклонитесь в сторону замаха. Если вы заинтересованы в том, чтобы овладетькаким-либо навыком, я могу вас уверить, что вы извлечете максимум возможного отустоявшихся приемов выполнения действий, которые включаются в данный навык,почерпнув это из книг, от преподавателей, инструкторов и наблюдая или изучаядействия других людей
Другуюсторону выработки составляют закономерности, которые регулируют сам процессобучения: когда надо поднажать, когда подослабить обучение; как наиболееэффективно повышать критерии, что делать, если возникли затруднения, и,вероятно, самое главное — когда остановиться. В этих вопросах обычно полагаютсяна интуицию и опыт тренеров или инструкторов, на случай иди удачу. Между темименно успешность применения этих закономерностей определяет разницу между простохорошим и великим преподавателями, между радостным, быстрым и успешнымобучением и обучением, приводящим к срывам, медленным, скучным и неприятным.Хороший процесс выработки, а не только хорошие приемы, делают обучениеэффективным.
Десятьправил выработки
1.Повышайте критерий небольшими градациями, чтобы у субъекта, всегда былареальная возможность выполнить требуемое и получить подкрепление.
2.В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесьформировать поведение по двум критериям одновременно.
3.Прежде чем увеличивать или повышать критерий, пользуйтесь подкреплениемтекущего уровня ответа, т.е. подкрепляйте любое исполнение данного действия,имеющегося в данный момент.
4.Вводя новый критерий, временно ослабьте старые.
5.Будьте впереди того, кого вы обучаете: полностью планируйте свою программувыработки так, чтобы в случае внезапного успеха обучаемого, вы знали, чтоследует подкреплять далее.
6.Не меняйте тренеров на “середине реки”; у вас может быть несколько инструкторовна одного обучающегося, но придерживайтесь одной программы выработки на каждыйиз типов поведения.
7.Если одна процедура выработки не приносит успеха, найдите другую, существуетстолько же способов добиться нужного поведения, сколько инструкторов, способныхих придумать.
8.Не кончайте тренировку, не дав положительного подкрепления, это соответствуетнаказанию.
9.Если навык ухудшается, “возвратитесь к детскому саду”, быстро повторите весьпроцесс выработки с серией легких подкреплений.
10.Оканчивайте, по возможности, каждую тренировку на высокой ноте и в любом случаеостанавливайтесь, оставаясь впереди обучаемого.
Особые ученики
Можноформировать поведение почти любого существа. Психологи обучали крошечных детейдвижением руки гасить и зажигать свет в комнате. Можно обучать птиц. Можноформировать поведение рыб. Однажды я обучала большого краба-отшельника звонитьв колокольчик, собирающий к обеду, дергая клешней за шнурок. (Фокус заключалсяв том, чтобы дать крабу пищу в тот момент, когда клешня, двигающаяся бесцельно,коснется шнурка. Я пользовалась длинным анатомическим пинцетом, чтобы подноситькусочки креветки прямо к его челюстям.) Профессор Гарвардского университетаРихард Хернетейн рассказывал, что однажды он обучал морского гребешка хлопать раковинойза пищевое вознаграждение. Дрессировщики морских млекопитающих любят хвастатьсячто они могут обучить любое животное выполнить любое действие, для которого унего имеются физические и умственные возможности, и насколько мне известно, этотак и есть.
Акак насчет того, чтобы формировать свое поведение? Существуют всевозможныепрограммы изменения собственного поведения: бросаем курить, следим за своимвесом и т.д. Большинство этих программ опирается в основном на методформирования поведения, обычно называемый модификациями поведения, они могутбыть или не быть успешными. Трудность, как мне кажется, состоит в том, что выдолжны сами себе давать подкрепление. Но когда вы подкрепляете сами себя,исчезает элемент неожиданности — ученик всегда знает, чего стоит тренер. Приэтом очень просто сказать: “Черт с ней, с еще одной звездочкой в моей карточке,я лучше выкурю сигарету”.
Яобнаружила, что единственным наиболее успешным приемом самоподкрепленияявляется постоянная регистрация результатов, которая может быть использована вовсех четырех программах. Нужно было вести регистрацию так, чтобы улучшение быловидно сразу. Я использовала графики. С их помощью моя виновность за упущениямогла уменьшаться при взгляде на график, на котором было видно, что несмотря нина что я сейчас нахожусь на более высоком уровне, чем шесть месяцев тому назад.Еще, может быть, далеко до совершенства, но “кривая”, или наклонная линия,графика шла в нужном направлении, и это является зримым доказательствомулучшения; и хотя это само по себе является слабым, медленно действующимподкреплением, оно создает достаточную мотивацию, чтобы продолжать мои занятия.
Выработка поведения без помощи слов
Вобычных ситуациях обучения, таких, как уроки тенниса, субъект знает, что ее илиего обучают, и обычно охотно включается в этот процесс. Поэтому вам необязательно дожидаться нужной реакции и подкреплять ее. Вы можете без особоговреда словами направлять поведение: “Делай так. Хорошо. Теперь повтори дважды.Хорошо”. Однако в нестандартных ситуациях лучше обойтись без инструкций и(словесных) обсуждений. Вы должны наметить план выработки, начальный ипромежуточные ходы, при помощи которых вы достигнете желаемой цели.
Виспользовании процесса формирования существуют две ловушки. Первая состоит в том,что легче заметить ошибки, чем улучшение, и поэтому для таких вербальныхсуществ, каковыми являемся мы, гораздо проще негодовать, когда критерий недостигнут, чем давать подкрепление, когда он достигнут. И это может свести нанет прогресс. Вторая опасность состоит в том, что если вы предполагаетесформировать чье-либо поведение, то очень заманчиво поболтать об этом. А такиеразговоры могут все разрушить. Если вы говорите: “Ты получишь награду” — за то,что положил белье в корзину, не куришь марихуану, тратишь меньше денег или зачто-либо другое, — вы лишь совершаете подкуп или даете обещание, а не истинноеподкрепление; при обучении, идущем по вашему плану, человек может иногда емупротивиться и нарочно поступать не так как нужно. Чтобы добиться результатов,надо осуществлять формирование поведения, а не говорить о нем.
Аесли вам удалось сформировать чье-либо поведение, то в дальнейшем также лучшеэтим не хвастаться. Некоторые этого совершенно не понимают и постоянноподчеркивают свою роль — в лучшем случае это проявляется в опеке, а это лучшийспособ нажить себе в лице субъекта врага на всю жизнь. Кроме того, если выпомогли кому-то улучшить какой-либо навык или избавиться от плохой привычки,меняя в качестве подкрепления собственное поведение, на кого падает основнаятяжесть работы? На субъекта. Умные родители никогда не раззванивают повсюду отом благе, которое они совершили, воспитывая своих детей. Во-первых, мы всезнаем, что эта работа никогда не кончается, а во-вторых, дети заслуживаютпохвалы — хотя бы за то, что выдерживают все педагогические ошибки, которые мысовершаем.
Таккак формирование поведения людей может или даже должно происходить внесловесной форме, то некоторые воспринимают это как своего рода злонамеренныеманипуляции. Мне кажется, что это не от недопонимания. Причина того, чтоформирование должно быть невербальным, состоит в том, что мы имеем дело споведением, а не с идеями, И не только с чьим-нибудь поведением, но и со своимсобственным.
Однакопоскольку вы можете формировать поведение людей без того, чтобы то, что выделаете, доходило до их сознания, и поскольку, не имея формального согласия нато, чтобы быть обученным, как это бывает при уроках игры в теннис, вы едва лине обязаны формировать людское поведение на невербальном уровне, то невозникает ли возможность заставлять людей совершать ужасные вещи?
Конечно,да, особенно если вы в качестве отрицательного подкрепления используете такиерезко неприятные стимулы, которые вызывают истинный страх и даже ужас. Влабораторных условиях психологи обнаружили феномен названный “выученнаябеспомощность”. Если животное обучено избегать неприятного стимула, такого какудар электрического тока, при помощи нажима на рычаг или перемещения в другуючасть клетки, где нет абсолютно никаких способов избежать удара тока, онопостепенно прекращает все попытки отделаться от неприятности. Оно становитсяполностью податливым и пассивным, и может даже лежать и получать наказания дажетогда, когда снова появляется путь к свободе. Аналогом этого феномена у людейвозможно является “промывание мозгов” Если человек подвергается строгойизоляции и неизбывному страху или боли, и если неприятные стимулы в последующемиспользуются в качестве отрицательного подкрепления, то в тех случаях, когдачеловек может избегнуть или прекратить их действие, изменив поведение, — ну,тогда… животные обычно погибают, а люди оказываются более стойкими, инекоторые начинают делать все что угодно, чтоб избежать отрицательногоподкрепления.
Стимулы
Все,что вызывает какую-либо поведенческую реакцию, называется стимулом. Некоторыестимулы способны вызывать реакции без какого-либо обучения или тренировки: мывздрагиваем от громкого звука, моргаем от яркого света, нас тянет в кухню,когда до нас доносится аппетитный запах; животные поступают точно так же. Такиезвуки, свет и запахи называются безусловными, или первичными, стимулами.
Другиестимулы заучиваются благодаря ассоциации. Сами по себе они могут ничего незначить, но становятся выделяемыми сигналами для поведения: сигналы светофоразаставляют нас стоять или идти, мы вскакиваем, чтобы снять трубку зазвонившеготелефона, на шумной улице оборачиваемся, услышав свое имя и т.д., и т.д.Ежедневно мы отвечаем на множество выученных сигналов. Они называютсяусловными, или вторичными, стимулами.
Приформальном тренинге львиная доля усилий приходится на образование условныхсигналов. Сержант, занимающийся строевой подготовкой со взводом новобранцев, ихозяин собаки на дрессировочной площадке в равной мере стремятся сделать восновном так, чтобы обучающиеся повиновались командам, которые вдействительности являются условными сигналами. Фокус не в том, что собака можетсидеть, а человек останавливаться, фокус в том, что это делается четко и покоманде. Вот что мы называем повиновением — не просто выполнение действия, ногарантия того, что оно будет выполнено по сигналу. Психологи называют это“поставить поведение под контроль стимулов”. Это вырабатывается с трудом,выработка основывается на правилах, а правила нуждаются в проверке.
Есливы руководите людьми и вам иногда приходится два или три раза повторять приказили инструкцию, прежде чем они будут выполнены, то значит у вас проблемы состимульным контролем. Разве не случается, что вы говорите: “Я тебе уже однаждысказала, я говорила тебе тысячу раз, не…” (Не хлопай дверью, или не кладимокрый купальник на кровать, или что-либо в этом роде.) Когда сказать один илитысячу раз недостаточно, поведение не управляется стимулами.
Иногдаможет казаться, что мы обладаем стимульным контролем, когда в действительностиэтого нет. Мы предполагаем, что сигналу или команде должны подчиниться, а этогоне происходит. Самой распространенной реакцией на это является усилениесигнала. Так, официант не понимает вашего французского? Говорите громче. Чащевсего это не помогает. Субъект должен распознавать сигнал, иначе безразлично,кричите ли вы что есть мочи или даже ревете с помощью усилительной аппаратурырок-ансамбля, на вас будут смотреть невидящим взором.
Другойреакцией человека на игнорирование условного сигнала является бешенство,которое действует только в том случае, если субъект проявляет преднамеренноенепослушание, не давая твердо заученного ответа на хорошо выученный сигнал. Приэтом иногда, показав характер, можно получить хорошее поведение.
Бывает,что субъект отвечает правильно, но с очень большой задержкой или черезпень-колоду. Часто неуклюжие ответы на команды определяются тем, что субъект необучен отвечать быстро. Без положительного подкрепления не только заправильный, но и за проворный ответ на сигнал у субъекта нет шансов усвоить,что успех приносит быстрое повиновение стимулам. При этом поведение вдействительности не контролируется стимулами.
Реальнаяжизнь” изобилует плохой организацией управления с помощью стимулов. Как толькоодин человек пытается проявить власть, другой оказывается в опасности проявить“непослушание” В действительности проблема состоит в непонимании команд илисигналов, которым он поэтому не может повиноваться. Это примеры плохойкоммуникации или нечеткого управления с. Помощью стимулов.
Правила управления с помощью стимулов
Длятого, чтобы управлять с помощью сигналов, надо сформировать нужное поведение, азатем, когда оно осуществляется, делать так, чтобы оно происходило во время илисразу после какого-либо определенного сигнала. Этот стимул затем становитсяключом, или сигналом, поведения.
Полныйконтроль с помощью стимулов определяется четырьмя условиями, к каждому изкоторых следует относиться как к самостоятельному разделу тренировочной задачи,самостоятельному пункту программы выработки:
1.Поведение всегда осуществляется сразу после подачи условного стимула (собакаладится, когда ей приказывают).
2.Поведение никогда не возникает в отсутствие стимула (во время занятий илиработы собака никогда не садится спонтанно).
3.Поведение никогда не наблюдается в ответ на другие стимулы (если вы говорите:“Лежать!”, собака не должна садиться).
4.Никакое другое поведение не возникает в ответ на данный стимул (когда выговорите; “Сидеть!” собака не должна ложиться или скакать и лизать ваше лицо)
Толькокогда все четыре условия соблюдаются, собака действительно полностью иокончательно понимает команду “Сидеть!”. Теперь вы действительно управляете еюс помощью стимула.
Жизненноважно сигнальное управление в военном деле. Занятия по строевой подготовке сновобранцами — утомительное и трудоемкое дело, и им самим оно может казатьсятрудным и бессмысленным, но оно выполняет очень важную функцию. Строеваяподготовка не только вырабатывает точные реакции на строевые команды, что даетвозможность командирам с легкостью приводить в движение большие группы людей,но она также вырабатывает навык ответа на условный сигнал вообще: повиновениекоманде, которое в конце концов является не столько умственным актом, скольковыученным умением, являющимся решающим, а часто и жизненно важным для солдата.С тех пор как были придуманы армии, строевая подготовка являлась способомвыработки этого навыка.
Чтоможет быть сигналом?
Условнымстимулом — выученным сигналом может быть все, абсолютно все, что может бытьвоспринято. Флаги, свет, слова, прикосновения, вибрация, хлопки пробокшампанского — короче говоря, безразлично, какой сигнал вы использует те Кольскоро субъект может воспринимать его, сигнал может быть использован для вызовавыученного поведения.
Вто время, как на каждый отдельный сигнал вам надо получать только какое-либоодно поведение, вполне достижимо получение одного и того же поведения нанесколько условных сигналов. Например, в переполненном людьми помещении ораторможет потребовать тишины, воскликнув: “Тихо!”, или встать и, подняв руку,жестом призвать к молчанию. А если присутствующие шумят и при этом находятся внекотором подпитии и, следовательно, отличаются рассеянным вниманием, поможетпозвякивание ложкой по стакану. Мы все обучены осуществлять данное поведение вответ на любой из, по крайней мере, трех этих стимулов.
Введениевторого условного стимула для выученного поведения называется переносомстимулов. Чтобы добиться переноса, вы предъявляете старый стимул — допустим,команду, поданную голосом, — как всегда, и новую команду — скажем, сигнал,поданный рукой, — и подкрепляете ответ; затем постепенно делаете старый стимулвсе менее и менее заметным и одновременно привлекаете внимание к новому, делаяего очень выраженным, пока на новый стимул не будете получать столь же хорошийответ, даже тогда, когда старый стимул не предъявляется вовсе. Обычно этотпроцесс идет несколько быстрее, чем выработка ответа на первоначальный стимул;когда уже выработано “Выполняй это действие” и “Выполняй это действие покоманде”, то легче выработать “Выполняй это действие также по другой команде”.
Время отставания
Чтобыдобиться точности, ответа на условный стимул, полезно применять приемограничения времени отставания. Допустим, ваш подопечный обучился совершатькакое-либо действие в ответ на условный сигнал, но обычно имеется некоторыйинтервал времени между предъявлением стимула и ответом субъекта. Вы пригласилилюдей на ужин, и они немого запоздали, или ваш слон после сигнала к остановкепостепенно замедляет ход и, наконец, останавливается.
Есливы хотите, то, используя ограничение времени отставания, можете в процессетренировки так сократить этот интервал, что поведение будет возникать такбыстро, как это только физически возможно.
Выначинаете с того, что устанавливаете нормативный интервал, с которым обычнонаблюдается поведение; затем вы подкрепляете только то поведение, котороесовершается в течение этого интервала. Поскольку живые существа характеризуютсявариабельностью, некоторые ответы будут выходить за пределы интервала и за нихне будет даваться подкрепление. Например, если вы подаете ужин точно вназначенное в приглашении время, а не ждете опоздавших, то они рискуют получитьвсе холодное или застать меньший выбор,
Когдавы подобным образом установите временной интервал и будете давать подкреплениетолько на его протяжении, то скоро вы обнаружите, что постепенно все ответыначинают наблюдаться в его пределах и ни один не выходит за него. Теперь выснова можете подтянуть гайки. Достаточно ли пятнадцати минут, чтобы семьясобралась? Начните подавать на стол через двенадцать минут после того, как всехпозвали, или через десять. Как быстро вы будете закручивать гайки, должно бытьточно определено; как и при каждом процессе выработки желательно находиться втех пределах, в которых наиболее часто наблюдается данное поведение.
Животныеи люди имеют очень развитое чувство времени и чрезвычайно четко реагируют навыработку времени отставания, но дрессировщик не должен полагаться на авось.Пользуясь часами или даже секундомером, если хотите, чтобы выработка отставанияработала на вас. Для поведения ближайших окружающих, включая себя, сократитевремя ответа, скажем, с пяти тактов до двух. И конечно, если вы работаете слюдьми, не обсуждайте ваши действия; вы не получите ничего, кроме возражений.Просто делайте и смотрите, что получается.
Вреальной жизни ограничение времени отставания является попросту тем временем,которое вы считаете нужным ждать, пока просьба или инструкция будут выполнены.Родителей, начальников и учителей, которые проявляют последовательность ввыработке определенного временного интервала реакции, обычно считают хорошими.
Стимулы в качестве подкрепления:поведенческие цепи
Кактолько стимул становится условным сигналом, происходит интересная вещь: онпревращается в подкрепление. Вспомните звонок на перемену в школе. Звонок наперемену является сигналом, условным сигналом, означающим: “Вы свободны, идитеи играйте”. А кроме того, он воспринимается как подкрепление — дети рады, когдаслышат его, и если бы они смогли сделать что-либо, чтоб заставить егопрозвенеть скорее, они бы это сделали. Теперь представьте себе звонок наперемену, который не звонит, если в классе нет тишины. Ко времени перемены увас будет очень тихий класс.
Поведенческиецепи — очень распространенное явление. В реальной жизни мы часто производимсерии связанных действий, состоящих из многих отдельных поведенческих актов. Ненадо далеко ходить за примерами — работа плотника или уборка квартиры —неплохая иллюстрация. Мы ожидаем, что и наши питомцы будут вести себя так же:“Подойди”, “Сядь”, “Ляг”, “Следуй за мной” и так далее без перерыва я безвидимого подкрепления. Эти длительные ряды действий являются цепным поведением.В противоположность другим длительным действиям эти могут выполняться часами,сотни раз без напряжения, без сбоев, без задержек, поскольку каждый акт вдействительности подкрепляется возможностью выполнить следующее действиецепочки, и так до заключительного подкрепления выполнением всего дела, всейцепи.
Однакоповеденческие цепи рвутся и поведение рассыпается на элементы, если в цепочкувклинивается невыученный поведенческий акт, или действие, не находящееся подконтролем стимулов. Вы не можете подкрепить субъекта сигналом, если он этотсигнал не распознает или не может выполнить то, что этот сигнал требует. Отсюдаследует, что цепное поведение следует всегда вырабатывать с конца. Начинайте споследнего действия в цепи, удостоверьтесь, что оно усвоено, и сигнал к еговыполнению хорошо узнается, лишь потом переходите к разучиванию предпоследнегодействия и т.д. Например, если при заучивании стихотворения, мелодии, текстаречи, роли в пьесе вы разделите задания, скажем, на пять частей и начнетезапоминать их в обратном порядке, с конца — вы всегда будете двигаться от того,что вы знаете слабее, к тому, что знаете более прочно, от материала, в которомвы не совсем уверены, к материалу, хорошо уже усвоенному, имеющемуподкрепляющее действие. Запоминание материала в том порядке как он написан идолжен воспроизводиться приводит к необходимости постоянно продираться отзнакомой тропы в сторону более трудного и неизвестного, что являетсянеподкреплением. Подход к запоминанию материала как к цепному поведению нетолько убыстряет процесс запоминания, но и делает его более приятным.
Поведенческиецепи — это особое понятие. Я часто сама спотыкалась на них, чувствуя, что надовернуться к концу ряда, так как я не могу заставить животное, ребенка или себявыполнить кажущуюся простой последовательность действий, пока я не понимала, чтопыталась выработать цепное поведение не с того конца. Когда делают пирог, тоглазурью его украшают в последнюю очередь, но если вы хотите обучить ребенкаполучать удовольствие от приготовления пирога, начните с того, что попросите“помочь” украсить его глазурью.
Генерализованное управление с помощьюстимулов
Сбольшинством животных приходится сначала немного повозиться, чтобы установитьуправление их поведением с помощью стимулов, но часто к тому времени, какберете под контроль сигналов третий или четвертый тип поведения, оказывается,что животное как бы обобщает, у него появляется нечто вроде понимания идеи.Выучив три-четыре условных поведенческих акта, большинство субъектов,по-видимому, начинают распознавать определенные события в качестве сигналов, каждыйиз которых означает свой тип поведения, и что получение подкрепления зависит отправильного распознавания и ответа на сигналы. С этого момента введениеусловных сигналов становится простым. У субъекта уже имеется общая картина, ивсе что ему надлежит сделать — это научиться классифицировать новые сигналы иассоциировать их с правильным поведением. Если вы, как дрессировщик, поможетепитомцу, сделав это понятным, последующее обучение может идти само собой многобыстрее, чем трудные начальные шаги.
Улюдей обобщение происходит еще быстрее. Если вы вознаградили за ответ только наодну выученную команду, люди очень скоро начинают давать ответы и на другиекоманды, чтобы заслужить подкрепление.
Итак,вы знаете о том, как сформировать новое поведение, а как вам избавиться отнежелательного поведения, которое уже имеется?
Существуетвосемь способов избавиться от нежелательного вида поведения. Всего восемь. И неважно, является ли это поведение укоренившимся, как в случае неряшливого соседапо комнате, или внезапным, как в случае детей, бесчинствующих в машине. Все,что вы можете предпринять по этим поводам, будет вариацией на тему одного извосьми методов. (Я не касаюсь здесь сложных сочетаний поведенческих проблем,которые возникают у человека с психическими нарушениями или у непредсказуемосвирепой собаки; я рассматриваю только отдельные проявления нежелательногоповедения.)
Вотэти восемь методов.
Метод1. “Убить зверя”. Это безусловно подействует. Вам никогда больше не придетсяснова иметь дело с данным поведением у данного субъекта.
Метод2. Наказание. (Предпочитаемо всеми, хотя оно почти никогда не приноситдействительной пользы.)
Метод3. Отрицательное подкрепление.
Метод4. Угашение: поведению предоставляется возможность исчезнуть самому по себе.
Метод5. Выработка несовместимого поведения. (Этот метод имеет особую значимость дляспортсменов и владельцев домашних животных.)
Метод6. Добиться, чтобы данное поведение совершалось по сигналу. (В последующем выперестанете давать этот сигнал. Это наиболее изощренный метод, применяемыйтренерами дельфинов для того, чтобы избавиться от нежелательного поведения.)
Метод7. “Формирование отсутствия”: подкрепляется все что угодно, кроменежелательного поведения. (Вежливый способ превратить неприятных родственниковв приятных.)
Метод8. Смена мотивации. (Это основной и самый лучший способ.)
Подкрепление в повседневной жизни
Подкреплениев бизнесе
Внашей стране труд и управление традиционно стояли на противоположных позициях.Мысль о том, что все принимают участие в общей игре, никогда не была особеннопопулярна в американском бизнесе. Практика бизнеса исходила из того, что каждаяиз сторон старается получить от другой как можно больше, а дать как можноменьше. Конечно, на самом деле это молчаливо подразумевалось исходнымипозициями обучения, но некоторые администрации склонялись к другим подходам. Вшестидесятые годы получили популярность “бережное обучение” и другиесоциально-психологические подходы, ставившие целью просветить администрацию повопросам нужд и чувств сотрудников и служащих. Но можно быть сколь угоднохорошо осведомленным, но не знать при этом, как же решать каждую конкретнуюпроблему. Положение в бизнесе таково, что одни занимают более высокое, другиеболее низкое положение, одни получают распоряжение, другие их отдают. В СШАситуация в большинстве случаев не напоминает семейную и не должна был, таковой.Поэтому семейственный тип разрешения межличностных конфликтов на работе непроходит.
Средипоследних публикаций о бизнесе меня в последнее время заинтересовали несколькосообщений, где описаны наиболее эффективные подходы, где используетсяподкрепление — от наиболее простых до совершенно блестящих. Например, один изконсультантов по менеджменту советует в случае, если необходимо временноосвободить от работы часть персонала, определить 10% худших и 20% лучшихработников. Вы освобождаете самых слабых работников, но вы так же должныобязательно обеспечить 20% лучших, при этом они должны знать, что их оставляютпотому, что они прекрасно работают. Очень здравая мысль. Помимо того, что выубережете своих лучших работников от нескольких бессонных ночей и оченьсущественно положительно их подкрепите при вызывающих тревогу обстоятельствах,вы к тому же побуждаете средних работников либо стремиться к подкреплению, которое,как они видят, получено лучшими, либо хотя бы не попасть в низшую группу —кандидатов на вылет.                               
Подкреплениемдля менеджеров среднего уровня и среднего возраста может быть более интереснаяработа на их теперешнем месте, вместо перспективы повышения — с более высокойответственностью они могут и не справиться (а могут и не желать занять болеевысокий пост, особенно если это связано с переездом).
Однакомпания, занимающаяся компьютерной техникой, выплачивает денежные премиинекурящим и тем, кто бросил курить, и в этом есть большой смысл: продукция,которую они выпускают, может быть испорчена частицами дыма. Другие способыподкрепления, находящие все большее применение, включают свободный выбор часовработы, так называемую “гибкую систему” (к ней особенно стремятся работающиематери), работу в самоуправляемых коллективах и.вознаграждение за проделаннуюработу, а не за потраченное на нее время. Все эти приемы управления делают упорна то, что работник действительно считает подкрепляющим — то, что нужно людям,а не только дает прибыль.
Программы,нацеленные на снижение себестоимости и повышение темпа работы — программы,которые по существу пытаются заставить работников работать лучше — куда менееэффективны, чем проекты, которые помогают работникам выполнять дело лучше иполучать за вознаграждение; Корпорации, пользующиеся положительнымподкреплением, часто видят результаты, когда оказываются в критическойситуации. Великолепный пример — авиакомпания Дельта, которая всегда славиласьзаботой о своих служащих. Во время спада 1981 года несмотря на значительныеубытки. Дельта отказалась сократить кого-либо из своих 37000 служащих.Фактически это привело к тому, что в целом по компании зарплата повысилась на8%. В прочно установившемся климате положительного подкрепления работникипривыкли мыслить в том же духе; они поменялись местами с администрацией иподкрепили компанию, создав фонд и купив новый самолет, Боинг-767 стоимостью 30млн. долларов.
Подкреплениев обществе
Иногдасоздается впечатление, будто бы бихевиористы утверждают, что все поведениечеловека является результатом обучения и подкрепления, а все человеческиеболезни, от войн до бородавок, можно исцелить правильным использованиемподкрепления. Это, конечно, не так. Поведение является богатой смесью внешних ивнутренних ответов, как выученных, так и невыученных. Как это известно каждойматери, индивидуальные особенности являются врожденными. Далее, громадная частьтого, что мы делаем и чувствуем, является результатом нашей эволюции в качествеобщественных животных. В это входит наше стремление к взаимодействию и взаимнойподдержке (“реципрокный альтруизм”), а также наклонность к агрессивнымреакциям, если кто-либо посягает на наши идеалы или собственность (“защитаореола”). А кроме того, то что делается или говорится в данный момент, может взначительной степени зависеть от физического состояния, оцениваемого либосогласно прошлому опыту, либо прогнозу на будущее: человек, который оченьголоден или мерзнет, может вести себя совсем не так, как тогда, когда оннаходится в комфортных условиях, вне зависимости от других обстоятельств.
Посколькуобщество не ограничивается только обменом подкреплений, социальныеэксперименты, включающие подкрепление в регулировании групповых отношений, даютнеоднозначные результаты. Например, использование подкрепления вструктурированных группах — скажем в тюрьме, больнице или колонии, можетпровалиться по вине любого, использующего это подкрепление. Один из моихдрузей-психологов рассказывал мне о системе поощрительных талонов длямалолетних правонарушителей, которая прекрасно работала при экспериментальнойпроверке проекта, но полностью провалилась и даже вызвала протест и возмущение,когда была перенесена в другое учреждение. Выяснилось, что наставники, как ипредусматривалось инструкцией, раздавали подкрепление за посещение уроков идругое желательное поведение, но, вручая талоны, они не улыбались. И этамаленькая ошибка была расценена (и я думаю, совершенно справедливо) юнымиправонарушителями как оскорбление, и все усилия пошли насмарку.
Общество,и особенно систему образования, часто критикуют за то, что они подавляюттворческие способности, вместо того, чтобы развивать их. Я думаю, что, хотятакая критика и обоснована, но нужно понимать, что общество заинтересовано всохранении Status quo. Инициативные люди непредсказуемы, и, возможно, общество можетвытерпеть лишь определенный процент таких людей. Если бы все стали вести себя,как наши “творческие” дельфины, мы бы никогда ничего не достигли. Поэтомудовольно часто индивидуальная нестандартность подавляется в угоду групповымстандартам норм поведения. Может быть, лишь смелость, необходимая для защитытаких устремлений, приводит некоторых из новаторов к успеху.
Ядумаю, что важное значение теории подкрепления для общества состоит не визменении отдельных видов поведения или реформировании учебных заведений, а втом влиянии, которое само по себе оказывает положительное подкрепление наотдельных индивидов. Подкрепление — это информация, информация о том, что то,что вы делаете, приводит к результату. Если у нас есть информация о том, какзаставить окружающую среду подкреплять нас, значит, мы эту среду контролируем,и мы больше ей неподвластны. В самом деле от успешности этого до некоторойстепени зависит наше приспособление к жизни, достигнутое в ходе эволюции.
Такимобразом, индивидам нравится обучаться с помощью подкрепления не по темпричинам, которые лежат на поверхности — получение пищи или другоговознаграждения, а потому, что они в этом процессе действительно обретаютнекоторый контроль над происходящим. А причина того, что людям нравитсяизменять поведение других с помощью подкрепления, состоит в том, что ответнаяреакция доставляет удовольствие. Глядя на то, как радуются животные, как сияютглаза малышей, люди расцветают и начинают сиять — от радости, вызваннойуспешностью собственных усилий; этот положительный результат сам по себеявляется мощным подкреплением. Некоторых людей возможность получения хорошихрезультатов захватывает полностью.
Науровне человеческих взаимоотношений правильное использование положительногоподкрепления может дать существенный эффект. Оно может привести к развитию иусилению семейных взаимоотношений, укрепить дружбу, ободрить детей и обучить ихв свою очередь превратиться в изобретательных и умелых источников подкрепления.Оно способствует искусству половых отношений, так как секс помимо всего прочегоявляется взаимным обменом положительных подкреплений. Если двое достиглиуспехов во взаимном подкреплении, они скорее всего будут счастливой парой.
Хорошоиспользовать подкрепление — это не значит без разбору расточать награды илиникогда не говорить “нет”. Такое неправильное представление о положительномподкреплении возникает довольно часто. Однажды, наблюдая за матерью, везущей поулице малыша в прогулочной коляске, я заметила, что всякий раз, как он начиналпроявлять признаки беспокойства, мать останавливалась, вынимала мешочек совсякими вкусностями: виноградом, орехами — и совала малышу что-нибудь в рот,хотя он, видимо, не был голоден и иногда отпихивал ее руку. Стараясь поступатьправильно, она добросовестно подкрепляла беспокойное поведение малыша. Она дажене проверяла, не является ли причиной беспокойства малыша непорядок в одеждеили какой-либо другой дискомфорт.
Никтоиз нас не представляет собой совершенства, и я не считаю, что мы должны всевремя думать о подкреплениях. Я предполагаю, что во взаимоотношениях с другимилюдьми сдвиг к положительным реакциям от резкости, яростных споров и упреков,которые являются стилем многих домов и организаций, повлияет не только наиндивидов, вовлеченных в эти контакты, но и распространится вовне, изменяясоотношение сил в обществе.
Процессэтого принятия может охватить жизнь одного, двух или трех поколений. Яподозреваю, что положительное подкрепление, будучи облечено в теорию, котораядает возможность анализировать причины неправильного хода событий, является тойсамой идеей, которая слишком заразительна для умов, чтобы ее развитиеприостановилось. Я полагаю, что большинство бихевиористов со мной согласятся —хотя они, конечно, считают, что это произойдет совсем скоро.
Воображаемоеобщество Скиннера, построенное исключительно на различных типах подкрепления,не должно, с моей точки зрения, точки зрения биолога, функционировать.Идеалистические общества, существующие в воображении или в реальности, иногдане принимают в расчет или пытаются приуменьшить такие биологические явления,как конфликты. Мы являемся в конце концов общественными животными, и в качестветаковых должны устанавливать иерархию. Соперничество внутри группы за болеевысокий статус — по всем направлениям, а не только по санкционированным ипредписанным — является абсолютно неизбежным и. фактически выполняет важнуюсоциальную функцию: будь то утопическое общество или табун лошадей,существование развитой иерархии направлено на сглаживание конфликтов. Ты знаешьсвое место, и незачем продолжать рычать, доказывая его. Я предчувствую, чтоиндивидуальный и групповой статус, как и многие другие человеческие потребностии тенденции, слишком сложны, чтобы их опровергать или отвергать с помощьюспланированной системы подкрепления, по крайней мере в обозримом будущем.
Некоторыевидят в теории подкрепления способ контроля, манипулирования или ограничениесвободы личности или общества. Но изменения общества должны начинаться сизменения отдельных личностей — со сдвигов, которые принесут личную пользу —точно так же, как видовые изменения должны начинаться на уровне одного гена.Социальные изменения не могут быть навязаны сверху — по крайней мере навязанынадолго (произведение “1984 год” Оруэлла написано неверно с биологической точкизрения). Живые существа имеют право не только на пищу и убежище, но и наподкрепляющее окружение. Использование и понимание подкрепления является теминдивидуальным опытом, который может пойти всем на пользу. Совершенно неограничивая нас, оно открывает дорогу для приобретения нового опыта, и будучиосознанным, усиливает не механические аспекты жизни, а богатство и удивительноеразнообразие всего поведения.
Список литературы
Дляподготовки данной работы были использованы материалы с сайта enpsy.ru/