Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Остерегайтесь самоподкрепляющегося поведения.



Имейте в виду, что вы можете не контролировать все виды поощрения, которые получает ваша собака. Некоторые реакции могут быть самоподкрепляющимися. Копание в отбросах, перелаивание с соседской собакой через забор, прыгание на гостей, копание ям в саду, охота на пылесос и жевание ваших тапочек – все это примеры самоподкрепляющегося поведения. Вы не можете просто игнорировать все нежелательные реакции в надежде, что они исчезнут сами собой, поскольку любая реакция, получающая поощрение, учащается. Игнорирование самоподкрепляющегося поведения – неэффективная и даже разрушительная тактика. Выискивайте такое поведение и делайте так, чтобы вы контролировали все поощрение, чтобы собака выучила, что вы намного интереснее всего окружающего.

Добиваемся точности.

Конечно, поощрение нужного поведения и игнорирование нежелательного – основа дрессировки собак с помощь положительного подкрепления. Но настоящая прелесть отбора поведения в том, что есть возможность ультра-усовершенствования в обучении: 1) очень точному поведению (например, определенной позиции на контактной зоне в аджилити); и/или 2) цепочке поведения (например, набор действий, которые собака должна произвести для правильного и безопасного преодоления горки).

При отборе поведения дрессировщик ждет, пока собака предложит какие-то действия. Поощряя каждый подходящий вариант, он подводит собаку к намеченному поведению. Дрессировщик может управлять действиями собаки, пользуясь точным и своевременным подкреплением и приспосабливая требования к каждому конкретному действию к конечной цели. То, что дрессировщик начинает поощрять в начале пути, очень сильно отличается от конечного продукта.

Например, чтобы научить База правильно проходить бум (сложная цепь действий), сначала я научила его касаться носом моей ладони. Я показала ему руку примерно в 25 см от него. Баз мог и проигнорировать ее, но как только он на нее посмотрел, я кликнула и дала ему лакомство. В следующий раз я показала ему руку, но уже ждала, чтобы он не только посмотрел, но и понюхал ее.

Если вы создаете собаке простые условия для выбора, она в большинстве случаев будет выбирать правильно, будет часто получать поощрение, и, следовательно, нужное поведение будет появляться все чаще и чаще. Поощрение повышает вероятность повторения поведения. У База был выбор – заметить мою ладонь или проигнорировать ее. При этом я таким образом использовала его окружающую среду (исключив возможные отвлекающие факторы), что я была уверена, что он выберет ладонь. Было бы нечестно начать эту игру среди стада овец или на собачьей площадке, поскольку сильные отвлечения сделали бы выбор База очень трудным. Неверный выбор был всегда доступен Базу, но на ранних стадиях дрессировки я делала его очень сложным. Занятия таким образом сделают ваши тренировки наполненными поощрением, и ваша собака всегда будет с нетерпением ждать их (см. таблицу в приложении А).

Мастера создания поведения: Бэйли.

На мое понимание приложения принципов обучения собак огромное влияние оказали работы Боба Бэйли и его чудесной жены, покойной д-ра Мэрион Бэйли. Мэрион (Бреланд) Бэйли училась у великого Б.Ф.Скиннера. Бэйли использовали принципы Скиннера по отношению к целому Ноеву ковчегу.

Удивительный дрессировщик любых животных, Боб Бэйли начал свою профессиональную карьеру, дрессируя дельфинов на службе в ВМФ США. Затем они владели и управляли Центром поведения животных, который Мэрион создала вместе со своим покойным мужем д-ром Келлером Бреландом. Здесь Боб и Мэрион обучили тысячи животных, как для любительских целей, так и для особо секретных нужд вооруженных сил. Например, они научили воронов нести в клювах маленькие шпионские камеры, следуя за лазерным указателем, мягко прижать камеру к нужному окну и открыть затвор, чтобы сфотографировать происходящее внутри.

Бэйли дрессировали все, от рептилий до приматов и китов. Боб часто говорит, что он «не дрессировщик собак», поскольку он дрессировал всего несколько сотен их. Как ни огромно вам может показаться это количество, по сравнению с более чем десятью тысячами животных, выпущенных Центром, это действительно немного. Бэйли говорит о дрессировке: «Это просто, но не легко».

Сейчас дрессировщики морских животных, владельцы зоопарков и дрессировщики собак всего мира извлекают пользу из новаторских трудов супругов Бэйли о дрессировке животных без принуждения. Особенно мир дрессировки собак развернулся на 180 градусов после популяризации Бэйли принципов оперантного научения. Я польщена и благодарна возможности познакомиться и поработать с этими выдающимися людьми. Вы найдете афоризмы Бэйли там и сям в тексте. Они стали моими заклинаниями.

Решение проблем.

Если тренировка не получается, Боб Бэйли советует проверить одно из трех необходимых условий: ваш расчет времени, выбор критериев или уровень поощрения.

Расчет времени.

Любой, кто занимался спортом, испытал влияние верного или неверного расчета времени на успех игры. Если вы слишком поздно ударите по мячу в бейсболе, то теряете шансы успеть добежать до «базы». Если же ударите слишком рано, то тем более ничего не выйдет. То же самое справедливо и для дрессировки собак. Если вы пытаетесь научить собаку касаться носом вашей ладони и при этом постоянно кликаете слишком рано, вы отмечаете поведение за секунду до того, как собака действительно коснется руки. Через некоторое время собака начнет тоько подносить нос к ладони, не касаясь ее. Вы можете использовать кликер или словесный маркер (например, «Да! »), чтобы обозначить правильное поведение, или просто бросать лакомство в нужный момент. Если время подачи маркера неверно, вы создадите ненужное поведение. Помните: только собака точно знает, какую реакцию вы подкрепили!

Точно так же, и дача лакомства собаке тоже влияет на успех ваших занятий. Хотя щелчок выделяет реакцию собаки, поощрение беспорядочно подкрепляет все, что происходит между щелчком и попаданием лакомства к собаке. Убедитесь, что вы подкрепляете ту реакцию, которую собирались. Боб Бэйли рекомендует: «Кликайте за действие и поощряйте за позицию! ». Например, если вы учите собаку двигаться от вас, если вы щелкнете за правильное действие, но позволите собаке подойти к вам за поощрением, чему на самом деле научится ваша собака? Уходить от вас и сразу возвращаться. Более эффективным будет щелкнуть за движение от вас и бросить награду вперед собаки, чтобы ей пришлось продолжить двигаться дальше, чтобы получить свое поощрение.

Выбор критериев.

Критерии – как правила игры. Критерий определяет, что вы должны увидеть перед тем, как подкрепить реакцию. Для сложного поведения вам нужно больше одного критерия, но вы должны заниматься каждым элементом отдельно (как касание носом в обучении прохождению зон). Вы можете добавлять следующий критерий только после того, как собака поняла предыдущие.

Собаки могут научиться вычислять критерии и играть по правилам. Эта идея жизненно важна для каждого щенка, так что вы можете очень рано начинать учить его правилам игры. Я учила маленького База, что в каждой игре есть правила, и что он должен следовать им, если хочет, чтобы игра продолжилась. Игра аджилити полна критериев для выступления: Если собака хочет стартовать, она сначала должна посидеть на стартовой линии; Если хочет правильно пройти слалом, надо войти так, чтобы первая стойка была слева. Вся жизнь будет наполнена этими правилами, так что лучше, чтобы щенок начал учиться им как можно раньше.

Критерии должны быть четкими – черное и белое. Собака либо сделала правильно, либо нет; не может быть серого цвета ни для вас, ни для собаки. Она должна ассоциировать поощрение только с правильным поведением. Вы никогда не должны поощрять собаку, если она не следовала вашим критериям. Если ваша собака научена касаться носом ладони, если ваш критерий – касание, вы не должны соглашаться на меньшее. Принятие чего-то еще (например, приближение к руке без касания или хватание за рукав) означает, что вы изменяете критерии поведения и вознаграждаете за меньшие усилия. В результате ваша собака научится делать это медленно (и возможно, она будет совсем сбита с толку). Мы все следуем определенным критериям в жизни. Вы сначала должны открыть холодильник, чтобы достать поесть. Стояние перед холодильником и плач дверь не откроют. Собака научится точно выполнять нужное поведение, если вы правильно сумеете подобрать реально выполнимые критерии и следовать им.

Чем больше критериев у вас для поведения, тем больше у вас контроля за ним. Например, чтобы преодолеть качели, собака А должна добежать до конца доски, поставить передние лапы на землю и коснуться поверхности земли носом. Собака В должна только взойти на доску и сойти с нее. Поскольку тренер собаки В только слегка наметил контуры поведения, у него будет меньше контроля за поведением собаки и, следовательно, меньше возможности улучшить его. Это пример последствий дрессировки с пропуском «шагов» поведения.
Вы можете намеренно заложить малое количество критериев для определенного поведения. Например, возможно, вы будете не так требовательны к выполнению команды «Сидеть» на старте в аджилити, чем к выдержке сидя в обидиенс. На аджилити я позволяю собаке лаять, пока она сидит на старте, но в обидиенс я бы потеряла за это много баллов. Заранее продумайте количество критериев, которое вам понадобится для каждого поведения. Чем больше их, тем больше контроль над поведением, но тем больше потребуется времени для обучения и поддержания навыка.


Поделиться:



Последнее изменение этой страницы: 2017-03-14; Просмотров: 274; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.017 с.)
Главная | Случайная страница | Обратная связь