Jour 2 – Enlever le leurre

Une fois que mon chien a compris le comportement que je souhaite lui enseigner et qu’il est capable de le produire sans se tromper, je vais alors pouvoir enlever le leurre.

⚠️ Attention : le leurre est la friandise qui intervient PENDANT que je guide mon chien. La récompense est la friandise qui intervient APRÈS que mon chien a produit le comportement (c’est mon renforçateur). Enlever le leurre ne veut donc pas dire enlever la récompense !

1. Comment enlever le leurre ?

Voici deux méthodes pour enlever le leurre :

  • Faire semblant d’avoir une récompense dans les mains, mais garder la main vide et récompenser avec l’autre main à l’arrivée.
    >> Par exemple, si j’apprends à mon chien à tourner sur lui-même, je peux faire semblant d’avoir une récompense dans la main pour qu’il suive mon geste. Une fois que mon chien a fini le comportement (il a tourné sur lui-même et est de retour face à moi), je vais alors pouvoir récompenser depuis ma pochette avec l’autre main.
  • Réduire l’amplitude de mon geste.
    >> Par exemple, si j’apprends à mon chien à tourner sur lui-même, au début je le guide en leurrant le tour complet. Une fois que mon chien a compris, je vais pouvoir leurrer puis cacher ma main dans le dos au 3/4 du tour et laisser mon chien terminer le tour de lui-même. Je pourrai ensuite le récompenser. Les prochaines fois, je pourrai cacher ma main dans mon dos à la moitié du tour (et laisser mon chien finir tout seul), puis au quart du tour, etc.

Il est possible de combiner ces deux méthodes à condition de ne pas aller trop vite pour ne pas perdre mon chien.

Mais alors, est-ce qu’un jour tu vas pouvoir enlever la récompense ? Oui … et non ! Souviens toi des lois de l’apprentissage et particulièrement de la loi de l’extinction : tout comportement qui n’est pas renforcé tend à disparaître.

➡️ Cela veut donc dire que, si tu ne renforces plus jamais un comportement que tu souhaites voir maintenu, ton chien va progressivement arrêter de produire ce comportement qui ne lui apporte plus rien. Pour que le comportement soit maintenu avec motivation (et pas par peur, rappelle toi du quadrant des apprentissages), il faut alors que ton chien y trouve un renforçateur. Peut-être que ton chien considère le fait d’être félicité comme un renforçateur à la hauteur de ses efforts… ou peut-être pas !

Le renforcement aléatoire

Le renforcement aléatoire, c’est renforcer mon chien de manière inattendue afin de voir un comportement persister.

Comment ça fonctionne ? Souviens-toi de la loi de l’extinction : tout comportement qui n’est pas renforcé tend à disparaître. Mais avant de disparaître, le comportement va s’intensifier en fréquence et en intensité (phase d’explosion).

Ainsi, si je ne renforce plus le comportement pendant un moment,  celui-ci va finir par diminuer. Mais dès lors que je renforce à nouveau ce comportement une fois de temps en temps, je vais alors “raviver” ce comportement de manière encore plus intense, ce qui va pousser mon chien à performer pour toujours donner le meilleur en espérant obtenir une récompense.

Que penser de ce renforcement aléatoire ? Et bien nous sommes mitigées, et voici pourquoi :

  • Pour des raisons éthiques : je pousse mon chien à performer en lui faisant espérer une récompense pour qu’il maintienne son comportement.
  • Pour une question de valeur des renforçateurs : prenons l’exemple où mon chien a le choix entre revenir au rappel ou continuer de courses le lapin qu’il vient de débusquer. Si je travaille en renforcement aléatoire, alors mon chien sait que parfois il n’est pas récompensé lorsqu’il revient au rappel. Il n’est donc pas sûr à 100% que d’abandonner ce qu’il est en train de faire en vaille la peine. Alors que, s’il est bon chasseur, il y a 9 chances sur 10 pour qu’il attrape ce lapin qui a beaucoup de valeur pour lui (qui représente un renforçateur de valeur 10/10). Alors, lequel de nous deux (le lapin ou moi) va peser plus lourd dans la balance ?

➡️ Voici donc comment nous faisons : nous continuons de renforcer à chaque fois pendant la phase d’apprentissage (renforcement continu), puis nous passons sur du renforcement aléatoire uniquement pour les comportements acquis, non importants et qui demandent peu d’efforts.
>> Par exemple, une fois que mon chien sait donner la patte dans toutes les circonstances (et qu’il a donc généralisé ce comportement), je vais alors continuer de renforcer aléatoirement pour maintenir ce comportement dans le répertoire de mon chien. MAIS il n’y a pas de raison vitale à ce que mon chien sache donner la patte … par contre, j’ai besoin d’être sûre et certaines à 300% que mon chien va revenir au rappel (important + beaucoup d’efforts), je vais donc considérer que lorsque je rappelle mon chien, je lui fais une PROMESSE : si tu reviens, tu es récompensé à CHAQUE FOIS. Tu trouveras plus d’infos sur le rappel dans le module à ce sujet !