C’est à dire qu’il y a des interactions entre l’individu et son environnement. Cela se présente de la sorte : antécédent ==> comportement ==> conséquence.
Un comportement (= tout ce que l’animal fait) peut être soit renforcé soit puni.
Si la conséquence d’un comportement que j’effectue est agréable pour moi (comme manger du chocolat), j’ai envie de la faire réapparaitre, alors je vais répéter mon comportement (il est « renforcé »). Au contraire, si le comportement amène une conséquence négative que j’ai envie d’éviter (comme me brûler avec une casserole chaude), alors je vais arrêter mon comportement (il est « puni »).
Les lois de l'apprentissage simplifiées
1. Renforcement positif (R+) : On peut renforcer un comportement en ajoutant quelque chose d’agréable. Par exemple, je gagne une prime au travail car j’ai bien travaillé.
2. Renforcement négatif (R-) : On peut renforcer un comportement en enlevant quelque chose de désagréable. Par exemple, je paye moins cher mon assurance car je n’ai pas fait d’accident l’an passé (le comportement « conduire prudemment » est renforcé en enlevant quelque chose de désagréable – payer cher).
3. Punition positive (P+) : On peut punir un comportement en ajoutant quelque chose de désagréable. Par exemple, je dois payer une amende car j’ai dépassé la limite de vitesse.
4. Punition négative (P-) : On peut punir un comportement en enlevant quelque chose d’agréable. Par exemple, on m’enlève mon permis de conduire car j’ai dépassé la limite.
5. Attention, très important, et pourtant on a tendance à l’oublier : il existe aussi “l’extinction d’un comportement” ! C’est quand un comportement qui a toujours été renforcé ne l’est plus. Du coup, le comportement va “exploser” avant de “s’éteindre”. Par exemple, d’habitude quand j’appuie sur la télécommande la TV s’allume. Là, elle ne s’allume plus. j’appuie plus fort (c’est explosion du comportement) et si ça ne marche toujours pas, je finis par arrêter et aller chercher des piles (le comportement d’appuyer s’éteint).
La différence entre punition et renforcement
On remarque donc que quand on punit on est « ré-actif » alors qu’en renforcement on est « pro-actif » : c’est à dire qu’on agit AVANT, et pour cela il faut pouvoir anticiper.
La différence entre renforcement positif et négatif
En équitation classique (et équitation éthologique), on utilise principalement du R- : je te chasse avec un stick (désagréable) et dès que tu fais ce que je veux (venir vers moi par exemple), j’enlève le stick. Donc comme quelque chose de désagréable diminue, la prochaine fois que tu verras le stick, tu vas répéter le comportement de venir vers moi.
Ici, on veut provoquer l’inverse : que l’animal agisse de lui-même dans le but d’obtenir quelque chose qui lui plait.
Pourquoi choisir le "R+" ?
R+ Avantages : l’entrainement se fait dans de meilleures émotions, le cheval va toujours essayer de donner plus, les apprentissages seront ancrés très longtemps (probablement à vie). D’après Karen Pryor dans « Don’t shoot the dog », le renforcement positif n’utilise pas les mêmes parties du cerveau : lors des apprentissages en “R+” l’animal est dans le “SEEKING system”, un système du cerveau qui explore, part à l’aventure, découvre le monde, et donc sécrète des hormones de bonheur et de plaisir !
R+ Désavantages : moins intuitif pour l’humain, loin de nos habitudes d’éducation. Le R+ est un outil puissant donc il faut savoir s’en servir comme il faut. Mettre l’accent sur la sécurité car si l’animal est frustré (s’énerve, ne comprend pas car nous sommes peu cohérents par exemple) cela peut être dangereux… et on ne veut pas ça ! De plus, cela n’est pas respectueux pour l’animal car il est perdu (émotions négatives), ne comprend pas et donc finit par s’énerver.
Bonne nouvelle ! Si on fait attention à bien maitriser les lois de l’apprentissage et à observer son animal, on peut tout à fait faire des apprentissages dans des émotions très positives et sans danger !
R- Avantages : instinctif, connu car on le voit partout (société, école, équitation classique,….)
R- Désavantages : développe des comportements de fuite, d’évitement. – L’animal peut généraliser (avoir peur de tout ce qui ressemble à une chambrière, par exemple un câble électrique.). – Peut rendre l’animal apathique, qui n’ose plus rien faire, passif, non motivé. – Peut développer de l’agression contre l’entraîneur. – En plus de tout cela, il y a une question d’éthique qui se pose. Dans quel type d’émotion je veux mon animal quand il s’entraîne avec moi ? Est-ce que je veux un cheval qui arrive du fond du pré quand il me voit ? – Enfin, le renforcement positif est moins intrusif que le renforcement négatif, car il n’oblige pas au contact physique (voir la hiérarchie proposée par Dr Susan Friedman pour ceux qui veulent aller plus loin).