Introduction
Conclusion

Chapitre 1 – Renforcements et Renforçateurs

1. L’apprentissage par conditionnement opérant

Nous l’avons vu lors d’un Module précédent : lorsque nous interagissons avec notre cheval dans une optique d’apprentissage, nous fonctionnons majoritairement par conditionnement opérant (se référer au chapitre 5, Module 3) et ce, qu’il s’agisse d’une séance en carrière, d’un exercice en liberté ou d’une rééducation sur un « problème » comportemental.

Or, le conditionnement est souvent vu comme quelque chose à éviter à tout prix. Être conditionné serait être soumis, contrôlé. Faux ! Le conditionnement est la base de certains apprentissages et ceux-ci ne sont pas délétères en tant que tels… s’ils sont bien menés et respectueux de l’animal !

En tant qu’humains, nous sommes par exemple conditionnés à nous arrêter au feu rouge… cela ne fait pas de nous des êtres lobotomisés et incapables de réflexion.

L’apprentissage par conditionnement est une réalité et s’applique à tous les êtres vivants sur lesquels les théories de l’apprentissage ont été étudiées. En revanche, retenez bien que tout apprentissage n’est pas forcément le produit d’un conditionnement conscient : comme évoqué lors du Module 3, les apprentissages individuels, sociaux et non-associatifs ont des types de fonctionnement différents… mais tout aussi efficaces dans leurs domaines d’application respectifs.

Les apprentissages par conditionnement opérant font de l’animal un acteur de l’apprentissage : il agit, « opère », constate le résultat de son comportement sur l’environnement et apprend le lien de causalité entre ce qu’il a exprimé et le résultat. Sauf qu’à l’origine de ce comportement, il y a une action, une demande, généralement humaine : la vôtre.

L’objectif de ces apprentissages opérants est de présenter un signal (vocal, gestuel/visuel, énergétique…) à l’animal et d’obtenir qu’il y réponde en exprimant le comportement voulu avec un temps de réponse le plus court possible.

 

Et à partir de là, en théorie, tout est possible ! Vous pouvez obtenir de votre cheval qu’il galope lorsque vous levez le bras, lorsque vous sifflez ou lorsque vous inspirez. Vous pouvez lui demander de reculer par un son, un contact, un regard… ou en vous grattant la tête ! Mais si la logique est la même quel que soit le signal choisi, il est en revanche absolument primordial de toujours respecter son intégrité physique et mentale en utilisant des codes progressifs et bienveillants. Nous y reviendrons.

Les premiers travaux effectués sur le conditionnement laissaient (volontairement) de côté les états mentaux de l’animal et ne prenaient en compte que les comportements qu’il exprimait (seuls indicateurs quantifiables et comparables selon les standards de l’époque). Le stress, le tempérament, les facilités de l’individu étaient complètement passés sous silence.

Aujourd’hui, les résultats des études en éthologie permettent de ne plus considérer l’animal comme une « boîte vide » et de mettre en œuvre des méthodes d’apprentissage respectueuses aussi bien du physique que du mental de l’apprenant. Nous savons que les chevaux ont des émotions, des envies, des préférences, qu’ils se souviennent, anticipent, évitent, réfléchissent. Toute personne souhaitant développer un lien durable et complice avec son cheval doit donc privilégier des méthodes lui permettant de s’exprimer, de se tromper… de dire « non » parfois. Au-delà d’une « séance de travail », chaque interaction avec un cheval devrait être avant tout l’occasion de laisser des souvenirs positifs et de bâtir un avenir motivant et confortable… Voyons comment choisir et mettre en application des demandes logiques et motivantes !

 

2. Éviter la punition à tout prix

En apprentissage opérant, il existe deux types de punitions : la punition positive et la punition négative.

Attention ! Les termes de « positive » et « négative » n’ont pas de valeur en tant que tels : ils signifient seulement que quelque chose est ajouté (positif) ou enlevé (négatif).

  • La punition positive consiste à ajouter quelque chose de désagréable (exemple : un cri, une claque).
  • La punition négative consiste à enlever quelque chose de désagréable (exemple : ôter la ration, se détourner pour enlever son attention).

La punition vise à réduire la probabilité d’apparition d’un comportement. Elle apparaît donc après le comportement « gênant »et a pour objectif d’indiquer à l’apprenant qu’il ne doit plus l’exprimer. Mais la punition doit être évitée à tout prix… Voici pourquoi :

  • Le comportement que l’on punit n’est pas forcément indésirable : incompréhension, mauvaise communication… et si le cheval n’était pas le fautif ? Peut-être que vous avez (inconsciemment) récompensé le mauvais comportement, peut-être que votre gestuelle a dit l’inverse de votre ordre vocal, peut-être que votre cheval n’a pas compris votre demande…
  • En punissant, on indique au cheval qu’il n’a pas le droit de faire d’erreurs. Or, un cheval qui ose proposer et se tromper est un prérequis indispensable à une évolution technique efficace. S’il a peur d’être réprimandé, votre cheval risque de s’éteindre, de prendre de moins en moins d’initiatives et de répondre à vos demandes à contrecœur… 
  • Punir peut avoir l’effet inverse de celui recherché. En se fâchant, on donne de l’attention au cheval et cette forme de punition positive peut être « préférée » à l’ignorance… Par exemple, des chevaux qui grattent à l’attache ou tapent à leur porte de box pendant des heures et sur lesquels on crie (ou jette des brosses…) ne cessent généralement pas d’exprimer ce comportement à long terme. Il est probable que ce soit un moyen d’attirer l’attention de l’humain… et de se distraire d’une situation répétitive ou peu stimulante.
  • En punissant, l’humain monte dans un état émotionnel négatif. Difficile en effet de crier, de taper ou de s’énerver avec un grand sourire. Cela ne serait pas congruent… Mais non seulement, cette émotion nuit à votre communication immédiate, mais elle a également tendance à s’installer et à entacher tout le reste de votre séance… voire des suivantes.
  • L’impact d’une punition sur l’état émotionnel du cheval doit également être pris en compte. Influencé par nos propres émotions délétères, potentiellement surpris par notre réaction et cherchant à éviter un nouveau geste aversif de la part de l’humain, le cheval va devenir de moins en moins enthousiaste et risque d’exprimer des comportements défensifs ou agressifs.
  • Punir nuit à l’apprentissage. Parce que l’animal apprenant est dans un état émotionnel négatif, parce que humain et animal ne sont plus connectés, parce que la communication est rompue… les apprentissages basés sur la punition sont moins efficaces, moins stables dans le temps et moins bien mémorisés.
  • Utilisée régulièrement, la punition entraîne le binôme dans un cercle vicieux de stress et de coercition. Humain et cheval commencent à se méfier l’un de l’autre, la complicité est impossible et l’amitié inenvisageable.

Il est néanmoins important d’accepter qu’il arrive à tout le monde de punir son cheval, volontairement ou non. Par peur, par douleur, par incompréhension, par frustration, nous pouvons nous retrouver dans des situations qui nous débordent totalement… et avoir les mauvaises réactions. Ces mauvaises réactions ne sont (heureusement !) pas forcément des punitions physiques : un soupir d’exaspération face à une erreur, un recul brusque suite à un mouvement de peur de notre cheval, un mot trop fort après une énième correction d’un exercice qui vous pose souci depuis des mois… L’important est de prendre conscience de toutes ces « mini punitions » qui, si elles ne traumatisent pas votre cheval, peuvent néanmoins altérer votre relation et votre communication.

3. Les renforçateurs en R-

Le renforcement négatif consiste à exercer une pression et à la relâcher dès que l’on obtient le comportement demandé. Il apparait donc avant le comportement donc on veut augmenter la probabilité d’apparition. En équitation traditionnelle, ce type d’apprentissage est omniprésent : pression des jambes pour faire avancer son cheval, pression sur les rênes pour ralentir ou pour tourner, pression sur le poitrail ou sur la tête pour faire reculer… Lorsque l’éducation et les séances d’apprentissage sont bien menées, l’objectif est que cette pression, ce contact, soit le plus fin et le plus léger possible. On parle de monter un cheval qui réagit « au souffle de la botte », d’avoir « deux grammes dans les mains ». Et si ces objectifs semblent louables, dans les faits, bien sûr, on observe des cavaliers menacer ou bousculer leurs chevaux, utilisant le renforcement dans son acceptation la plus délétère : faire craindre au cheval une montée des phases et une augmentation de la pression physique à laquelle il se substitue en répondant le plus vite possible. Dans ce contexte, on retrouve donc les mêmes limites que dans la punition : communication coupée, émotions négatives, apprentissage inefficace.

Mais le renforcement négatif peut tout à fait être utilisé de manière respectueuse et permettre un apprentissage confortable. Si le terme « pression » est souvent connoté négativement, il est possible de le remplacer par le mot « signal » et ainsi d’ouvrir le champ des possibles ! En effet, le renforcement négatif ne consiste pas forcément à appuyer / pousser / gêner votre cheval. Vous pouvez démarrer vos demandes avec un signal presque imperceptible, qui ne mettra pas votre cheval dans une position de soumission physique ou mentale, et considérer l’apprentissage par renforcement négatif plus comme une série de suggestions que comme des obligations auxquelles le cheval ne peut pas se soumettre.

 

Voici une proposition de progression dans les signaux, ou les aides, que vous pouvez utiliser pour un apprentissage en renforcement négatif :

  1. Énergie : définissez précisément et visualisez ce que vous voulez, puis adoptez l’énergie nécessaire à cette demande. Votre intention ne doit pas être la même selon que vous demandez une foulée de reculer ou un départ au galop. Vivez votre demande intérieurement, chaque cellule de votre corps doit être convaincue de ce que vous désirez obtenir de votre cheval !
  2. Souffle / Respiration : si vous désirez un mouvement, inspirez et grandissez-vous. A l’inverse, si vous cherchez un ralentissement ou un arrêt, expirez et adoptez une posture congruente. Au début, cela peut demander quelques efforts mais peu à peu, la respiration peut devenir un signal puissant dans votre communication.
  3. Gestuelle sans contact : tout votre corps communique ! Quand vous demandez un exercice à votre cheval, utilisez votre gestuelle pour passer votre message : regard, orientation de la tête ou des épaules, bras qui se lèvent, main qui pointe… Chaque partie de votre corps peut (et doit !) donner des informations à votre cheval. Cela ne signifie pas forcément que vous devez vous mettre en mouvement mais vous devez présenter une gestuelle raccord avec votre énergie et l’exercice demandé.
  4. Voix / Claquements de langue : si vous débutez dans votre relation avec votre cheval ou que vous lui proposez un exercice encore instable, il est fort probable que l’énergie et le souffle ne suffisent pas ! Vous pouvez alors utiliser un code vocal ou un claquement de langue pour indiquer votre demande : à vous de choisir ce qui vous « parle » et vous semble le plus efficace.
  5. Contact : comme nous l’avons vu au Module 3, les chevaux n’ont pas énormément de contacts physiques entre eux. Ils passent beaucoup de temps à proximité les uns des autres et synchronisent leurs activités, mais ils se touchent assez rarement. Bien sûr, la plupart des chevaux apprécient (ou apprennent à apprécier) les caresses et les grattouilles, mais cela n’est pas toujours évident. On peut donc en déduire que les demandes basées sur un contact physique ne sont pas forcément bien perçues. Si l’on apprend à son cheval à se déplacer suite à une pression sur ses flancs, par exemple, il faut donc s’assurer que cette pression est tolérée, comprise et ne suscite pas de fuite en avant. Le contact doit toujours être le plus léger possible, être augmenté progressivement uniquement si nécessaire et ôté dès que le cheval a donné la réponse attendue. En fonction de l’exercice, ce contact peut être effectué avec votre main, vos jambes mais également votre stick ou votre cordelette. L’important n’est pas l’outil mais bien l’utilisation qui en est faite.

Sentez-vous libre de rajouter des étapes intermédiaires, voire d’échanger les étapes 3 et 4 proposées ci-dessus : vous pouvez préférer utiliser la voix à votre gestuelle, annoncer votre exercice avec un claquement de langue puis le confirmer avec un mot dédié… L’important est d’être logique et rigoureux dans votre communication. Si vous demandez un reculer parfois avec un mot, parfois avec un contact sur la longe, il est probable que votre cheval soit confus et ait du mal à reculer de manière légère et efficace dans toutes les situations. Au début, clarifiez les choses pour pouvoir ensuite aller plus loin, en ayant par exemple différents types de codes pour un même exercice.

Et si ça ne suffit pas ? Et si votre cheval ne répond pas à votre demande, qu’il semble s’appuyer, se distraire… ignorer le signal ? Votre premier réflexe doit être de « scanner » vos aides : êtes-vous sûr.e d’avoir été progressif.ve ? D’avoir utilisé un code identique à la fois précédente ? d’avoir attendu que votre cheval soit disponible physiquement et mentalement ? Votre cheval et vous étiez-vous en « situation de réussite » ? (n’oubliez pas de vous référer régulièrement aux 10 Grands Principes des Interactions Homme-Cheval évoqués au Module 4).

On se demande souvent si l’on peut augmenter les phases, monter dans la pression exercée, sans pour autant contraindre son cheval ou rompre la communication. La réponse est « oui mais ». Oui, on peut utiliser des signaux plus « forts » sans heurter son cheval si l’on est progressif, à l’écoute et que cela permet de faire comprendre ce que l’on souhaite. Mais augmenter ses aides ne doit pas signifier faire fuir son cheval ou négliger de remettre en question les aides précédentes. Si vous avez besoin de pousser, taper, appuyer fort, c’est qu’une pièce du puzzle n’est pas acquise…

Pour mettre en place des apprentissages par renforcement négatif qui soient respectueux et efficaces, il convient donc de :

  • Ne pas dépasser seuil homéostasique : chaque cheval a une limite, une « ligne rouge » qu’il faut respecter et ne pas franchir, au risque d’altérer la communication et de le voir devenir méfiant et démotivé. Ce qui convient à une monture ne convient pas forcément au tempérament et à la sensibilité d’une autre…
  • Travailler sur son timing et son tact : le renforcement positif peut rapidement devenir délétère s’il est mal mené. Un humain approximatif, anxieux et sur la défensive peut amener le cheval à devenir prudent… voire fuyant.
  • Se souvenir que la pression n’est pas forcément physique ! Votre présence, votre respiration, votre regard sont autant de signaux que vous pouvez utiliser pour faire bouger votre cheval et lui indiquer l’exercice que vous souhaitez obtenir.
  • Prendre conscience que relâcher fait partie intégrante de l’apprentissage. En effet, si le type et l’intensité de la pression que vous mettez sont des critères importants, le moment où vous cessez cette pression est primordiale. Rappelez-vous que votre cheval va associer le moment exact où vous cessez votre signal à la réponse qu’il doit donner.

 

4. Les renforçateurs en R+

Le renforcement positif consiste à marquer le comportement voulu (généralement par un mot ou l’utilisation d’un clicker) au moment où il apparait et à le récompenser ensuite en offrant quelque chose d’agréable. Il met donc l’accent sur ce que l’on veut, et non pas sur ce que l’on ne recherche pas. Le renforcement positif est donc valorisant pour le cheval, qui apprend très rapidement à « aimer l’école » puisqu’on laisse sous silence les « mauvaises réponses » et que l’on renforce fortement les exercices réussis.

Travailler en privilégiant le renforcement positif revient à insister sur le confort mental et émotionnel du cheval. Des études ont montré que l’utilisation du clicker (boitier en métal permettant de « cliquer » avec un son métallique au moment d’apparition du comportement souhaité) donnait de meilleurs résultats lors de l’apprentissage : mémorisation plus longue, exercice plus stable et, surtout, animal plus motivé et enthousiaste lors des séances.

Pour information, il existe quatre types d’apprentissage en R+ :

  • La cible (« target ») : on récompense le cheval quand il touche la cible avec une partie de son corps (généralement le nez dans un premier temps) afin de l’inciter à « aller vers ».
  • La capture : on marque un comportement présenté « par hasard » par le cheval, par exemple lorsqu’il se roule, pour permettre l’apprentissage d’un comportement similaire (ici, le coucher).
  • Le leurre : on guide le cheval en le « feintant » par notre gestuelle ou l’utilisation de nourriture pour l’aider à comprendre. Cela peut permettre de résoudre un blocage.
  • Le shapping : on marque les étapes successives d’un même apprentissage pour diviser la difficulté et permettre au cheval de garder son enthousiasme et sa motivation.

 

Quels marqueurs utiliser en R+ ?

Le marqueur sert à indiquer au cheval qu’il vient d’exprimer le comportement recherché. Il doit être immédiat quand le comportement est bien exécuté pour aider l’animal à comprendre ce que l’on veut.

  1. Voix : « oui », « là », « bien » : le marqueur vocal doit être bref pour être efficace. La difficulté est souvent de ne communiquer aucune émotion en utilisant ce marqueur, afin de le rendre le plus neutre possible. Autant dire que ça n’est pas le plus simple, ni le plus efficace à utiliser…
  2. Claquement de langue : il est possible d’utiliser un claquement de langue précis pour marquer les bons comportements. Mais attention : ce claquement de langue ne doit absolument pas être utilisé pour autre chose ! Si vous avez par exemple l’habitude d’utiliser votre langue pour le départ au galop par renforcement négatif, trouvez un autre moyen de marquer les comportements recherchés en renforcement positif ! Tout doit être mis en œuvre pour éviter les confusions et le manque de précision.
  3. Clicker : l’avantage de ce petit boitier est que le son produit est constamment le même, qu’il n’est pas sujet aux émotions, aux maux de gorges ou aux hésitations ! Son seul inconvénient est qu’il nécessite quelques efforts pour être pris en main correctement, mais son utilisation est tout à fait conseillée pour mettre en place des apprentissages efficaces et respectueux.

 

Quels renforçateurs utiliser en R+ ?

Le renforçateur sert à récompenser le cheval et apparaît après le marqueur. Il est d’abord donné systématiquement, à chaque bonne réponse, et devient plus aléatoire au fur et à mesure que l’apprentissage se confirme.

  1. Caresses : comme évoqué pour le renforcement négatif R-, le contact physique n’est pas forcément positif pour votre cheval. Les grattouilles peuvent être appréciées mais sont souvent plus efficaces dans des relations Homme-Cheval confirmées, quand les deux protagonistes se connaissent bien et apprécient leurs contacts réciproques.
  2. Voix : renforcement secondaire, elle doit souvent être conditionnée pour devenir « renforçante ». Elle permet de récompenser l’animal à distance (« oui, c’est bizarre », « bravo mon grand, bel effort ») mais n’est généralement pas suffisante en début d’apprentissage.
  3. Nourriture : renforcement primaire, il a une forte valeur en tant que tel et sans besoin de conditionnement préalable. Sauf traumatisme, tous les chevaux apprécient les récompenses alimentaires. La valence est forte et les animaux travaillés en R+ avec nourriture sont ceux exprimant les meilleurs taux de réussite dans les apprentissages testés.

 

Les indispensables d’un signal efficace (en R- et en R+)

  • Exclusif : un même signal ne peut pas être utilisé pour deux exercices différents,
  • Logique : demander un arrêt en sautillant sur place, ou un départ au galop en expirant n’est pas forcément le plus évident à comprendre pour son cheval,
  • Rigoureux : une fois le signal choisi, on le garde !
  • Respectueux : le cheval est un animal sensible, sa perception du monde et de nos signaux diffèrent des nôtres.

 

Pensez aussi au R+ pour vous !!
 
Apprenez à repérer vos efforts et vos progrès, à marquer vos succès (au moins dans votre tête) et à vous récompenser ! Il peut simplement s’agir de visualiser ce que vous avez fait de juste, d’inspirer un grand coup et de sourire (vraiment !) mais vous pouvez également vous le répéter avec conviction : « là, j’ai réussi à obtenir un départ au galop léger et sans contrainte, je suis fier.e de l’avoir fait et d’en avoir pris conscience ». Vous allez ainsi envoyer des messages positifs à votre cerveau et vous motiver en douceur à rechercher ces instants d’auto-récompense !

Les bases du R+ : la politesse

 

Les bases du R+ : travail en zone protégée et mise en place de la cible/target

 

EXERCICE – MODULE 5 – CHAPITRE 1

  1. Je demande à mon cheval de reculer à distance. Placé face à lui, je fais un pas vers lui pour l’inciter à reculer, tend ma longe s’il ne recule pas, relâche la pression quand il met son poids du corps vers l’arrière et le récompense ensuite avec de la nourriture. S’agit-il d’un renforcement positif ou d’un renforcement négatif ?
  2. Je travaille l’immobilité en renforcement positif en récompensant quand mon cheval a une posture correcte, équilibrée, loin des friandises alimentaires. Il a néanmoins tendance à me bousculer ou à fouiller dans mes poches. Que faire ?