La psychologie pour retenir l'audience en vidéo ?
Salut à toi, c’est Clémence de Cleenk !
Le mois dernier, je t’ai montré les trois premiers leviers pour capter l’attention sur YouTube (Zeigarnik, info-gap, FOMO). J'espère que tu les a déjà bien mis en pratique.

Mais tu le sais : un clic, ce n’est rien si ton spectateur part au bout de 10 secondes. Donc on ne va pas s'arrêter en si bon chemin. Le deuxième défi qu'il va falloir relever maintenant, c’est de retenir l’audience et de faire en sorte que ton message reste en mémoire.
Et là encore, il y a de la science derrière. Je t'ai préparé non pas 2 mais 4 leviers psychologiques que tu peux appliquer directement dans tes vidéos pour que ton spectateur reste, écoute et se souvienne. Car oui, on veut que nos vidéos marquent les esprits !
La violation d'attentes
La psychologue Judee Burgoon a développé l’expectancy violations theory (qu'on va appeler l'EVT). Selon l'EVT, les comportements qui bousculent les attentes provoquent une arousal : un mot compliqué pour dire une activation cognitive et émotionnelle !
Ça veut dire quoi ? L’audience perçoit qu’il y a “quelque chose d’inhabituel”, ce qui déclenche une réévaluation de l’information. En clair : notre tête se met en alerte et on accorde plus d’attention au message.
La violation d’attente sur YouTube peut prendre plusieurs formes, par exemple :
- L’ingrédient absurde
Un créateur de recettes commence normalement : “Aujourd’hui je reproduis une recette italienne”. Puis, au lieu de mettre des pâtes, il pose un abricot ou du ciment sur la table. Le spectateur reste bloqué, surpris par l’incohérence et continue à regarder pour comprendre si c’est une blague, une critique ou un vrai test !
- Le résultat contraire à la promesse
Une vidéo annonce : “Voici comment réussir une miniature parfaite”… et la première image montre au contraire une miniature ratée, moche ou illisible.

Le spectateur est perturbé car l’image ne colle pas au discours. Cette incohérence crée une tension qui le pousse à rester pour avoir l’explication ou un dénouement.
- Le conseil contre-intuitif
Un coach annonce : “Si tu veux réussir sur YouTube, arrête de publier”. C’est à l’opposé de ce qu’on s’attend à entendre. Comme la phrase contredit une certaine croyance commune, le spectateur est réveillé et veut comprendre ce paradoxe.
Pourquoi ça marche ? Plus l’incohérence est forte, plus elle déclenche des réactions. Les spectateurs expriment leur confusion : “Je suis la seule à avoir vu ça ?”, “Au début tu m’as fait peur”, "je suis restée bloqué sur X, pendant toute la vidéo", etc.
Attention tout de même, certains créateurs peuvent utiliser la violation d’attente en forçant le trait avec des propos choquants ou polémiques. Ça marche sur le moment : ça surprend, ça indigne et ça génère beaucoup de réactions ! Mais ce type d’attention peut être négative.
Le spectateur reste, mais pas parce qu’il est captivé par ton message. Il reste parce qu’il est agacé, choqué ou qu’il veut contredire. Et si ça peut faire grimper les vues, ça finit souvent par abîmer la crédibilité et la relation avec ton audience.
Donc l'idée, c’est d’utiliser la violation d’attente de façon positive et cohérente. Par exemple en cassant une idée reçue, en surprenant avec un objet incongru ou en annonçant un conseil contre-intuitif. L’objectif n’est pas de provoquer gratuitement, mais de forcer l’attention pour mieux délivrer ton message !
Le pattern interrupt
Alors que la violation d’attente joue sur la logique du fond, le pattern interrupt repose sur une rupture de rythme ou de perception. Notre cerveau adore les schémas répétitifs, mais dès qu’un élément casse brutalement la continuité, il se met en alerte.
Concrètement, c’est ce qu’on voit dans la vidéo Uexpress devenue virale : une explication pseudo-scientifique racontée avec sérieux et soudain on se retrouve dans les rayons express avec une promo Ariel 😂
Ce n’est pas juste un changement dans le contenu, c’est une rupture nette dans le flux narratif.

Le pattern interrupt réveille l’attention en cassant la continuité. Et c’est aussi pour ça qu’on en retrouve très souvent dès les premières secondes d’un short. Sur TikTok ou YouTube Shorts, le spectateur scrolle presque automatiquement. Pour l’arrêter, il faut une coupure nette, une rupture qui secoue le cerveau et le force à sortir de son mode végétatif : un effet visuel ou sonore marqué (flash, explosion, bruit fort) ou une phrase choc dès le début qui rompt la continuité attendue.
Le peak and rule
Le peak–end rule, c’est une règle simple : notre cerveau ne garde pas tout d’une expérience. Ce qu’on retient surtout, c’est le moment le plus intense et la fin.
Le reste ? Beaucoup plus flou.
Une étude le montre bien : des participants devaient plonger leur main dans l’eau froide. Certains devaient la tenir 60 secondes. D’autres, 90 secondes… mais avec les 30 dernières un peu moins froides !

Résultat : la majorité a préféré la version plus longue, tout simplement parce qu’elle “finissait mieux”.
Si on l'applique à une vidéo YouTube, ce n’est pas la moyenne des infos qui compte, mais le pic et la conclusion.
• Le pic : ça peut être une révélation, une anecdote qui percute, une surprise qui change la perspective.
• La fin : ça peut être une phrase qui résonne… mais aussi un récap/check-list simple, qui laisse une impression claire et actionnable.
Exemple : dans une vidéo conseil, le pic, c’est l’astuce que personne ne connaît et qui change tout. Et la fin, ce n’est pas juste un “merci d’avoir regardé”, mais :
1. Vérifie ton CTR.
2. Retravaille ta miniature.
3. Ajuste ton angle de vidéo.
Le spectateur repart avec une idée nouvelle + un plan concret. Et c’est ce qui fait qu’il s’en souviendra plus.
Le pic et la fin marquent le souvenir mais il y a un dernier levier, plus profond encore : celui du ressenti.
Activation de la mémoire émotionnelle et sensorielle
Pourquoi certaines histoires nous restent en tête alors que d’autres sortent de nos têtes aussitôt ? Parce qu’elles activent non seulement la mémoire “des faits”, mais aussi la mémoire émotionnelle et sensorielle.
Il y a une expérience menée par Uri Hasson à Princeton qui m’a marquée. Son équipe a fait écouter des histoires riches en détails sensoriels (odeurs, textures, sons) à des volontaires, tout en mesurant leur activité cérébrale avec l’IRM. Résultat : les mêmes zones du cerveau s’activaient chez l’auditeur que chez la personne qui racontait.
Parler d’un parfum activait les zones du cerveau liées à l’odorat, décrire une texture rugueuse activait les zones du toucher.
Si on vulgarise, une histoire racontée avec des détails, c’est une histoire que le spectateur “vit” dans sa tête.
C’est exactement ce que réussissent des formats introspectifs comme ceux de Legend. Invité face cam, cadre épuré, storytelling, on n’entend pas seulement “j’étais perdu à ce moment-là”, mais : “j’étais assis dans ma voiture, moteur coupé, les mains qui tremblaient encore, incapable de sortir”. On voit la scène, on ressent le malaise et notre cerveau réagit comme si on y était.
Mais ce levier n’est pas réservé aux formats psy ou narratifs. Même dans une vidéo business ou conseil, tu peux faire ressentir plutôt que simplement informer. Au lieu de dire “mon client a doublé ses ventes”, tu peux dire “je me souviens encore de son appel après des mois de doute, il parlait vite au téléphone, on entendait le sourire dans sa voix quand il m’a dit qu’il venait de faire +50% en un mois”.
Est-ce que tu as imaginé la scène ?
;)
Bref, ce n’est pas la donnée brute qui reste en mémoire, mais la sensation vécue. Si tu arrives à transmettre non seulement l’idée, mais aussi le ressenti, ta vidéo sera mille fois plus marquante.
J'espère que cet article t'a plu. Est-ce que ces conseils t'ont été utiles ?
N'hésite pas à me faire un retour, ça me ferait très plaisir.
Cleenk ;)
Comments ()