
Par Benjamin Atlani, CEO de WiXar — dix ans d'immersive learning, plus de cent projets. Mis à jour en mai 2026.
En bref — L'immersive learning (apprentissage immersif) échoue rarement par manque de contenu : il échoue parce que l'apprenant décroche. La réalité virtuelle capte l'attention, mais l'immersion seule ne suffit pas à engager. Ce qui transforme un apprenant en acteur, c'est le story acting — rendre la main à l'apprenant pour qu'il devienne l'acteur de ses conséquences — articulé avec trois méthodes pédagogiques éprouvées : la taxonomie de Bloom (la trajectoire cognitive), le triangle de Houssaye (la posture), la méthode FALC (la charge cognitive). Ces quatre leviers n'opèrent pas en se mélangeant, mais comme les plans distincts d'un même scénario. C'est leur emboîtement qui rend l'apprentissage immersif efficace — pas leur accumulation.
On a longtemps cru que le problème de l'e-learning était un problème de contenu : pas assez riche, pas assez à jour, pas assez interactif. C'est une erreur de diagnostic. Le contenu n'a jamais été aussi abondant, et les taux de complétion restent désespérément bas. Les apprenants ne décrochent pas parce qu'ils manquent d'information — ils décrochent parce que rien ne les oblige, au sens fort, à rester. Le module tourne en arrière-plan pendant qu'on relève ses mails.
L'immersive learning — l'apprentissage immersif — est né précisément pour briser cette passivité.
Ce point de fuite devient un gouffre dès qu'on touche aux compétences relationnelles. Et ce sont précisément ces compétences qui manquent le plus cruellement là où des agents de première ligne affrontent un public sous tension : l'agent d'accueil d'une collectivité, le soignant face à un patient ou une famille à cran, le vendeur devant un client qui s'emporte, l'agent de sécurité en confrontation. Pour ces métiers, la formation classique — une vidéo de bonnes pratiques, un quiz — ne transmet rien d'utilisable : personne n'a jamais appris à désamorcer une agression en regardant quelqu'un d'autre le faire.
Le problème n'est donc pas cognitif, il est motivationnel et expérientiel. Et c'est un problème qu'on identifiait déjà clairement dès 2018 : les deux écueils structurels de l'EdTech sont l'abandon — c'est-à-dire l'engagement — et la mémorisation. Toute la suite découle de là. Si on ne règle pas l'engagement, le reste est sans objet : un savoir parfaitement structuré que personne ne traverse jusqu'au bout ne forme personne.
L'immersive learning est arrivé avec une promesse réelle sur ce terrain précis. En immersion — que ce soit en réalité virtuelle, en 360° ou en réalité mixte — l'apprenant est là : son cerveau accepte l'environnement comme réel, et il n'est plus distrait par le monde extérieur — pas d'alertes, pas de notifications, pas de fil d'actualité. La captation de l'attention, qui est le préalable de tout apprentissage, est obtenue presque mécaniquement par le dispositif.
Mais c'est ici que se loge la première fausse bonne idée, et c'est l'une des plus tenaces que nous ayons rencontrées en dix ans : croire que l'immersion suffit, et que pouvoir regarder partout, c'est déjà interagir. C'est faux. Un apprenant qui tourne la tête dans une sphère à 360° reste un spectateur. Il choisit où poser son regard, mais son parcours est prédéterminé, et rien de ce qu'il fait n'a de conséquence. L'immersion captive ; elle ne rend pas acteur. Confondre les deux a produit des quantités de contenus VR coûteux et parfaitement passifs — des films à 360° déguisés en formations.
L'immersion règle donc la captation, pas l'engagement. Pour passer de l'attention captée à l'engagement réel, il faut autre chose.
C'est le concept que je développe depuis nos premiers projets immersifs en 2016, et que j'ai formalisé sous le nom de story acting — [dès 2018 dans un article fondateur]. Sa définition tient en une phrase : rendre la main au spectateur pour en faire l'acteur de ses conséquences. Chaque décision de l'apprenant infléchit la suite de l'histoire ; ce qu'il fait compte, et il le sait.
Ce concept n'est pas né de la pédagogie. Il est né du game design et des sciences de la motivation — des travaux sur l'immersion spatiale et émotionnelle (Björk et Holopainen), sur le récit comme moteur d'attention (Ernest Adams), sur la motivation du joueur (Celia Hodent). C'est précisément ce qui en fait sa valeur pour la formation : il importe dans l'apprentissage la seule discipline qui ait fait de l'engagement son obsession, là où la pédagogie classique a toujours pu le tenir pour acquis. Quand un apprenant doit venir en salle, l'engagement n'est pas un problème de conception. En digital et en autonomie, il devient le problème — et c'est celui que le story acting attaque de front.
Le ressort n'est pas le divertissement, c'est l'agentivité : le sentiment d'avoir prise sur le cours des choses. C'est lui qui crée la charge émotionnelle, et donc l'ancrage mémoriel d'une situation vécue plutôt que lue. L'interaction, pour produire cet effet, doit être offerte au bon niveau, sans surcharge, et le plus naturellement possible — ce que nous appelons des interactions bio-inspirées, intuitives au point de se faire oublier. La richesse d'une interaction tient à ce qu'on ne voit pas : sa simplicité apparente pour l'apprenant, malgré la complexité du traitement en coulisses.

Le story acting est le moteur. Mais un moteur sans châssis ne va nulle part. L'engagement, à lui seul, ne produit pas d'apprentissage : il produit une expérience marquante, ce qui n'est pas la même chose. Pour que l'émotion se convertisse en compétence, trois méthodes éprouvées entrent en jeu — non comme des ingrédients qu'on mélange, mais comme les plans distincts d'un même scénario.
- La taxonomie de Bloom (formulée par Benjamin Bloom en 1956, révisée en 2001) donne la trajectoire cognitive : mémoriser, comprendre, appliquer, analyser, évaluer, créer. En formation classique on reste souvent coincé dans les deux premiers niveaux. L'immersion, parce qu'elle fait agir, rend opérables les niveaux supérieurs : on n'évalue plus une décision sur un quiz, on la prend sous contrainte. Bloom décide ce que l'apprenant doit savoir faire à la sortie.
- Le triangle de Houssaye (1988) décide qui pilote et qui s'efface. Son apport contre-intuitif est qu'on ne peut pas activer simultanément les trois pôles — savoir, formateur, apprenant : dans toute situation, l'un « fait le mort ». Le cours magistral fait taire l'apprenant. Le story acting bascule délibérément la situation vers l'axe apprenant–savoir : le formateur n'est plus le transmetteur en direct, il devient concepteur du scénario et accompagnateur du débriefing, là où son intervention a le plus de valeur. Ce n'est pas un équilibre ; c'est un choix de posture assumé.
- La méthode FALC (Facile à Lire et à Comprendre) décide ce qu'on n'impose pas inutilement à l'attention. Conçue pour l'accessibilité cognitive, elle devient en VR une discipline universelle : dans un environnement déjà saturé de stimuli, toute consigne illisible se paie en surcharge et tue l'engagement qu'on vient d'allumer. Une idée par message, une interface dépouillée, un vocabulaire concret : on ne gaspille pas la charge mentale sur l'outil, on la réserve à l'apprentissage.
Un agent d'accueil face à un usager qui hausse le ton et menace de déraper. C'est précisément le type de compétence qu'aucune vidéo de bonne pratique ne transmet : on ne comprend pas la désescalade, on l'éprouve.
Le story acting ouvre la scène et place l'apprenant en première personne face à l'usager. Sa réaction — le choix des mots, mais aussi le moment où il parle et le registre qu'il adopte — fait monter ou redescendre la tension en temps réel. Il ne coche pas la « bonne réponse » : il vit les conséquences d'un ton mal ajusté autant que d'une phrase maladroite.
- Bloom structure la difficulté en arrière-plan : reconnaître les signaux d'escalade, appliquer les techniques de reformulation et d'apaisement, puis analyser une situation qui résiste et ajuster sa stratégie quand la première approche échoue — les niveaux cognitifs montent sans qu'il ait l'impression de réviser une fiche.
-Houssaye fixe la posture : aucun formateur en surplomb pendant l'échange, l'apprentissage se fait par confrontation directe à la situation, et le formateur réapparaît au débriefing — là, sur une soft skill, son regard sur ce qui s'est joué vaut de l'or.
-FALC garde l'ensemble jouable : les rares consignes sont courtes et univoques, l'interface ne dit qu'une chose à la fois, et pas un gramme de charge mentale n'est gaspillé sur « comment ça marche » au moment précis où toute l'attention doit aller à l'autre.
Les quatre opèrent en même temps, sur quatre plans, dans la même minute d'expérience. Sans story acting, la progression de Bloom redevient un parcours subi, la bascule de Houssaye retombe en transmission passive, et la sobriété FALC ne sert qu'à délivrer un contenu qu'on endure. Sans les trois autres, le story acting produit un beau jeu dont on ne retient rien d'utile. C'est l'emboîtement qui fait l'efficience — pas l'accumulation.
Ce scénario n'a rien de spécifique à un guichet de mairie. C'est le même moteur qui se décline partout où un professionnel encaisse la tension du public : le soignant qui doit annoncer une mauvaise nouvelle à une famille à bout, le vendeur confronté à un client agressif, l'agent de sécurité qui doit faire respecter une consigne sans que le ton ne dérape. Mêmes signaux à lire, même nécessité de s'entraîner pour de vrai, même impossibilité d'y arriver avec une vidéo. Ce qui change d'un secteur à l'autre, c'est l'habillage de la scène ; ce qui ne change pas, c'est la mécanique qui rend l'entraînement efficace. (Voir notre page dédiée : former ses agents à la désescalade face à l'agressivité du public.)

L'expertise, en immersive learning, ne se mesure pas au nombre de méthodes qu'on cite mais au nombre d'erreurs qu'on a cessé de commettre. Quelques convictions, payées par l'expérience :
L'immersion n'augmente pas mécaniquement la rétention de tout. Elle excelle sur l'apprentissage procédural et contextuel — les gestes, l'enchaînement d'actions, la décision en situation — et sur le transfert vers le réel quand celui-ci est trop coûteux, dangereux ou rare à reproduire. Elle est rarement le moyen le plus efficient de transmettre du savoir purement déclaratif. Vouloir tout passer en immersif est une fausse bonne idée ; l'immersive learning est spécifique, pas universel.
Plus de technologie ne signifie pas plus d'apprentissage. Haptique, photoréalisme, complexité d'interaction : autant d'ajouts qui impressionnent en démonstration et nuisent en formation s'ils ne servent pas une intention pédagogique explicite. L'effet de nouveauté gonfle les premiers résultats puis retombe ; ce qui reste, c'est la qualité du scénario.
Et le piège le plus fréquent : faire de l'engagement une fin. L'engagement est un moyen. S'il ne débouche pas sur une compétence transférée, on a produit un divertissement, pas une formation.
Cette mécanique n'est pas un modèle d'atelier : elle se vérifie sur des déploiements réels. Lors d'une formation à la désescalade d'insultes envers des agents de l'État, conçue pour l'INSEE (Ministère de l'Économie et des Finances) (105 apprenants), 65 % des agents déjà en poste déclaraient à l'issue de la session qu'ils allaient modifier leur comportement, et 88 % jugeaient les situations réalistes — le réalisme étant le préalable de tout transfert. Plus tôt, les agents d'Atalian avaient été formés en réalité virtuelle par le jeu avec WiXar, un cas relayé jusque sur BFM Business. Ces retours mesurent la réception et l'intention, non un changement constaté sur le terrain ; ils indiquent une direction, pas une preuve d'efficacité absolue.
L'obstacle n'a jamais été la pertinence pédagogique de l'immersif — c'était le coût et la complexité de production qui réservaient la bonne VR à quelques budgets. C'est ce verrou que WiXar fait sauter : une interface de conception no-code en spatial computing qui permet à un ingénieur pédagogique, sans compétence de développement, de construire des scénarios où la trajectoire de Bloom, la posture de Houssaye, la sobriété FALC et les embranchements du story acting s'orchestrent directement.
Ce n'est pas un hasard si la méthode et l'outil procèdent de la même histoire — de WideWebVR aux premières expériences à 360° jusqu'à WiXar aujourd'hui. Le story acting a été pensé pour être produit, pas seulement décrit. WiXar ne se contente donc pas de rendre la VR accessible : il rend accessible la VR qui fonctionne — celle où la technologie sert l'engagement, l'engagement sert l'apprentissage, et rien n'est ajouté qui ne serve les deux.
Quelles méthodes pédagogiques utiliser pour une formation en immersive learning ?
Quatre leviers se complètent : la taxonomie de Bloom pour structurer la progression cognitive, le triangle de Houssaye pour définir la posture entre formateur, apprenant et savoir, la méthode FALC pour limiter la charge cognitive, et le story acting pour engager l'apprenant en le rendant acteur de ses conséquences. L'enjeu n'est pas de les additionner mais de les faire opérer simultanément, sur des plans distincts, dans un même scénario — qu'il soit déployé en réalité virtuelle, en 360° ou en réalité mixte.
Qu'est-ce que le story acting ?
Le story acting consiste à rendre la main à l'apprenant pour qu'il devienne l'acteur de ses conséquences : chaque décision infléchit la suite de l'expérience. Formalisé par Benjamin Atlani (WiXar) à partir de 2016, le concept est issu du game design et des sciences de la motivation, et appliqué à la formation immersive pour résoudre le problème d'engagement que la pédagogie classique n'avait pas à traiter.
Pourquoi l'e-learning classique a-t-il de faibles taux de complétion ?
Parce que son problème n'est pas le contenu mais l'engagement. Un module passif, qu'on suit en faisant autre chose, ne crée ni motivation ni compétence durable — particulièrement pour les compétences relationnelles, qui s'acquièrent par la pratique en situation, pas par le visionnage.
L'immersive learning améliore-t-il vraiment la mémorisation ?
L'immersion (réalité virtuelle, 360°, réalité mixte) excelle sur l'apprentissage procédural et contextuel et sur le transfert vers des situations difficiles à reproduire (risques, gestes techniques, relations difficiles). Elle n'augmente pas mécaniquement la rétention de tout type de savoir, et reste peu efficiente pour du contenu purement déclaratif. Son efficacité dépend de la qualité du scénario, pas de la technologie employée.
Peut-on créer une formation immersive sans savoir coder ?
Oui. WiXar est un outil de conception no-code en spatial computing qui permet à un concepteur de formation de construire et d'adapter des scénarios immersifs sans compétence de développement.
Pour aller plus loin : découvrez comment former vos agents à la désescalade face à l'agressivité du public, ou demandez une démo de WiXar (bouton en haut à droite).