Glossary Term

Hallucination IA

Back to Glossaire Index

1 category

L’hallucination IA désigne le phénomène par lequel un système d’intelligence artificielle générative (un agent conversationnel, un générateur de texte ou d’images) produit une information fausse, inventée ou incohérente, tout en la présentant avec une assurance et une fluidité parfaites. Le modèle ne ment pas au sens humain du terme : il génère statistiquement la suite de mots la plus probable, sans disposer d’une véritable conscience du vrai et du faux. Comprendre ce mécanisme est devenu indispensable pour quiconque utilise ChatGPT, Claude, Gemini ou tout autre outil basé sur un grand modèle de langage (LLM).

Définition précise de l’hallucination en intelligence artificielle

Une hallucination est une sortie (texte, code, citation, image) qui n’est pas justifiée par les données d’entraînement ni par le contexte fourni, et qui ne correspond pas à la réalité. Le terme est emprunté à la psychologie par analogie : le modèle « perçoit » quelque chose qui n’existe pas. Contrairement à une simple erreur factuelle isolée, l’hallucination se caractérise par sa plausibilité trompeuse. La réponse semble crédible, bien structurée et professionnelle, ce qui la rend d’autant plus dangereuse : l’utilisateur n’a aucun signal évident lui indiquant que l’information est fabriquée.

On distingue généralement deux grandes familles. L’hallucination intrinsèque contredit directement la source ou le contexte fourni dans la requête. L’hallucination extrinsèque ajoute une information invérifiable ou absente, comme une étude scientifique qui n’existe pas, un article de loi inventé ou une citation attribuée à tort.

Pourquoi une IA hallucine : les causes techniques

L’hallucination n’est pas un bug accidentel : elle découle directement du fonctionnement même des modèles de langage. Un LLM est entraîné à prédire le mot suivant le plus probable, pas à dire la vérité. Plusieurs facteurs précis expliquent le phénomène.

La nature probabiliste du modèle : il optimise la cohérence statistique du texte, pas son exactitude. Quand une information manque, il comble le vide avec ce qui « sonne juste ».
Le cutoff des connaissances : un modèle ne connaît que ce qui figure dans ses données d’entraînement, arrêtées à une date donnée. Interrogé sur un événement récent, il peut inventer une réponse plausible.
Les lacunes et biais des données : si un sujet est rare, ambigu ou mal représenté dans le corpus, le modèle extrapole et improvise.
Les requêtes ambiguës ou orientées : une question mal formulée, ou qui présuppose un fait faux, pousse le modèle à valider cette fausse prémisse plutôt qu’à la corriger.
La température élevée : ce paramètre qui contrôle la créativité augmente la part d’aléatoire, donc le risque d’invention.

Exemples concrets d’hallucinations

Dans le texte et le code

Les cas les plus documentés concernent les références inventées. Un modèle peut citer un livre, un auteur, un numéro d’arrêt juridique ou une référence DOI parfaitement formatés mais totalement fictifs. En 2023, des avocats américains ont été sanctionnés pour avoir soumis au tribunal des décisions de jurisprudence générées par ChatGPT et qui n’avaient jamais existé. En programmation, un LLM peut suggérer une fonction ou une bibliothèque (un package) au nom crédible mais inexistant, un phénomène exploité par des attaquants sous le nom de « slopsquatting ».

Dans la génération d’images

Les générateurs visuels comme Midjourney ou DALL·E hallucinent eux aussi : mains à six doigts, textes illisibles sur une enseigne, objets aux proportions impossibles ou reflets incohérents. Le modèle reproduit des motifs statistiques sans comprendre l’anatomie ou la physique réelle.

Cas d’usage à risque : quand la vigilance est critique

Toutes les hallucinations n’ont pas la même gravité. Demander un brainstorming créatif tolère parfaitement l’imprécision, voire en profite. En revanche, certains domaines exigent une vérification systématique :

Le médical et le juridique : un diagnostic ou un conseil légal erroné peut avoir des conséquences directes et graves.
La finance et la comptabilité : chiffres, taux et obligations réglementaires inventés faussent toute décision.
Le journalisme et la recherche : sources, dates et citations doivent être tracées et confirmées.
La documentation technique : une commande système ou un réglage erroné peut casser un projet.

Comment réduire les hallucinations : méthodes concrètes

On ne supprime pas totalement les hallucinations, mais on réduit fortement leur fréquence avec des techniques éprouvées, côté utilisateur comme côté ingénierie.

Côté utilisateur : bien formuler ses prompts

Fournir le contexte : coller le document source dans la requête force le modèle à s’appuyer sur des faits réels plutôt que sur sa mémoire interne.
Autoriser le « je ne sais pas » : préciser explicitement dans le prompt que le modèle doit répondre « information non disponible » plutôt que d’inventer.
Demander les sources : exiger des citations vérifiables, puis les contrôler une par une.
Décomposer la tâche : une question simple et précise réduit l’ambiguïté et donc le risque d’improvisation.

Côté technique : RAG et vérification

La méthode la plus efficace en entreprise est le RAG (Retrieval-Augmented Generation), qui connecte le modèle à une base documentaire fiable et à jour grâce aux embeddings. Le LLM ne répond plus de mémoire : il s’appuie sur des documents récupérés en temps réel, ce qui ancre ses réponses dans des faits sourcés. S’ajoutent l’abaissement de la température, le réglage fin (fine-tuning) sur un domaine précis, et des couches de vérification automatique qui croisent la réponse avec des sources externes.

Conseils pratiques pour l’utilisateur quotidien

Adoptez un réflexe simple : traitez l’IA comme un assistant brillant mais parfois trop sûr de lui. Ne déléguez jamais une décision importante sans contrôle humain. Vérifiez systématiquement les noms propres, les dates, les chiffres et les citations. Recoupez avec une source officielle dès qu’un enjeu réel est en jeu. Et méfiez-vous justement des réponses qui semblent trop parfaites : la confiance affichée par un modèle n’a aucune corrélation avec son exactitude.

FAQ sur l’hallucination IA

Peut-on supprimer complètement les hallucinations ?

Non, pas à ce jour. Elles sont une conséquence intrinsèque du fonctionnement probabiliste des modèles de langage. On peut toutefois en réduire drastiquement la fréquence avec le RAG, des prompts bien cadrés et une vérification humaine.

Pourquoi l’IA invente-t-elle des sources qui paraissent si vraies ?

Parce qu’elle a appris le format typique d’une référence (un titre, un auteur, une date, un numéro) et le reproduit fidèlement, même quand la source réelle lui manque. La forme est correcte, le fond est inventé.

Tous les modèles hallucinent-ils autant ?

Non. Les modèles récents, équipés de recherche web intégrée et de mécanismes de citation, hallucinent moins que les générations précédentes. Le taux varie aussi selon le domaine, la qualité de la requête et la configuration utilisée.

Une hallucination est-elle la même chose qu’un biais ?

Non. Un biais reflète une tendance systématique héritée des données d’entraînement (stéréotypes, déséquilibres). Une hallucination est une invention factuelle ponctuelle. Les deux phénomènes peuvent coexister mais relèvent de causes différentes.