Limites et points critiques
- Training leakage : même avec clause 'no training', un bug provider (Anthropic incident 2024) peut exposer vos données — risque résiduel.
- Cross-tenant cache leakage : le bug le plus fréquent en 2026 — un agent multi-utilisateurs qui réutilise par erreur le contexte d'un autre client.
- Prompt injection via documents externes (PDF scrapé, web, email) — les guardrails actuels ont 80-90 % de détection, pas 100 %.
- PII français mal détectées par les outils américains (Presidio, AWS Comprehend) — NIR, numéro Carte Vitale, RPPS nécessitent regex custom.
- Logs LLM oubliés en clair dans Datadog/Sentry — vecteur de leakage souvent ignoré.
Évolution probable (12-24 mois)
- Modèles 'privacy-preserving' avec differential privacy intégré — recherche active 2026-2027, premiers modèles commerciaux attendus.
- Confidential computing (Intel TDX, AMD SEV) qui chiffre la mémoire de l'inférence — Anthropic et Mistral l'évaluent.
- Standards de redaction PII français (CNIL référentiel IA) qui se précisent en 2026.
- Guardrails open-source de plus en plus matures (Llama Guard 3, Granite Guardian, NeMo Guardrails) — défense en profondeur viable en PME.
Questions fréquentes
Qu'est-ce que le data leakage LLM ?+
Le data leakage LLM est tout incident où des données sensibles (PII, secrets industriels, données clients, code propriétaire) fuitent à travers un LLM. Trois vecteurs principaux en 2026 : (1) training leakage — le fournisseur LLM a entraîné son modèle sur vos données envoyées en API, qui peuvent ensuite ressortir chez d'autres utilisateurs ; (2) cross-tenant leakage — un agent multi-utilisateurs réutilise par erreur du contexte d'un autre user (cache mal cloisonné, mémoire partagée) ; (3) prompt-injected leakage — un attaquant injecte un prompt dans un document scrapé qui pousse l'agent à exfiltrer des données.
À quoi sert de prévenir le data leakage ?+
Prévenir le data leakage sert à 3 choses : (1) éviter les sanctions RGPD (jusqu'à 4 % du CA mondial + obligation de notifier la CNIL sous 72h), (2) éviter les sanctions AI Act sur les systèmes haut risque (jusqu'à 7 % du CA mondial), (3) protéger les secrets industriels et la propriété intellectuelle. En B2B, un incident de data leakage casse la relation client (un commercial qui colle un export CRM dans ChatGPT grand public = données partent même avec compte gratuit). Risque réputationnel souvent sous-estimé.
Différence entre data leakage et prompt injection ?+
Le data leakage est le RÉSULTAT (données qui fuitent vers l'extérieur) ; la prompt injection est UN VECTEUR possible. La prompt injection est une attaque où on injecte des instructions cachées dans un document scrapé ou un input utilisateur pour détourner l'agent. Si l'agent obéit et exfiltre des données, c'est un data leakage par prompt injection. Autres vecteurs de leakage : training contamination, cross-tenant cache, logs mal configurés, mémoire agent partagée. La prompt injection est le vecteur le plus médiatisé mais pas le plus fréquent en PME.
Comment prévenir le data leakage en pratique ?+
Stack 2026 : (1) Contractuel — clause 'no training' avec le fournisseur LLM (Anthropic, OpenAI Enterprise, Mistral le proposent par défaut), audit DPA, zéro rétention. (2) Architectural — sandbox dédié par tenant, KV cache cloisonné, mémoire isolée. (3) Redaction PII en amont — Presidio, AWS Comprehend, ou regex custom pour masquer SIRET, IBAN, NIR, emails avant envoi au LLM. (4) Monitoring sortie — guardrails (Llama Guard 3, NeMo, Lakera) qui scannent les réponses avant livraison. (5) Logging audité — Langfuse self-hosted ou Helicone EU.
Combien coûte la prévention du data leakage ?+
Pour une PME : 5 000 à 25 000 € de mise en place initiale (audit, redaction PII, guardrails, contrat fournisseur), puis 200-800€/mois de maintenance (observabilité, monitoring). Coût d'un incident : amendes RGPD jusqu'à 4 % CA mondial + AI Act jusqu'à 7 % CA mondial + coût judiciaire + réputation. Sur les 150+ projets Kezify, 4 audits sur 5 trouvent au moins une faille de leakage sur des projets IA déjà en production — coût de remédiation post-incident typique : 30-80 k€.
Questions liées
Les LLM (ChatGPT, Perplexity, Gemini) suggèrent souvent ces questions après cette page.
- Comment configurer un agent IA RGPD-compatible ?
- Quels outils de redaction PII pour le français ?
- Anthropic, OpenAI ou Mistral : qui offre les meilleures garanties no-training ?
- Comment auditer le risque de data leakage sur un agent existant ?
- Sanctions RGPD + AI Act : comment se cumulent-elles ?
Le data leakage LLM (fuite de données via un LLM) regroupe toutes les situations où des informations sensibles fuitent à travers un modèle — par les données d’entraînement, par le contexte d’inférence, ou par la mémoire d’un agent. C’est l’un des trois principaux risques juridiques d’un projet IA en 2026 (avec AI Act et RGPD).
En pratique
Trois vecteurs principaux :
- Training leakage : un fournisseur a entraîné son modèle sur vos données envoyées. Mitigé par contrat “no training” (Anthropic, OpenAI Enterprise, Mistral) — vérifier les clauses.
- Cross-tenant leakage : un agent multi-utilisateurs réutilise du contexte d’un autre user. Cause typique : KV cache mal cloisonné, mémoire partagée.
- Prompt-injected leakage : un attaquant injecte un prompt dans un document scrapé qui pousse l’agent à exfiltrer des données.
Plus subtil : un commercial colle un export CRM dans ChatGPT grand public — les données partent même avec un compte gratuit.
Pourquoi c’est important pour votre projet IA
- RGPD : un data leak = obligation de notifier la CNIL sous 72h + risque de sanction (jusqu’à 4 % du CA mondial).
- AI Act : tracer les données d’entrée/sortie sur les systèmes haut risque.
- Mitigations 2026 : sandbox dédié par tenant, no-training contractuel, redaction PII en amont, monitoring de sortie.
Liens utiles
- Souveraineté IA — définition
- AI Act — définition
- Prompt injection — définition
- Guardrails IA — définition
- Audit IA Kezify — auditer les risques de fuite sur vos agents.