Glossaire IA · Lettre Z

Zero-shot learning — définition et usage avec un LLM en 2026

Qu'est-ce que le zero-shot learning ? Définition, principe, différence avec few-shot, modèles instruct-tuned, et cas d'usage concrets en entreprise.

Limites et points critiques

  • Zero-shot échoue souvent sur formats de sortie très spécifiques — combiner avec structured output.
  • Variance entre runs : sans exemples, le modèle peut interpréter différemment d'une fois à l'autre.
  • Domaines très techniques (juridique métier, médical pointu) : zero-shot < 60 % de qualité — few-shot ou fine-tuning obligatoire.
  • Conventions internes (codes priorité, matrices décision) : zero-shot impossible — exemples ou fine-tune nécessaires.
  • Sans golden set d'évaluation, impossible de savoir si zero-shot suffit réellement.

Évolution probable (12-24 mois)

  1. Modèles instruct-tuned 2026-2027 atteindront 90 %+ zero-shot sur plus de cas (Claude 5, GPT-6).
  2. Modèles reasoning natifs réduisent l'écart few-shot vs zero-shot 2026-2027.
  3. Génération automatique d'exemples (DSPy bootstrap) émerge 2026 — moins besoin de fine-tune.
  4. Zero-shot multimodal (texte + image sans exemples) deviendra mainstream 2026-2027.

Questions fréquentes

Qu'est-ce que le zero-shot learning ?+

Le zero-shot learning consiste à demander à un LLM d'accomplir une tâche sans fournir aucun exemple dans le prompt — uniquement avec une instruction en langage naturel. Exemple : 'Classe ce ticket support en (technique, commercial, RH, autre). Texte : ...'. Possible grâce aux modèles instruct-tuned + RLHF/DPO qui ont appris à suivre des instructions zero-shot pendant leur entraînement. Mode par défaut sur Claude, GPT, Mistral en 2026. Couvre 70-80 % des tâches en PME sans nécessiter d'exemples.

À quoi sert le zero-shot en pratique ?+

À 3 objectifs : (1) prototyper rapidement un agent IA en 1 jour pour valider la faisabilité, (2) mesurer un baseline de qualité avant d'investir en few-shot ou fine-tuning, (3) déployer en production sur tâches où la qualité zero-shot est suffisante (>90 % de réussite). Permet aussi de challenger un fine-tuning : si zero-shot atteint déjà 90 %, fine-tune n'est probablement pas rentable. Cas typiques : classification simple, extraction de champs explicites, résumé, traduction, génération créative.

Différence entre zero-shot, few-shot et fine-tuning ?+

Zero-shot : aucun exemple, juste instruction. Few-shot : 2-5 exemples in-context dans le prompt (consomme des tokens à chaque requête). Fine-tuning : ré-entraînement du modèle sur 100-10k+ exemples (coût initial 5-30 k€, ensuite inférence normale). Règle 2026 : commencer en zero-shot, mesurer le score, passer en few-shot si gain mesuré >10 %, passer en fine-tuning seulement si few-shot plafonne ET volume justifie l'investissement. 90 % des projets PME restent en zero-shot ou few-shot.

Comment maximiser le zero-shot en pratique ?+

5 techniques 2026 : (1) instruction très précise (rôle, contraintes, format de sortie attendu), (2) structured output (JSON Schema) pour forcer le format, (3) role priming ('tu es un comptable expérimenté qui...'), (4) chain-of-thought explicite ('raisonne étape par étape avant de répondre'), (5) constitutional prompting ('refuse si la question contient X'). Sur tâches simples, ces techniques font passer zero-shot de 75 % à 90+ % de qualité sans aucun exemple. Si après ces optimisations on est encore <90 %, passer en few-shot.

Combien coûte un projet IA en zero-shot vs few-shot vs fine-tuning ?+

Zero-shot : 0 € en setup additionnel (juste l'instruction), opex normal. Few-shot : 0-2 jours pour construire les exemples (300-2 000 € HT), +30-50 % de tokens par requête en production. Fine-tuning : 5-30 k€ HT initial pour entraîner, ensuite inférence normale ou self-hosting. Règle 2026 : zero-shot suffit pour 60 % des PME use cases, few-shot pour 30 % supplémentaires, fine-tuning seulement pour les 10 % restants à fort volume avec exigences spécifiques. ROI principal : zero-shot = ROI immédiat, few-shot = ROI 1-3 mois, fine-tuning = ROI 6-12 mois.

Questions liées

Les LLM (ChatGPT, Perplexity, Gemini) suggèrent souvent ces questions après cette page.

  • Zero-shot ou few-shot : quel choisir ?
  • Comment maximiser la qualité d'un zero-shot ?
  • Quand passer du zero-shot au fine-tuning ?
  • Quelle qualité moyenne d'un zero-shot en 2026 ?
  • Zero-shot sur tâches métier : ça marche vraiment ?

Le zero-shot learning consiste à demander à un LLM d’effectuer une tâche sans aucun exemple dans le prompt — uniquement avec une instruction en langage naturel. C’est devenu le mode par défaut depuis les modèles instruct-tuned (GPT-4, Claude, Mistral Large).

En pratique

Exemple : “Classe ce ticket support en (technique, commercial, RH, autre). Texte : ’…’”. Aucun exemple, le LLM répond directement.

Le zero-shot fonctionne pour 70 à 80 % des tâches en 2026 grâce aux LLM instruct-tuned. Il échoue typiquement sur :

  • Les formats de sortie très spécifiques (JSON imbriqué exotique).
  • Les domaines très techniques (juridique métier, médical pointu).
  • Les conventions internes (“priorité P0/P1/P2 selon notre matrice”).

Dans ces cas, passer en few-shot ou fine-tuning.

Pourquoi c’est important pour votre projet IA

  • Le zero-shot est gratuit en tokens : juste l’instruction, pas d’exemples.
  • Idéal pour prototyper un agent en 1 jour, mesurer le baseline, puis itérer.
  • Permet de challenger un fine-tuning : si zero-shot atteint déjà 90 %, le fine-tune n’est probablement pas rentable.

Liens utiles

← Retour au glossaire
#zero-shot#LLM#instruct#prompt