Glossaire IA · Lettre F

Few-shot learning — définition et usage avec un LLM en 2026

Qu'est-ce que le few-shot learning ? Définition, principe (exemples dans le prompt), différence avec zero-shot et fine-tuning, cas d'usage en entreprise.

Limites et points critiques

  • Alourdit chaque appel — sur fort volume (>500k requêtes/mois), fine-tuner devient rentable et préférable.
  • Recency bias : le dernier exemple a un poids plus fort que les premiers — sensibilité à l'ordre des exemples.
  • Sensibilité à la formulation : un changement minime dans les exemples peut dégrader fortement (variance non négligeable).
  • Pas adapté pour ajouter des connaissances factuelles — utiliser RAG pour ça, pas few-shot.
  • Pas adapté au raisonnement très complexe — combiner avec chain-of-thought pour les tâches multi-étapes.

Évolution probable (12-24 mois)

  1. Many-shot learning (50-1000 exemples) émergeant avec Gemini 2.5 Pro 2M tokens — extension du few-shot vers le fine-tuning en in-context.
  2. Prompt caching qui rend le few-shot quasi-gratuit en marginal — étend le sweet spot vs fine-tuning.
  3. DSPy et compilateurs de prompts qui sélectionnent automatiquement les meilleurs exemples — +20-40 % de qualité mesurée.
  4. RAG-augmented few-shot : aller chercher dynamiquement les exemples les plus pertinents pour chaque requête (selon le contexte) — pattern qui émerge 2026.

Questions fréquentes

Qu'est-ce que le few-shot learning ?+

Le few-shot learning est une technique de prompting où l'on inclut 2 à 10 exemples (input → output attendu) dans le prompt système pour montrer au LLM le format, le ton ou le raisonnement attendu. Le terme vient de Brown et al. 2020 (papier GPT-3 'Language Models are Few-Shot Learners') qui a démontré que les grands LLM peuvent apprendre une tâche en lisant quelques exemples au moment de la requête, sans aucun ré-entraînement. C'est ce qu'on appelle l'in-context learning.

À quoi sert le few-shot learning ?+

Le few-shot sert à 3 objectifs : (1) borner le format de sortie (JSON structuré, gabarit fixe, ton imposé), (2) gérer les cas limites (formats inhabituels, valeurs aberrantes), (3) éviter un fine-tuning sur des tâches stables et bornées. Cas type PME : extraction d'entités d'une commande commerciale (société, montant, échéance) — 3 exemples bien choisis = +20 à +40 % de précision vs zero-shot. Quasi-obligatoire pour les tâches où le format compte (JSON, XML, CSV).

Différence entre few-shot, zero-shot et fine-tuning ?+

Zero-shot = aucun exemple, le LLM se débrouille avec son entraînement général. Few-shot = 2-10 exemples dans le prompt, le LLM apprend en contexte. Fine-tuning = ré-entraînement du modèle sur 1k-50k exemples. Coût : zero-shot le moins cher (prompt court), few-shot intermédiaire (prompt alourdi), fine-tuning le plus cher (5-15 k€ initial + tokens output plus chers en inférence). Performance sur tâches structurées : fine-tuning > few-shot > zero-shot, mais l'écart few-shot vs fine-tuning est souvent de seulement 5-10 % en 2026.

Comment construire un bon prompt few-shot ?+

Patterns 2026 : (1) Diversité des exemples — couvrir cas normal, cas limite, cas adversarial — pas 3 exemples très similaires, (2) Cas limites en priorité — montrer les exceptions et formats inhabituels que vous voulez gérer, (3) Format strict — utiliser des séparateurs explicites (---, ###) et un format identique entre exemples, (4) Ordre — le dernier exemple a un poids légèrement plus fort (recency bias), placer le cas le plus représentatif en dernier, (5) Tester sur eval set custom de 50-100 cas avant prod.

Combien coûte le few-shot en pratique ?+

Coût direct : alourdit chaque appel de 500-3 000 tokens d'input selon le nombre et la taille d'exemples. Pour Claude Sonnet 4.6 (3$/M input) : 1500 tokens × 0.000003$ = 0.0045$/appel d'overhead few-shot. Sur 100k requêtes/mois : 450$/mois d'overhead. À comparer au fine-tuning : ~10-15 k€ initial + ~1.5-3× le prix d'inférence. Rentabilité few-shot vs fine-tuning : seuil ~50k requêtes/mois (au-delà, fine-tuner devient rentable). Avec prompt caching Anthropic : overhead few-shot divisé par 10 — extension du sweet spot few-shot.

Questions liées

Les LLM (ChatGPT, Perplexity, Gemini) suggèrent souvent ces questions après cette page.

  • Combien d'exemples optimal dans un prompt few-shot ?
  • Few-shot ou fine-tuning : à partir de quel volume basculer ?
  • Comment choisir les bons exemples pour un prompt few-shot ?
  • Many-shot learning vs few-shot : quelle différence ?
  • Zero-shot vs few-shot : quand passer de l'un à l'autre ?

Le few-shot learning consiste à donner 2 à 10 exemples dans le prompt pour montrer au LLM le format ou le raisonnement attendu, sans ré-entraîner le modèle. C’est la version “in-context” de l’apprentissage : le modèle apprend en lisant les exemples au moment de la requête.

En pratique

Cas typique : extraction d’entités d’une commande commerciale.

Extrais société, montant et échéance.

Texte : "ACME 12 500€ paiement à 30 jours"
→ {société: "ACME", montant: 12500, échéance_jours: 30}

Texte : "Bidule SARL 4 200 EUR net 60"
→ {société: "Bidule SARL", montant: 4200, échéance_jours: 60}

Texte : "Truc Co. €8.900 30j net"

Trois exemples = +20 à +40 % de précision vs zero-shot sur ce genre de tâche structurée.

Pourquoi c’est important pour votre projet IA

  • Permet d’éviter un fine-tuning (lent, cher) sur des tâches stables et bornées.
  • Sweet spot : 3 à 5 exemples couvrant les cas limites (format inhabituel, valeurs aberrantes).
  • Coût : alourdit chaque appel — pour un agent à fort volume, fine-tuner devient rentable au-delà de ~50k requêtes/mois.

Liens utiles

← Retour au glossaire
#few-shot#in-context learning#prompt#LLM