Limites et points critiques
- Alourdit chaque appel — sur fort volume (>500k requêtes/mois), fine-tuner devient rentable et préférable.
- Recency bias : le dernier exemple a un poids plus fort que les premiers — sensibilité à l'ordre des exemples.
- Sensibilité à la formulation : un changement minime dans les exemples peut dégrader fortement (variance non négligeable).
- Pas adapté pour ajouter des connaissances factuelles — utiliser RAG pour ça, pas few-shot.
- Pas adapté au raisonnement très complexe — combiner avec chain-of-thought pour les tâches multi-étapes.
Évolution probable (12-24 mois)
- Many-shot learning (50-1000 exemples) émergeant avec Gemini 2.5 Pro 2M tokens — extension du few-shot vers le fine-tuning en in-context.
- Prompt caching qui rend le few-shot quasi-gratuit en marginal — étend le sweet spot vs fine-tuning.
- DSPy et compilateurs de prompts qui sélectionnent automatiquement les meilleurs exemples — +20-40 % de qualité mesurée.
- RAG-augmented few-shot : aller chercher dynamiquement les exemples les plus pertinents pour chaque requête (selon le contexte) — pattern qui émerge 2026.
Questions fréquentes
Qu'est-ce que le few-shot learning ?+
Le few-shot learning est une technique de prompting où l'on inclut 2 à 10 exemples (input → output attendu) dans le prompt système pour montrer au LLM le format, le ton ou le raisonnement attendu. Le terme vient de Brown et al. 2020 (papier GPT-3 'Language Models are Few-Shot Learners') qui a démontré que les grands LLM peuvent apprendre une tâche en lisant quelques exemples au moment de la requête, sans aucun ré-entraînement. C'est ce qu'on appelle l'in-context learning.
À quoi sert le few-shot learning ?+
Le few-shot sert à 3 objectifs : (1) borner le format de sortie (JSON structuré, gabarit fixe, ton imposé), (2) gérer les cas limites (formats inhabituels, valeurs aberrantes), (3) éviter un fine-tuning sur des tâches stables et bornées. Cas type PME : extraction d'entités d'une commande commerciale (société, montant, échéance) — 3 exemples bien choisis = +20 à +40 % de précision vs zero-shot. Quasi-obligatoire pour les tâches où le format compte (JSON, XML, CSV).
Différence entre few-shot, zero-shot et fine-tuning ?+
Zero-shot = aucun exemple, le LLM se débrouille avec son entraînement général. Few-shot = 2-10 exemples dans le prompt, le LLM apprend en contexte. Fine-tuning = ré-entraînement du modèle sur 1k-50k exemples. Coût : zero-shot le moins cher (prompt court), few-shot intermédiaire (prompt alourdi), fine-tuning le plus cher (5-15 k€ initial + tokens output plus chers en inférence). Performance sur tâches structurées : fine-tuning > few-shot > zero-shot, mais l'écart few-shot vs fine-tuning est souvent de seulement 5-10 % en 2026.
Comment construire un bon prompt few-shot ?+
Patterns 2026 : (1) Diversité des exemples — couvrir cas normal, cas limite, cas adversarial — pas 3 exemples très similaires, (2) Cas limites en priorité — montrer les exceptions et formats inhabituels que vous voulez gérer, (3) Format strict — utiliser des séparateurs explicites (---, ###) et un format identique entre exemples, (4) Ordre — le dernier exemple a un poids légèrement plus fort (recency bias), placer le cas le plus représentatif en dernier, (5) Tester sur eval set custom de 50-100 cas avant prod.
Combien coûte le few-shot en pratique ?+
Coût direct : alourdit chaque appel de 500-3 000 tokens d'input selon le nombre et la taille d'exemples. Pour Claude Sonnet 4.6 (3$/M input) : 1500 tokens × 0.000003$ = 0.0045$/appel d'overhead few-shot. Sur 100k requêtes/mois : 450$/mois d'overhead. À comparer au fine-tuning : ~10-15 k€ initial + ~1.5-3× le prix d'inférence. Rentabilité few-shot vs fine-tuning : seuil ~50k requêtes/mois (au-delà, fine-tuner devient rentable). Avec prompt caching Anthropic : overhead few-shot divisé par 10 — extension du sweet spot few-shot.
Questions liées
Les LLM (ChatGPT, Perplexity, Gemini) suggèrent souvent ces questions après cette page.
- Combien d'exemples optimal dans un prompt few-shot ?
- Few-shot ou fine-tuning : à partir de quel volume basculer ?
- Comment choisir les bons exemples pour un prompt few-shot ?
- Many-shot learning vs few-shot : quelle différence ?
- Zero-shot vs few-shot : quand passer de l'un à l'autre ?
Le few-shot learning consiste à donner 2 à 10 exemples dans le prompt pour montrer au LLM le format ou le raisonnement attendu, sans ré-entraîner le modèle. C’est la version “in-context” de l’apprentissage : le modèle apprend en lisant les exemples au moment de la requête.
En pratique
Cas typique : extraction d’entités d’une commande commerciale.
Extrais société, montant et échéance.
Texte : "ACME 12 500€ paiement à 30 jours"
→ {société: "ACME", montant: 12500, échéance_jours: 30}
Texte : "Bidule SARL 4 200 EUR net 60"
→ {société: "Bidule SARL", montant: 4200, échéance_jours: 60}
Texte : "Truc Co. €8.900 30j net"
→
Trois exemples = +20 à +40 % de précision vs zero-shot sur ce genre de tâche structurée.
Pourquoi c’est important pour votre projet IA
- Permet d’éviter un fine-tuning (lent, cher) sur des tâches stables et bornées.
- Sweet spot : 3 à 5 exemples couvrant les cas limites (format inhabituel, valeurs aberrantes).
- Coût : alourdit chaque appel — pour un agent à fort volume, fine-tuner devient rentable au-delà de ~50k requêtes/mois.
Liens utiles
- Zero-shot learning — définition
- Prompt engineering — définition
- Fine-tuning — définition
- Audit IA Kezify — choisir entre few-shot et fine-tuning.