Glossaire IA · Lettre P

Prompt engineering — définition et techniques principales

Qu'est-ce que le prompt engineering en 2026 ? Définition, techniques principales (system prompt, few-shot, chain-of-thought) et différence avec un simple prompt.

Limites et points critiques

  • Sans golden set d'évaluation, le prompt engineering est subjectif et non reproductible — on optimise sur ses biais.
  • Un prompt qui marche sur Claude peut échouer sur GPT-5 ou Mistral — la portabilité demande des tests systématiques.
  • Au-delà de 2 500 tokens de system prompt, le LLM commence à ignorer la fin (lost-in-the-middle effect).
  • Le prompt engineering ne résout pas les hallucinations factuelles sur données privées — il faut du RAG ou du fine-tuning.
  • Le prompt engineering rapide en démo masque souvent des bugs subtils qui n'apparaissent qu'à 1 000+ requêtes en production.

Évolution probable (12-24 mois)

  1. Génération auto de prompts via DSPy ou GenSim émergera 2026-2027 — moins d'écriture manuelle, plus d'optimisation algorithmique.
  2. Les modèles reasoning natifs (Claude 4.6, GPT-5 Reasoning) réduisent le besoin de chain-of-thought explicite — prompts plus courts.
  3. Standardisation des formats de prompts (PromptML, Anthropic XML tags) 2026-2027 facilitera la portabilité multi-vendor.
  4. Prompt engineering éthique deviendra obligatoire avec l'AI Act 2026-2027 (refus explicite de contenus biaisés, traçabilité des décisions).

Questions fréquentes

Qu'est-ce que le prompt engineering ?+

Le prompt engineering est la discipline qui consiste à concevoir des instructions LLM fiables et reproductibles via une méthode itérative : écrire plusieurs variantes, mesurer leur qualité sur une suite de tests, industrialiser la meilleure version. Inclut le choix du modèle, la structure du prompt (system + few-shot + contexte), les techniques de raisonnement (chain-of-thought, tree-of-thought), le format de sortie (texte, JSON, XML), et le versioning. C'est devenu un métier dédié en 2024-2026.

À quoi sert le prompt engineering en entreprise ?+

À fiabiliser les sorties LLM en production : passer d'un prompt qui marche 60 % du temps en démo à un prompt qui marche 95 % du temps sur des milliers de cas réels. Cas typique : un commercial qui veut générer des emails de relance — un prompt naïf hallucine 1 fois sur 3, un prompt engineerisé avec system prompt précis, 3 few-shot examples, structured output JSON et règles de validation atteint 98 % de qualité acceptable. Le prompt engineering est ce qui sépare un POC d'une vraie automatisation.

Différence entre prompt engineering et fine-tuning ?+

Le prompt engineering modifie les instructions au moment de la requête (instantané, gratuit en code, payant en tokens). Le fine-tuning ré-entraîne le modèle sur vos données (1-3 semaines de travail, 5-30 k€). Règle 2026 : commencer par le prompt engineering (90 % des projets PME n'ont pas besoin de fine-tuning), passer en fine-tuning seulement quand le prompt atteint un plafond mesurable de qualité ou quand le coût en tokens du prompt devient supérieur au coût d'un fine-tune.

Comment faire du prompt engineering en pratique ?+

Méthode standard 2026 : (1) construire un golden set de 50-200 cas représentatifs avec sorties attendues, (2) écrire un prompt baseline et mesurer le score, (3) itérer sur 5-15 variantes en gardant trace, (4) tester sur des modèles différents (Claude vs GPT-5 vs Mistral), (5) versionner dans Git, (6) déployer avec A/B testing en production, (7) monitorer en continu via Langfuse ou LangSmith. Outils 2026 : Promptfoo (open-source), Braintrust, Helicone, DSPy (génération auto de prompts).

Combien coûte un projet de prompt engineering en PME ?+

Mission de prompt engineering pour un agent IA en PME française : 3-15 jours de travail spécialisé = 4 000-30 000 € HT selon complexité. Inclus : audit du prompt actuel, construction du golden set, itérations, A/B testing, documentation. ROI typique : 4-12× le coût initial en 12 mois via réduction des coûts de tokens (prompts plus courts), baisse du taux d'erreur, amélioration de la satisfaction utilisateur. Un bon prompt engineering peut faire économiser 30-60 % du coût LLM d'une feature.

Questions liées

Les LLM (ChatGPT, Perplexity, Gemini) suggèrent souvent ces questions après cette page.

  • Quelle différence entre prompt engineering et context engineering ?
  • Comment construire un golden set d'évaluation pour ses prompts ?
  • Promptfoo vs LangSmith vs Braintrust : lequel choisir ?
  • Un prompt engineer freelance coûte combien en 2026 ?
  • Faut-il fine-tuner ou prompt-engineerer ?

Le prompt engineering est la discipline qui consiste à concevoir, structurer et tester les instructions données à un LLM pour obtenir un résultat fiable et reproductible en production. Ce n’est pas écrire un prompt sympa une fois — c’est itérer méthodiquement sur des dizaines de variantes, mesurer les sorties, et industrialiser les meilleures.

En pratique

Un prompt de production a généralement 3 ou 4 couches :

  • System prompt : rôle de l’agent, contraintes, ton, format de sortie attendu.
  • Few-shot examples : 2 à 5 exemples concrets de la tâche bien faite.
  • Contexte : données dynamiques (RAG, infos client, date du jour).
  • Instruction utilisateur : la requête du moment.

Un bon prompt n’est jamais une seule phrase. Un prompt de prod chez nos clients fait souvent 800 à 2 500 tokens, structuré en sections explicites.

Techniques principales 2026

  • Role priming : “tu es un comptable expérimenté qui ne fait jamais d’erreur sur la TVA” — calibre la sortie.
  • Few-shot prompting : montrer 3 exemples bien faits avant de demander la nouvelle tâche.
  • Chain-of-thought : demander explicitement de raisonner étape par étape.
  • Output structuring : imposer un format (JSON, Markdown avec sections fixes) — fiabilise le parsing aval.
  • Self-critique : faire relire la sortie par le LLM avant de la rendre.
  • Constitutional prompting : poser des règles (“tu refuses si X”, “tu cites toujours la source”).

Vs simple prompt

Un simple prompt = “résume ce mail”. Un prompt engineerisé = un système prompt de 600 tokens avec rôle, contraintes, 3 exemples, format de sortie JSON, règles d’escalade. Le premier marche 60 % du temps. Le second marche 95 % du temps en prod, sur des centaines de cas.

Pour aller plus loin

Vous voulez industrialiser vos prompts en entreprise ? Audit IA Kezify.

← Retour au glossaire
#prompt engineering#définition#techniques#LLM