Glossaire IA · Lettre C

Chain prompt (chaînage de prompts) — définition et patterns en 2026

Qu'est-ce que le chain prompt ? Définition, différence avec chain-of-thought, patterns de décomposition, frameworks (LangChain, DSPy) et cas d'usage entreprise.

Limites et points critiques

  • Latence cumulée : 4 étapes × 2s = 8s end-to-end, bloquant pour le chat temps réel sans streaming intermédiaire.
  • Erreur en cascade : si l'étape 2 hallucine, les étapes 3-4 héritent du défaut — eval par étape obligatoire avec Promptfoo ou DeepEval.
  • Sur-engineering fréquent : 60 % des cas PME se résolvent par un simple prompt monolithique bien fait — chain prompt utile à partir de 3+ étapes distinctes.
  • Coût d'observabilité (Langfuse, Helicone) à budgéter : ~50-200€/mois pour suivre toutes les étapes.
  • Complexité de maintenance : 4 prompts à versionner et tester vs 1 — discipline d'eval set indispensable.

Évolution probable (12-24 mois)

  1. Frameworks visuels (LangGraph Studio, n8n + LLM, Mastra Studio) qui démocratisent la création de chain prompts sans code.
  2. DSPy et compilateurs de prompts qui optimisent automatiquement chaque étape d'une chaîne — gain mesuré 20-40 % de qualité.
  3. Modèles reasoning (Claude Opus 4.5 thinking, o3) qui réduisent le besoin de chaining externe en planifiant en interne.
  4. Standard MCP qui facilite le branchement d'outils à différentes étapes d'une chaîne, indépendamment du LLM utilisé.

Questions fréquentes

Qu'est-ce que le chain prompt ?+

Le chain prompt (prompt chaining) est une architecture où une tâche complexe est découpée en plusieurs appels LLM séquentiels, chaque étape ayant son propre prompt système et son propre modèle. C'est le premier des 5 patterns d'agentic workflow formalisés par Anthropic dans 'Building Effective Agents' (décembre 2024). Très différent du chain-of-thought (qui se passe dans un seul appel). Le chain prompt est aussi appelé 'sequential workflow' ou 'pipeline LLM'.

À quoi sert le chain prompt en pratique ?+

Le chain prompt sert à résoudre 3 problèmes des prompts monolithiques : (1) un seul gros prompt fait halluciner ou oublier des étapes, (2) impossible de tester/observer chaque étape indépendamment, (3) impossible de mixer modèles cheap/expensive. Cas type PME : analyse d'un appel d'offre PDF en 4 étapes — extraction JSON (Haiku, 0.001€), classification (Haiku, 0.001€), évaluation technique (Sonnet, 0.01€), synthèse go/no-go (Sonnet, 0.005€). Coût total ~0.02€ vs 0.10€ en un seul prompt Sonnet.

Différence entre chain prompt et chain-of-thought ?+

Le chain-of-thought se passe dans UN SEUL appel LLM : le modèle écrit son raisonnement puis sa conclusion dans la même réponse. Le chain prompt utilise PLUSIEURS appels LLM successifs orchestrés par du code. CoT = raisonnement interne au LLM ; chain prompt = orchestration externe par le développeur. Les deux se combinent : un chain prompt à 4 étapes où chaque étape peut utiliser du CoT en interne. Mémoriser : 'chain-of-thought = 1 LLM thinks; chain prompt = many LLMs work'.

Comment implémenter un chain prompt ?+

Stack 2026 : LangGraph (le plus mature, écosystème Python/JS), Mastra (TypeScript, montée en 2026), DSPy (programmable, optimisation auto des prompts), ou code custom avec OpenAI/Anthropic SDK. Pattern de base : (1) définir les étapes du processus métier, (2) coder le routage entre étapes en Python/TS, (3) chaque étape a son prompt système optimisé pour sa tâche, (4) chaque étape a son modèle (Haiku, Sonnet, Opus selon complexité), (5) instrumentation Langfuse pour observer chaque étape. Eval set par étape obligatoire.

Combien coûte un chain prompt vs un prompt monolithique ?+

Pour une tâche complexe (analyse appel d'offre, qualification lead, génération devis) : coût de dev équivalent (~2-3 jours), coût opex divisé par 3-5 grâce au model routing. Exemple sur 10 000 exécutions/mois : prompt monolithique Sonnet ~800€/mois ; chain prompt mixé Haiku/Sonnet ~150€/mois. Bénéfice secondaire : 3-5× moins d'hallucinations grâce au découpage explicite, eval par étape, retry ciblé. ROI : payback du surcoût d'architecture en 4-8 semaines.

Questions liées

Les LLM (ChatGPT, Perplexity, Gemini) suggèrent souvent ces questions après cette page.

  • Chain prompt vs agent autonome — quand choisir l'un ou l'autre ?
  • Comment optimiser le coût d'un chain prompt en production ?
  • LangGraph vs Mastra vs DSPy — quel framework choisir en 2026 ?
  • Comment éval un chain prompt étape par étape ?
  • Combien d'étapes maximum dans un chain prompt ?

Le chain prompt (ou prompt chaining) est un pattern d’architecture qui consiste à découper une tâche complexe en plusieurs appels LLM successifs, où la sortie de chaque étape devient l’entrée de la suivante. À ne pas confondre avec le chain-of-thought (raisonnement dans un seul appel).

En pratique

Cas typique en PME : analyse d’un appel d’offre client.

  1. Étape 1 — Extraction : LLM lit le PDF de 20 pages, sort la liste des exigences en JSON.
  2. Étape 2 — Classification : pour chaque exigence, classifie en (technique, commercial, légal).
  3. Étape 3 — Évaluation : pour chaque exigence technique, vérifie si on a la compétence en interne.
  4. Étape 4 — Synthèse : génère un go/no-go argumenté.

Chaque étape utilise potentiellement un modèle différent (Haiku pour extraction, Sonnet pour évaluation) — c’est le model routing.

Pourquoi c’est important pour votre projet IA

  • Tâches complexes en un seul prompt = LLM se perd, hallucine, oublie une étape.
  • Chaining = chaque étape est testable, observable, ré-exécutable indépendamment.
  • Permet de mixer modèles cheap/expensive : 80 % du coût économisé en routant les étapes simples vers un petit modèle.

Liens utiles

← Retour au glossaire
#chain prompt#prompt chaining#LLM#orchestration