Mise en œuvre

Combien de temps pour déployer un agent IA en production ? (2-6 mois détaillés)

Timeline réaliste d'un projet agent IA en PME française : cadrage, POC, pilote, production. Avec les jalons, les pièges, et les durées réelles observées sur 40 projets.

“On peut avoir ça en production pour la fin du mois ?”. Question qu’on entend chaque semaine. Réponse honnête : non, sauf si vous déployez un assistant ChatGPT sans intégration à vos outils — mais alors ça n’a pas de valeur différenciante.

Voici les vraies durées observées sur 40 projets menés chez Kezify depuis 2024, phase par phase, avec les jalons et les pièges qui font glisser le calendrier.

La réponse courte

Type de projetDurée réalisteFourchette observée
Assistant interne simple (1 source, 5 utilisateurs)6-8 semaines5 à 12 semaines
Agent métier avec 2-3 intégrations3-4 mois10 à 20 semaines
Agent multi-étapes + RAG + garde-fous4-6 mois16 à 28 semaines
Plateforme multi-agents enterprise8-12 mois30 à 50 semaines

Au-dessous de 6 semaines, on livre uniquement si le cas d’usage est extrêmement ciblé. Au-dessus de 12 mois sur un seul agent, il y a un problème de scope.

Phase 1 — Cadrage (2-3 semaines)

Objectif : décider quoi construire et pour qui.

Ce qu’on fait concrètement :

  • Entretiens sponsor métier + 3-5 utilisateurs cibles (1h chacun).
  • Audit des données sources (qualité, accessibilité, RGPD).
  • Cartographie 5-10 cas d’usage candidats, priorisation.
  • Sélection du top 1 à développer en POC.
  • Définition des 5 KPI de succès avec baseline.

Livrable : un document de cadrage de 15-25 pages + un chiffrage précis pour le POC.

Piège fréquent : sauter cette phase. “On connaît nos besoins”. Non, les besoins évoluent entre la pré-vente commerciale et le vrai terrain. Budget sauté = +40 % de dérive garantis sur les phases suivantes.

Phase 2 — POC (2-4 semaines)

Objectif : prouver que la techno tient sur vos vraies données.

Ce qu’on fait :

  • Montage d’un prototype fonctionnel sur Claude 4.6 Sonnet ou Mistral Large.
  • Connexion à 1 source de données réelle (pas de mock).
  • Test sur 50-200 cas représentatifs issus de votre historique.
  • Mesure de la qualité sortie vs attendu.
  • Identification des 3-5 cas d’échec les plus graves.

Livrable : prototype démontrable + rapport de qualité + recommandation go / no-go production.

Piège fréquent : présenter un POC qui marche sur 10 cas bien choisis comme une preuve. Un POC doit être testé sur 50-200 cas non triés pour être crédible.

Phase 3 — Pilote (4-8 semaines)

Objectif : faire fonctionner en conditions réelles sur un périmètre restreint.

Ce qu’on fait :

  • Intégration dans l’outil métier final (Zendesk, Salesforce, SharePoint, etc.).
  • Mise en place de l’observabilité (Langfuse + dashboard métier).
  • Garde-fous anti-hallucination + validation humaine sur 100 % des sorties.
  • Formation 3-5 utilisateurs pilotes.
  • Déploiement sur 10-20 % du volume total.
  • Itérations hebdomadaires sur les cas qui cassent.

Livrable : agent déployé sur périmètre restreint + métriques hebdo + liste d’ajustements faits.

Piège fréquent : ouvrir le pilote à trop d’utilisateurs trop tôt. Si vous démarrez avec 30 utilisateurs et que l’agent a un problème, vous avez 30 personnes frustrées. Commencer à 5 permet d’itérer vite sans casser la confiance.

Phase 4 — Production (2-4 semaines)

Objectif : généraliser à tout le périmètre.

Ce qu’on fait :

  • Passage de 20 % à 100 % du volume progressivement (20 %, 50 %, 100 %).
  • Automatisation du monitoring alerting (Langfuse + Grafana).
  • Documentation utilisateur finale.
  • Formation des N+1 et des managers.
  • Transfert de compétence à l’équipe interne qui reprendra la main.
  • Plan de maintenance formalisé (qui patch les prompts quand le modèle change).

Livrable : agent en production, équipe interne formée, runbook en place.

Piège fréquent : considérer qu’un agent “en production” est fini. Les LLM évoluent tous les 3 mois, les prompts vieillissent, les données changent. Budget de maintenance à prévoir : 15-25 % du coût initial par an.

Le calendrier type pour un projet “agent support client”

Exemple concret chiffré, cas vu 8 fois chez nous :

SemainePhaseEffort consultantEffort client
1-2Cadrage5 j-h3 j-h (entretiens + audit)
3-5POC12 j-h2 j-h (revue hebdo)
6-12Pilote25 j-h5 j-h (tests + feedback)
13-14Production8 j-h3 j-h (go-live + formation)
15+Maintenance1 j-h / mois0,5 j-h / mois

Total : 11 à 14 semaines selon les ajustements, 50 jours-homme consultant, 13 jours-homme client.

Ce qui accélère vraiment le calendrier

Vraies accélérations observées :

  • Décision rapide — un sponsor qui valide en 48h au lieu de 2 semaines fait gagner 3-4 semaines sur le projet total.
  • Données propres dès le jour 1 — un CSV bien structuré plutôt que 4 bases à rapprocher économise 2-3 semaines de pilote.
  • Outil métier qui a une API moderne — Zendesk, Salesforce, Shopify récents : 1 semaine. ERP custom des années 2000 : +4 semaines.
  • Utilisateurs pilotes motivés — 5 utilisateurs qui veulent l’outil vs 5 qui le subissent : 2-3 semaines gagnées sur le pilote.

Les “hacks” qui ne marchent pas : mettre 3 consultants en parallèle au lieu d’1, sauter le cadrage, court-circuiter les tests utilisateurs. On a essayé. Ça coûte toujours plus cher au final.

Ce qui ralentit systématiquement

  • Indécision sur le périmètre (+1-3 semaines).
  • Changement de sponsor en cours de route (+2-6 semaines).
  • Découverte tardive d’un problème RGPD (+2-4 semaines pour DPA, révision juridique).
  • Intégration à un outil métier legacy sans API propre (+2-6 semaines).
  • Attente de validation IT interne (+1-4 semaines).

Les cas où on allonge volontairement

On refuse de livrer plus vite quand :

  • Le secteur est réglementé (santé, banque, assurance) : on impose +4 semaines minimum pour la revue conformité.
  • Les volumes sont massifs (>100k cas / mois) : on impose un pilote à 10 % minimum pendant 6 semaines avant généralisation.
  • Le cas d’usage touche directement des clients externes (pas interne) : on double la phase de tests + garde-fous.

Livrer vite un projet qui cassera dans 3 mois est pire que livrer lentement un projet qui tient 3 ans.

Pour estimer votre projet

Si vous voulez une estimation sur votre cas précis, 30 minutes au téléphone. On vous dit la fourchette réaliste basée sur votre secteur, vos outils existants et votre niveau de maturité équipe. Sans engagement.

Pour aller plus loin

← Retour au blog
#timeline#projet#agent IA#méthode