Conseil / stratégie

Cas client — générateur de propales pour un cabinet de conseil (15 consultants)

Comment nous avons réduit le temps de production d'une proposition commerciale de 4 h à 45 min pour un cabinet de conseil stratégie français, avec ROI au mois 5.

Client
Cabinet de conseil en stratégie français (confidentiel)
Durée
10 semaines

Le contexte

Un cabinet de conseil en stratégie français (bureau à Paris et à Lyon, 15 consultants, ~4 M€ CA) nous contacte en novembre 2025. Problématique claire : chaque associé passe 3 à 5 heures à rédiger une proposition commerciale, souvent le soir et le week-end. Résultat : les propales ne partent pas assez vite (48-72 h vs 24 h attendu par le marché), elles sont inégales en qualité selon l’associé qui rédige, et elles pillent le temps de développement commercial.

Le managing partner nous dit : “On perd des opportunités qu’on ne devrait pas perdre, juste parce qu’on répond trop lentement. Et les 4 heures de propale par opp, c’est 4 heures en moins pour faire du terrain.”

Les 3 frictions trouvées en audit (2 semaines)

1. Pas de capitalisation sur les propales passées

Le cabinet a produit ~200 propales sur les 3 dernières années. Chaque propale est repartie d’un template quasi blanc. Les meilleurs arguments, les cas client pertinents, les éléments différenciants étaient réécrits à chaque fois de tête.

2. La bibliothèque de cas clients est désorganisée

180 cas clients sur SharePoint, dont environ 60 qui sont vraiment réutilisables (anonymisés, clients qui acceptent d’être cités). Mais :

  • Dispersés dans 4 arborescences différentes selon les périodes.
  • 50 % ne sont pas taggés par secteur ou par type de mission.
  • 20 % sont obsolètes et à archiver.
  • Retrouver le bon cas prend 15-30 minutes.

3. Pas de ton standardisé entre associés

Chaque associé rédige avec son style. Les clients qui ont déjà reçu 2 propales du cabinet remarquent l’incohérence.

La solution déployée

Phase 2 du projet (8 semaines) : un agent IA de génération de propales qui :

  1. Prend en entrée : un brief de 5-15 lignes (secteur client, type de mission, enjeu principal, budget indicatif, délai) saisi par l’associé dans un formulaire simple.
  2. Interroge la base RAG de propales passées + cas clients pour identifier les 3-5 plus pertinents.
  3. Génère une propale v0 structurée dans le template du cabinet : contexte, compréhension de l’enjeu, approche proposée, références, méthodologie, livrables, planning, équipe, chiffrage.
  4. Propose un ton aligné sur le style éditorial du cabinet (ajusté avec 20 propales récentes annotées comme “bon exemple”).
  5. Laisse l’associé éditer dans un Google Doc préparé, avec commentaires sur les zones à personnaliser en priorité.

Architecture technique

  • Modèle principal : Claude 4.6 Sonnet via Anthropic EU direct, DPA signé.
  • Modèle léger : Claude 4.5 Haiku pour la classification initiale du brief.
  • RAG : PgVector self-hosted sur VPS Scaleway avec chunking sémantique + re-ranking Cohere Rerank v3.
  • Base documentaire : 200 propales + 60 cas clients + 40 ressources internes (études sectorielles, vocabulaire métier, méthodologie cabinet) indexées en 1 mois.
  • Interface : Retool custom avec formulaire brief + bouton “générer”, Google Docs en sortie.
  • Observabilité : Langfuse self-hosted pour tracer chaque génération.

Ce qu’on a mesuré

Baseline (novembre 2025, 20 propales chronométrées) :

  • Temps de rédaction v0 : 3 h 45 min moyen.
  • Temps de revue + envoi : 45 min moyen.
  • Total : 4 h 30 min par propale.

Après 6 semaines de production (février 2026, 34 propales chronométrées) :

MétriqueAvantAprèsDelta
Temps brief → v0 générée4 h8 min-96 %
Temps édition humaine035 min+35 min
Temps revue + envoi30 min15 min-50 %
Temps total4 h 30 min58 min-78 %
Taux de propales envoyées < 24h12 %81 %+69 points
Taux de signature sur opps chaudes31 %38 %+7 points

Le taux de signature qui progresse de 7 points est la surprise qu’on n’attendait pas aussi forte. L’explication partagée avec le client : répondre en moins de 24h signale un niveau de sérieux qui rassure les prospects.

Ce qui a été difficile

Faire accepter le générateur aux associés seniors

Résistance forte des 2 associés les plus expérimentés les premières semaines : “Je perds ma patte dans ce que génère l’outil.”. On a résolu ça en :

  • Mode “génération par associé” : chacun peut pousser ses propres propales de référence pour influencer le style de ses futures v0.
  • Règle : chaque v0 est jetable. Si l’associé la trouve mauvaise, poubelle, rédaction à la main. Pas d’obligation de l’utiliser.

Résultat : les 2 associés réticents sont devenus les plus gros utilisateurs à la semaine 6.

Nettoyer et annoter la base de cas clients

On a dû passer 1,5 semaine à :

  • Archiver 35 cas obsolètes.
  • Re-tagger 110 cas par secteur / type de mission / livrable.
  • Ajouter des metadata “ok à citer nommément” / “citer anonymisé” / “ne pas citer” selon les accords clients.

Travail ingrat mais critique. Sans ça, l’IA aurait surfait des cas non utilisables en propale.

Prévenir le “génération trop générique”

Premières propales générées étaient trop bien écrites mais trop génériques — vraie critique. On a durci le prompt pour :

  • Exiger la mention explicite du nom du prospect et d’un élément propre à son contexte.
  • Forcer au moins 2 références clients concrètes avec détails.
  • Interdire les formules creuses (“nous vous accompagnons dans votre transformation”).

Après ajustement, les propales se distinguaient d’une concurrence qui restait très générique chez les autres cabinets.

Le ROI

  • Coût projet : 32 000 € HT (audit inclus 4 800 €).
  • Coût d’exploitation : 85 €/mois API Claude + 20 €/mois Scaleway VPS + 45 €/mois Cohere = 150 €/mois.
  • Gain temps associé : 15 propales / mois × 3,5 h gagnées × 350 €/h chargé = 18 400 €/mois, soit 220 k€/an.
  • CA additionnel estimé : +7 points de signature sur 45 opps / an à ~40 k€ moyen = ~125 k€ / an en net additionnel.

ROI : atteint en mois 5, porté par le temps libéré des associés.

Ce que dit le client 3 mois après

“On craignait de perdre notre ‘patte’ de cabinet. En fait on a créé la patte. Maintenant tout le cabinet répond avec un ton unifié, plus dense, plus structuré. Les propales qui sortent sont meilleures que nos meilleures propales d’il y a 2 ans. Les associés passent plus de temps en rendez-vous client et en stratégie, moins en rédaction. Et on répond en moins de 24h sur 80 % des opportunités, ce qui transforme le taux de conversion.” — Managing partner.

Prochaine étape chez ce client

Phase 3 en cours (démarrage avril 2026) : extension à la production des livrables de mission (restitutions, analyses sectorielles, notes de synthèse). Budget prévu 45 000 €, ROI attendu sur réduction du temps junior consultant × 12 consultants × 6 h/semaine gagnées.

Pour votre cabinet ?

Si vous dirigez un cabinet de conseil, d’expertise, d’audit ou de services professionnels avec un problème de volume de propales, nos chiffres sont atteignables chez vous. 30 minutes au téléphone pour qualifier, sans engagement.

Pour aller plus loin