Le contexte
Un cabinet de conseil en stratégie français (bureau à Paris et à Lyon, 15 consultants, ~4 M€ CA) nous contacte en novembre 2025. Problématique claire : chaque associé passe 3 à 5 heures à rédiger une proposition commerciale, souvent le soir et le week-end. Résultat : les propales ne partent pas assez vite (48-72 h vs 24 h attendu par le marché), elles sont inégales en qualité selon l’associé qui rédige, et elles pillent le temps de développement commercial.
Le managing partner nous dit : “On perd des opportunités qu’on ne devrait pas perdre, juste parce qu’on répond trop lentement. Et les 4 heures de propale par opp, c’est 4 heures en moins pour faire du terrain.”
Les 3 frictions trouvées en audit (2 semaines)
1. Pas de capitalisation sur les propales passées
Le cabinet a produit ~200 propales sur les 3 dernières années. Chaque propale est repartie d’un template quasi blanc. Les meilleurs arguments, les cas client pertinents, les éléments différenciants étaient réécrits à chaque fois de tête.
2. La bibliothèque de cas clients est désorganisée
180 cas clients sur SharePoint, dont environ 60 qui sont vraiment réutilisables (anonymisés, clients qui acceptent d’être cités). Mais :
- Dispersés dans 4 arborescences différentes selon les périodes.
- 50 % ne sont pas taggés par secteur ou par type de mission.
- 20 % sont obsolètes et à archiver.
- Retrouver le bon cas prend 15-30 minutes.
3. Pas de ton standardisé entre associés
Chaque associé rédige avec son style. Les clients qui ont déjà reçu 2 propales du cabinet remarquent l’incohérence.
La solution déployée
Phase 2 du projet (8 semaines) : un agent IA de génération de propales qui :
- Prend en entrée : un brief de 5-15 lignes (secteur client, type de mission, enjeu principal, budget indicatif, délai) saisi par l’associé dans un formulaire simple.
- Interroge la base RAG de propales passées + cas clients pour identifier les 3-5 plus pertinents.
- Génère une propale v0 structurée dans le template du cabinet : contexte, compréhension de l’enjeu, approche proposée, références, méthodologie, livrables, planning, équipe, chiffrage.
- Propose un ton aligné sur le style éditorial du cabinet (ajusté avec 20 propales récentes annotées comme “bon exemple”).
- Laisse l’associé éditer dans un Google Doc préparé, avec commentaires sur les zones à personnaliser en priorité.
Architecture technique
- Modèle principal : Claude 4.6 Sonnet via Anthropic EU direct, DPA signé.
- Modèle léger : Claude 4.5 Haiku pour la classification initiale du brief.
- RAG : PgVector self-hosted sur VPS Scaleway avec chunking sémantique + re-ranking Cohere Rerank v3.
- Base documentaire : 200 propales + 60 cas clients + 40 ressources internes (études sectorielles, vocabulaire métier, méthodologie cabinet) indexées en 1 mois.
- Interface : Retool custom avec formulaire brief + bouton “générer”, Google Docs en sortie.
- Observabilité : Langfuse self-hosted pour tracer chaque génération.
Ce qu’on a mesuré
Baseline (novembre 2025, 20 propales chronométrées) :
- Temps de rédaction v0 : 3 h 45 min moyen.
- Temps de revue + envoi : 45 min moyen.
- Total : 4 h 30 min par propale.
Après 6 semaines de production (février 2026, 34 propales chronométrées) :
| Métrique | Avant | Après | Delta |
|---|---|---|---|
| Temps brief → v0 générée | 4 h | 8 min | -96 % |
| Temps édition humaine | 0 | 35 min | +35 min |
| Temps revue + envoi | 30 min | 15 min | -50 % |
| Temps total | 4 h 30 min | 58 min | -78 % |
| Taux de propales envoyées < 24h | 12 % | 81 % | +69 points |
| Taux de signature sur opps chaudes | 31 % | 38 % | +7 points |
Le taux de signature qui progresse de 7 points est la surprise qu’on n’attendait pas aussi forte. L’explication partagée avec le client : répondre en moins de 24h signale un niveau de sérieux qui rassure les prospects.
Ce qui a été difficile
Faire accepter le générateur aux associés seniors
Résistance forte des 2 associés les plus expérimentés les premières semaines : “Je perds ma patte dans ce que génère l’outil.”. On a résolu ça en :
- Mode “génération par associé” : chacun peut pousser ses propres propales de référence pour influencer le style de ses futures v0.
- Règle : chaque v0 est jetable. Si l’associé la trouve mauvaise, poubelle, rédaction à la main. Pas d’obligation de l’utiliser.
Résultat : les 2 associés réticents sont devenus les plus gros utilisateurs à la semaine 6.
Nettoyer et annoter la base de cas clients
On a dû passer 1,5 semaine à :
- Archiver 35 cas obsolètes.
- Re-tagger 110 cas par secteur / type de mission / livrable.
- Ajouter des metadata “ok à citer nommément” / “citer anonymisé” / “ne pas citer” selon les accords clients.
Travail ingrat mais critique. Sans ça, l’IA aurait surfait des cas non utilisables en propale.
Prévenir le “génération trop générique”
Premières propales générées étaient trop bien écrites mais trop génériques — vraie critique. On a durci le prompt pour :
- Exiger la mention explicite du nom du prospect et d’un élément propre à son contexte.
- Forcer au moins 2 références clients concrètes avec détails.
- Interdire les formules creuses (“nous vous accompagnons dans votre transformation”).
Après ajustement, les propales se distinguaient d’une concurrence qui restait très générique chez les autres cabinets.
Le ROI
- Coût projet : 32 000 € HT (audit inclus 4 800 €).
- Coût d’exploitation : 85 €/mois API Claude + 20 €/mois Scaleway VPS + 45 €/mois Cohere = 150 €/mois.
- Gain temps associé : 15 propales / mois × 3,5 h gagnées × 350 €/h chargé = 18 400 €/mois, soit 220 k€/an.
- CA additionnel estimé : +7 points de signature sur 45 opps / an à ~40 k€ moyen = ~125 k€ / an en net additionnel.
ROI : atteint en mois 5, porté par le temps libéré des associés.
Ce que dit le client 3 mois après
“On craignait de perdre notre ‘patte’ de cabinet. En fait on a créé la patte. Maintenant tout le cabinet répond avec un ton unifié, plus dense, plus structuré. Les propales qui sortent sont meilleures que nos meilleures propales d’il y a 2 ans. Les associés passent plus de temps en rendez-vous client et en stratégie, moins en rédaction. Et on répond en moins de 24h sur 80 % des opportunités, ce qui transforme le taux de conversion.” — Managing partner.
Prochaine étape chez ce client
Phase 3 en cours (démarrage avril 2026) : extension à la production des livrables de mission (restitutions, analyses sectorielles, notes de synthèse). Budget prévu 45 000 €, ROI attendu sur réduction du temps junior consultant × 12 consultants × 6 h/semaine gagnées.
Pour votre cabinet ?
Si vous dirigez un cabinet de conseil, d’expertise, d’audit ou de services professionnels avec un problème de volume de propales, nos chiffres sont atteignables chez vous. 30 minutes au téléphone pour qualifier, sans engagement.
Pour aller plus loin
- Implémentation Claude / GPT / Mistral en production — projet clé en ma… — Nous cadrons, architecturons et implémentons votre premier projet IA en
- RAG ou fine-tuning ? Le choix technique qui change tout le TCO — Fine-tuner un modèle LLM ou monter un RAG sur votre
- Cas client — automatisation recrutement chez un cabinet RH Lyon (+35 %… — Comment nous avons augmenté de 35 % la capacité de
- Cas client — rédaction de conclusions chez un cabinet d’avocats Paris… — Comment nous avons réduit de 55 % le temps de
- Cas client — triage support pour un e-commerce mode (180k tickets/an) — Comment nous avons réduit de 62 % le temps de
- Combien coûte réellement un projet IA en PME en 2026 ? — Audit, POC, mise en production