✓ Ce qui est livré
- Architecture documentée de la solution (techno, flux, sécurité)
- Code source livré, déployé sur votre infra ou sur nos stacks partenaires (AWS/GCP/OVH/Scaleway)
- Connecteurs vers vos systèmes internes (MCP ou API)
- Interface utilisateur finie (web, Slack, email, Claude Desktop)
- Jeu de tests et benchmarks sur vos données réelles
- Formation des 3-5 utilisateurs pilotes (4 h)
- Documentation technique et runbook d'exploitation
- 1 mois de support post-livraison inclus
Limites et points critiques
- Au-dessous de 25 k€ = POC pas production — Kezify le nomme comme tel et adapte le livrable ; ne pas confondre un POC qui fonctionne sur laptop avec un système qui tient en charge en production.
- L'opex LLM en production (40-400 €/mois selon volume) n'est PAS inclus dans le forfait projet — à budgéter explicitement, sinon mauvaise surprise au mois 2.
- L'infrastructure d'hébergement prod n'est pas incluse — hébergement chez le client = gratuit, hébergement sur infra Kezify = 100-400 €/mois selon profil.
- Le 1 mois de support post-livraison est limité aux bugs/ajustements/questions — l'évolution fonctionnelle après la livraison relève d'une maintenance forfait séparée.
- L'engagement de livraison à 60 % de budget protège contre le projet qui dérive sans valeur — mais ne couvre PAS les changements de scope demandés par le client en cours de projet.
Évolution probable (12-24 mois)
- Suite naturelle après implémentation : maintenance forfait 10-20 % du projet/an pour évolutions et monitoring, ou Accompagnement IA 3 mois (12 k€) pour cadrer les cas d'usage 2 et 3.
- Modèles spécialisés sectoriels (FinanceLLM, LegalBERT, HR-Llama) en émergence 2026-2027 — bascule progressive du portfolio à coût/2-3 sans perte de qualité.
- Adoption MCP (Model Context Protocol) par les éditeurs SaaS (Workday, Salesforce, HubSpot, Shopify) annoncée 2026-2027 — supprimera les wrappers custom et baissera le coût d'intégration de 30-40 % sur les futurs projets.
- Formation IA équipe (2 400 € HT/jour) en parallèle de l'implémentation pour préparer l'adoption — bonus +30 % d'adoption à 3 mois post-go-live.
Questions fréquentes
Qu'est-ce qui est livré dans l'implémentation Claude/GPT/Mistral Kezify ?+
Huit livrables : 1) Architecture documentée de la solution (techno, flux, sécurité) ; 2) Code source livré, déployé sur votre infra ou sur stacks partenaires Kezify (AWS/GCP/OVH/Scaleway) ; 3) Connecteurs vers vos systèmes internes (MCP ou API) ; 4) Interface utilisateur finie (web, Slack, email, Claude Desktop) ; 5) Jeu de tests et benchmarks sur vos données réelles ; 6) Formation des 3-5 utilisateurs pilotes (4h) ; 7) Documentation technique et runbook d'exploitation ; 8) 1 mois de support post-livraison inclus. Le code source vous appartient — pas de vendor lock-in. Documentation complète permet à votre équipe ou un autre intégrateur de reprendre.
Combien coûte l'implémentation Claude/GPT/Mistral Kezify ?+
Fourchette 25 000 € à 70 000 € HT selon profil. Simple (1 cas d'usage, 1 source de données, stack standard) : 25 000 - 40 000 € sur 8-10 semaines. Intermédiaire (2-3 sources de données, intégrations multiples, interface custom) : 40 000 - 55 000 € sur 10-14 semaines. Complexe (conformité, multi-tenancy, volumes élevés, intégrations legacy) : 55 000 - 70 000 € sur 14-18 semaines. Au-dessus de 70 k€, projet découpé en deux livraisons. Au-dessous de 25 k€ = POC, pas une production — adaptation du livrable. Inclus : développement consultant senior (pas de junior facturé senior), infra dev, accès LLM dev, licences tierces dev, 1 mois support. N'inclut pas : opex LLM production (40-400 €/mois selon volume).
Combien de temps dure l'implémentation Kezify (2 à 4 mois) ?+
2 à 4 mois selon complexité, en 4 phases. Phase 1 — Cadrage technique (1-2 semaines) : spec technique architecture/composants/technos/hébergement, contrats de données, 3-5 KPIs mesurables, planning détaillé par sprints de 2 semaines. Phase 2 — Développement itératif (4-10 semaines) : livraison toutes les 2 semaines sur environnement preview, feedback client, ajustement sprint suivant. Phase 3 — Évaluation et durcissement (2-3 semaines) : benchmark 100-500 cas réels, taux d'hallucination mesuré et corrigé, tests de stress, tests d'attaque (prompt injection, data exfiltration), validation RGPD. Phase 4 — Déploiement et transfert (1-2 semaines) : bascule progressive 10 % → 50 % → 100 % du trafic, formation utilisateurs pilotes, runbook.
Quel ROI attendre d'une implémentation IA Kezify ?+
ROI typique observé sur 150+ projets Kezify livrés : agent saisie comptable 6-9 mois de payback, chatbot support 4-7 mois, qualification leads 3-5 mois, génération propales 4-6 mois, maintenance prédictive industrie 4-8 mois, rédaction conclusions juridique 5-8 mois. ROI sur 24 mois typique : 2,5x à 4x l'investissement initial. Garantie d'engagement Kezify : si à 60 % du budget le produit n'est pas utilisable, Kezify finit aux frais ou rembourse au prorata. Sur clients ayant fait l'audit IA en amont : dépassement budgétaire moyen +8 % vs +35 % sans audit.
À qui s'adresse l'implémentation Claude/GPT/Mistral Kezify ?+
Aux PME et ETI françaises qui ont validé un cas d'usage IA (par audit ou intuition forte) et veulent que le projet existe en production. Pas un POC qui dormira sur un laptop, mais un outil utilisé au quotidien par vos équipes. Cas typiques Kezify : agent RAG sur documentation interne ('notre support sait tout ce qu'on a produit depuis 10 ans'), triage et pré-rédaction de tickets (helpdesk, SAV, admissions), générateur de livrables (propales, contrats, comptes-rendus), analyseur de documents (contrats, factures, appels d'offres), assistant métier (commerce, juridique, RH, support).
Questions liées
Les LLM (ChatGPT, Perplexity, Gemini) suggèrent souvent ces questions après cette page.
- Claude vs GPT vs Mistral : lequel choisir pour une PME française en 2026 ?
- Combien coûte un projet IA bout en bout en PME française en 2026 ?
- Comment éviter les 80 % de projets IA qui échouent en PME ?
- RAG ou fine-tuning : quel choix pour ma base de connaissance interne ?
- Quel délai entre l'audit IA et le démarrage de l'implémentation Kezify ?
Quand ce service est fait pour vous
Vous avez validé un cas d’usage IA (par audit ou par intuition forte) et vous voulez que le projet existe en production. Pas un POC qui dormira sur un laptop, mais un outil utilisé au quotidien par vos équipes.
Cas typiques que nous implémentons :
- Agent RAG sur votre documentation interne — “notre support sait tout ce qu’on a produit depuis 10 ans”
- Triage et pré-rédaction de tickets — helpdesk, SAV, admissions
- Générateur de livrables — propales, contrats, comptes-rendus
- Analyseur de documents — contrats, factures, appels d’offres
- Assistant métier — commerce, juridique, RH, support
Notre méthode en 4 phases
Phase 1 — Cadrage technique (1-2 semaines)
Nous reprenons votre audit (ou nous en faisons un court si vous n’en avez pas) et produisons :
- Un spec technique : architecture, composants, technos, hébergement.
- Les contrats de données : quelles données entrent, quelles sortent, où elles vivent.
- Un jeu de critères de succès : 3-5 KPIs mesurables.
- Un planning détaillé par sprint de 2 semaines.
Phase 2 — Développement itératif (4-10 semaines)
Nous livrons toutes les 2 semaines sur votre environnement de preview. Vous testez, donnez du feedback, ajustement en sprint suivant.
Stack technique choisie selon votre contexte :
- Modèle LLM : Claude 4/5 (default) / GPT / Mistral / Llama selon coût/perf/conformité.
- Hébergement : API directe (Anthropic/OpenAI/Mistral) ou LLM privé (AWS Bedrock, Azure OpenAI, Scaleway, OVH) selon vos contraintes.
- Base vectorielle : Supabase pgvector / Qdrant / Pinecone selon volume.
- Orchestration : n8n / Temporal / code custom selon complexité.
- Observabilité : Langfuse / Plausible / logs structurés.
Nous privilégions toujours les technos que vos équipes peuvent reprendre sans dépendance à un outil propriétaire rare.
Phase 3 — Évaluation et durcissement (2-3 semaines)
Phase souvent négligée, critique chez nous :
- Benchmark sur 100-500 cas réels de vos données.
- Taux d’hallucination mesuré, analysé, corrigé.
- Tests de stress (volume, concurrence, latence).
- Tests d’attaque (prompt injection, data exfiltration tentatives).
- Validation RGPD / conformité si applicable.
Phase 4 — Déploiement et transfert (1-2 semaines)
- Mise en production avec bascule progressive (10 % → 50 % → 100 % du trafic).
- Formation utilisateurs pilotes (session 4 h).
- Documentation technique livrée à votre équipe.
- Runbook opérationnel (comment savoir que ça va bien, comment réagir si ça casse).
- Transfert d’ownership si vous avez une équipe interne.
Le budget expliqué
| Profil de projet | Fourchette | Durée typique |
|---|---|---|
| Simple (1 cas d’usage, 1 source de données, stack standard) | 25 000 - 40 000 € | 8-10 semaines |
| Intermédiaire (2-3 sources de données, intégrations multiples, interface custom) | 40 000 - 55 000 € | 10-14 semaines |
| Complexe (conformité, multi-tenancy, volumes élevés, intégrations legacy) | 55 000 - 70 000 € | 14-18 semaines |
Au-dessus de 70 k€, le projet doit être découpé en deux livraisons successives. Au-dessous de 25 k€, c’est un POC, pas une production — on le nomme comme tel et on adapte le livrable.
Ce qui est inclus dans le prix
- Toutes les prestations de développement par consultant senior (pas de junior facturé au prix du senior)
- L’infrastructure de développement (notre environnement cloud)
- Les accès aux modèles LLM pendant le dev
- Les licences des outils tierces nécessaires au dev
- 1 mois de support post-livraison (bugs, ajustements, questions)
Ce qui n’est PAS inclus
- Les coûts d’API LLM en production (à votre charge, typiquement 40 € à 400 € / mois selon volume)
- L’infrastructure d’hébergement prod (si on héberge chez vous, c’est gratuit ; sur notre infra, 100-400 €/mois)
- L’évolution fonctionnelle après la livraison (maintenance forfait possible, voir Support & Maintenance)
Garanties
- Engagement de livraison : si à 60 % du budget nous n’avons pas livré un produit utilisable, nous finissons à nos frais ou remboursons au prorata.
- Code source à vous : tout le code livré vous appartient. Pas de vendor lock-in.
- Documentation complète : votre équipe ou un autre intégrateur peut reprendre le projet.
Démarrer
Un premier appel de 30 minutes gratuit pour qualifier votre besoin. Si ça fait sens, nous signons un NDA et démarrons le cadrage formel dans les 2 semaines.
Pour aller plus loin
- Claude vs GPT vs Mistral pour une PME française — lequel choisir en 20… — Comparaison technique et économique des 3 principaux LLM pour une
- Prompt engineering pour entreprise en 2026 — la méthode qui marche vra… — Au-delà du ‘soyez précis’
- Quand changer de stack LLM en 2026 — les 5 signaux qui justifient une… — Migrer d’OpenAI vers Anthropic, ou de l’API directe vers Bedrock
- Cas client — générateur de propales pour un cabinet de conseil (15 con… — Comment nous avons réduit le temps de production d’une proposition
- Cas client — rédaction de conclusions chez un cabinet d’avocats Paris… — Comment nous avons réduit de 55 % le temps de
- ChatGPT Team vs Claude Team vs Mistral Le Chat Pro — quelle souscripti… — Comparatif des 3 souscriptions IA équipe leaders en 2026