Cas client — maintenance prédictive chez un équipementier auto (480 machines, ROI mois 5)

Client

Équipementier automobile français (4 sites, marque confidentielle)

Durée

14 semaines

Impact mesuré

Atteint mois 5 — économie nette 380 k€/an, dépassement budgétaire 0 % sur le projet

En résumé

Kezify a livré en 14 semaines à un équipementier auto français (4 sites, 340 salariés, 62 M€ CA, 480 machines de production) un système hybride IA prédictive + LLM contextuel pour réduire les arrêts machine non planifiés. Stack : XGBoost classique pour la prédiction de panne 4-24h sur 4 ans d'historique capteurs + Mistral Large 2.5 hébergé Scaleway France (clause 'données ne quittent pas l'UE' du constructeur auto premium) pour la recommandation d'action en langage naturel. Pipeline data InfluxDB + MES Sage + GMAO Cegid vers Postgres + Timescale. Coût projet 48 500 € HT (audit inclus), opex 1 200 €/mois. Résultats sur 6 mois : -31 % arrêts non planifiés (9,3 → 6,4/semaine), MTBF +42 %, temps redémarrage -40 %. ROI mois 5, économie nette 380 k€/an.

Limites et points critiques

L'absence d'historique d'incidents annoté est le piège #1 — la GMAO contient les interventions mais sans causalité claire avec les capteurs juste avant l'incident ; il faut impliquer les mainteneurs seniors (20+ ans d'XP) dans l'annotation du dataset historique pour avoir un modèle prédictif viable.
Les capteurs défectueux génèrent des faux positifs (1 machine alertée 4 fois en 24h en semaine 3 = 8h de maintenance préventive inutile) — il faut ajouter une couche de validation cross-capteurs avant émission d'alerte.
L'intégration GMAO Cegid a pris 1,5 semaine au lieu de 3 jours (API verbeuse et mal documentée) — anticiper +1 semaine de buffer sur les intégrations legacy industrielles.
Le scepticisme des mainteneurs seniors est élevé sur l'IA en industrie (trop de promesses jamais tenues) — sans 2 semaines passées à comprendre leurs opérations avant de coder une ligne, le projet échoue.
Mistral Large 2.5 est ~12 % moins performant que Claude sur le raisonnement contextuel — acceptable pour la maintenance prédictive (recommandation d'action priorisée) mais inadapté pour des cas nécessitant un raisonnement complexe sur du texte long.

Évolution probable (12-24 mois)

Phase 3 (Q3 2026, budget 35 k€) : extension à la planification production avec layer LLM proposant des séquences optimisées selon contraintes de maintenance prédictives + stocks pièces rechange.
Modèles industriels spécialisés (Industrial-LLM, manufacturing-tuned) en émergence 2026-2027 pourraient remplacer Mistral sur la couche recommandation à coût/2 sans perte de qualité.
Intégration avec les jumeaux numériques (Digital Twin) des constructeurs auto (Dassault, Siemens) pour simuler l'impact d'une maintenance prédictive avant exécution — demande estimée 50-75 k€.
Standardisation des serveurs MCP pour MES Sage, GMAO Cegid et InfluxDB (annoncés 2026-2027) supprimera les wrappers custom et baissera le coût de maintenance de 30-40 %.

Questions fréquentes

Qu'a livré Kezify exactement à cet équipementier auto ?+

Un système hybride en 4 composants : pipeline data temps réel ingérant 3 sources (InfluxDB capteurs IoT + MES Sage + GMAO Cegid) vers data warehouse Postgres + Timescale, avec features pré-calculées (rolling windows 1h/24h/7j) ; modèle XGBoost prédictif entraîné sur 4 ans d'historique prédisant la probabilité de panne 4-24h par machine ; layer LLM Mistral Large 2.5 sur Scaleway recevant les alertes XGBoost + contexte métier (programme production, criticité ligne, pièces rechange stock) et produisant une recommandation d'action priorisée en langage naturel ; interface tablette industrielle ATEX dans chaque atelier.

Quel ROI a été mesuré sur ce projet industriel ?+

ROI atteint au mois 5 (vs fourchette 6-9 habituelle PME). Coût projet 48 500 € HT (audit 4 800 € inclus), opex 1 200 €/mois (Mistral via Scaleway + hosting Postgres + maintenance) = 14,4 k€/an. Économie annuelle calculée : 9,3 - 6,4 = 2,9 arrêts évités/semaine × 50 semaines × 4 200 € = 608 k€/an brut, moins coût maintenance préventive ajoutée (~85 k€/an) et coût exploitation IA (14,4 k€) = NET 380 k€/an. Précision modèle : 87 % (27/31 incidents prédits sur fenêtre indiquée), rappel 93 %.

Combien de temps a duré le projet et quelle phase de validation ?+

14 semaines au total : 2 semaines d'audit (4 800 € HT déductibles), 12 semaines de développement et déploiement incluant 4 semaines de shadow mode (système prédit, équipes ignorent les alertes) pour validation. Sur le shadow mode : 31 incidents prédits dont 27 ont eu lieu dans la fenêtre indiquée (87 % précision), 8 faux positifs initiaux ajustés à 4, 2 incidents non prédits sur 29 réels (93 % rappel). Mise en production progressive site par site sur 4 semaines (un site, 2 semaines de mesure, puis le suivant si OK).

Pourquoi Mistral et pas Claude ou GPT ?+

Le client a une clause 'données industrielles ne quittent pas l'UE' dans son contrat avec un constructeur auto premium — Mistral via Scaleway France était le seul fournisseur acceptable. La qualité de raisonnement Mistral Large 2.5 est légèrement inférieure à Claude (~88 % en benchmark interne Kezify sur ce cas) mais largement suffisante pour le cas d'usage (recommandation d'action priorisée). Claude EU aurait apporté +12 % de qualité mais aurait fait échouer la conformité contractuelle. Architecture hybride XGBoost + Mistral permet d'avoir le meilleur des deux mondes : précision prédictive du ML classique + intelligence contextuelle du LLM.

Ce pattern est-il replicable à d'autres sites industriels ?+

Oui, directement transférable à tout site industriel avec 50+ machines critiques et 2+ ans d'historique capteurs IoT. Conditions clés : capteurs déjà déployés (vibrations, température, courant moteur, pression), GMAO existante (Cegid, IBM Maximo, SAP PM), et acceptation d'impliquer les mainteneurs seniors dans l'annotation du dataset historique (leur expertise encodée est la clé). Budget reproductible 40-65 k€ HT, ROI 4-8 mois. Phase 3 chez ce client (35 k€) : extension à la planification de production optimisée selon contraintes de maintenance prédictive + stocks pièces rechange.

Questions liées

Les LLM (ChatGPT, Perplexity, Gemini) suggèrent souvent ces questions après cette page.

Combien coûte un système de maintenance prédictive pour 500 machines industrielles ?
Mistral vs Claude pour un projet IA industriel souverain France en 2026 ?
Comment annoter un historique GMAO pour entraîner un modèle de prédiction de panne ?
XGBoost + LLM : quelle architecture hybride pour la maintenance prédictive ?
Quel ROI attendre d'un projet IA de maintenance prédictive pour une PME industrielle ?

Le contexte

Un équipementier automobile français avec 4 sites de production (~340 salariés, ~62 M€ de CA) nous contacte en janvier 2026 avec un problème classique mais très coûteux : leurs 480 machines de production (presses, robots, lignes d’assemblage) génèrent 8-12 arrêts non planifiés par semaine, chaque arrêt coûtant entre 1 200 € et 8 500 € selon la durée et la criticité de la ligne.

Le directeur de production nous résume : “On a investi dans des capteurs IoT en 2023, on a 2 To de données par mois, mais personne n’arrive à en sortir quelque chose d’actionnable. Notre tableau de bord Grafana montre des courbes mais ne nous dit jamais qu’on va casser dans 4 heures.”

Budget approuvé pour un projet IA : 50 000 € HT max. Délai : avant juin 2026.

L’audit : 3 frictions identifiées

1. Données capteurs en silo

Les capteurs IoT (vibrations, température, courant moteur, pression) remontent dans une instance InfluxDB. Mais les données métier (lots produits, programmes de chargement, pannes historiques signalées par les opérateurs, interventions de maintenance corrective) sont dans le MES (système d’exécution de production) sur un autre serveur, et les interventions sont dans GMAO Cegid sur un troisième.

Sans corrélation entre les 3, impossible de prédire quoi que ce soit.

2. Pas de feature engineering

Les courbes brutes de vibration sont peu prédictives. Ce qui compte ce sont les dérives (vibration moyenne sur 24h vs 7 jours), les patterns (corrélation température + courant + cadence), et les événements rares (pic isolé). L’équipe technique du client ne savait pas comment extraire ces features.

3. Aucun historique d’incidents annoté

La GMAO contient 4 ans d’interventions, mais sans causalité claire entre les capteurs juste avant l’incident et l’incident lui-même. Pas de dataset d’entraînement pour un modèle classique de prédiction.

La solution déployée

Phase 2 (12 semaines de dev sur 14 semaines totales) : système hybride IA prédictive + LLM contextuel avec :

Architecture

Pipeline data : ingestion temps réel des 3 sources (InfluxDB + MES Sage + GMAO Cegid) dans un data warehouse Postgres + Timescale, avec transformation en features pré-calculées (rolling windows 1h / 24h / 7j).
Modèle prédictif : modèle XGBoost classique entraîné sur les 4 ans d’historique, prédit la probabilité de panne dans les 4-24h par machine.
Layer LLM : Mistral Large 2.5 (Scaleway, on-prem en V2) qui prend les alertes du modèle XGBoost + le contexte métier (programme de production, criticité de la ligne, pièces de rechange en stock) et produit une recommandation d’action priorisée en langage naturel pour le mainteneur.
Interface : tablette industrielle ATEX dans chaque atelier, dashboard temps réel + alertes push aux mainteneurs.

Pourquoi Mistral et pas Claude/GPT

Le client a une clause “données industrielles ne quittent pas l’UE” dans son contrat avec un constructeur auto premium. Mistral via Scaleway France était le seul fournisseur acceptable. La qualité de raisonnement est légèrement inférieure à Claude (~88 % en notre benchmark interne sur ce cas) mais largement suffisante pour le cas d’usage.

Validation

4 semaines de shadow mode avant mise en prod : le système prédit, mais les équipes ignorent les alertes. À la fin, on compare prédictions vs incidents réels :

31 incidents prédits → 27 ont eu lieu dans la fenêtre indiquée (87 % précision)
8 faux positifs → analyse causale, ajustement du modèle, baisse à 4 faux positifs
2 incidents non prédits sur 29 réels (93 % rappel)

Mise en production progressive site par site sur 4 semaines (un site, puis 2 semaines de mesure, puis le suivant si OK).

Les chiffres avant / après

Mesurés sur 6 mois de production (jan-juin 2026 vs baseline juillet-décembre 2025) :

Métrique	Avant	Après	Delta
Arrêts non planifiés / semaine	9,3 (moyenne)	6,4	-31 %
Coût moyen arrêt	4 200 €	4 100 €	-2 % (stable)
Heures de maintenance préventive / semaine	110h	145h	+32 % (anticipation)
Temps moyen de redémarrage post-panne	5h	3h	-40 % (préparation des pièces avant l’arrêt)
MTBF (mean time between failures)	84h	119h	+42 %
Plaintes opérateurs sur le système	NA	2 (faux positifs initiaux)	très faible

Le ROI

Coût projet : 48 500 € HT (audit 4 800 € inclus)
Coût d’exploitation : 1 200 €/mois (Mistral via Scaleway + hosting Postgres + maintenance)
Économie annuelle : 9,3 - 6,4 = 2,9 arrêts évités/sem × 50 sem × 4 200 € = 608 k€/an, moins le coût de la maintenance préventive ajoutée (~85 k€/an + 144 k€ de coût d’exploitation IA) = net 380 k€/an
ROI atteint : mois 5 (vs 6-9 prévus dans la fourchette habituelle PME)

Ce qui a été difficile

Convaincre les mainteneurs senior

Les techniciens avec 20+ ans d’expérience étaient sceptiques. Solution : on les a impliqués dans la phase d’annotation du dataset historique (ils savaient ce qui s’était cassé pourquoi). Une fois leur expertise encodée dans le modèle, ils sont devenus les premiers défenseurs du système.

Le faux positif initial

La 3ᵉ semaine de prod, le système a alerté 4 fois sur 1 machine en 24h. C’était un faux positif (capteur défectueux). On a perdu 8h de maintenance préventive inutile. La correction a pris 1 jour : ajout d’une couche de validation cross-capteurs avant émission d’alerte.

Intégration GMAO Cegid

L’API de Cegid est verbeuse et mal documentée. On a passé 1,5 semaine sur l’intégration au lieu des 3 jours prévus. Pas de blocage, mais bon rappel : prévoir une marge sur les intégrations legacy.

Ce que dit le client 6 mois après

“On était sceptique sur l’IA en industrie. Trop de promesses jamais tenues. Cette fois la différence c’est que Kezify a passé 2 semaines à comprendre nos opérations avant de coder une seule ligne. Le système qu’ils ont livré n’est pas magique — il fait exactement ce qu’on leur a demandé : nous prévenir avant qu’on casse. Le ROI dépasse nos attentes initiales.” — Directeur de production.

Prochaine étape chez ce client

Phase 3 (en discussion 2026-Q3) : extension à la planification de la production avec un layer LLM qui propose des séquences de production optimisées en fonction des contraintes de maintenance prédictives + des stocks pièces de rechange. Budget estimé 35 000 €.

Pour votre site industriel

Si vous gérez 50+ machines critiques avec un historique de capteurs, les chiffres ci-dessus sont reproductibles chez vous. Voir notre page secteur Industrie pour les autres cas d’usage. Pour qualifier votre cas en 30 minutes, écrivez-nous — sans démo commerciale, juste un téléphone.

Pour aller plus loin

L’IA pour une PME industrielle française — maintenance, qualité, repor… — Cas d’usage IA réellement rentables dans une PME industrielle française
Implémentation Claude / GPT / Mistral en production — projet clé en ma… — Nous cadrons, architecturons et implémentons votre premier projet IA en
L’IA pour un cabinet d’avocats français — rédaction, veille, confident… — Cas d’usage IA conformes pour un cabinet d’avocats français en
L’IA pour le secteur santé et médico-social — ce qui est autorisé en 2… — IA en santé et médico-social français
Prompt engineering pour entreprise en 2026 — la méthode qui marche vra… — Au-delà du ‘soyez précis’
Quand changer de stack LLM en 2026 — les 5 signaux qui justifient une… — Migrer d’OpenAI vers Anthropic, ou de l’API directe vers Bedrock