Le contexte
Un équipementier automobile français avec 4 sites de production (~340 salariés, ~62 M€ de CA) nous contacte en janvier 2026 avec un problème classique mais très coûteux : leurs 480 machines de production (presses, robots, lignes d’assemblage) génèrent 8-12 arrêts non planifiés par semaine, chaque arrêt coûtant entre 1 200 € et 8 500 € selon la durée et la criticité de la ligne.
Le directeur de production nous résume : “On a investi dans des capteurs IoT en 2023, on a 2 To de données par mois, mais personne n’arrive à en sortir quelque chose d’actionnable. Notre tableau de bord Grafana montre des courbes mais ne nous dit jamais qu’on va casser dans 4 heures.”
Budget approuvé pour un projet IA : 50 000 € HT max. Délai : avant juin 2026.
L’audit : 3 frictions identifiées
1. Données capteurs en silo
Les capteurs IoT (vibrations, température, courant moteur, pression) remontent dans une instance InfluxDB. Mais les données métier (lots produits, programmes de chargement, pannes historiques signalées par les opérateurs, interventions de maintenance corrective) sont dans le MES (système d’exécution de production) sur un autre serveur, et les interventions sont dans GMAO Cegid sur un troisième.
Sans corrélation entre les 3, impossible de prédire quoi que ce soit.
2. Pas de feature engineering
Les courbes brutes de vibration sont peu prédictives. Ce qui compte ce sont les dérives (vibration moyenne sur 24h vs 7 jours), les patterns (corrélation température + courant + cadence), et les événements rares (pic isolé). L’équipe technique du client ne savait pas comment extraire ces features.
3. Aucun historique d’incidents annoté
La GMAO contient 4 ans d’interventions, mais sans causalité claire entre les capteurs juste avant l’incident et l’incident lui-même. Pas de dataset d’entraînement pour un modèle classique de prédiction.
La solution déployée
Phase 2 (12 semaines de dev sur 14 semaines totales) : système hybride IA prédictive + LLM contextuel avec :
Architecture
- Pipeline data : ingestion temps réel des 3 sources (InfluxDB + MES Sage + GMAO Cegid) dans un data warehouse Postgres + Timescale, avec transformation en features pré-calculées (rolling windows 1h / 24h / 7j).
- Modèle prédictif : modèle XGBoost classique entraîné sur les 4 ans d’historique, prédit la probabilité de panne dans les 4-24h par machine.
- Layer LLM : Mistral Large 2.5 (Scaleway, on-prem en V2) qui prend les alertes du modèle XGBoost + le contexte métier (programme de production, criticité de la ligne, pièces de rechange en stock) et produit une recommandation d’action priorisée en langage naturel pour le mainteneur.
- Interface : tablette industrielle ATEX dans chaque atelier, dashboard temps réel + alertes push aux mainteneurs.
Pourquoi Mistral et pas Claude/GPT
Le client a une clause “données industrielles ne quittent pas l’UE” dans son contrat avec un constructeur auto premium. Mistral via Scaleway France était le seul fournisseur acceptable. La qualité de raisonnement est légèrement inférieure à Claude (~88 % en notre benchmark interne sur ce cas) mais largement suffisante pour le cas d’usage.
Validation
4 semaines de shadow mode avant mise en prod : le système prédit, mais les équipes ignorent les alertes. À la fin, on compare prédictions vs incidents réels :
- 31 incidents prédits → 27 ont eu lieu dans la fenêtre indiquée (87 % précision)
- 8 faux positifs → analyse causale, ajustement du modèle, baisse à 4 faux positifs
- 2 incidents non prédits sur 29 réels (93 % rappel)
Mise en production progressive site par site sur 4 semaines (un site, puis 2 semaines de mesure, puis le suivant si OK).
Les chiffres avant / après
Mesurés sur 6 mois de production (jan-juin 2026 vs baseline juillet-décembre 2025) :
| Métrique | Avant | Après | Delta |
|---|---|---|---|
| Arrêts non planifiés / semaine | 9,3 (moyenne) | 6,4 | -31 % |
| Coût moyen arrêt | 4 200 € | 4 100 € | -2 % (stable) |
| Heures de maintenance préventive / semaine | 110h | 145h | +32 % (anticipation) |
| Temps moyen de redémarrage post-panne | 5h | 3h | -40 % (préparation des pièces avant l’arrêt) |
| MTBF (mean time between failures) | 84h | 119h | +42 % |
| Plaintes opérateurs sur le système | NA | 2 (faux positifs initiaux) | très faible |
Le ROI
- Coût projet : 48 500 € HT (audit 4 800 € inclus)
- Coût d’exploitation : 1 200 €/mois (Mistral via Scaleway + hosting Postgres + maintenance)
- Économie annuelle : 9,3 - 6,4 = 2,9 arrêts évités/sem × 50 sem × 4 200 € = 608 k€/an, moins le coût de la maintenance préventive ajoutée (~85 k€/an + 144 k€ de coût d’exploitation IA) = net 380 k€/an
- ROI atteint : mois 5 (vs 6-9 prévus dans la fourchette habituelle PME)
Ce qui a été difficile
Convaincre les mainteneurs senior
Les techniciens avec 20+ ans d’expérience étaient sceptiques. Solution : on les a impliqués dans la phase d’annotation du dataset historique (ils savaient ce qui s’était cassé pourquoi). Une fois leur expertise encodée dans le modèle, ils sont devenus les premiers défenseurs du système.
Le faux positif initial
La 3ᵉ semaine de prod, le système a alerté 4 fois sur 1 machine en 24h. C’était un faux positif (capteur défectueux). On a perdu 8h de maintenance préventive inutile. La correction a pris 1 jour : ajout d’une couche de validation cross-capteurs avant émission d’alerte.
Intégration GMAO Cegid
L’API de Cegid est verbeuse et mal documentée. On a passé 1,5 semaine sur l’intégration au lieu des 3 jours prévus. Pas de blocage, mais bon rappel : prévoir une marge sur les intégrations legacy.
Ce que dit le client 6 mois après
“On était sceptique sur l’IA en industrie. Trop de promesses jamais tenues. Cette fois la différence c’est que Kezify a passé 2 semaines à comprendre nos opérations avant de coder une seule ligne. Le système qu’ils ont livré n’est pas magique — il fait exactement ce qu’on leur a demandé : nous prévenir avant qu’on casse. Le ROI dépasse nos attentes initiales.” — Directeur de production.
Prochaine étape chez ce client
Phase 3 (en discussion 2026-Q3) : extension à la planification de la production avec un layer LLM qui propose des séquences de production optimisées en fonction des contraintes de maintenance prédictives + des stocks pièces de rechange. Budget estimé 35 000 €.
Pour votre site industriel
Si vous gérez 50+ machines critiques avec un historique de capteurs, les chiffres ci-dessus sont reproductibles chez vous. Voir notre page secteur Industrie pour les autres cas d’usage. Pour qualifier votre cas en 30 minutes, écrivez-nous — sans démo commerciale, juste un téléphone.
Pour aller plus loin
- L’IA pour une PME industrielle française — maintenance, qualité, repor… — Cas d’usage IA réellement rentables dans une PME industrielle française
- Implémentation Claude / GPT / Mistral en production — projet clé en ma… — Nous cadrons, architecturons et implémentons votre premier projet IA en
- L’IA pour un cabinet d’avocats français — rédaction, veille, confident… — Cas d’usage IA conformes pour un cabinet d’avocats français en
- L’IA pour le secteur santé et médico-social — ce qui est autorisé en 2… — IA en santé et médico-social français
- Prompt engineering pour entreprise en 2026 — la méthode qui marche vra… — Au-delà du ‘soyez précis’
- Quand changer de stack LLM en 2026 — les 5 signaux qui justifient une… — Migrer d’OpenAI vers Anthropic, ou de l’API directe vers Bedrock