maint.ing
Les indicateurs maintenance qui mentent : MTBF, MTTR, disponibilité

Les indicateurs maintenance qui mentent : MTBF, MTTR, disponibilité

Les indicateurs maintenance qui mentent : MTBF, MTTR, disponibilité

11 min de lecture

Introduction

Votre tableau de bord affiche MTBF = 480 h sur la presse n°3. Vendredi 14h, votre chef de prod vous appelle pour le troisième arrêt de la semaine. Quelqu'un ment, et ce n'est pas votre équipe.

Les trois KPI canoniques de la maintenance industrielle, MTBF, MTTR et disponibilité, sont mathématiquement justes. Tous les CMMS du marché savent les calculer en quelques secondes. Le problème n'est pas la formule.

Le problème, c'est que ces formules s'appliquent sur des données non nettoyées, et qu'elles produisent alors des nombres opérationnellement faux. Des nombres qui finissent en revue mensuelle, en CAPEX déféré, en cibles budgétaires inatteignables. Bref, en décisions stratégiques bâties sur du sable.

Cet article diagnostique trois failure modes classiques des KPI maintenance, avec chiffres terrain à l'appui, et fournit pour chacun une correction concrète, implémentable sans changer de logiciel.

Pour qui : responsables maintenance, ingénieurs fiabilité, chefs de prod, directions techniques. Pas utile si vous n'avez pas encore de CMMS, ou si vos arrêts non planifiés sont rares (moins d'un par mois).


MTBF gonflé : préventif et correctif mélangés

Le mensonge le plus répandu, et le plus invisible.

🟦 À RETENIR — sélectionne ce paragraphe + clique "À retenir" dans la toolbar :
MTBF (Mean Time Between Failures, NF EN 13306, ISO 14224 §6.5) = uptime cumulé divisé par le nombre de défaillances. Mesure de référence de la fiabilité d'un équipement réparable.

Le piège

La plupart des CMMS calculent le MTBF sur tous les WO terminés : préventifs, correctifs, inspections, tout ce qui ferme dans la même bucket. Résultat : plus vous faites de maintenance préventive (donc plus vous êtes mature), plus votre MTBF affiché grimpe, sans que vos équipements soient plus fiables.

Le bruit du préventif amortit le signal du correctif. Et le signal du correctif, c'est exactement ce qu'on cherche à mesurer.

Exemple chiffré : asset X sur 12 mois (8 760 h calendaires)

50 WO préventifs réalisés (graissage, contrôles) + 5 pannes correctives.

Méthode de calcul

Formule

Résultat

Lecture opérationnelle

MTBF naïf (tous WO)

8 760 / 55

159 h

"Asset stable"

MTBF correct (correctifs only)

8 760 / 5

1 752 h

Tombe en panne tous les 2 mois

Facteur d'erreur : ×11.

🟠 ATTENTION — sélectionne ce paragraphe + clique "Attention" dans la toolbar :
Un asset qui panne tous les 2 mois est étiqueté "fiable" en revue mensuelle. Le CAPEX de remplacement reste reporté année après année. Le jour où l'asset lâche en plein cycle critique, la direction découvre le mensonge. Trop tard.

Comment recalculer

Étape

Action

Détail

1

Séparer les types de WO au niveau data

Préventif, correctif, amélioration, inspection, urgence. Taxonomie ISO 14224 §B.2 utilisable telle quelle.

2

Filtrer le calcul

MTBF = uptime / count(WO WHERE maintenance_type IN ('CORRECTIVE', 'EMERGENCY'))

3

Distinguer défaillance fonctionnelle et potentielle

Un préventif qui détecte une dégradation avant la panne n'est pas une panne. Le compter comme défaillance tue l'intérêt même de l'inspection.

🟢 CONSEIL PRATIQUE — sélectionne ce paragraphe + clique "Conseil pratique" dans la toolbar :
Sur votre prochaine revue mensuelle : recalculez le MTBF sur correctifs uniquement sur un seul asset critique. Comparez avec le MTBF affiché. Le facteur d'erreur va parler de lui-même, et le débat sur la taxonomie démarrera tout seul.


MTTR sous-estimé : le blast radius des arrêts en cascade

Quand le coût réel d'une panne est invisible dans le KPI.

🟦 À RETENIR — sélectionne ce paragraphe + clique "À retenir" :
MTTR (Mean Time To Repair) = temps moyen entre l'ouverture du WO et sa complétion. Souvent confondu avec active repair time (le temps réellement passé à réparer).

Le piège

Le MTTR mesure la réparation de l'équipement défaillant. Mais une panne crée presque toujours un blast radius : la machine X tombe, la ligne Y arrêtée en aval, la matière Z dégradée en attendant, l'équipe immobilisée. Le MTTR sur le WO de X ne capture rien de cela.

Exemple chiffré : capteur HS sur presse n°3, vendredi 8h

Étape

Élément impacté

Durée

Coût direct

1

Machine X : remplacement capteur

2 h

50 € pièce + 2 h tech = 200 €

2

Ligne Y aval : attente diagnostic + commande

+4 h

6 opérateurs immobilisés ≈ 1 800 €

3

Matière Z dans la presse : résine figée, rework

+1 jour-équipe

Matière + nettoyage ≈ 4 500 €

4

Pénalité contractuelle client

livraison retardée

3 000 €

Total

Downtime opérationnel réel

~32 h

~9 500 €

MTTR affiché : 2 h. Downtime opérationnel réel : 32 h. Facteur d'erreur : ×16.

🟠 ATTENTION — sélectionne ce paragraphe + clique "Attention" :
Le coût horaire de panne calculé sur le MTTR (200 €) est ridiculement sous-évalué. Pas de business case pour investir dans la fiabilité parce que "ça coûte rien". Le vrai coût (perte de production + matière + équipe = 9 500 €) reste invisible. Le management refuse les budgets fiabilité parce que les KPI ne justifient pas la dépense.

Comment recalculer

Étape

Action

Détail

1

Modéliser le blast radius

Créer un objet "Shutdown" ou "Incident parent" qui regroupe les WO enfants déclenchés par la cascade. La plupart des CMMS modernes le permettent via un champ parent_shutdown_id ou incident_id.

2

Calculer le MTTR sur le parent

downtime = closed_at(parent) - opened_at(parent), pas la somme des MTTR enfants.

3

Distinguer active repair time et downtime

ISO 14224 §3.13 fait cette distinction depuis 30 ans. Vos rapports doivent les afficher côte à côte. Pas le même nombre.


Disponibilité gonflée : les micro-arrêts non comptés

1 point d'OEE perdu dans le brouillard statistique.

🟦 À RETENIR — sélectionne + clique "À retenir" :
Availability = Uptime / (Uptime + Downtime). Au cœur du calcul OEE (Overall Equipment Effectiveness) = Availability × Performance × Quality.

Le piège

La disponibilité ne compte que les downtimes loggés via un WO. Mais sur une ligne de production typique, environ 60 % des arrêts sont des micro-arrêts de moins de 15 minutes : calage, réglage, purge, micro-bourrage, attente matière, changement de format mineur.

Ces arrêts ne génèrent pas de WO parce que l'opérateur les résout en 5 minutes sans rien dire à personne. Résultat : invisibles dans le CMMS, invisibles dans la dispo, invisibles dans l'OEE.

Exemple chiffré : ligne 24/7 sur 1 mois (720 h théoriques)

Indicateur

Uptime

Downtime loggé (WO)

Micro-arrêts (50 × 10 min)

Calcul

Résultat

Dispo apparente (CMMS seul)

712 h

8 h

invisibles

712 / 720

98,9 %

Dispo réelle (avec micro-arrêts)

703,7 h

8 h

8,3 h

703,7 / 720

97,8 %

Écart : 1 point. Semble cosmétique. Pas sur l'OEE.

Composant OEE

Performance

Qualité

Calcul

OEE

OEE nominal (dispo apparente)

92 %

98 %

98,9% × 92% × 98%

89,2 %

OEE réel (dispo avec micro-arrêts)

92 %

98 %

97,8% × 92% × 98%

88,2 %

🟠 ATTENTION — sélectionne + clique "Attention" :
Sur une usine à 50 M€ de CA, 1 point d'OEE perdu représente environ 500 k€ de marge évaporée chaque année dans le brouillard statistique. La cible OEE budgétée devient inatteignable parce que la baseline est fausse. Les équipes sont jugées sur un mensonge.

Comment recalculer

Étape

Action

Détail

1

Instrumenter les micro-arrêts

Compteur stop_count sur l'asset, incrémenté à chaque arrêt > 5 secondes via SCADA, PLC, ou capteur de présence. Première brique du downtime tracking sérieux.

2

Aggréger en time-buckets

Pas un WO par micro-arrêt (overhead administratif insoutenable). Buckets horaires ou journaliers via meter readings dans le CMMS. Une ligne par jour suffit.

3

Distinguer 3 catégories

Breakdown (>1 h, ouvre WO), short stop (15-60 min, loggé sans WO), minor stoppage (<15 min, compteur agrégé). Chacune reportée séparément.

🟢 CONSEIL PRATIQUE — sélectionne + clique "Conseil pratique" :
La norme SEMI E10-0814 (semi-conducteur) distingue 6 états d'équipement. C'est le standard le plus rigoureux au monde sur ce sujet. À adapter selon le niveau de maturité de votre site, sans copier-coller à l'identique.


Tableau récapitulatif

À imprimer et à apporter à votre prochain comité.

Indicateur

Faille classique

Calcul correct

Impact direction

MTBF

Mélange PM + correctif dans le compteur de défaillances

Filtrer maintenance_type ∈ {CORRECTIVE, EMERGENCY} (ISO 14224)

Risque caché ×5 à ×10

MTTR

WO start → complete only, ignore le blast radius

Modéliser un shutdown parent + downtime cascadé

Coût horaire panne ×3 à ×15

Disponibilité

Micro-arrêts <15 min jamais loggés

Instrumenter via SCADA + agréger en meter readings

OEE faux de 1 à 3 points


Mise en pratique : 3 actions pour votre prochaine revue mensuelle

Aucune de ces actions ne demande un nouveau logiciel ou un budget. Juste une taxonomie de WO propre, un objet "shutdown parent" dans votre CMMS existant, et un cron qui agrège les micro-arrêts depuis votre SCADA.

Étape 1 : recalculer le MTBF sur correctifs uniquement. Sur un asset critique, recalculez le MTBF en excluant les WO préventifs. Comparez avec le MTBF affiché. Le facteur d'erreur va parler de lui-même.

Étape 2 : logger le prochain incident avec un incident_id. Sur le prochain arrêt non routine, loggez non seulement le WO de réparation mais aussi un identifiant d'incident qui groupe tous les WO impactés. Calculez le downtime réel sur ce parent.

Étape 3 : demander au SCADA vos micro-arrêts du mois. Demandez à votre équipe automatisme le nombre de micro-arrêts <15 min sur le mois passé. Comparez à zéro, ce que votre CMMS croit. Vous allez avoir une surprise.


Questions fréquentes

Q : Pourquoi mon MTBF est-il trompeur ?
R : Le MTBF calculé sur tous les ordres de travail terminés mélange préventifs et correctifs. Plus vous avez de PM réalisés, plus le MTBF affiché monte, sans que votre équipement soit plus fiable. La correction : filtrer le calcul sur les seuls WO de type CORRECTIVE ou EMERGENCY, conformément à la taxonomie ISO 14224.

Q : Qu'est-ce que le blast radius d'une panne ?
R : Le blast radius désigne l'ensemble des conséquences en cascade d'une panne : machine X tombe, ligne Y attend, matière Z se gâte, équipe en attente. Le MTTR calculé sur le seul WO de réparation de X ne capture rien de tout cela. Pour mesurer le coût réel, il faut modéliser un objet shutdown parent qui regroupe tous les WO impactés et calculer le MTTR sur ce parent.

Q : Pourquoi ma disponibilité affichée est-elle fausse ?
R : La disponibilité ne compte que les downtimes loggés dans le CMMS via un ordre de travail. Mais environ 60 % des arrêts industriels sont des micro-arrêts de moins de 15 minutes (calage, réglage, purge, micro-bourrage) que l'opérateur résout en 5 minutes sans créer de WO. Ces minutes invisibles font gonfler artificiellement le taux de disponibilité affiché de 1 à 3 points sur l'OEE.

Q : Comment corriger mes KPI sans changer de logiciel ?
R : Aucun des 3 fixes ne demande un nouveau logiciel. (1) Ajouter un champ maintenance_type sur vos WO pour distinguer préventif, correctif, urgence. (2) Introduire un champ incident_id pour grouper les WO d'un même blast radius. (3) Instrumenter les micro-arrêts via votre SCADA et agréger via meter readings. Le tout dans votre CMMS existant.


Conclusion

Ces 3 indicateurs ne sont pas mauvais. C'est leur configuration qui ment.

Les 3 points à retenir :

  1. Le MTBF n'a de sens que filtré sur les défaillances réelles. Tout ce qui ferme un WO n'est pas une panne.

  2. Le MTTR seul cache le vrai coût d'une panne. Le blast radius doit être modélisé pour mesurer le downtime opérationnel.

  3. La disponibilité est fausse tant que les micro-arrêts ne sont pas instrumentés. SCADA + meter readings est la voie pragmatique.

Prochaine étape concrète : sur votre prochaine revue mensuelle, recalculez le MTBF sur correctifs uniquement sur un seul asset critique. L'écart va lancer la conversation.


Références

  • ISO 14224:2016 — Industries du pétrole, du gaz naturel et pétrochimique : collecte et échange de données de fiabilité et de maintenance pour les équipements

  • NF EN 13306 — Terminologie de la maintenance

  • SEMI E10-0814 — Specification for Definition and Measurement of Equipment Reliability, Availability, and Maintainability (RAM)

  • Seiichi Nakajima (1988) — TPM: An Introduction, référence historique sur la décomposition OEE et les "six big losses"


Article publié initialement sur freemaint.com/blog le 26 mai 2026.

Melek Mehrez est fondateur de FreeMaint, CMMS freemium dont la taxonomie de WO est nativement alignée sur ISO 14224.

Commentaires

Chargement des commentaires…