Industria 4.0: mantenimiento predictivo
La Cátedra iDanae (inteligencia, datos, análisis y estrategia) en Big Data y Analytics, creada en el marco de colaboración de la Universidad Politécnica de Madrid (UPM) y Management Solutions, publica su newsletter trimestral correspondiente al 4T22 sobre Industria 4.0: mantenimiento predictivo
Industria 4.0: mantenimiento predictivo
Introducción
A lo largo de la historia, la aparición y el desarrollo de nuevas técnicas, máquinas e inventos, o la transformación de los procesos industriales, han generado avances disruptivos que han transformado las economías y la sociedad. Esto ha ocurrido en diferentes momentos de la historia: la primera revolución industrial (siglo XVIII), con la aplicación del agua y el vapor a la producción mecánica; la segunda revolución industrial (siglo XIX), con la transformación de las cadenas de montaje y los sistemas de producción en masa basados en la electricidad; y en el siglo XX, con la aparición de los ordenadores y su incorporación a los procesos industriales, dando lugar a la tercera revolución industrial. Finalmente, durante el siglo XXI, la evolución de la tecnología, la generación y almacenamiento de ingentes cantidades de datos, y el desarrollo de técnicas de machine learning (ML) e inteligencia artificial (IA) se han convertido en pilares transformadores en todos los sectores de la economía, dando lugar a lo que se conoce como Cuarta Revolución Industrial.
En este contexto, surge la denominada Industria 4.0, que se basa en el principio de digitalización de la industria en los diferentes productos y servicios de la cadena de valor de las empresas (incorporación de unidades de control inteligentes, robotización, internet de las cosas, aplicación de infraestructuras y tecnologías big data, uso de entornos cloud, interconexión de procesos para compartir información basada en el almacenamiento de grandes cantidades de datos, etc.). Esta digitalización permite tomar decisiones en las fábricas sin intervención humana, y adaptar la producción a los medios y recursos disponibles en cada momento para maximizar la eficiencia.
Los principios y técnicas de la Industria 4.0 pueden aplicarse a multitud de campos industriales (segmentación y comprensión de las preferencias de los clientes, rediseño de productos, predicción de la demanda, búsqueda de eficiencias, funcionamiento inteligente de maquinaria, monitorización y trazabilidad a distancia, etc.). Entre ellos, uno de los que ha cobrado mayor relevancia es el denominado mantenimiento predictivo: en lugar de realizar un mantenimiento periódico o correctivo (sustitución de piezas rotas o maquinaria obsoleta), este enfoque pretende predecir cuándo un determinado componente o máquina fallará o necesitará ser sustituido, basándose no solo en criterios preestablecidos, sino también en la monitorización de múltiples elementos asociados al uso real, el desgaste o la aparición de elementos anómalos. Esto también permite planificar con antelación las operaciones de mantenimiento, reduciendo las roturas o paradas de las líneas de producción y las operaciones de mantenimiento innecesarias, lo que minimiza los costes de explotación.
De hecho, el mantenimiento predictivo ha demostrado ser uno de los tipos de mantenimiento más rentables, dado su potencial para lograr la mayor eficacia global de los equipos (OEE). Datos del Departamento de Energía de EE.UU.4 sugieren que la implantación de un sistema de mantenimiento predictivo arroja resultados notables: retorno de la inversión diez veces superior, reducción del 25-30% de los costes de mantenimiento, eliminación del 70-75% de las averías, reducción del 35-45% del tiempo de inactividad y aumento del 20-25% de la producción.
Este documento pretende ofrecer una visión general del mantenimiento predictivo, las diferentes técnicas de IA y ML que pueden utilizarse para desarrollar dichos mecanismos, así como los retos que deben abordarse para su implantación efectiva.
Mantenimiento predictivo
Definición
El mantenimiento se define como la combinación de todas las acciones técnicas, administrativas y de gestión realizadas durante el ciclo de vida de un elemento destinadas a mantenerlo o devolverlo a un estado en el que pueda realizar la función requerida5 . Aunque algunos autores han clasificado hasta 18 tipos diferentes de mantenimiento6 , los más utilizados en la industria son los siguientes:
- Mantenimiento reactivo: reparar activamente piezas o componentes una vez averiados (es decir, "hacerlo funcionar hasta que se rompa"). Este método da lugar a tiempos elevados de parada de la producción, ya que no es capaz de predecir o evitar un fallo.
- Mantenimiento periódico: se ejecuta a intervalos de tiempo periódicos para un determinado número de componentes. Este mantenimiento no depende de la condición o el estado del componente. Evita paradas de producción al evitar averías, pero aumenta los costes de mantenimiento.
A diferencia del mantenimiento tradicional, el mantenimiento predictivo pretende combinar las ventajas de los distintos enfoques: evitar tiempos de inactividad por averías y reducir los costes de mantenimiento programando las operaciones de mantenimiento solo cuando sean necesarias. Para conseguir estos objetivos, un sistema ideal de mantenimiento predictivo debe tener 10 propiedades deseadas7 : realizar una detección y un diagnóstico rápidos, distinguir entre distintos tipos de fallos (la llamada característica de “aislabilidad”), ser robusto, identificar comportamientos novedosos o inusuales, clasificar la estimación de errores, adaptarse a un entorno cambiante, ser fácil de explicar, contar con unos requisitos mínimos de modelización, incorporar la computación en tiempo real y la gestión del almacenamiento, y ser capaz de identificar múltiples fallos.
Para construir un sistema de mantenimiento de estas características, los tipos de fallos suelen clasificarse en fallos asociados a los componentes, impacto ambiental, errores humanos y gestión de los procesos8 . Para predecir estos fallos suele ser necesario monitorizar muchos componentes, aplicando distintas técnicas (por ejemplo, análisis de vibraciones, pruebas de partículas, termografía, análisis de señales de motores, emisiones acústicas, monitorización de la presión o la temperatura, etc.)9 . En conjunto, estas técnicas suelen detectar fallos como grietas por desequilibrio, fatiga, desgaste por abrasión y corrosión, roces, defectos y fugas, entre otros.
Se definen dos enfoques principales del mantenimiento predictivo, basados en modelos físicos y en datos:
- Los métodos basados en modelos físicos utilizan el conocimiento experto para construir una descripción matemática de la degradación del sistema supervisado. Por ejemplo, la resistencia de los materiales, la indicación de ingenieros o productores, la información ex ante basada en pruebas, etc. Aunque pueden utilizarse datos reales para calibrar los parámetros, los resultados se basan en modelos teóricos a priori. Este enfoque puede ser difícil de aplicar en el caso de sistemas grandes y complejos.
- Los métodos basados en datos predicen el estado actual del sistema monitorizando su estado durante el uso en tiempo real y capitalizan los datos históricos sobre el uso real para aprender de los fallos del pasado. Para poder aplicar este método es pertinente recopilar y almacenar datos en tiempo real (por ejemplo, incorporando sensores), y aplicar algoritmos avanzados de aprendizaje automático o ciencia de datos.
Podría desarrollarse un modelo híbrido, donde se utilizasen los datos reales para calibrar de forma periódica los parámetros del modelo físico. La implantación de este enfoque permitiría poder contrastar las dos perspectivas, de forma que una de ellas podría servir como contraste para la otra, dotando así de mayor calidad al sistema de mantenimiento predictivo. En todo caso, dado que se incorpora el ML en los métodos basados en datos, este documento se centra en dichos métodos (para profundizar en los métodos basados en modelos físicos, véase el Recuadro 1)
Recuadro 1: métodos de mantenimiento basados en modelos físicosExisten muchos enfoques diferentes para los métodos de mantenimiento basados en modelos físicos. Dos de los modelos físicos más utilizados para el mantenimiento son el modelo de Arrhenius y el modelo de crecimiento de fallos mecánicos de CoffinManson, cuyo fundamento teórico se enuncia a continuación (estos modelos pueden desarrollarse y aplicarse en múltiples variaciones). El modelo de Arrhenius El modelo de Arrhenius se ha aplicado a una gran variedad de mecanismos de fallo, aunque originalmente se diseñó para aquellos que dependen de reacciones químicas, procesos de difusión o procesos de mitigación . El objetivo es estimar el tiempo hasta el fallo. La ecuación operativa es: tf=Ae(ΔH⁄kT) donde tf es el tiempo hasta el fallo, A es un factor de escala, ΔH es la energía de activación, k es la constante de Boltzmann, y T es la temperatura en el punto donde tiene lugar el proceso de fallo. El modelo de crecimiento de fallos mecánicos de Coffin-Manson Este modelo se aplica típicamente a fallos mecánicos, fatiga de materiales o deformación de materialesb,c. El objetivo es estimar el número de ciclos hasta el fallo. La ecuación operativa es: Nf=Af-α ΔT-β G(TM) donde Nf es el número de ciclos hasta el fallo, A es un factor de escala, f es la frecuencia de los ciclos, ΔT es el intervalo de temperatura durante un ciclo, G(TM) es un término de Arrhenius evaluado en el punto de temperatura máxima alcanzada en cada ciclo, α es el exponente de la frecuencia de los ciclos, y β es el exponente de la amplitud de temperatura |
Métodos basados en datos
El diseño y la implantación de un sistema de mantenimiento predictivo pueden apoyarse en métodos específicos para extraer información de los procesos industriales reales. Cuando estos métodos se basan en datos y en la aplicación de técnicas de IA, los métodos suelen denominarse "métodos basados en datos", y el sistema de mantenimiento predictivo también puede denominarse "sistema basado en datos".
Los métodos basados en datos se desarrollan cada vez más gracias a la incorporación de técnicas que permiten capturar y almacenar datos directamente de los procesos productivos. Los datos son recogidos por sensores o herramientas de medición a lo largo del tiempo, y forman series temporales. Por tanto, deben incorporarse métodos basados en datos diseñados para aplicarse a series temporales. Además, cuando el activo funciona correctamente, podrían construirse diferentes conjuntos de datos de entrenamiento en función de las diferentes tolerancias mecánicas, ajustes de montaje u otros factores. Estos elementos añaden dimensionalidad y complejidad al problema.
Para desarrollar un sistema de mantenimiento predictivo basado en datos, hay que aplicar dos etapas secuenciales (véase figura 1):
- El uso de técnicas de IA para producir modelos y algoritmos. Requiere el desarrollo de tres fases: dos fases comunes en casi todos los proyectos de ciencia de datos, importantes para la preparación del conjunto de datos (preprocesamiento y feature engineering), y una tercera fase específica para la detección de fallos (la aplicación de técnicas de detección de anomalías).
- La aplicación de los resultados de dichos modelos para implementar el proceso de mantenimiento, que suele estructurarse en tres fases: diagnóstico, pronóstico y mitigación.

Uso de técnicas de IA
- Preprocesamiento: esta fase consiste en preparar los datos recopilados para los siguientes pasos. Cada modelo o arquitectura de ML (incluidos los modelos de aprendizaje profundo) tiene diferentes requisitos de estructura de datos que deben satisfacerse. Un paso de preprocesamiento adecuado también puede mejorar el rendimiento del modelo. Además, dado que los datos recopilados suelen tener una estructura de serie temporal, es importante garantizar que los datos recopilados en diferentes momentos de tiempo se conviertan en una serie temporal fácil de manejar (el proceso denominado sincronización de datos). Este proceso es característico del mantenimiento predictivo. Existen otras técnicas que pueden aplicarse en este paso: validación de datos (para comprobar que los datos son correctos), limpieza de datos (para eliminar o interpolar los valores que faltan), oversampling (para tratar conjuntos de datos muy desequilibrados), data augmentation (para tratar conjuntos de datos pequeños), codificación de variables categóricas (para facilitar su manejo por parte de distintos modelos), escalado (para garantizar la comparabilidad entre variables) o tratamiento del ruido (para modelizar cómo afecta el ruido a los sensores), entre otras.
- Feature engineering: esta fase consiste en la extracción de información y la creación de nuevas variables que se utilizarán como entrada del modelo en etapas posteriores. Algunas de las técnicas más comunes que suelen aplicarse son la extracción de variables estadísticas a lo largo del tiempo, la extracción de la relación tiempo/frecuencia de las variables, la aplicación de técnicas de reducción de la dimensionalidad (como PCA o selección de variables) para reducir el espacio de variables y la complejidad del modelo, la combinación de variables existentes o el análisis de las correlaciones existentes entre variables.
- Detección de anomalías: el objetivo de esta etapa es detectar si un activo funciona en condiciones normales. El enfoque para abordar este problema depende de diferentes condiciones: la existencia de etiquetado para los datos disponibles, la dimensionalidad de las etiquetas (es decir, clasificación múltiple o binaria), la necesidad de incluir la dependencia del tiempo, utilizando por ejemplo algoritmos de ML como RNN (por ejemplo, LSTM o GRU), etc. En el caso de datos no etiquetados, pueden aplicarse múltiples métodos no supervisados, como la detección de valores atípicos o algoritmos de clustering, junto con otros métodos estadísticos tradicionales.
El objetivo de las técnicas de un marco de detección de anomalías es estudiar la distribución de probabilidad de los datos y encontrar valores atípicos como puntos que no se ajustan a la distribución habitual. Entre otras, existen algunas técnicas que pueden resultar útiles:
- Métodos de aprendizaje no supervisado basados en cálculos de densidad, como k-NN, local outlier factor (LOF) o local correlation integral (LOCI). El principio subyacente es que el comportamiento normal corresponde a regiones de alta densidad y las anomalías a regiones de baja densidad.
- Métodos de clustering como K-means o el clustering jerárquico. Para estos métodos, los datos normales pertenecen a grupos grandes y las anomalías corresponden a grupos pequeños o incluso inexistentes.
- Técnicas de aprendizaje profundo, como los mapas autoorganizados (SOM) o los autocodificadores (autoencoders, ambos con redes neuronales vanilla o RNN para incorporar la dependencia del tiempo). En este caso, los valores atípicos se detectan mediante un error de reconstrucción, suponiendo que la mayoría de los datos de entrenamiento representan las condiciones normales de funcionamiento de los dispositivos o el sistema supervisado.
- También pueden considerarse otros métodos, como los modelos de mixturas gaussianas (GMM), kernel density estimation (KDM), la divergencia KL, la detección de valores atípicos basada en histogramas o el análisis de diagramas de caja, entre otros.
Proceso de mantenimiento
- Diagnóstico: esta fase tiene como objetivo cuantificar la peligrosidad de una anomalía, es decir, medir si la anomalía evolucionará hacia un fallo o no. Una anomalía que no evolucione hacia un fallo no significa necesariamente que el modelo de detección de anomalías sea erróneo (si todas las anomalías fueran fallos, no habría forma de predecir cuándo podría producirse una, aparte de dar una simple estimación de la probabilidad). También es plausible que haya pequeñas anomalías que puedan evolucionar en futuros fallos. Existen múltiples formas de abordar esta etapa, que dependerán de la técnica utilizada en la etapa de detección de anomalías. Es común definir una métrica llamada Health Index (HI) que mide lo cerca/lejos que está el comportamiento actual del sistema comparado con las condiciones normales de trabajo. Puede ser un porcentaje de desviación en comparación con los datos normales o una medida de degradación en una escala numérica. La definición exacta del HI dependerá de la técnica utilizada (por ejemplo, si se ha utilizado un método de clustering, la distancia al grupo más cercano es un buen candidato, mientras que en un algoritmo de detección de valores atípicos basado en la densidad, la desviación de la densidad local es un buen candidato).
- Pronóstico: este paso pretende calcular o estimar la vida útil restante del sistema, o el tiempo o número de ciclos hasta el siguiente fallo. Normalmente no se dispone de datos para calcularlo con un alto nivel de precisión. Sin embargo, un posible enfoque es controlar el HI y compararlo con las condiciones normales de funcionamiento. Para ello, existen distintos métodos:
- Método basado en la similitud: comparar el comportamiento actual con los datos de aproximación al fallo anteriores.
- Método estadístico: utilizar medidas estadísticas como la distribución del tiempo hasta el fallo o modelos de supervivencia.
- Modelización supervisada: utilizar modelos de series temporales (por ejemplo ARIMA o RNN) para determinar directamente el tiempo hasta el fallo. Este enfoque solo es viable cuando se dispone de datos etiquetados de fallos anteriores.
- Análisis no supervisado: calcular y realizar un seguimiento del HI a lo largo del tiempo.
- Mitigación: el último paso consiste en planificar las operaciones de mantenimiento para minimizar los costes y las pérdidas, dada toda la información proporcionada en los pasos anteriores. Este paso no implica ningún tipo de métodos analíticos avanzados, pero es clave presentar la información de los modelos basados en datos de forma concisa y comprensible, para que los responsables implicados en el mantenimiento, o en el proceso de toma de decisiones, puedan tomar las decisiones empresariales adecuadas. En este paso, la interpretabilidad y la explicabilidad de los diferentes métodos aplicados en los pasos anteriores podrían ser cruciales desde una perspectiva empresarial.
Principales retos
La implantación de un sistema de mantenimiento predictivo basado en datos es un proceso complejo, ya que son muchos los elementos que deben combinarse. Además de consideraciones financieras o económicas, hay que tener en cuenta retos principales relacionados con dos elementos: los datos y los modelos.
- Retos relacionados con los datos:
- Es fundamental recopilar datos actualizados de los múltiples aspectos del funcionamiento del dispositivo, máquina o proceso industrial. Estos datos suelen producirse en tiempo real, de forma automatizada, por lo que es necesario desarrollar o instalar sensores que midan y capturen los datos.
- Estos datos procedentes de sensores a veces son de distintos tipos (registro de variables físicas, sonidos, imágenes, etc.), por lo que tienen que ser procesados inicialmente para ser utilizados por los algoritmos de ML.
- Los datos deben almacenarse de forma eficaz y estar disponibles (incluso en tiempo real) para su envío a otras partes del proceso de mantenimiento.
- La gran cantidad de datos supone otro reto en el almacenamiento y el tratamiento de la información.
- También hay que tener en cuenta la gobernanza y la calidad de los datos, como en muchos otros sistemas basados en la información.
- Por último, es importante garantizar que los datos están protegidos frente a ciberataques, y que también se cumple la normativa sobre protección de datos.
- Retos relacionados con los modelos:
- Uno de los retos clave es garantizar la existencia de una función de analytics adecuada, lo que incluye la existencia de áreas dentro de la organización dedicadas al desarrollo y la validación de los modelos, que cuenten con personas altamente cualificadas.
- Además, dada la alta exigencia de rendimiento que se pide al área de modelización, es importante contar con un marco de modelización integral que garantice la corrección y la eficiencia del proceso de modelización y su supervisión, así como con un marco de gobernanza de modelos establecido para gestionar todos los modelos que puedan desarrollarse.
- Ambos elementos deben apoyarse en marcos tecnológicos que permitan una integración adecuada y continua de los diferentes procesos (desde la planificación del modelo, el desarrollo, las pruebas, la implementación, el uso, la monitorización y la baja del modelo), siendo un marco MLOps una práctica cada vez más habitual.
- Es importante asegurarse de que los modelos se diseñan para construir sistemas de predicción (y no solo de detección), a fin de garantizar que se pueda implementar una gestión anticipativa con éxito.
- Uno de los principales retos es la capacidad de realizar el mantenimiento en tiempo real, lo que requiere sistemas muy exigentes en términos de precisión, puntualidad, coordinación, y dispositivos técnicos para garantizar la correcta aplicación de un sistema de modelización predictiva.
Conclusiones
Las nuevas tecnologías, el internet de las cosas (IoT), el big data, la disponibilidad de datos, la aplicación de técnicas de ML y el aumento de la potencia de cálculo y la capacidad de almacenamiento en los últimos años, han dado lugar a una nueva revolución industrial, la denominada Industria 4.0. Una de las áreas que han atraído la atención es la transformación de los procesos de mantenimiento hacia un enfoque data-driven, capitalizando la producción de nueva información sobre los procesos industriales y la aplicación de las técnicas de ML para hacer más eficiente el mantenimiento de la maquinaria y los dispositivos, en términos de ahorro de costes y tiempo.
Este nuevo tipo de mantenimiento pretende predecir cuándo y dónde se producirá un futuro fallo para programar las operaciones de mantenimiento cuando sea oportuno. Esto presenta múltiples ventajas frente a las estrategias de mantenimiento tradicionales (como el mantenimiento reactivo o periódico), que presentan costes más elevados.
Las técnicas de aprendizaje automático pueden ayudar a diseñar y desarrollar un sistema de mantenimiento predictivo basado en datos. Sin embargo, hay varios retos que deben abordarse para implantar con éxito un sistema de este tipo
La newsletter “Industria 4.0: mantenimiento predictivo" ya está disponible para su descarga en la web de la Cátedra tanto en español como en inglés.