El análisis RAMS|Terotecnic Ingeniería

Es una cuestión muy difícil hacer un artículo sobre lo que es un análisis RAMS sin extenderse hasta el infinito en explicaciones y definiciones de todos los elementos implicados. En este artículo intentaremos dar unas breves pinceladas para que al menos, aquellos que no han tenido todavia ningún contacto con un análisis RAMS acaben entendiendo de que va, para que sirve y como podemos realizarlo.

Introducción

RAMS es el acrónimo de Reliability (fiabilidad), Availability (disponibilidad), Maintainability (mantenibilidad) y Security (seguridad). Decir de manera sucinta que este análisis en teoría nos permitiría pronosticar para un período determinado de tiempo la disponibilidad y el factor de servicio de un proceso de producción concreto. Si nos damos cuenta hemos introducido un dato más además de los que incluye el acrónimo, «EL TIEMPO» luego explicaremos la importancia de esto.

La nueva pregunta es ¿en que nos vamos a basar para realizar este análisis del sistema? Pues lo haremos basándonos en su configuración (mantenibilidad), en la fiabilidad de sus componentes y en la filosofía o estrategia de mantenimiento que se le esté realizando.

De esta ecuación hay dos factores muy relacionados, la fiabilidad y la disponibilidad, ambas hacen referencia a la capacidad de un sistema para operar correctamente o de estar disponible para que opere. Esta capacidad depende a su vez, entre otros, de los factores siguientes:

De los modos de fallo del sistema o de su entorno.
De la probabilidad de que suceda cada fallo o, alternativamente, la tasa de fallo.
Del efecto de un fallo en la funcionalidad del sistema.

El siguiente factor, la mantenibilidad, está inversamente relacionada con la duración y el esfuerzo requerido por las actividades de mantenimiento, o dicho de otro modo viene a ser como de facil es hacerle un mantenimiento al equipo, y eso incluye las medidas preventivas, para eliminar o disminuir las vulnerabilidades y amenazas en general. La mantenibilidad tiene como objetivo evitar cualquier tipo de fallo mediante la detección de los primeros síntomas de anomalía para que se puedan tomar las medidas adecuadas para anticipar la resolución a un problema inminente, evitando así las posteriores medidas correctivas y caídas o degradaciones del funcionamiento del sistema. Entre los factores que afectan la mantenibilidad se pueden destacar los siguientes:

Tiempo de realización del mantenimiento.
Tiempo para la detección, identificación y localización de fallos.
Tiempo para restablecer un sistema en caso de fallo.
Todos los modos de operación y mantenimiento requeridos durante todo el ciclo del sistema.

Como puede comprobar, la mantenibilidad en realidad es una medida de tiempo, ya que la suma de todos estos factores será el determinante de la buena o mala mantenibilidad.

Por último en esta introducción debemos hablar del objetivo de la seguridad de funcionamiento, que no es otra cosa que asegurarse de proporcionar un producto que cumpla con las necesidades finales del usuario, a un bajo coste y en el tiempo límite prefijado, considerando esta seguridad de funcionamiento como las características propias que le permite comportamientos funcionales especificados (RAMS) en un tiempo determinado, con una duración establecida y sin daños a sí mismo o al ambiente.

La siguiente pregunta a responder para entender este concepto sería: ¿Existe relación entre Fiabilidad, Disponibilidad, Mantenibilidad y Seguridad?

Pues sí, efectivamente existen relaciones entre la Fiabilidad, la Disponibilidad, la Mantenibilidad y la Seguridad de funcionamiento. A mayor Seguridad, menor Disponibilidad y viceversa. Aumentando la Mantenibilidad y la Fiabilidad se consigue incrementar la Disponibilidad y la Seguridad de funcionamiento.

Así pues, el análisis RAMS se sustenta en un modelo de simulación que toma en cuenta la configuración de los equipos teniendo en cuenta su mantenibilidad, los fallos aleatorios teniendo en cuenta su estadística, las reparaciones teniendo en cuenta sus tiempos de respuesta, las paradas parciales y totales y el mantenimiento planificado necesario teniendo en cuenta su criticidad.

Durante la ejecución de un estudio RAMS, se realiza la adecuada caracterización probabilística de los procesos de deterioro que afectarán los equipos, sub-sistemas y sistemas asociados al citado proceso de producción a fin de pronosticar la mayoría de los escenarios de paros o fallos.

¿Qué se puede obtener de un análisis RAM?

Disponibilidad total, que es el número de horas durante las que se espera que el proceso o sistema funcionará correctamente.
Del proceso RAMS obtendremos la jerarquización de los equipos o sistemas críticos que nos permitirá conocer la proporción con la cual los equipos o sistemas estudiados afectan la disponibilidad de la instalación. De esta manera, se puede saber qué equipo o sistema es más importante al momento de estudiar la disponibilidad, y se puede optimizar la estrategia de mantenimiento para los distintos equipos/sistemas.
Información de confiabilidad que se utilizará para definir una estrategia de mantenimiento basada en la confiabilidad de los equipos, que permita maximizar el tiempo de uso entre fallos de los mismos.
Predicción estadística de fallos críticos en la instalación que es el tiempo medio entre fallos críticos o el punto en el que el sistema definido por el diagrama de bloques de confiabilidad falla.

¿Qué software nos puede ayudar a generar un análisis RAMS?

MAROS™ & TARO™ desarrollados por DNV
RAMP desarrollado por Reliass
RAM Commander desarrollado por Reliass
BlockSim desarrollado por ReliaSoft

En definitiva y para comenzar con la base fundamental de este artículo explicaremos que son las siguientes variables MTTF, MTBF y MTTR que nos encontraremos y que mejor caracterizan los datos estadísticos de los diversos equipos o sistemas de producción.

1. Parámetros RAMS

1.1 Definición de tasas de fallo.

Antes de comenzar lo ideal es insertar una gráfica para entender mejor los parámetros que vamos a desarrollar.

Parámetros relacionados con el análisis RAMs

Como se observa en el gráfico anterior, tenemos un sistema que a lo largo del tiempo (en azul) está funcionando correctamente hasta que aparece un fallo (rayo en rojo). Cuando aparece el fallo, el sistema está durante un tiempo fuera de servicio (en amarillo) y, pasado un tiempo (suponemos una vez reparado), este pasa a estar de nuevo en servicio (en azul).

El estado de «en servicio» (en azul) permanecerá hasta que al cabo de un tiempo, aparece, nuevamente un fallo (rayo en rojo).

Este es el ejemplo típico de un sistema de producción. Ahora bien, ¿que significan los parámetros que refleja que además son los estándares de un análisis RAMs? Comencemos con el MTTF:

1.2 MTTF:

¿Qué significa el parámetro MTTF? MTTF es el acrónimo de Mean Time To Failure (Tiempo medio hasta el fallo) y representa el tiempo en que el sistema está activo, cumpliendo las funcionalidades por las cuales ha sido diseñado.

En los sistemas reparables (donde el sistema puede ir a un fuera de servicio y ponerse en marcha de nuevo cuando ha sido reparado), el MTTF y el MUT (Mean Up Time, Tiempo medio en servicio) son exactamente iguales.

1.3 MTBF

¿Qué significa el parámetro MTBF? MTBF es el acrónimo de Mean Time Between Failures, (Tiempo medio entre fallos), nos indica cual es la previsión que se tiene de cada cuanto el sistema fallará. Es decir, responde a la pregunta, ¿cada cuantas horas se prevé que aparezca un fallo al sistema bajo análisis? Se simboliza con la «R». De este dato se desprende la tasa de fallo λ, es 1/MTBF.

El MTBF está totalmente ligado a la fiabilidad del equipo, producto o instalación en realidad es el parámetro cuantitativo de la fiabilidad.

Cuidado porque es muy habitual confundir el MTTF y el MTBF aunque como se observa gráficamente en la gráfica anterior se puede ver que la diferencia entre ambos parámetros es el tiempo MDT (en amarillo), es decir, el tiempo que el sistema está fuera de servicio. De este modo, podemos decir que MTBF = MTTF + MDT.

Se puede abundar más sobre estas variables pero no es el tema líder de este artículo.

2. Fiabilidad

2.1 Definición de fiabilidad

La fiabilidad de un dispositivo es la probabilidad de que un componente o sistema, sometidos a unas condiciones de trabajo concretas, funcione correctamente durante un determinado período de tiempo. En consecuencia, si estas condiciones cambian, la fiabilidad cambiará también, por lo que la fiabilidad es altamente dependiente de las condiciones y no se pueden hacer comparaciones de la misma sin tener en cuenta las condiciones de trabajo de cada sistema. Como ya hemos dicho, la fiabilidad se representa por R(t). El valor complementario de R(t) se conoce como función acumulada de la probabilidad de fallo, se representa por F(t) y representa la probabilidad de que el equipo falle al cabo de un tiempo t.

2.2 Definición del fallo y tipos de fallo

Se define fallo como el cese de la capacidad de un elemento para realizar la función requerida. Los fallos pueden clasificarse de acuerdo con su criticidad o con su naturaleza.

El concepto de criticidad de un fallo está relacionado con la gravedad de las consecuencias que puede provocar. Si únicamente atendemos al impacto en el servicio del equipo o sistema, los fallos pueden clasificarse como:

Significativos:
- Fallo que impide la prestación del sistema a la producción o que provoca un retraso en la misma que sea superior al periodo especificado o preestablecido.
Importantes:
- Fallo funcional que debe ser corregido para que el equipo logre el rendimiento especificado pero que no provoca un retraso, ni suspende la producción en un plazo superior al especificado para el fallo significativo.
Menores:
- Fallo que no impide que el equipo logre el rendimiento especificado y que no cumple con los criterios para ser considerado fallo significativo o importante.

Lo que ocurre en realidad es que los fallos no se miden sólo atendiendo al propio equipo y a la función para la que está diseñado. Lo normal es que además de los daños en el propio equipo, se tenga en cuenta los daños producidos a otros sistemas, a las personas o al medioambiente. Cuando más impacto es capaz de provocar el fallo del equipo en cualquiera de estas facetas, más crítico es.

Visto desde este punto de vista, los fallos pueden clasificarse en cuatro niveles, siendo necesario establecer cuantitativamente qué se entiende por importante, apreciable y despreciable, a fin de reducir al máximo la subjetividad a la hora de calificar el fallo.

Categoría del fallo	Función	Equipo	Ambiente	Personas
CATASTROFICO	Perdida de una función esencial	Produce daños importantes	Produce daños importantes	Puede causar muerte o daños corporales
CRÍTICO	Perdida de una función esencial	Produce daños importantes	Produce daños importantes	Presenta riesgos despreciables de muerte o de daños personales
NO CRÍTICO	Funcionamiento degradado	No causa daños apreciables	No causa daños apreciables	No representa daños apreciables
MENOR	Funcionamiento degradado	Causa daños apreciables	No causa daños apreciables	No representa daños apreciables

Niveles de gravedad de los fallos cuando se consideran los daños del equipo, de las personas y del medio ambiente.

Hay una última valoración para clasificar los fallos, y esta es la que se atiene a su naturaleza ante la evidencia del propio fallo y es que los fallos pueden ser evidentes u ocultos al operador o el mantenedor. Un fallo es evidente, cuando produce un efecto en el sistema que es patente más tarde o temprano, por el contrario, un fallo se dice que es oculto cuando necesita de un evento posterior para ser detectado, lo que suele ser habitual en los sistemas de control o de detección y en los sistemas formados por dos equipos redundantes en los que uno está en activo y el otro está en reposo hasta que el anterior falle.

3. Mantenibilidad

3.1 Definición de mantenibilidad

Cuando se produce un fallo en un equipo, se necesita un tiempo para detectar en qué componente se ha producido y para repararlo o sustituirlo por uno nuevo a fin de dejar el equipo en condiciones de funcionamiento esto se define como mantenibilidad que es la probabilidad de que un equipo que ha tenido un fallo sea puesto de nuevo en funcionamiento, mediante la aplicación de ciertas acciones, dentro de un tiempo «t» que se conoce como tiempo de restauración.

La mantenibilidad, por tanto, no está asociada únicamente a las características técnicas de la instalación sino también a las capacidades, experiencias y medios técnicos de los equipos de trabajo, por lo que los valores de mantenibilidad obtenidos con distintos equipos de trabajo pueden ser diferentes, al no ser iguales las capacidades y experiencias de sus miembros, como tampoco necesariamente las herramientas o útiles específicos empleados por cada uno de ellos.

3.2 Clases de mantenimiento

Ha continuación explicaremos cuales son los tipos de mantenimiento industrial que hay, algunos de ellos son planificados y otros no planificados. Los no planificados son aquellos que se tienen que hacer de emergencia porque la maquinaria ha fallado y no ha sido detectado.

Lo ideal sería que todo el mantenimiento fuese planificado, de esa forma, aumentaremos la seguridad de los trabajadores y no pondremos en riesgo la continuidad de la producción ni comprometeremos el medio ambiente. Pero esto no es siempre posible. Por eso el primero de los mantenimientos que explicamos es:

3.2.1 Mantenimiento correctivo

El mantenimiento correctivo consiste en corregir los errores del equipo conforme vayan apareciendo. Por su propia naturaleza, el mantenimiento correctivo es difícilmente programable, aunque a veces pueden ser planificados, cuando son desgaste que ya vienen previstos y ya se tienen en cuenta en los planes de mantenimiento. Una fina línea separa este último mantenimiento correctivo de un preventivo.

3.2.2 Mantenimiento preventivo

El mantenimiento preventivo consiste en una intervención sistemática del equipo, aunque este aún no haya dado señas de desgaste o error. Se tienen en cuenta las vulnerabilidades de la maquinaria, los manuales de los fabricantes y los materiales y se planifica un mantenimiento programado para efectuarlo en el momento oportuno para intervenir el equipo y no llegar a la necesidad de una reparación más seria. Normalmente requiere un buen plan de mantenimiento industrial y un software capaz de gestionarlo.

3.2.3 Mantenimiento predictivo

Este es el tipo de mantenimiento industrial más avanzado y el que requiere mayor preparación, formación y precisión. Normalmente se realiza un análisis de criticidad de la planta y se incluyen en el plan de mantenimiento predictivo todos aquellos equipos que según las tablas que hemos expuesto van más haya de lo Importante y/o crítico. El mantenimiento predictivo se trata de realizar una serie de análisis físico/químicos periódicos a los equipos para poder descubrir si alguna de las variables de la maquina han cambiado y predecir las averías y los errores antes de que se produzcan, análisis de vibración, de ultrasonidos, de termografía, de aceite, de calidad eléctrica, análisis no destructivos, endoscopia, etc.

Primero se establecen unos valores base y una vez se conocemos los parámetros normales, pueden verse variaciones en ellos que indiquen un posible problema en el equipo, así se evita llegar a la avería.

3.2.4 Mantenimiento cero horas u overhaul

Consiste en tareas y procedimientos que dejan la máquina a cero horas de funcionamiento. Esto quiere decir que, bien cuando ya está comenzando a bajar el rendimiento del equipo o bien cuando todavía funciona a la perfección, se sustituyen todos los componentes necesarios hasta que tiene el mismo desgaste por el uso que si fuera totalmente nueva. Es uno de los tipos de mantenimiento industrial que sirven para asegurarse de alargar la vida útil del equipo a largo plazo y de forma controlada.

3.2.5 Mantenimiento en uso

Este es uno de los tipos de mantenimiento industrial de más baja intervención. Normalmente lo suelen hacer los usuarios del propio equipo o personal auxiliar. Consiste en simples tareas de prevención, como una limpieza adecuada o una observación sobre defectos visibles.

4. Disponibilidad

4.1 Definición de disponibilidad

Cuando se produce un fallo en un equipo reparable éste deja de realizar las funciones para las cuales ha sido requerido hasta que se repare el fallo. Aparece, así, un nuevo concepto, la disponibilidad, que se define como la probabilidad de que un equipo realice las funciones requeridas en un instante o periodo de tiempo determinado, siempre que funcione y se mantenga de acuerdo con los procedimientos establecidos.

En los equipos complejos, la disponibilidad dependerá de la disponibilidad de los equipos que lo forman, de acuerdo también con las configuraciones básicas serie y paralelo.

Por ejemplo, un sistema serie estará operativo únicamente cuando todos los componentes que lo forman estén operativos.

Un sistema paralelo no será operativo y por tanto, no estará disponible, cuando estén indisponibles simultáneamente todos los componentes que lo forman.

4.2 Efectos y criticidad AMFEC O FMECA Análisis de modos de fallo

FMEA/FMECA, es el acrónimo de “Failure mode, effects and criticality analysis” o «Análisis de los Modos de Fallo y sus Efectos». La norma por la que se rige el análisis FMEA es la UNE-EN 60812:2008 “Analysis techniques for system reliability – Procedure for failure mode and effects analysis (fmea)”. ¿Pero qué es esta herramienta FMEA? El FMEA es un procedimiento sistemático para el análisis de un sistema con el fin de identificar los modos de fallo potenciales, sus causas y efectos en el funcionamiento del sistema. Este tipo de análisis debe hacerse al inicio del ciclo de desarrollo del sistema, de manera que la eliminación o mitigación del modo de fallo sea lo más rentable posible. Lo ideal sería que este trabajo se inicie tan pronto como el sistema se haya definido lo suficiente como para presentarlo mediante un diagrama de bloques funcionales en donde se puede definir la función de sus elementos y por tanto se puedan barajar criterios para la mitigación o eliminación de los fallos posibles. (FMEA es tan amplio que merece la pena dedicar todo un artículo a su estudio y desarrollo)

5. Metodología de un Análisis RAMS

5.1 Modelo General de un Análisis RAMS

La siguiente imagen representa toda la metodología y procedimiento para completar un análisis RAMS

Metodología y procedimientos para completar un análisis RAMS

El análisis RAM se inicia con la recopilación de datos que podemos llamar Etapa 1.

I Etapa

Como ya hemos explicado, se trata de generar datos para el posterior análisis de estadística y estos datos pueden recopilarse de distintas fuentes de información, de un lado las acciones referentes al equipo y de otro las propia de la producción. En cuanto a las acciones de los equipos recopilaremos datos de los reportes de operaciones, de inspecciones técnicas, avisos, ordenes de trabajo, de los historiales de fallas, etc. Y en cuanto a los datos de producción recopilaremos todo lo referente a tiempos de producción, modos de falla, planes de mantenimiento preventivo, paradas no programadas y tiempos de reparación.

Podremos dividir este trabajo en distintos pasos:

El primero será la recopilación de datos históricos propios, esta fuente de información es la más representativa del comportamiento de fallas y reparaciones de los equipos a considerar en el análisis, son los datos más importantes porque son veraces ya que corresponden a los equipos funcionando en la producción para la que fueron diseñados, el problema es que generalmente esta información es escasa sobre todo en aquellas industrias de reciente instalación por los mismos parámetros de tiempo.

De cualquier forma para recopilar la máxima información propia o evidencia de fallas y reparaciones de los equipos, se debe buscar en cualquier parte donde pudiera haber quedado un registro, GMAOS, SAP, también se debe recurrir al personal de mantenimiento, quienes muchas veces llevan sus indicadores de gestión en archivos personales, los cuales también son una fuente valiosa de información. Esta etapa se conoce como depuración de la data de fallas y reparaciones, y debe ser llevada a cabo en apoyo con los expertos en mantenimiento quienes conocen el comportamiento de fallas y reparaciones de los equipos.

El segundo paso de la primera etapa, sería buscar la opinión de expertos. Hay veces que no es suficiente con los datos obtenidos en el paso anterior y tenemos que recurrir a esta técnica que es complicada también en diversos sectores donde no existen expertos sobre un sistema concreto o si existen no están a nuestro alcance. En el caso de que se disponga de estos expertos, entre los que por supuesto se puede contar con el equipo de mantenimiento y las personas implicadas en la manipulación del sistema, se puede optar por el uso de algunas herramientas como el método Dhelphi ha modo de cuestionario de sucesos futuros, que podría resultar de gran ayuda.

Si con estos dos pasos tampoco tenemos suficiente información podemos recurrir a la búsqueda de información genérica. Esta información con datos de confiabilidad genéricos puede provenir de reconocidas bases de datos internacionales como OREDA, PARLOC, WELL MASTER, IEEE, pero teniendo mucho cuidado con estos datos que no son específicos de la industria para la que estemos elaborando el análisis RAMS.

II ETAPA

La segunda etapa para un análisis RAM, es la revisión y validación de datos. Para esta última tarea será importante escoger un equipo de trabajo con alta experiencia en el conocimiento del comportamiento de fallas y reparaciones de los equipos incluidos en el análisis. Estas personas, seguramente ya han colaborado en alguno de los pasos anteriores, por lo que muchos de ellos ya estarán familiarizados con esta tarea.

Este equipo de expertos deberán validar las distribuciones de probabilidad que reflejan la información de confiabilidad (Tiempos Para la Falla) y mantenibilidad (Tiempos Para Reparar) de los equipos incluidos en el Análisis RAM. En esta etapa también se debe validar la estructura e información técnica contenida en la base de datos, en resumen se trata de dar estructura y orden a todos los datos recolectados en la etapa anterior para que tengan sentido y puedan dar respuestas a los cálculos estadísticos para los que han sido recopilados.

III ETAPA

Es la etapa más complicada, se trata de realizar el análisis estadístico de todos los datos estructurados obtenidos en las etapas anteriores. Para esta etapa nos podemos ayudar de herramientas informáticas muy eficaces para este trabajo. RARE y RAPTOR. El trabajo a realizar se trata de establecer la distribución probabilística y los parámetros del MTBF y el MTTR, de los que obtendremos lo que realmente buscamos, que no es otra cosa que la mejora de la confiabilidad del sistema

IV ETAPA

Última etapa de las presentadas, se trata de graficar la información para presentarla y tener una mejor visión del conjunto de las cosas para poder plantear otros escenarios. Presentar el riesgo de OEE probabilístico y de las propuestas para mejorar el desempeño futuro del sistema analizado.

ABREVIATURA Y TÉRMINOS

DBD: Diagrama de Bloque de Disponibilidad
DFP: Diagrama de Flujo de Procesos
OEE: Overall Equipment Effectiveness / Eficiencia General de los Equipos
PI&D: Piping and Instrumentation Diagram / Diagrama de Tuberías e Instrumentación
R(t): Riesgo
RAM: Reliability, Availability and Maintainability Analysis / Análisis de Confiabilidad, Disponibilidad y Mantenibilidad
TPF: Tiempo para la Falla
TPR: Tiempo para Reparar
TPEF – MTBF: Tiempo promedio entre Fallas
TPEEP: Tiempo Promedio entre Eventos de Paro
TPPR – MTTR: Tiempo promedio para reparar
TPFS: Tiempo Promedio Fuera de Servicio
λ: Tasa de falla

Bibliografía

Formación análisis RAMS de Terotecnic Ingeniería S.L.
Marta Zárata Fraga. Proyecto fin de carrera – Análisis RAMS – Universidad Carlos III de Madrid Escuela Politécnica Superior. Departamento de Ingeniería Mecánica.
Amendola, Luis. Indicadores de fiabilidad propulsores en la gestión del mantenimiento. Universidad Politécnica de Valencia.
Arques Patón, José Luis (2009). Ingeniería y gestión del mantenimiento en el sector ferroviario.
García de Korazar, Xabier (2004). Proceso de mejora de RAMS a lo largo del ciclo de vida
García de Korazar, Xabier (2004). Proceso de mejora de RAMS a lo largo del ciclo de vida (II).
Gómez de la Vega H., Medina N., Semeco K, Yanez M. Análisis de Confiabilidad, Disponibilidad y Mantenibilidad en Sistemas Productivos.
Plazas Aguilar, Jaime (2010). Ingeniería de confiabilidad aplicada a un sistema de control local en una planta de transporte de hidrocarburos. Proyecto Fin de Carrera. Universidad de los Andes.
Rojas Monsalve, Elimar Anauro. Experiencias en el desarrollo de Análisis de Confiabilidad, Disponibilidad y Mantenibilidad (Análisis RAM). Revista Predictiva21
Geovanny Solórzano. Aplicación de un análisis RAM en un sistema de bombeo de agua cruda
Gráficas de Leedeo.

Guillermo Díaz Povedano

Director de Terotecnic Ingeniería, S.L.
¡Toda la ingeniería de confiabilidad a su alcance!

Terotecnic

El análisis RAMS

Introducción

¿Qué se puede obtener de un análisis RAM?

¿Qué software nos puede ayudar a generar un análisis RAMS?