El análisis de Causa Raíz – RCA – ACR

Introducción

La gestión empresarial contemporánea, centra sus propósitos en la calidad de sus productos y/o servicios y en la eficiencia de su gestión y entrega, para ello la utilización de modelos sistemáticos, la buena gestión de los procesos y del mantenimiento y la mejora continuo son determinantes, pero en esta meta, siempre surgen problemas unos más grandes otros pequeños a veces únicos a veces repetitivos y por esto, la resolución de problemas requiere medidas especificas más si son reiterativos, pues sus efectos se oponen a los objetivos organizacionales. Así los problemas pueden ser definidos como comportamientos no deseados de un proceso, y su relación con los errores determina la concepción de aplicar medidas preventivas y/o correctivas según el caso y bien gestionados facilitan los ajustes y validación de los procesos.

En la gestión empresarial moderna el análisis y resolución de problemas forman parte de la filosofía de mejoramiento continuo y los problemas que son reiterativos merecen especial atención, pues son los que más impactan en los resultados de las empresas, de ahí nuestro interés en redactar este tipo de artículos explicativos para ayudar a nuestros clientes y lectores a solventar en la medida de lo posible sus problemas industriales con herramientas y técnicas de probados resultados.

Hemos visto en artículos anteriores herramientas para resolver problemas, como por ejemplo el método 8D que en realidad podría forman parte de un RCA o es una herramientas aplicables al mismo. Hoy dedicaremos este artículo de nuestro blog a hablar sobre el análisis de causa raíz, una de las herramientas más extendidas y eficaces cuando necesitamos encontrar con precisión cual es el motivo detonador de un problema o dicho de otro modo, cual es su causa raíz.

Definición y motivación

El análisis de Causa Raíz o RCA por su acrónimo (Root Cause Analysis) o ACR acrónimo en español de (Análisis Causa Raíz), es un método de resolución de problemas dirigido a identificar las causas o acontecimientos iniciales que provocaron el problema. Esta práctica se basa en el supuesto de que los problemas se resuelven mejor al tratar de corregir o eliminar las causas raíz del mismo, en vez de tratar solamente los síntomas evidentes que nos encontramos en primera instancia. Al dirigir las medidas correctivas a las causas primarias, se espera que la probabilidad de la repetición del problema se minimizará. Sin embargo, se reconoce que la prevención total de la recurrencia de una sola intervención no es siempre posible, por lo tanto, el RCA es considerado a menudo como un proceso iterativo, y con frecuencia es usado como una herramienta de mejora continua.

Deliberadamente, en adelante llamaremos a la técnica indistintamente por ACR o RCA para que en las búsquedas el artículo sea encontrado por ambos acrónimos.

Dicho esto, y como hago en muchos de mis artículos, intentaré explicar esto de manera sucinta y sencilla y no se me ocurre manera más sencilla que proponeros que pensemos en problemas comunes, como por ejemplo: Si nos sentimos mal físicamente, vamos a ver a un médico y le pedimos que busque la causa de nuestro malestar. Si nuestro automóvil nos deja tirados y tenemos que avisar a la grúa, lo llevamos a un taller mecánico para que encuentren la causa del problema. Pero, para estos dos ejemplos podríamos haber tomado otras decisiones, podríamos habernos quedado en casa y esperar a sentirnos mejor para volver al trabajo, podríamos haber cogido un taxi y haber dejado el coche averiado en casa, pero habríamos paliado sólo los efectos y no habríamos tratado las verdaderas causas y por tanto se volverán a repetir o nos tendríamos que enfrentar a ellas más adelante.

Pues en cualquier ámbito de la empresa o de la industria deberíamos hacer exactamente lo mismo, buscar la causa raíz y no solucionar sus efectos sobre todo en la gestión de la confiabilidad que es la parte que a nosotros nos afecta.

Un RCA, en principio es un método reactivo de detección de problemas y solución de los mismos, esto significa que el análisis se realiza después de que un evento ha ocurrido, aunque el resultado de esta investigación se convierte inmediatamente en un método proactivo, esto quiere decir que tomamos o realizamos una acción que evitará que el mismo problema vuelva a ocurrir; no somos preventivos, no hacemos correctivo, luego somos proactivos al respecto.

Como podemos ver en la imagen siguiente, en un problema las partes visibles, las obvias están a la vista de cualquiera y en la mayoría de los casos nos son más que el efecto de las verdaderas causas del mismo.

Un ejemplo muy práctico que quizás les suene a los ingenieros de confiabilidad: Una bomba centrifuga pierde por el cierre mecánico, el efecto es que vemos salir producto por el cierre, lo vemos nosotros y cualquiera que pase por al lado de la bomba. Si cambiamos el cierre y ponemos un nuevo hemos solucionado temporalmente el efecto, pero ¿Cuál era o es la causa? Si no solucionamos la causa o causas lo más probable es que en poco tiempo el cierre vuelva a perder producto.

En confiabilidad que es mi disciplina, el Análisis Causa Raíz (ACR) es una metodología que emplea un conjunto de técnicas o procesos, para identificar factores causales de falla, es decir, busca el origen de un problema definido, relacionado con el personal, los procesos, las tecnologías, y la organización, con el objetivo de identificar actividades o acciones rentables que los eliminen.

La resolución de problemas, la investigación de incidentes y análisis de causa raíz están conectados fundamentalmente por tres preguntas básicas:

Definiciones y términos usados en ACR

Antes de revisar la descripción de la Metodología de Análisis Causa Raíz (ACR), es preciso conocer las definiciones de los términos de uso común.

Si tiene interés sobre el tema y quieres ampliar información contacte con nosotros o visite las páginas Acrónimos y/o Definiciones de nuestra Web. Y si necesita un ACR con precisión y garantía cuente con nosotros, Análisis Causa Raíz Terotecnic Ingeniería.

Principios generales, objetivos y beneficios del análisis de causa raíz

Son varios los objetivos de un proceso de análisis de causa raíz:

  • El primer objetivo es descubrir la causa de un problema o suceso.
  • El segundo objetivo es hallar y comprender cómo resolver, compensar o aprender de los problemas subyacentes que forman parte de la causa.
  • El tercer objetivo es aplicar lo que aprendemos a partir del análisis para prevenir problemas futuros de manera sistemática o repetir logros.

En realidad, este tercer objetivo es el que da valor a la eficacia del análisis. Si aplicamos lo aprendido en el mismo para ser proactivos en este y otros problemas similares habremos conseguido beneficio a largo plazo. Se trata por tanto de utilizar el RCA para modificar problemas centrales de proceso y sistema de un modo que permitan evitar problemas futuros.

Lo que suele ocurrir y donde normalmente fallamos es en el hecho de que tratar los diferentes síntomas puede hacernos sentir productivos, resolver un gran número de problemas puede hacernos pensar que estamos tomando cartas en el asunto. Sin embargo, si no diagnosticamos la causa real de un problema, es probable que este vuelva a producirse una y otra vez y acaben tachándonos de ineficaces.

Existe una serie de principios esenciales que determinan la eficacia de un análisis de causa raíz (RCA); estos principios no sólo ofrecerán un aporte a la calidad del análisis, sino que además ayudarán al analista a obtener la confianza y el apoyo de partes interesadas, clientes, colaboradores, servicios, etc.

  1. Centrarse en corregir y remediar las causas en lugar de los síntomas.
    1. Es evidente sino para nada necesitamos el análisis, porque los síntomas están a la vista o son normalmente fáciles de localizar
  2. No ignorar la importancia de tratar los síntomas para alcanzar una solución a corto plazo.
    1. Esto no siempre es necesario porque, si el análisis se ejecuta con rapidez, el resultado del análisis implicará la eliminación de los síntomas. No obstante, en muchos otros casos hay que eliminar los síntomas por producción, por seguridad o por daños al medio ambiente.
  3. Comprender que en algunos casos y de hecho se da a menudo, puede haber varias causas.
    1. No debemos empecinarnos en buscar una única causa raíz, en muchos casos puede haber varias causas implicadas.
  4. Centrarse en CÓMO y POR QUÉ algo sucedió y no en QUIÉN es el responsable.
    1. En un RCA, buscar responsables no es lo adecuado, ya que la responsabilidad última siempre es de una especificación, norma u orden mal explicada o por falta de formación. En cuyo caso deberíamos ahondar mucho antes de señalar con el dedo y además sería inútil. Lo importante es centrarse en el CÓMO y el POR QUÉ.
  5. Ser metódico y buscar evidencia concreta de causas y efectos para respaldar la argumentación de la supuesta causa raíz de un problema.
    1. Este es el buen hacer y la experiencia del que dirija el análisis de causa raíz
  6. Proporcionar información suficiente para elaborar un plan de acción correctivo.
    1. Esto corresponde a la última parte del análisis en la propia elaboración del informe no debemos quedarnos cortos en la información y especificar paso a paso como hemos llegado a las conclusiones.
  7. Considerar el modo de prevenir (o replicar) la solución de una causa en el futuro o sea ser proactivo.
    1. Lo ideal tras el análisis es ser proactivo y tratar la causa para equipos iguales, con elementos iguales y síntomas iguales. Esto reducirá la probabilidad de ocurrencia y redundará en la fiabilidad de la gestión de los activos.

En resumen y según se describe en los siete principios anteriores, cuando analizamos problemas y causas en profundidad, es importante adoptar un enfoque completo e integral. Además de descubrir la raíz de un problema, deberíamos esforzarnos por proporcionar contexto e información que permitan elaborar un plan de acción o tomar una decisión. Recuerde que el análisis eficaz es aquel que puede dar lugar a medidas para tomar.

Técnicas y métodos para la realización de un RCA

Existe un gran número de técnicas y estrategias que podemos utilizar para el análisis de causa raíz. La siguiente lista no es por tanto exhaustiva en absoluto. A continuación, abordaremos de manera muy resumida algunas de las técnicas más comunes y útiles. Pero además iremos lanzando en nuestro blog artículos explicativos más desarrollados de cada una de ellas.

  • Análisis de los modos de falla y efectos (FMECA).
  • Análisis del árbol de fallas.
  • Los 5 porqué.
  • Diagrama de Ishikawa.
  • Análisis de Pareto regla 20/80.
  • Método de resolución de problemas 8D
  • Análisis de barreras.
  • Diagrama de Gantt
  • Diagrama de flujo
  • Matriz de relación
  • Inferencia Bayesiana.
  • Análisis árbol factor causal.
  • Análisis de cambios.
  • Árbol de la realidad actual (teoría de las restricciones).
  • Diagnóstico de problemas RPR (Rapid Problem Resolution, en IT)
  • Lluvia o tormenta de ideas (Brainstorming)
  • El marco lógico
  • Entrevistas
  • Listas chequeables

He marcado en negrita las más utilizadas o al menos las que yo mejor manejo y creo que además arrojan mejores resultados.

Se elegirá para el RCA una o varias de las técnicas anteriormente expuestas dependiendo del problema, de la disponibilidad del grupo, de la interrelación de este con el problema, de la criticidad del equipo, y de la envergadura del proyecto. Pero, de cualquier forma, si va a afrontar el papel de líder del grupo tenga en cuenta los siguientes consejos generales.

  • Haga preguntas que permitan aclarar la información y lo acerquen a obtener respuestas.
  • Cuanto más profundice e interrogue sobre las causas potenciales, más probabilidades tendrá de hallar la raíz.
  • Una vez que crea haber identificado la raíz del problema (en lugar de otro síntoma), podrá formular incluso más preguntas:
    • ¿Por qué está seguro de que esta es la causa y no esta otra?
    • ¿Cómo puede corregir esta raíz para evitar que el problema vuelva a surgir?
  • Utilice preguntas simples, como por ejemplo “¿por qué?”, “¿cómo?” y “¿esto qué significa?”, para facilitar la comprensión.
  • Trabaje en equipo e incorpore una mirada nueva
    • Ya sea que trabaje con un compañero o un equipo de colegas, incorporar una perspectiva diferente a la suya lo ayudará a encontrar soluciones más rápidamente y le servirá para mitigar los sesgos.
    • Recibir la opinión de otras personas también le permitirá contar con un punto de vista adicional y cuestionar sus propias hipótesis.
  • Planee un análisis de causa raíz futuro
    • A medida que avance en el análisis, es importante que tenga muy presente el proceso.
    • Tome notas. Haga preguntas sobre el proceso de análisis.
    • Identifique si una técnica o un método determinados funciona mejor para las necesidades y los entornos específicos de su negocio.

Y tenga en cuenta lo siguiente:

  • En el método de mapeo de la causa, la palabra raíz en el análisis de causa raíz se refiere a todas las causas que están por debajo de la superficie.
  • Céntrese en una sola causa, a la vez, y cuando haya terminado céntrese en la siguiente, en otro caso puede limitar el conjunto de soluciones establecidas resultando que las mejores soluciones se perdieron.
  • Un Mapa de Causa proporciona una explicación visual simple de todas las causas que se requieren para producir el incidente (hablaremos de ello en artículos sobre las herramientas disponibles para el análisis).
  • No pierda de vista que «La raíz es el sistema de causas que revela todas las diferentes opciones para las soluciones».
  • Hay tres pasos básicos para el método de Mapeo de la Causa:
    1. Definir el problema por su impacto a las metas globales
    2. Analizar las causas en un mapa visual
    3. Prevenir o mitigar cualquier impacto negativo en los objetivos seleccionando las soluciones más eficaces.

A continuación expongo una serie de causas o desviaciones por las que puede salir mal el análisis; nos referiremos a ellos como CAMINOS INCORRECTOS:

  • La enunciación del problema incluye más de un problema.
  • La enunciación del problema asigna una causa.
  • La enunciación del problema asigna culpa.
  • La enunciación del problema ofrece una solución.
  • El gráfico de ejecución tiene unidades de medida que no guardan relación con el enunciado del problema.
  • La enunciación del problema no incluye alguno de los cuatro elementos esenciales:
    • objetivo/estándar,
    • realidad,
    • diferencia,
    • tendencia.
  • Los recursos están alineados incorrectamente y asignados al problema incorrecto.
  • El problema no tiene fundamento.

Por otro lado enumeraré los puntos de referencia para alcanzar el éxito en nuestro análisis:

  • La enunciación del problema es clara y práctica.
  • El equipo ha llegado a un consenso acerca de la enunciación del problema.
  • El equipo está de acuerdo con el fundamento acerca del motivo por el que el problema y su solución son importantes.
  • El problema está en su área de control, de modo que el equipo puede asumir la responsabilidad real de resolverlo.

Desarrollo de un ACR

El proceso en su totalidad depende de la aplicación de pensamiento crítico para definir correctamente el problema en primer lugar. Es fácil confundir el verdadero problema con los síntomas del problema y/o con las causas supuestas del problema. Esto puede ocasionar que se solucionen los síntomas pero no la causa, o que se identifique incorrectamente la causa y , en consecuencia, se apliquen medidas correctivas no eficaces. Si se comienza por el lugar incorrecto, nunca se llegará a un buen destino ni a una solución sostenible para el problema raíz.

Además, su puesto en la organización y sus anteriores experiencias en resolución de problemas pueden influenciar en el modo de interpretar el problema actual. Lo que un psicólogo quizás llamaría “sesgo de confirmación”, está claro que todos tenemos cierta tendencia a ver lo que esperamos ver. Por ejemplo, es posible que un empleado de la fábrica que investiga en un análisis causa raíz vincule el problema con sus causas, mientras que quizás un director de operaciones defina el mismo problema según sus síntomas.
Puede ser de ayuda pensar en términos de la estructura de un árbol, en la que las raíces representan varias causas posibles y las ramas representan varios síntomas. El tronco conecta las causas con los síntomas y representa el verdadero problema.

En el gráfico siguiente se muestran las etapas que se van a desarrollar durante la ejecución de una Metodología de Análisis Causa Raíz en PEP para identificar las acciones y/o recomendaciones que eliminen las causas que las fallas.

Expliquemos brevemente cada uno de los pasos.

Conformación del Equipo de trabajo.

Se conformará el Equipo de Trabajo, lo ideal es crear un grupo pequeño y diversificado de personas con conocimiento del producto, del proceso o la función, que posean conocimiento en las áreas técnicas correspondientes y que cuenten con el tiempo y autoridad necesarios para tomar decisiones y acciones que resuelvan el problema.

Recopilación y Tratamiento de Datos

El análisis de un problema se inicia con la recopilación de datos de fallas de equipos y sus respectivos impactos asociados (en seguridad, ambiente, producción y costos de mantenimiento); con el objeto de jerarquizar las fallas mediante el empleo de histogramas que permitan realizar un tratamiento a los datos. Los datos debieran informatizarse para su mejor gestión.

Los datos mínimos requeridos son:

  • Nombres de la instalación y equipo(s) asociado(s) a la falla.
  • Descripción de la falla (Modo de falla).
  • Fecha y hora que ocurrió la falla.
  • Causas de la falla.
  • Acciones correctivas ejecutadas.
  • Costo de la reparación realizada.
  • Tiempo fuera de servicio.
  • Producción diferida.
  • Impactos en la seguridad y en el ambiente.

Esta información se obtendrá de la revisión de:

  • Diagrama de flujo de procesos y diagrama de tubería e instrumentos.
  • Datos de frecuencia de fallas, producción diferida, impacto en seguridad / ambiente y costos de mantenimiento (estimados).
  • Manuales de equipos.
  • Manuales de operación.
  • Condiciones operacionales / tendencias.
  • Planes de Mantenimiento.
  • Información específica sobre las fallas: causas inmediatas, estudios previos, fotos, análisis de falla, análisis de laboratorio, entre otros.
  • Todo lo anterior puede ser consultado en el documento de contexto operacional de la instalación.

Jerarquización de problemas.

Este apartado es para el caso de un ACR que englobe a más de un problema o a varias fallas y se trata de jerarquizar la importancia de cada una de ellas para dar prioridades. Puede utilizarse un análisis de criticidad tradicional. Donde entrará a valorarse la probabilidad de que ocurra el problema, la consecuencia que acarrea para la empresa y el medio ambiente.

Para la probabilidad podemos utilizar también un Diagrama de Pareto 80/20 se debe determinar los modos de falla que sumen 80% de las averías en un determinado periodo de tiempo, con el fin de enfocar los esfuerzos en estos. Normalmente eso supone aproximadamente el 20% del total de los modos de falla, es decir que resolviendo ese 20% de fallas, se reducirá 80% del impacto.

Definición del problema

El propósito final de esta parte es describir el problema partiendo de datos reales que hayan sido aportados por aquellos trabajadores que se encuentran directamente relacionados con el mismo. La descripción debe ser detallada pero concisa de manera que el problema sea conceptualizado y entendido por el grupo, el objetivo es definir el problema, dice un axioma que «un problema bien definido es un problema medio resuelto”.

Esta descripción del problema debe dar una información completa, recogiendo datos como:

  • ¿Quién? (Who).
  • ¿Qué? (What).
  • ¿Cuándo? (When).
  • ¿Dónde? (Where).
  • ¿Por qué? (Why).
  • ¿Cuánto? (How much).
  • ¿Cómo? (How).

Con el fin de identificar los factores que pudieron haber intervenido en la producción del problema definido, se recomienda realizar una sesión de lluvia de ideas por parte del equipo de trabajo.

Estas sesiones pueden incluir una serie de preguntas sencillas que ayudarán a recopilar la información que el Equipo Natural de Trabajo está buscando, por ejemplo:

  • ¿Cuál es el problema? (enunciado)
  • ¿Cómo ocurrió el problema?
  • ¿Dónde ocurrió el problema? Y ¿Dónde no ocurrió?
  • ¿Qué condiciones se presentaron antes de que ocurrirá el problema?
  • ¿Qué controles o protecciones pudieron prevenir que ocurriera el problema y no lo hicieron?
  • ¿Cuál es el impacto del problema en Seguridad, Ambiente, Producción y Costos de Mantenimiento?

Análisis causa efecto

Una de las herramientas más aplicadas en el RCA es el método Causa-Efecto. Este método se basa en el hecho de que un evento de falla siempre tiene una causa, y que está a su vez tiene otra causa, convirtiéndose la primera en efecto de la segunda. Dicho de otra manera una causa siempre se convierte en efecto de otra causa, formándose de este modo una cadena de causas y efectos, que puede continuar hasta llegar a la causa fundamental del problema.

Planificación de Soluciones

Uno de los pasos más importantes, después de haberse realizado el Análisis Causa-Efecto, es determinar las soluciones que resolverán el problema de forma sustentable, de tal manera que éste no debe repetirse. Se deberán plantear las acciones necesarias para corregir las causas raíces físicas que provocan la falla; así como para corregir las causas latentes, que hacen que las personas cometan errores y omisiones.

Hecho esto, lo que corresponde es implementar las acciones correctivas para solucionar el problema. Estas acciones atacarán directamente contra la causa raíz o las causas si son varias. Si la causa es muy compleja habrá que elaborar también un programa que contenga:

  • Responsabilidades y responsables
  • Tiempo.
  • Recursos requeridos.
  • Retiro de las acciones de contención que fueron definidas inicialmente y elegir controles que aseguren que no se presente nuevamente la causa.
  • Si pueden utilizarse indicadores del proceso del servicio, reportes de desperdicios, de horas extra, etcétera.
  • Capacitación del personal.
  • Que el equipo confirme cuantitativamente que las acciones resolverán el problema para el cliente y no causarán efectos secundarios no deseados.
  • Evaluación objetiva de cada acción posible en relación con un criterio de decisión predeterminado, por parte del equipo.
  • Por parte del equipo, probar que la acción correctiva eliminará el problema conduciendo pruebas de verificación.

Evaluación de soluciones

Con el objeto de determinar si las soluciones propuestas son convenientes, es necesario realizar el Análisis Costo-Riesgo-Beneficio, que tratará de comparar el costo de llevar a cabo las acciones contra el riesgo de seguir perdiendo el costo de las consecuencias si no se hace nada, considerando los beneficios al poner en marcha dichas acciones.

Uno de los métodos más simples es la evaluación económica mediante el cálculo o determinación del Valor Presente Neto (VPN).

Jerarquización de soluciones

Si finalmente consideramos que se pueden obtener muchas soluciones para un mismo problemas, será necesario jerarquizarlas, tomando en cuenta la limitación de recursos para llevar a cabo los proyectos. Una forma práctica de jerarquizar las soluciones es determinar la “Eficiencia de la Inversión” que se obtiene de dividir el VPN (valor presente neto) obtenido entre el costo de la solución. Es recomendable otorgar prioridad a las soluciones con mayor índice de “Eficiencia de la Inversión”.

Ejecución de soluciones y su seguimiento

Una vez que se ha identificado la verdadera causa raíz, la resolución de problemas se vuelve mucho más sencilla. Ya se cuenta con la información necesaria para proponer, verificar e implementar medidas correctivas. Estas pueden ser medidas correctivas temporales diseñadas para volver a lograr el objetivo rápidamente o medidas correctivas permanentes que garanticen una mejora sostenible. A menudo, las compañías definen ambos tipos de medidas e implementan una medida correctiva temporal para solucionar el problema a corto plazo al mismo tiempo que trabajan en una medida correctiva permanente que garantice una solución sostenible a largo plazo.

Finalmente las soluciones que sean autorizadas para su ejecución y realizadas materialmente deben ser documentadas mediante informes y seguidas para ver su desenlace y conformidad de respuesta.


En artículos siguientes desarrollaremos con más profundidad algunas de las herramientas más eficaces para utilizarlos en un ARC.

Por favor valore si le ha gustado o comente.


Guillermo Díaz Povedano
Guillermo Díaz Povedano

Director de Terotecnic Ingeniería, S.L.

Referencias

Turner,S (2004) “Herramientas para el éxito”, Mc graw Hill, México.
Rambaud, Laurie. (2006) “Resolución de problemas estructurados 8D”.
INCOLDA (1994) “Las 7 herramientas básicas”, Bogotá.
Bird,F, (2000) “Liderazgo practico en el control de pérdidas”, INST,Madrid
Instituto Mexicano de Control de Calidad, IMECCA, Formación de facilitadores para el trabajo en grupo, Módulo III, México, Marzo, 1998.
Horovitz, Jacques, La Calidad del Servicio. Editorial McGraw Hill, 1991, Madrid, España, 1991.
Robbins, Stephen P., Comportamiento Organizacional, Teoría y Práctica. Séptima Edición. Editorial Prentice Hall, México 1996.
Thompson, Phillip C.. Círculos de Calidad. Cómo hacer que funcionen. Grupo Editorial Norma. Primera Edición. Colombia 1994.
Flores, Benito, Ing., Artículo: Calidad en empresas de servicio. Memorias XXV Congreso Nacional de Control de Calidad. Guadalajara, Jalisco, México. Octubre 1 – 4 de 1997.
Paredes y Asociados Cía. Ltda. Seminario Taller Administración de Procesos. Panamá Mayo de 1999

El análisis RAMS

Es una cuestión muy difícil hacer un artículo sobre lo que es un análisis RAMS sin extenderse hasta el infinito en explicaciones y definiciones de todos los elementos implicados. En este artículo intentaremos dar unas breves pinceladas para que al menos, aquellos que no han tenido todavia ningún contacto con un análisis RAMS acaben entendiendo de que va, para que sirve y como podemos realizarlo.

Introducción

RAMS es el acrónimo de Reliability (fiabilidad), Availability (disponibilidad), Maintainability (mantenibilidad) y Security (seguridad). Decir de manera sucinta que este análisis en teoría nos permitiría pronosticar para un período determinado de tiempo la disponibilidad y el factor de servicio de un proceso de producción concreto. Si nos damos cuenta hemos introducido un dato más además de los que incluye el acrónimo, «EL TIEMPO» luego explicaremos la importancia de esto.

La nueva pregunta es ¿en que nos vamos a basar para realizar este análisis del sistema? Pues lo haremos basándonos en su configuración (mantenibilidad), en la fiabilidad de sus componentes y en la filosofía o estrategia de mantenimiento que se le esté realizando.

De esta ecuación hay dos factores muy relacionados, la fiabilidad y la disponibilidad, ambas hacen referencia a la capacidad de un sistema para operar correctamente o de estar disponible para que opere. Esta capacidad depende a su vez, entre otros, de los factores siguientes:

  • De los modos de fallo del sistema o de su entorno.
  • De la probabilidad de que suceda cada fallo o, alternativamente, la tasa de fallo.
  • Del efecto de un fallo en la funcionalidad del sistema.

El siguiente factor, la mantenibilidad, está inversamente relacionada con la duración y el esfuerzo requerido por las actividades de mantenimiento, o dicho de otro modo viene a ser como de facil es hacerle un mantenimiento al equipo, y eso incluye las medidas preventivas, para eliminar o disminuir las vulnerabilidades y amenazas en general. La mantenibilidad tiene como objetivo evitar cualquier tipo de fallo mediante la detección de los primeros síntomas de anomalía para que se puedan tomar las medidas adecuadas para anticipar la resolución a un problema inminente, evitando así las posteriores medidas correctivas y caídas o degradaciones del funcionamiento del sistema. Entre los factores que afectan la mantenibilidad se pueden destacar los siguientes:

  • Tiempo de realización del mantenimiento.
  • Tiempo para la detección, identificación y localización de fallos.
  • Tiempo para restablecer un sistema en caso de fallo.
  • Todos los modos de operación y mantenimiento requeridos durante todo el ciclo del sistema.

Como puede comprobar, la mantenibilidad en realidad es una medida de tiempo, ya que la suma de todos estos factores será el determinante de la buena o mala mantenibilidad.

Por último en esta introducción debemos hablar del objetivo de la seguridad de funcionamiento, que no es otra cosa que asegurarse de proporcionar un producto que cumpla con las necesidades finales del usuario, a un bajo coste y en el tiempo límite prefijado, considerando esta seguridad de funcionamiento como las características propias que  le  permite  comportamientos  funcionales  especificados (RAMS) en un tiempo determinado, con una duración establecida y sin daños a sí mismo o al ambiente.

La siguiente pregunta a responder para entender este concepto sería: ¿Existe relación entre Fiabilidad, Disponibilidad, Mantenibilidad y Seguridad?

Pues sí, efectivamente existen relaciones entre la Fiabilidad, la Disponibilidad, la Mantenibilidad y la Seguridad de funcionamiento. A mayor Seguridad, menor Disponibilidad y viceversa. Aumentando la Mantenibilidad y la Fiabilidad se consigue incrementar la Disponibilidad y la Seguridad de funcionamiento.

Así pues, el análisis RAMS se sustenta en un modelo de simulación que toma en cuenta la configuración de los equipos teniendo en cuenta su mantenibilidad, los fallos aleatorios teniendo en cuenta su estadística, las reparaciones teniendo en cuenta sus tiempos de respuesta, las paradas parciales y totales y el mantenimiento planificado necesario teniendo en cuenta su criticidad.

Durante la ejecución de un estudio RAMS, se realiza la adecuada caracterización probabilística de los procesos de deterioro que afectarán los equipos, sub-sistemas y sistemas asociados al citado proceso de producción a fin de pronosticar la mayoría de los escenarios de paros o fallos.

¿Qué se puede obtener de un análisis RAM?

  • Disponibilidad total, que es el número de horas durante las que se espera que el proceso o sistema funcionará correctamente.
  • Del proceso RAMS obtendremos la jerarquización de los equipos o sistemas críticos que nos permitirá conocer la proporción con la cual los equipos o sistemas estudiados afectan la disponibilidad de la instalación. De esta manera, se puede saber qué equipo o sistema es más importante al momento de estudiar la disponibilidad, y se puede optimizar la estrategia de mantenimiento para los distintos equipos/sistemas.
  • Información de confiabilidad que se utilizará para definir una estrategia de mantenimiento basada en la confiabilidad de los equipos, que permita maximizar el tiempo de uso entre fallos de los mismos.
  • Predicción estadística de fallos críticos en la instalación que es el tiempo medio entre fallos críticos o el punto en el que el sistema definido por el diagrama de bloques de confiabilidad falla.
¿Qué software nos puede ayudar a generar un análisis RAMS?
  • MAROS™ & TARO™ desarrollados por DNV
  • RAMP desarrollado por Reliass
  • RAM Commander desarrollado por Reliass
  • BlockSim desarrollado por ReliaSoft

En definitiva y para comenzar con la base fundamental de este artículo explicaremos que son las siguientes variables MTTF, MTBF y MTTR que nos encontraremos y que mejor caracterizan los datos estadísticos de los diversos equipos o sistemas de producción.

1. Parámetros RAMS

1.1 Definición de tasas de fallo.

Antes de comenzar lo ideal es insertar una gráfica para entender mejor los parámetros que vamos a desarrollar.

Como se observa en el gráfico anterior, tenemos un sistema que a lo largo del tiempo (en azul) está funcionando correctamente hasta que aparece un fallo (rayo en rojo). Cuando aparece el fallo, el sistema está durante un tiempo fuera de servicio (en amarillo) y, pasado un tiempo (suponemos una vez reparado), este pasa a estar de nuevo en servicio (en azul). 

El estado de «en servicio» (en azul) permanecerá hasta que al cabo de un tiempo, aparece, nuevamente un fallo (rayo en rojo). 

Este es el ejemplo típico de un sistema de producción. Ahora bien, ¿que significan los parámetros que refleja que además son los estándares de un análisis RAMs? Comencemos con el MTTF:

1.2 MTTF:

¿Qué significa el parámetro MTTF? MTTF es el acrónimo de Mean Time To Failure (Tiempo medio hasta el fallo) y representa el tiempo en que el sistema está activo, cumpliendo las funcionalidades por las cuales ha sido diseñado.

En los sistemas reparables (donde el sistema puede ir a un fuera de servicio y ponerse en marcha de nuevo cuando ha sido reparado), el MTTF y el MUT (Mean Up Time, Tiempo medio en servicio) son exactamente iguales. 

1.3 MTBF

¿Qué significa el parámetro MTBF? MTBF es el acrónimo de Mean Time Between Failures, (Tiempo medio entre fallos), nos indica cual es la previsión que se tiene de cada cuanto el sistema fallará. Es decir, responde a la pregunta, ¿cada cuantas horas se prevé que aparezca un fallo al sistema bajo análisis? Se simboliza con la «R». De este dato se desprende la tasa de fallo λ, es 1/MTBF.

El MTBF está totalmente ligado a la fiabilidad del equipo, producto o instalación en realidad es el parámetro cuantitativo de la fiabilidad.

Cuidado porque es muy habitual confundir el MTTF y el MTBF aunque como se observa gráficamente en la gráfica anterior se puede ver que la diferencia entre ambos parámetros es el tiempo MDT (en amarillo), es decir, el tiempo que el sistema está fuera de servicio. De este modo, podemos decir que MTBF = MTTF + MDT.

Se puede abundar más sobre estas variables pero no es el tema líder de este artículo.

2. Fiabilidad

2.1 Definición de fiabilidad

La fiabilidad de un dispositivo es la probabilidad de que un componente o sistema, sometidos a unas condiciones de trabajo concretas, funcione correctamente durante un determinado período de tiempo. En consecuencia, si estas condiciones cambian, la fiabilidad cambiará también, por lo que la fiabilidad es altamente dependiente de las condiciones y no se pueden hacer comparaciones de la misma sin tener en cuenta las condiciones de trabajo de cada sistema. Como ya hemos dicho, la fiabilidad se representa por R(t). El valor complementario de R(t) se conoce como función acumulada de la probabilidad de fallo, se representa por F(t) y representa la probabilidad de que el equipo falle al cabo de un tiempo t.

2.2 Definición del fallo y tipos de fallo

Se define fallo como el cese de la capacidad de un elemento para realizar la función requerida. Los fallos pueden clasificarse de acuerdo con su criticidad o con su naturaleza.

El concepto de criticidad de un fallo está relacionado con la gravedad de las consecuencias que puede provocar. Si únicamente atendemos al impacto en el servicio del equipo o sistema, los fallos pueden clasificarse como:

  • Significativos:
    • Fallo que impide la prestación del sistema a la producción o que provoca un retraso en la misma que sea superior al periodo especificado o preestablecido.
  • Importantes:
    • Fallo funcional que debe ser corregido para que el equipo logre el rendimiento especificado pero que no provoca un retraso, ni suspende la producción en un plazo superior al especificado para el fallo significativo.
  • Menores:
    • Fallo que no impide que el equipo logre el rendimiento especificado y que no cumple con los criterios para ser considerado fallo significativo o importante.

Lo que ocurre en realidad es que los fallos no se miden sólo atendiendo al propio equipo y a la función para la que está diseñado. Lo normal es que además de los daños en el propio equipo, se tenga en cuenta los daños producidos a otros sistemas, a las personas o al medioambiente. Cuando más impacto es capaz de provocar el fallo del equipo en cualquiera de estas facetas, más crítico es.

Visto desde este punto de vista, los fallos pueden clasificarse en cuatro niveles, siendo necesario establecer cuantitativamente qué se entiende por importante, apreciable y despreciable, a fin de reducir al máximo la subjetividad a la hora de calificar el fallo.

Categoría del falloFunciónEquipoAmbientePersonas
CATASTROFICOPerdida de una función esencialProduce daños importantesProduce daños importantesPuede causar muerte o daños corporales
CRÍTICOPerdida de una función esencialProduce daños importantesProduce daños importantesPresenta riesgos despreciables de muerte o de daños personales
NO CRÍTICOFuncionamiento degradadoNo causa daños apreciablesNo causa daños apreciablesNo representa daños apreciables
MENORFuncionamiento degradado Causa daños apreciablesNo causa daños apreciablesNo representa daños apreciables
Niveles de gravedad de los fallos cuando se consideran los daños del equipo, de las personas y del medio ambiente.

Hay una última valoración para clasificar los fallos, y esta es la que se atiene a su naturaleza ante la evidencia del propio fallo y es que los fallos pueden ser evidentes u ocultos al operador o el mantenedor. Un fallo es evidente, cuando produce un efecto en el sistema que es patente más tarde o temprano, por el contrario, un fallo se dice que es oculto cuando necesita de un evento posterior para ser detectado, lo que suele ser habitual en los sistemas de control o de detección y en los sistemas formados por dos equipos redundantes en los que uno está en activo y el otro está en reposo hasta que el anterior falle.

3. Mantenibilidad

3.1 Definición de mantenibilidad

Cuando se produce un fallo en un equipo, se necesita un tiempo para detectar en qué componente se ha producido y para repararlo o sustituirlo por uno nuevo a fin de dejar el equipo en condiciones de funcionamiento esto se define como mantenibilidad que es la probabilidad de que un equipo que ha tenido un fallo sea puesto de nuevo en funcionamiento, mediante la aplicación de ciertas acciones, dentro de un tiempo «t» que se conoce como tiempo de restauración.

La mantenibilidad, por tanto, no está asociada únicamente a las características técnicas de la instalación sino también a las capacidades, experiencias y medios técnicos de los equipos de trabajo, por lo que los valores de mantenibilidad obtenidos con distintos equipos de trabajo pueden ser diferentes, al no ser iguales las capacidades y experiencias de sus miembros, como tampoco necesariamente las herramientas o útiles específicos empleados por cada uno de ellos.

3.2 Clases de mantenimiento

Ha continuación explicaremos cuales son los tipos de mantenimiento industrial que hay, algunos de ellos son planificados y otros no planificados. Los no planificados son aquellos que se tienen que hacer de emergencia porque la maquinaria ha fallado y no ha sido detectado.

Lo ideal sería que todo el mantenimiento fuese planificado, de esa forma, aumentaremos la seguridad de los trabajadores y no pondremos en riesgo la continuidad de la producción ni comprometeremos el medio ambiente. Pero esto no es siempre posible. Por eso el primero de los mantenimientos que explicamos es:

3.2.1 Mantenimiento correctivo

El mantenimiento correctivo consiste en corregir los errores del equipo conforme vayan apareciendo. Por su propia naturaleza, el mantenimiento correctivo es difícilmente programable, aunque a veces pueden ser planificados, cuando son desgaste que ya vienen previstos y ya se tienen en cuenta en los planes de mantenimiento. Una fina línea separa este último mantenimiento correctivo de un preventivo.

3.2.2 Mantenimiento preventivo

El mantenimiento preventivo consiste en una intervención sistemática del equipo, aunque este aún no haya dado señas de desgaste o error. Se tienen en cuenta las vulnerabilidades de la maquinaria, los manuales de los fabricantes y los materiales y se planifica un mantenimiento programado para efectuarlo en el momento oportuno para intervenir el equipo y no llegar a la necesidad de una reparación más seria. Normalmente requiere un buen plan de mantenimiento industrial y un software capaz de gestionarlo.

3.2.3 Mantenimiento predictivo

Este es el tipo de mantenimiento industrial más avanzado y el que requiere mayor preparación, formación y precisión. Normalmente se realiza un análisis de criticidad de la planta y se incluyen en el plan de mantenimiento predictivo todos aquellos equipos que según las tablas que hemos expuesto van más haya de lo Importante y/o crítico. El mantenimiento predictivo se trata de realizar una serie de análisis físico/químicos periódicos a los equipos para poder descubrir si alguna de las variables de la maquina han cambiado y predecir las averías y los errores antes de que se produzcan, análisis de vibración, de ultrasonidos, de termografía, de aceite, de calidad eléctrica, análisis no destructivos, endoscopia, etc.

Primero se establecen unos valores base y una vez se conocemos los parámetros normales, pueden verse variaciones en ellos que indiquen un posible problema en el equipo, así se evita llegar a la avería.

3.2.4 Mantenimiento cero horas u overhaul

Consiste en tareas y procedimientos que dejan la máquina a cero horas de funcionamiento. Esto quiere decir que, bien cuando ya está comenzando a bajar el rendimiento del equipo o bien cuando todavía funciona a la perfección, se sustituyen todos los componentes necesarios hasta que tiene el mismo desgaste por el uso que si fuera totalmente nueva. Es uno de los tipos de mantenimiento industrial que sirven para asegurarse de alargar la vida útil del equipo a largo plazo y de forma controlada.

3.2.5 Mantenimiento en uso

Este es uno de los tipos de mantenimiento industrial de más baja intervención. Normalmente lo suelen hacer los usuarios del propio equipo o personal auxiliar. Consiste en simples tareas de prevención, como una limpieza adecuada o una observación sobre defectos visibles.

4. Disponibilidad

4.1 Definición de disponibilidad

Cuando se produce un fallo en un equipo reparable éste deja de realizar las funciones para las cuales ha sido requerido hasta que se repare el fallo. Aparece, así, un nuevo concepto, la disponibilidad, que se define como la probabilidad de que un equipo realice las funciones requeridas en un instante o periodo de tiempo determinado, siempre que funcione y se mantenga de acuerdo con los procedimientos establecidos.

En los equipos complejos, la disponibilidad dependerá de la disponibilidad de los equipos que lo forman, de acuerdo también con las configuraciones básicas serie y paralelo.

Por ejemplo, un sistema serie estará operativo únicamente cuando todos los componentes que lo forman estén operativos.

Un sistema paralelo no será operativo y por tanto, no estará disponible, cuando estén indisponibles simultáneamente todos los componentes que lo forman.

4.2 Efectos y criticidad AMFEC O FMECA Análisis de modos de fallo

FMEA/FMECA, es el acrónimo de “Failure mode, effects and criticality analysis” o «Análisis de los Modos de Fallo y sus Efectos». La norma por la que se rige el análisis FMEA es la UNE-EN 60812:2008 “Analysis techniques for system reliability – Procedure for failure mode and effects analysis (fmea)”. ¿Pero qué es esta herramienta FMEA? El FMEA es un procedimiento sistemático para el análisis de un sistema con el fin de identificar los modos de fallo potenciales, sus causas y efectos en el funcionamiento del sistema. Este tipo de análisis debe hacerse al inicio del ciclo de desarrollo del sistema, de manera que la eliminación o mitigación del modo de fallo sea lo más rentable posible. Lo ideal sería que este trabajo se inicie tan pronto como el sistema se haya definido lo suficiente como para presentarlo mediante un diagrama de bloques funcionales en donde se puede definir la función de sus elementos y por tanto se puedan barajar criterios para la mitigación o eliminación de los fallos posibles. (FMEA es tan amplio que merece la pena dedicar todo un artículo a su estudio y desarrollo)

5. Metodología de un Análisis RAMS

5.1 Modelo General de un Análisis RAMS

La siguiente imagen representa toda la metodología y procedimiento para completar un análisis RAMS

El análisis RAM se inicia con la recopilación de datos que podemos llamar Etapa 1.

I Etapa

Como ya hemos explicado, se trata de generar datos para el posterior análisis de estadística y estos datos pueden recopilarse de distintas fuentes de información, de un lado las acciones referentes al equipo y de otro las propia de la producción. En cuanto a las acciones de los equipos recopilaremos datos de los reportes de operaciones, de inspecciones técnicas, avisos, ordenes de trabajo, de los historiales de fallas, etc. Y en cuanto a los datos de producción recopilaremos todo lo referente a tiempos de producción, modos de falla, planes de mantenimiento preventivo, paradas no programadas y tiempos de reparación.

Podremos dividir este trabajo en distintos pasos:

El primero será la recopilación de datos históricos propios, esta fuente de información es la más representativa del comportamiento de fallas y reparaciones de los equipos a considerar en el análisis, son los datos más importantes porque son veraces ya que corresponden a los equipos funcionando en la producción para la que fueron diseñados, el problema es que generalmente esta información es escasa sobre todo en aquellas industrias de reciente instalación por los mismos parámetros de tiempo.

De cualquier forma para recopilar la máxima información propia o evidencia de fallas y reparaciones de los equipos, se debe buscar en cualquier parte donde pudiera haber quedado un registro, GMAOS, SAP, también se debe recurrir al personal de mantenimiento, quienes muchas veces llevan sus indicadores de gestión en archivos personales, los cuales también son una fuente valiosa de información. Esta etapa se conoce como depuración de la data de fallas y reparaciones, y debe ser llevada a cabo en apoyo con los expertos en mantenimiento quienes conocen el comportamiento de fallas y reparaciones de los equipos.

El segundo paso de la primera etapa, sería buscar la opinión de expertos. Hay veces que no es suficiente con los datos obtenidos en el paso anterior y tenemos que recurrir a esta técnica que es complicada también en diversos sectores donde no existen expertos sobre un sistema concreto o si existen no están a nuestro alcance. En el caso de que se disponga de estos expertos, entre los que por supuesto se puede contar con el equipo de mantenimiento y las personas implicadas en la manipulación del sistema, se puede optar por el uso de algunas herramientas como el método Dhelphi ha modo de cuestionario de sucesos futuros, que podría resultar de gran ayuda.

Si con estos dos pasos tampoco tenemos suficiente información podemos recurrir a la búsqueda de información genérica. Esta información con datos de confiabilidad genéricos puede provenir de reconocidas bases de datos internacionales como OREDA, PARLOC, WELL MASTER, IEEE, pero teniendo mucho cuidado con estos datos que no son específicos de la industria para la que estemos elaborando el análisis RAMS.

II ETAPA

La segunda etapa para un análisis RAM, es la revisión y validación de datos. Para esta última tarea será importante escoger un equipo de trabajo con alta experiencia en el conocimiento del comportamiento de fallas y reparaciones de los equipos incluidos en el análisis. Estas personas, seguramente ya han colaborado en alguno de los pasos anteriores, por lo que muchos de ellos ya estarán familiarizados con esta tarea.

Este equipo de expertos deberán validar las distribuciones de probabilidad que reflejan la información de confiabilidad (Tiempos Para la Falla) y mantenibilidad (Tiempos Para Reparar) de los equipos incluidos en el Análisis RAM. En esta etapa también se debe validar la estructura e información técnica contenida en la base de datos, en resumen se trata de dar estructura y orden a todos los datos recolectados en la etapa anterior para que tengan sentido y puedan dar respuestas a los cálculos estadísticos para los que han sido recopilados.

III ETAPA

Es la etapa más complicada, se trata de realizar el análisis estadístico de todos los datos estructurados obtenidos en las etapas anteriores. Para esta etapa nos podemos ayudar de herramientas informáticas muy eficaces para este trabajo. RARE y RAPTOR. El trabajo a realizar se trata de establecer la distribución probabilística y los parámetros del MTBF y el MTTR, de los que obtendremos lo que realmente buscamos, que no es otra cosa que la mejora de la confiabilidad del sistema

IV ETAPA

Última etapa de las presentadas, se trata de graficar la información para presentarla y tener una mejor visión del conjunto de las cosas para poder plantear otros escenarios. Presentar el riesgo de OEE probabilístico y de las propuestas para mejorar el desempeño futuro del sistema analizado.

ABREVIATURA Y TÉRMINOS

  • DBD:           Diagrama de Bloque de Disponibilidad
  • DFP:           Diagrama de Flujo de Procesos
  • OEE:         Overall Equipment Effectiveness / Eficiencia General de los Equipos
  • PI&D:         Piping and Instrumentation Diagram / Diagrama de Tuberías e Instrumentación
  • R(t):           Riesgo
  • RAM: Reliability, Availability and Maintainability Analysis / Análisis de Confiabilidad, Disponibilidad y Mantenibilidad
  • TPF:           Tiempo para la Falla
  • TPR:          Tiempo para Reparar
  • TPEF – MTBF:        Tiempo promedio entre Fallas
  • TPEEP:     Tiempo Promedio entre Eventos de Paro
  • TPPR – MTTR:       Tiempo promedio para reparar
  • TPFS:       Tiempo Promedio Fuera de Servicio
  • λ:   Tasa de falla

Bibliografía

  • Formación análisis RAMS de Terotecnic Ingeniería S.L.
  • Marta Zárata Fraga. Proyecto fin de carrera – Análisis RAMS – Universidad Carlos III de Madrid Escuela Politécnica Superior. Departamento de Ingeniería Mecánica.
  • Amendola, Luis. Indicadores de fiabilidad propulsores en la gestión del mantenimiento. Universidad Politécnica de Valencia.
  • Arques Patón, José Luis (2009). Ingeniería y gestión del mantenimiento en el sector ferroviario.
  • García de Korazar, Xabier (2004). Proceso de mejora de RAMS a lo largo del ciclo de vida
  • García de Korazar, Xabier (2004). Proceso de mejora de RAMS a lo largo del ciclo de vida (II).
  • Gómez de la Vega H., Medina N., Semeco K, Yanez M. Análisis de Confiabilidad, Disponibilidad y Mantenibilidad en Sistemas Productivos.
  • Plazas Aguilar, Jaime (2010). Ingeniería de confiabilidad aplicada a un sistema de control local en una planta de transporte de hidrocarburos. Proyecto Fin de Carrera. Universidad de los Andes.
  • Rojas Monsalve, Elimar Anauro. Experiencias en el desarrollo de Análisis de Confiabilidad, Disponibilidad y Mantenibilidad (Análisis RAM). Revista Predictiva21
  • Geovanny Solórzano. Aplicación de un análisis RAM en un sistema de bombeo de agua cruda
  • Gráficas de Leedeo.

Guillermo Díaz Povedano
Guillermo Díaz Povedano

Director de Terotecnic Ingeniería, S.L.

Método 8D para la resolución de problemas

Con el año tan caótico que hemos vivido y los que quizás nos quede por vivir en la pequeña y mediana empresa mejor será prepararse. Desde Terotecnic no podemos ayudarle a resolver sus problemas en su día a día aunque nos gustaría, pero si que creemos que podemos ayudarle a gestionarlos mejor. Por eso hemos escrito este artículo sobre la aplicación del método 8D para la resolución de problemas en la empresa, esperamos que le guste.

Método 8D, definición

El método 8D es una metodología para la resolución de problemas que todo equipo de dirección debe tener sobre su mesa. Básicamente se trata de conformar un equipo “competente” para resolver los problemas que surjan siguiendo un proceso de análisis y toma de decisiones estructuradas en 8 pasos, focalizándose en los hechos (objetividad) y no en las opiniones (subjetividad).

Un poco de Historia

Durante la Segunda Guerra Mundial, el gobierno de Estados Unidos, para resolver problemas en las líneas de producción implementó una metodología para el control de las desviaciones y las no conformidades de los productos terminados, denominándola Military Standard 1520, que también se conoce como (Corrective Action and Disposittion System for Noconnforming Material) «Acción correctiva y sistema de disposición para material no conforme».
La metodología 8D, tal y como hoy la conocemos, la documentó la empresa Ford Motor Company en 1987 quien aplicó esta disciplina a sus líneas de producción, pero antes de esto, está disciplina pasó por muchas revisiones y modelos intermedios: entre los 60 y 70 hubo un D4 que también se le llamó Team Oriented Problem Solving, también hubo un D7 hasta que a finales de la década de los 90, Ford creó y aprobó una nueva versión del 8D, denominada oficialmente como “Global 8D” (G8D), que sirve como estándar actual en esta empresa y en muchas otras compañías que como ésta necesitan de un método estructurado para la resolución de sus problemas.

Si su empresa necesita iniciarse en este método, lea atentamente este artículo.

Preliminares

Antes de comenzar con G8D, debemos dejar claro que esto es un método para la resolución de problemas por lo que entender lo que es un problema es importante para evaluar si, iniciar las 8 disciplinas que engloba el G8D o no; un problema es un obstáculo, es algo que impide que las cosas sigan su curso normal, por tanto, es una diferencia entre una situación esperada y una situación real. Normalmente los problemas son originados por múltiples causas y en distintos niveles, G8D permite encontrar la causa raíz para poder dar una solución adecuada y definitiva a un problema concreto que normalmente es repetitivo en el tiempos.

En general se emplea G8D para la resolución de cualquier tipo de problema aunque entre las aplicaciones más usuales se encuentran:

  • Resolución de no conformidades de los clientes.
  • Resolución de reclamaciones de proveedores o clientes.
  • Solución de problemas que se presenten de manera repetitiva.
  • En la industria, incidentes o averías repetitivas.
  • Por necesidad de abordar problemas desde la visión de un grupo.

Disciplinas del método G8D

Las 8 disciplinas del G8D son las siguientes:

  • D1. Formación de un equipo de expertos que cubran todas las funciones.
  • D2. Definición integral del problema.
  • D3. Implementar y verificar una acción de contención provisional.
  • D4. Identificar y verificar la causa raíz.
  • D5. Determinar acciones correctivas permanentes, así como definir las acciones preventivas para evitar que un problema similar surja de nuevo.
  • D6. Implementar y verificar las acciones correctivas permanentes.
  • D7. Prevenir la recurrencia del problema y/o su causa raíz.
  • D8. Reconocer los esfuerzos del equipo.

D 1. Establecer el equipo

D 1-1 Creación del equipo

Crear un grupo pequeño y diversificado de personas con conocimiento del producto, del proceso o la función, que posean conocimiento en las áreas técnicas correspondientes y que cuenten con el tiempo y autoridad necesarios para tomar decisiones y acciones que resuelvan el problema.

D 1-2 Efectividad del equipo

Elegir al líder con las características ideales para este cometido. El líder será el que maneje toda la información referente al problema y mantendrá al resto de miembros informados además, será el responsable de que se cumplan los objetivos marcados por el grupo

El líder en cuanto al equipo debe:

  • Crear ambiente de seguridad y de cooperación, no de competencia.
  • Conseguir de los participantes el compromiso para trabajar para la consecución de la eliminación del problema.
  • Conseguir que las tareas necesarias y no las ambiciones personales, determinen los procedimientos.

En cuanto al trabajo a realizar el líder deberá:

  • Describir un enfoque específico sobre el problema.
  • Promover decisiones y metas realistas.
  • Explicar y resumir de modo claro, comprensible y breve tanto el problema como las resoluciones e ideas que se vayan introduciendo.
  • Debe ser inspirador y vigorizante en el caso de decaimiento del equipo.
  • Debe dar un sentido de dirección y de seguridad en la consecución de los objetivos.

D 2. Describir el problema

El propósito de esta disciplina es describir el problema partiendo de datos reales que hayan sido aportados por aquellos trabajadores que se encuentran directamente relacionados con el mismo. La descripción debe ser detallada pero concisa de manera que el problema sea conceptualizado y entendido por el grupo, el objetivo es definir el problema, dice un axioma que «un problema bien definido es un problema medio resuelto”. Aún así, hay que decir que muy pocas veces la descripción del problema hecha al inicio del 8D es totalmente completa y no requiere revisiones posteriores.

Esta descripción del problema debe dar una información completa, recogiendo datos como:

  • ¿Quién? (Who).
  • ¿Qué? (What).
  • ¿Cuándo? (When).
  • ¿Dónde? (Where).
  • ¿Por qué? (Why).
  • ¿Cuánto? (How much).
  • ¿Cómo? (How).

D 3. Acciones internas de contención

Implementar y verificar acciones contenedoras:

  • Definir e implementar acciones para contener y aislar el efecto del problema de cualquier cliente interno/externo, hasta que la acción correctiva sea implementada. esta solución debe ser probada y evaluada antes de implementarla.
  • Cuando sea aplicable, establecer acciones inmediatas, enmendar el problema: reparar, retrabajar, segregar, identificar para no utilizar, informar, cambiar o sustituir el producto; en caso de servicio, ofrecer otras alternativas para que se proporcione nuevamente, cómo reponerlo sin costo, etc.
  • Definir, implementar y verificar la efectividad de acciones temporales para aislar a los clientes del proceso del efecto del problema. Entendido como cliente no sólo los clientes de producto final sino todos aquellos activos o personas que se vean afectadas por el problema.

D 4. Definir y verificar la causa raíz

En esta disciplina trataremos de identificar las causa o causas potenciales que podrían haber ocasionado el problema o causa raíz del mismo. Por lo general, encontrar una causa raíz no es fácil, si lo fuese, este procedimiento no sería necesario; lo que ocurre en la mayoría de los casos es que los elementos cambiantes más a la vista no son siempre los verdaderos causantes del problema, y en muchas ocasiones cuando se analiza el problema en profundidad, se identifican unas posibles causas que a su vez están originadas por otras causas iniciales. La verdadera causa raíz se identifica al comprobar que tras su eliminación, el problema deja de existir definitivamente.

Para hallar la causa raíz del problema disponemos de una serie de herramientas que nos pueden ayudar a identificar las causas potenciales del mismo tales como:

Brainstorming, lluvia de ideas importante para G8D
  • Lluvia de ideas.
  • Análisis de tareas.
  • Análisis de barreras.
  • Análisis de cambios.
  • Diagrama de causa-efecto o diagrama de pescado.
  • Diagrama de árbol de fallos.
  • Diagrama de afinidad.
  • Diagrama de Pareto.
  • Los cinco por qué.

Verificación de las causas del problema es el momento de la comprobación de teorías:

  • Inventarios semanales.
  • Reducción de correctivos.
  • Confirmación de cantidades en sistema por muestreo.
  • Verificación de KPIs

D 5. Elegir y verificar las acciones correctivas permanentes (PCA)

Una vez encontrada la causa raíz, lo que corresponde es implementar las acciones correctivas para solucionar el problema. Estas acciones atacarán directamente contra la causa raíz o las causas si son varias. Si la causa es muy compleja habrá que elaborar también un programa que contenga:

  • Responsabilidades y responsables
  • Tiempo.
  • Recursos requeridos.
  • Retiro de las acciones de contención que fueron definidas inicialmente y elegir controles que aseguren que no se presente nuevamente la causa.
  • Si pueden utilizarse indicadores del proceso del servicio, reportes de desperdicios, de horas extra, etcétera.
  • Capacitación del personal.
  • Que el equipo confirme cuantitativamente que las acciones resolverán el problema para el cliente y no causarán efectos secundarios no deseados.
  • Evaluación objetiva de cada acción posible en relación con un criterio de decisión predeterminado, por parte del equipo.
  • Por parte del equipo, probar que la acción correctiva eliminará el problema conduciendo pruebas de verificación.

Si en la pruebas no se consiguen buenos resultados, se deberán buscar más causas del problema.

D 6. Implementar y validar las acciones correctivas permanentes

Ha llegado el momento de verificar que las acciones hayan sido las apropiadas para la eliminación de la causa raíz. Para la verificación de resultados habrá que establecer qué informaciones o estadísticas serán recopiladas y analizadas que contengan datos de antes y después de la verificación. También es importante prestar atención a los posibles efectos adversos que pudieran ser causados por las acciones tomadas.

D 7. Prevenir la repetición

Prevenir su reincidencia y documentar es el siguiente paso entre las disciplinas 8D; este paso consiste básicamente en evaluar la efectividad de las acciones emprendidas para eliminar el fallo, y observar que el problema no se vuelve a repetir, en caso de detectar que el problema se sigue presentando se establecerán otras acciones. Por otro lado, es primordial para esta metodología recopilar toda la información recopilada durante el proceso.

Para prevenir la ocurrencia se pueden usar algunas herramientas como AMFE, o análisis modal de fallos y efectos, un procedimiento de análisis de fallos potenciales en un sistema, clasificándolos por su gravedad o por el efecto de los fallos en el sistema; también se puede utilizar el sistema Poka-Yoke que se aplica con el fin de evitar errores en la operación de un sistema.

Debido a que los problemas iguales o similares presentan una tendencia a repetirse, cualquier disciplina para la prevención estará enfocada a la identificación y eliminación de:

  • Malas prácticas.
  • Mejora de los procesos.
  • Mejora de Diseños o rediseños.
  • Mejora o implementación de procedimientos (operativos o administrativos) que pudieran contribuir a que el problema se repita.
    • Procedimientos incorrectos o confusos.
    • Procedimientos no respetados.
    • Procedimientos inexistentes.
  • En deficiencias en el producto final adoptar medidas globales que incluyan a los clientes y proveedores.
  • En último extremo realizar un cambio de responsabilidades.

Las soluciones adoptadas en esta disciplina, normalmente son extrapolables a otras áreas de la planta, contribuyendo a solventar problemas similares rápida y efectivamente y de forma permanente, o simplemente previniendo su ocurrencia en otras áreas.

Es importante en este punto marcar un calendario de auditoría para asegurar que la solución implementada es totalmente efectiva y el problema se ha corregido definitivamente.

D8. Cerrar el problema y reconocer al equipo y las contribuciones individuales

El paso final de un esfuerzo de solución de problemas, orientado a trabajo de equipo, es reconocer los esfuerzos colectivos del equipo para la solución del problema y mostrar gratitud aplaudiendo las contribuciones individuales.

Ventajas:

  • Crea un buen ambiente para interacciones futuras.
  • Refuerza las fortalezas del trabajo en equipo.
  • Fortalece a la empresa.
  • Mejora la autoestima.
  • Contribuye al crecimiento profesional.
Guillermo Díaz Povedano
Guillermo Díaz Povedano

Director de Terotecnic Ingeniería, S.L.

Te presentamos nuestro Blog

INICIAMOS UNA NUEVA ETAPA

Hoy publicamos nuestra primera entrada para esta nueva etapa de Terotecnic Ingeniería, S.L.

A pesar de eso no hay un antes ni un después para nosotros, esto sólo es un punto y seguido. La única diferencia estriba en que damos hoy un paso más en nuestra relación con nuestros clientes y activamos esta nueva y remozada Web que ofrece nuestra información y servicios de manera más dinámica, más personalizada y con más dedicación al servicio dentro de la propia Web y de las redes sociales. Conócenos.

¿Por qué publicamos este Blog?
  • Porque proporciona contexto a los nuevos clientes y a nuestros nuevos lectores. Nos dedicamos a la Ingeniería del mantenimiento industrial y con este blog pretendemos difundir y compartir ideas, experiencias, formación y trabajo a este respecto.
  • Esperamos que este modo de comunicación que emprendemos hoy, sirva para dar difusión a las nuevas estrategias y a la gestión del mantenimiento con nuevas tecnologías, tales como todas las herramientas dedicadas a la fiabilidad, al mantenimiento predictivo y proactivo, y todo lo que pueda reducir el mantenimiento correctivo y el mantenimiento preventivo para convertir ambas formas de trabajo en un mantenimiento preventivo a condición.
¿Como serán las entradas en este blog?

Las entradas podrán ser cortas o larga, pequeños ping o llamadas de atención de algún tema concreto, o entradas largas sobre temas de interes dentro de la ingeniería industrial. Dentro de cualquiera de estos dos formatos, intentaremos categorizarlos por medio de las categorías propias de Word Press o añadirles etiquetas para que puedas navegar por ellas con criterios de similar taxonomía.

Por último decirte, que puedes colaborar con nuestro blog si te parece que puedes aportar conocimiento en estas materias para nuestros visitantes. Para ello sólo tienes que:

  • Ir a la página contactos y rellena los datos que pide el formulario.
  • En comentarios escribe: quiero participar como editor.
  • Nos pondremos en contacto contigo y podrás enviar tu artículo.
  • No te preocupes por nada, nosotros le daremos formato y lo situaremos con tu firma en el blog.

Finalmente os invitamos a visitarnos con asiduidad para que podais ir viendo las nuevas entradas.

Gracias por todo TEROTECNIC