Analisis de Fallas - Pareto vs Jack-Knife

10
ANÁLISIS DE FALLA – PARETO VS. GRÁFICOS DE DISPERSIÓN LOGARÍTMICA Análisis Pareto A finales del siglo XIX, Wilfredo Pareto (1842-1923), ingeniero italiano, construyó histogramas sobre la base de la distribución de la riqueza en Italia, concluyendo que el 80% de la riqueza del país se encontraba en manos del 20% de la  población total. Posterior a sus estudios, se pudo constatar que esta tendencia de distribución era representativa de una diversidad de datos poblacionales. La regla de 80/20, así como algunas variaciones como el análisis ABC (que utiliza la regla 80/15/5) o el listado de los “top ten”, son hoy en día una práctica común en muchos campos de estudio. Un ejemplo de esto es su aplicación en la ingeniería de mantenimiento, donde el análisis Pareto es comúnmente utilizado para identificar aquellos códigos de falla más críticos para las operaciones, ya sea en términos del costo de mantención o de la confiabilidad y disponibilidad de los equipos. La siguiente tabla presenta el registro de fallas para una flota de 13 palas en una faena minera en el norte de Chile para un determinado mes. Los distintos códigos de fallas han sido ordenados en forma descendente según el tiempo fuera de servicio total asociado a cada uno de ellos: Tabla 4.1: Registro de fallas para una flota de 13 palas Código Descripción Cantidad Duración (min) % Tiempo % Acumulado de Tiempo MTTR 1 Inspecciones Eléctricas 30 1015 13,0% 13,0% 33,8 2 Cable de Alimentación 15 785 10,1% 23,1% 52,3 11 Sobretemperatura Motor 36 745 9,6% 32,6% 20,7 3 Cambio de sub-estación o traslado de pala 27 690 8,8% 41,5% 25,6 10 Relay de Sobrecarga 23 685 8,8% 50,3% 29,8 7 Motores Auxiliares 13 600 7,7% 58,0% 46,2 12 Fallas de Tierra 7 575 7,4% 65,3% 82,1 8 Motores Principales 12 555 7,1% 72,5% 46,3 5 Cortes de energía a ñas su-estaciones 21 395 5,1% 77,5% 18,8 15 Compresor de Aire 8 355 4,6% 82,1% 44,4 6 Sistema de protección de los límites de cables 10 277 3,6% 85,6% 27,7 9 Sistema de alumbrado 26 240 3,1% 88,7% 9,2 4 Reparaciones o chequeos al conectador cable 15 225 2,9% 91,6% 15,0 17 Fallas de sobrecorriente 6 220 2,8% 94,4% 36,7 14 Sistema de control 7 165 2,1% 96,5% 23,6 16 Controles del operador 5 155 2,0% 98,5% 31,0 14 Misceláneos 9 115 1,5% 100,0% 12,8  

description

Estadística para mantenimiento

Transcript of Analisis de Fallas - Pareto vs Jack-Knife

  • ANLISIS DE FALLA PARETO VS. GRFICOS DE DISPERSIN

    LOGARTMICA

    Anlisis Pareto

    A finales del siglo XIX, Wilfredo Pareto (1842-1923), ingeniero italiano,

    construy histogramas sobre la base de la distribucin de la riqueza en Italia,

    concluyendo que el 80% de la riqueza del pas se encontraba en manos del 20% de la

    poblacin total. Posterior a sus estudios, se pudo constatar que esta tendencia de

    distribucin era representativa de una diversidad de datos poblacionales. La regla de

    80/20, as como algunas variaciones como el anlisis ABC (que utiliza la regla 80/15/5)

    o el listado de los top ten, son hoy en da una prctica comn en muchos campos de

    estudio.

    Un ejemplo de esto es su aplicacin en la ingeniera de mantenimiento,

    donde el anlisis Pareto es comnmente utilizado para identificar aquellos cdigos de

    falla ms crticos para las operaciones, ya sea en trminos del costo de mantencin o de

    la confiabilidad y disponibilidad de los equipos.

    La siguiente tabla presenta el registro de fallas para una flota de 13 palas en

    una faena minera en el norte de Chile para un determinado mes. Los distintos cdigos

    de fallas han sido ordenados en forma descendente segn el tiempo fuera de servicio

    total asociado a cada uno de ellos:

    Tabla 4.1: Registro de fallas para una flota de 13 palas

    Cdigo Descripcin Cantidad Duracin (min) % Tiempo% Acumulado

    de Tiempo MTTR

    1 Inspecciones Elctricas 30 1015 13,0% 13,0% 33,82 Cable de Alimentacin 15 785 10,1% 23,1% 52,3

    11 Sobretemperatura Motor 36 745 9,6% 32,6% 20,73 Cambio de sub-estacin o traslado de pala 27 690 8,8% 41,5% 25,6

    10 Relay de Sobrecarga 23 685 8,8% 50,3% 29,87 Motores Auxiliares 13 600 7,7% 58,0% 46,2

    12 Fallas de Tierra 7 575 7,4% 65,3% 82,18 Motores Principales 12 555 7,1% 72,5% 46,35 Cortes de energa a as su-estaciones 21 395 5,1% 77,5% 18,8

    15 Compresor de Aire 8 355 4,6% 82,1% 44,46 Sistema de proteccin de los lmites de cables 10 277 3,6% 85,6% 27,79 Sistema de alumbrado 26 240 3,1% 88,7% 9,24 Reparaciones o chequeos al conectador cable 15 225 2,9% 91,6% 15,0

    17 Fallas de sobrecorriente 6 220 2,8% 94,4% 36,714 Sistema de control 7 165 2,1% 96,5% 23,616 Controles del operador 5 155 2,0% 98,5% 31,014 Miscelneos 9 115 1,5% 100,0% 12,8

  • La tabla presenta adems la frecuencia de la falla y el porcentaje acumulado

    del tiempo fuera de servicio. Se observa que aproximadamente 80% del tiempo fuera de

    servicio total del equipo se debe a los cdigos de falla 1, 2, 11, 3, 10, 7, 12, 8 y 5 (zona

    achurada). Grficamente se observa lo siguiente:

    0.0%

    2.0%

    4.0%

    6.0%

    8.0%

    10.0%

    12.0%

    14.0%

    1 2 11 3 10 7 12 8 5 15 6 9 4 17 14 16 13Cdigo de Fallas

    Porc

    en

    taje

    0.0%

    10.0%

    20.0%

    30.0%

    40.0%

    50.0%

    60.0%

    70.0%

    80.0%

    90.0%

    100.0%

    Porc

    en

    taje

    Acu

    mu

    lado

    Figura 4.7: Registro de fallas para flota de palas

    De igual manera, el criterio de priorizacin podran ser los costos de

    mantencin asociados a los cdigos de falla, la frecuencia de falla, o bien, el tiempo

    medio para reparar (razn entre el tiempo fuera de servicio y el nmero de fallas). Sobre

    la base de los cdigos de falla identificados por el anlisis de Pareto, mantencin puede

    elaborar sus planes de accin priorizando sus esfuerzos sobre dichos tipos de fallas de

    acuerdo al objetivo deseado: mejorar la disponibilidad del chancador (disminuir el

    tiempo fuera de servicio), su confiabilidad (frecuencia de falla) o su mantenibilidad, o

    bien, disminuir los costos de mantencin.

    Grficos de Dispersin Logartmica

    La metodologa de Grficos de Dispersin Logartmica (Jack-knife

    Diagrams, en ingls) es una metodologa alternativa para la priorizacin en los planes

    de mantenimiento.

  • Siguiendo con el ejemplo de las palas revisado en la seccin anterior, se

    sabe que el tiempo total fuera de servicio para un determinado cdigo de falla, que se

    denomina por la letra i, es producto de dos factores: uno de ellos es el nmero de fallas

    imprevistas asociadas a ese cdigo (ni) y el otro es el tiempo medio asociado al

    diagnstico y reparacin (MTTRi). A su vez, se ha establecido que el tiempo total fuera

    de servicio asociado al cdigo de falla corresponde al producto de los dos factores

    anteriores:

    iii MTTRnTFS = (4.6)

    La figura 4.8 muestra una representacin grfica de la frecuencia de falla y

    del Tiempo Medio Para Reparar:

    0

    20

    40

    60

    80

    100

    0 20 40 60Nmero de Fallas

    MTT

    R

    CURVAS DE TFS CONSTANTES: Familia de Hiperbolas

    117

    16

    15

    14

    13

    12

    11

    10

    9

    87

    6

    54

    3

    2

    Figura 4.8: Grfico de Dispersin x-y del MTTR vs. Nmero de Fallas (fuente:

    [Knights04]).

    Un aspecto que representa una desventaja del grfico de dispersin es que

    las curvas de TFS constante son hiprbolas, que en general son muy difciles de trazar.

    Para evitar lo anterior, se propone como solucin la aplicacin del logaritmo de la

    ecuacin 4.6, con lo que se obtiene lo siguiente:

    ( ) ( ) ( )iii MTTRnTFS logloglog += (4.7)

  • Si se construye un grfico de dispersin x-y con los ejes ajustados a escala

    logartmica, como se aprecia en la figura 4.9, las isoclinas de TFS constante tendrn

    ahora la forma de rectas con pendiente negativa.

    Figura 4.9: Grfico de Dispersin Logartmica del MTTR vs. Nmero de Fallas

    (fuente: [Knights04]).

    Esto facilita de gran manera el proceso de trazado de las curvas de TFS

    constante. Adems, permite determinar cul de los factores, MTTRi o ni, es el dominante

    en el tiempo de detencin.

    Si se considera que aquellas fallas que tienen un tiempo medio de

    reparacin muy largo son del tipo agudas, mientras que aquellas fallas que presentan un

    alto nivel de ocurrencia son del tipo crnicas, mediante la determinacin de valores

    lmites para el MTTR y n, el grfico de dispersin logartmica puede ser dividido en

    cuatro cuadrantes:

    1,0

    10,0

    100,0

    1 10 100

    Nmero de Fallas

    MTT

    R

    Rectas de TFS constante

  • 1,0

    10,0

    100,0

    1 10 100Nmero de Fallas

    TMFS

    1716

    15

    14

    13

    12

    11

    10

    9

    87

    6

    54

    3

    2

    1

    Agudas yCrnicasAgudas

    28.9

    Crnicas

    15.9

    Bajo Control

    Figura 4.10: Grfico de Dispersin Logartmica Mostrando Valores Lmites

    (fuente: [Knights04]).

    Los cuadrantes superiores representan la zona de fallas agudas, mientras que

    los cuadrantes del lado derecho representan una zona de fallas crnicas. El cuadrante

    superior derecho representa una zona de fallas agudas y crnicas simultneamente.

    Los valores lmites, denominados umbrales, pueden ser valores absolutos

    asignados por poltica interna de la empresa o bien pueden obtenerse empricamente,

    sobre la base de valores relativos de los datos de reparacin.

    La tabla 4.2 presenta un resumen de la clasificacin asignada a los distintos

    tipos de fallas. Se aprecia que aquellas fallas que se ubican en el cuadrante Agudo &

    Crnico representan un 21,8% del tiempo total fuera de servicio debido a mantencin

    no programada. Aquellas fallas que se ubican en el cuadrante agudo y en el cuadrante

    crnico representan el 41,7% y el 26,6% del tiempo fuera de servicio, respectivamente.

  • Tabla 4.2: Clasificacin de los Cdigos de Falla (fuente: [Knights04]).

    Cdigo Descripcin Cantidad Duracin (minutos)%

    TiempoTiempo Medio

    (minutos)FALLAS CRNICAS & AGUDAS

    1 Inspecciones elctricas 30 1015 13,0 33,810 Relay de sobrecarga 23 685 8,8 29,8

    SUBTOTAL 21,8 63,6FALLAS AGUDAS

    2 Cable de alimentacin daado 15 785 10,1 52,37 Motores auxiliares 13 600 7,7 46,212 Fallas de tierra 7 575 7,4 82,18 Motores principales 12 555 7,1 46,315 Compresor de aire 8 355 4,6 44,417 Fallas de sobrecorriente 6 220 2,8 36,716 Controles del operador 5 155 2,0 31,0

    SUBTOTAL 41,7 338,9FALLAS CRNICAS

    11 Sobretemperatura del motor 36 745 9,6 20,73 Cambio de subestacin o traslado de pala 27 690 8,8 25,65 Cortes de energa a subestaciones 21 395 5,1 18,89 Sistema de alumbrado 26 240 3,1 9,2

    SUBTOTAL 26,6 74,3

    La clasificacin de los tipos de falla en los grficos de dispersin

    logartmica provee una sencilla manera de identificar problemas de confiabilidad,

    disponibilidad y mantenibilidad. Es comn utilizar al tiempo medio entre fallas (TMEF)

    como un ndice de la confiabilidad. Por otro lado, la disponibilidad, confiabilidad y

    mantenibilidad de los equipos se encuentran relacionados a travs de la siguiente

    aproximacin:

    MTTRTMEF

    TMEFidadDisponibil

    + (4.12)

    Esta relacin muestra que la disponibilidad de las palas puede ser mejorada

    incrementando el TMEF, disminuyendo el MTTR, o mediante una combinacin de

    ambas acciones.

  • 1,0

    10,0

    100,0

    1 10 100Nmero de Fallas

    TMFS

    1716

    15

    14

    13

    12

    11

    10

    9

    87

    6

    54

    3

    2

    1

    Agudas y Crnicas

    Agudas

    28.9

    Crnicas

    15.9

    Confiabilidad

    MTTR

    1,0

    10,0

    100,0

    1 10 100Nmero de Fallas

    TMFS

    1716

    15

    14

    13

    12

    11

    10

    9

    87

    6

    54

    3

    2

    1

    Agudas y Crnicas

    Agudas

    28.9

    AgudasAgudas

    28.9

    Crnicas

    15.9

    CrnicasCrnicas

    15.9

    Confiabilidad

    MTTR

    Figura 4.11: Problemas de confiabilidad de la flota (fuente: [Knights04]).

    1,0

    10,0

    100,0

    1 10 100Nmero de Fallas

    TMFS

    1716

    15

    14

    13

    12

    11

    10

    9

    87

    6

    54

    3

    2

    1

    Agudas y Crnicas

    Agudas

    28.9

    Crnicas

    15.9

    MTTR

    Disponibilidad

    1,0

    10,0

    100,0

    1 10 100Nmero de Fallas

    TMFS

    1716

    15

    14

    13

    12

    11

    10

    9

    87

    6

    54

    3

    2

    1

    Agudas y Crnicas

    Agudas

    28.9

    AgudasAgudas

    28.9

    Crnicas

    15.9

    CrnicasCrnicas

    15.9

    MTTR

    Disponibilidad

    Figura 4.12: Problemas de disponibilidad de la flota (fuente: [Knights04]).

  • 1,0

    10,0

    100,0

    1 10 100Nmero de Fallas

    TMFS

    1716

    15

    14

    13

    12

    11

    10

    9

    87

    6

    54

    3

    2

    1

    Agudas y Crnicas

    Agudas

    28.9

    Crnicas

    15.9

    Mantenibilidad

    MTTR

    1,0

    10,0

    100,0

    1 10 100Nmero de Fallas

    TMFS

    1716

    15

    14

    13

    12

    11

    10

    9

    87

    6

    54

    3

    2

    1

    Agudas y Crnicas

    AgudasAgudas

    28.9

    Crnicas

    15.9

    CrnicasCrnicas

    15.9

    Mantenibilidad

    MTTR

    Figura 4.13: Problemas de mantenibilidad de la flota (fuente: [Knights04]).

    1,0

    10,0

    100,0

    1 10 100Nmero de Fallas

    TMFS

    1716

    15

    14

    13

    12

    11

    10

    9

    87

    6

    54

    3

    2

    1

    Agudas y Crnicas

    Agudas

    28.9

    Crnicas

    15.9

    MTTR

    1,0

    10,0

    100,0

    1 10 100Nmero de Fallas

    TMFS

    1716

    15

    14

    13

    12

    11

    10

    9

    87

    6

    54

    3

    2

    1

    Agudas y Crnicas

    Agudas

    28.9

    AgudasAgudas

    28.9

    Crnicas

    15.9

    CrnicasCrnicas

    15.9

    MTTR

    Figura 4.14: Problemas de confiabilidad, disponibilidad y mantenibilidad de la

    flota (fuente: [Knights04]).

    Volviendo al grfico de dispersin logartmica, las fallas crnicas son

    aquellas que ms contribuyen al nmero de fallas observadas (N). Estas son entonces

    las fallas que ms afectan la confiabilidad de la flota de palas analizada (figura 4.11).

  • Encontrar soluciones a la causa raz de estas fallas sera la manera ms eficiente de

    incrementar el TMEF de la flota.

    Similarmente, la figura 4.12 muestra aquellas fallas que ms afectan la disponibilidad de la

    flota. En este caso el umbral queda establecido por un lmite en el tiempo fuera de servicio,

    que se representa a travs de una de sus isoclinas. Al igual que los umbrales antes

    establecidos, este valor puede ser absoluto o relativo a los datos. En este caso se ha

    escogido el lmite que pasa por la interseccin de los umbrales de frecuencia de falla y del

    TMPR.

    Encontrando solucin a la causa raz de las fallas situadas por sobre este

    lmite incrementar la disponibilidad de la flota. El cdigo de falla 9 (sistema de

    alumbrado o de luces) representa un caso interesante. En la figura 4.11 se identific

    como una falla del tipo crnica; resolver este problema incrementara el TMEF y por lo

    tanto podra esperarse que se viera mejorada la disponibilidad de la flota. Sin embargo,

    comnmente las reparaciones del sistema de alumbrado requieren de muy poco tiempo.

    Si fuese posible eliminar estas fallas, el MTTR resultante del resto de los cdigos de

    falla se vera incrementado. Luego, de acuerdo a la ecuacin 4.12, el efecto de

    incrementar el TMEF se vera opacado por el incremento del MTTR, lo que producira

    un efecto reducido en trminos de mejorar la disponibilidad.

    La figura 4.13 representa las fallas agudas de la flota de palas que ms

    afectan la mantenibilidad, mientras que la figura 4.14 muestra el efecto combinado de

    los lmites de confiabilidad, disponibilidad y mantenibilidad. Aqu se puede ver que si

    bien, eliminar los cdigos de falla 15, 16 y 17 puede reducir el TMEF, la disponibilidad

    de la flota no se ver mayormente afectada, pues estos cdigos de falla no ocurren de

    manera frecuente.

    Existe otra buena razn para identificar las fallas agudas aparte del criterio

    de tiempo fuera de servicio, y es que la reparacin de estas fallas son generalmente ms

    caras. Es ms, no slo el costo directo de reparacin es mayor sino que tambin el Costo

    de Oportunidad por Prdida de Produccin por falla.

    De esta manera, al separar los problemas de tipo crnico de los de tipo

    agudo, el departamento de mantencin de una compaa minera puede contestar ms

    fcilmente qu tipos de falla se deben priorizar para mejorar ptimamente el negocio

    minero.

    En algunas industrias, las consecuencias econmicas (costo de oportunidad,

    extensin de costos fijos, costo de niveles de inventario subptimos y costo de

  • sobredimensionamiento) de una detencin imprevista pueden ser relativamente ms

    importantes que los costos directos de reparacin y mantencin. En la industria minera,

    por ejemplo, para ciclos de alto precio del metal, el costo de oportunidad por prdida de

    produccin puede ser ms significativo que los costos de reparacin. En este caso es

    deseable priorizar la produccin, es decir la confiabilidad y disponibilidad del equipo,

    por sobre la mantenibilidad (asociada a los costos).

    Sin embargo, cuando el precio del cobre cae, el costo de produccin pasa a

    ser un factor de mayor importancia en cuanto a los mrgenes de venta alcanzables por la

    empresa. En este escenario, los esfuerzos de mantencin deben dirigirse tanto a

    controlar y reducir los costos de mantencin y reparacin como a asegurar una buena

    confiabilidad y disponibilidad.