Test Fisher y Mcnemar

download Test Fisher y Mcnemar

of 7

Transcript of Test Fisher y Mcnemar

  • 7/28/2019 Test Fisher y Mcnemar

    1/7

    Metodologa de la Investigacin 1/7

    www.fisterra.com Atencin Primaria en la Red

    Asociacin de variables cualitativas:El test exacto de Fisher y el test de Mcnemar

    Autores:

    Sonia Prtega Daza(1), Salvador Pita Fernndez(2)(1) Unidad de Epidemiologa Clnica y Bioestadstica. Complejo Hospitalario Juan Canalejo (A Corua).(2) Mdico de Familia. Centro de Salud de Cambre (A Corua). Actualizada el 14/11/2004.

    Desde que Pearson1,2 introdujo el test de la

    2

    en 1900, sta se ha convertido en una herramienta deuso general para conocer si existe o no relacin entre variables de tipo cualitativo. Sin embargo, suaplicacin exige de ciertos requerimientos acerca del tamao muestral que no siempre son tenidos en

    cuenta3. La prueba2

    es aplicable a los datos de una tabla de contingencia solamente si las

    frecuencias esperadas son suficientemente grandes. Del mismo modo, cuando los datos exhiben algn

    grado de dependencia, el test

    2

    no ser el mtodo apropiado para contrastar la hiptesis nula deindependencia. En este trabajo se introducirn la prueba exacta de Fisher y el test de McNemar como

    alternativa estadstica al test

    2

    cuando no se verifiquen las condiciones necesarias para su utilizacin4-7

    .

    La prueba de probabilidad exacta de Fisher

    El test exacto de Fisher permite analizar si dos variables dicotmicas estn asociadas cuando la muestraa estudiar es demasiado pequea y no se cumplen las condiciones necesarias para que la aplicacin del

    test

    2

    sea adecuada. Estas condiciones exigen que los valores esperados de al menos el 80% de lasceldas en una tabla de contingencia sean mayores de 5. As, en una tabla 2x2 ser necesario que todaslas celdas verifiquen esta condicin, si bien en la prctica suele permitirse que una de ellas muestrefrecuencias esperadas ligeramente por debajo de este valor.

    En situaciones como esta, una forma de plantear los resultados es su disposicin en una tabla decontingencia de dos vas. Si las dos variables que se estn considerando son dicotmicas, nos

    encontraremos con el caso de una tabla 2 x 2 como la que se muestra en la Tabla 1. El test exacto deFisher se basa en evaluar la probabilidad asociada a cada una de las tablas 2 x 2 que se pueden formarmanteniendo los mismos totales de filas y columnas que los de la tabla observada. Cada una de estasprobabilidades se obtiene bajo la hiptesis nula de independencia de las dos variables que se estnconsiderando.

    Tabla 1. Tabla de contingencia general para la comparacinde dos variables dicotmicas en el caso de gruposindependientes.

    Caracterstica A

    Caracterstica B Presente Ausente Total

    Presente a b a + b

    Ausente c d c + d

    Total a + c b + d n

    La probabilidad exacta de observar un conjunto concreto de frecuencias a, b, c y d en una tabla 2 x 2cuando se asume independencia y los totales de filas y columnas se consideran fijos viene dada por ladistribucin hipergeomtrica:

    ( ) ( ) ( ) ( )!!!!!

    !!!!

    dcban

    dbcadcbap

    ++++=

    (1)

    Esta frmula se obtiene calculando todas las posibles formas en las que podemos disponer n sujetos enuna tabla 2 x 2 de modo que los totales de filas y columnas sean siempre los mismos, (a+b), (c+d),(a+c) y (b+d).

  • 7/28/2019 Test Fisher y Mcnemar

    2/7

    Metodologa de la Investigacin 2/7

    www.fisterra.com Atencin Primaria en la Red

    La probabilidad anterior deber calcularse para todas las tablas de contingencia que puedan formarsecon los mismos totales marginales que la tabla observada. Posteriormente, estas probabilidades se usanpara calcular valor de la p asociado al test exacto de Fisher. Este valor de p indicar la probabilidad deobtener una diferencia entre los grupos mayor o igual a la observada, bajo la hiptesis nula deindependencia. Si esta probabilidad es pequea (p

  • 7/28/2019 Test Fisher y Mcnemar

    3/7

    Metodologa de la Investigacin 3/7

    www.fisterra.com Atencin Primaria en la Red

    La Tabla 3 muestra todas las posibles combinaciones de frecuencias que se podran obtener con losmismos totales marginales que en la Tabla 2. Para cada una de estas tablas, se ha calculado laprobabilidad exacta de ocurrencia bajo la hiptesis nula, segn la expresin (1). Los resultadosobtenidos se muestran en la Tabla 4. El valor de la p asociado al test exacto de Fisher puede entoncescalcularse sumando las probabilidades de las tablas que resultan ser menores o iguales a la probabilidadde la tabla que ha sido observada:

    0909,00280,00599,00030,0 =++=p

    Tabla 4. Probabilidad exacta asociada con cada una de lasdisposiciones de frecuencias de la Tabla 3.

    a b c d p

    (i) 0 5 8 1 0,0030

    (ii) 1 4 7 2 0,0599

    (iii) 2 3 6 3 0,2797

    (iv) 3 2 5 4 0,4196

    (v) 4 1 4 5 0,2098

    (vi) 5 0 3 6 0,0280

    Otro modo de calcular el valor de p correspondiente consistira en sumar las probabilidades asociadas aaquellas tablas que fuesen ms favorables a la hiptesis alternativa que los datos observados. Es decir,aquellas situaciones en las que la diferencia en la prevalencia de obesidad entre hombres y mujeresfuese mayor que la observada en la realidad. En el ejemplo, slo existe una tabla ms extrema que lacorrespondiente a los datos observados (aquella en la que no se observa ninguna mujer obesa), deforma que:

    0629,00599,00030,0 =+=p

    (2)

    Este sera el valor de la p correspondiente a un planteamiento unilateral. En este caso la hiptesis acontrastar sera que la prevalencia de obesidad es igual en hombres y mujeres, frente a la alternativa de

    que fuese mayor en los varones. Cuando el planteamiento se hace con una perspectiva bilateral, lahiptesis alternativa consiste en asumir que existen diferencias en la prevalencia de obesidad entresexos, pero sin especificar de antemano en qu sentido se producen dichas diferencias. Para obtener elvalor de la p correspondiente a la alternativa bilateral deberamos multiplicar el valor obtenido en (2) pordos:

    1258,00629,02 ==p

    Como se puede observar, las dos formas de clculo propuestas no tienen por qu proporcionarnecesariamente los mismos resultados. El primer mtodo siempre resultar en un valor de p menor oigual al del segundo mtodo. Si recurrimos a un programa estadstico como el SPSS para el cmputo deltest, ste utilizar la primera va para obtener el p-valor correspondiente a la alternativa bilateral y elsegundo mtodo de clculo para el valor de p asociado a un planteamiento unilateral. En cualquier caso,y a la vista de los resultados, no existe evidencia estadstica de asociacin entre el sexo y el hecho de

    ser obeso en la poblacin de estudio.

    El test de McNemar

    En otras ocasiones, una misma caracterstica se mide en ms de una ocasin para cada uno de losindividuos que se incluyen en una investigacin. En estos casos, el inters se centra en comparar si lasmediciones efectuadas en dos momentos diferentes (normalmente antes y despus de algunaintervencin) son iguales o si, por el contrario, se produce algn cambio significativo. Por ejemplo,puede interesarnos estudiar, a distintos tiempos, el porcentaje de sujetos que se mantienen con fiebretras la aplicacin de un antitrmico o comparar la proporcin de enfermos con un determinado sntomaantes y despus de un tratamiento.

    Para el caso de datos pareados, existen claramente cuatro tipos de pares de observaciones, segn cada

    individuo presente o no la caracterstica de inters en los dos momentos en los que se efecta laevaluacin (Tabla 5). As, los resultados obtenidos pueden mostrarse igualmente en una tabla 2 x 2

  • 7/28/2019 Test Fisher y Mcnemar

    4/7

    Metodologa de la Investigacin 4/7

    www.fisterra.com Atencin Primaria en la Red

    como en la Tabla 1, con la salvedad de que aqu los datos son dependientes y por lo tanto no resultar

    adecuada la utilizacin del test

    2

    .

    Tabla 5. Frecuencia de cada una de las posibles combinaciones en unestudio de datos pareados.

    Observacin 1 Observacin 2 Nmero de pares

    Tipo Caracterstica Caracterstica

    1 Presente Presente a

    2 Presente Ausente b

    3 Ausente Presente c

    4 Ausente Ausente d

    Total n

    Con esta notacin, las proporciones de individuos con la caracterstica de inters en los dos momentos

    en los que se efecta la medicin son n

    bap

    +=1

    y n

    cap

    +=2

    , respectivamente. Estamosinteresados por lo tanto en la diferencia entre estas dos proporciones:

    n

    cb

    n

    ca

    n

    bappd

    =

    +

    +== 21

    La hiptesis nula que se quiere contrastar es que el valor esperado para esta diferencia es cero, frente a

    la hiptesis alternativa de que las dos proporciones 1p

    y 2p

    sean efectivamente diferentes. Esto sepuede contrastar centrando nuestra atencin en las casillas b y cque son las que muestran discordanciaen los dos momentos en los que se efectu la medicin. La prueba de McNemar contrasta as si elnmero de individuos que han dejado de presentar la caracterstica de inters (b) es el mismo que elnmero de individuos que han realizado el cambio inverso (c).

    El error estndar para la diferencia entre dos proporciones viene dado por:

    ( )( )

    n

    cbcb

    nppSE

    2

    21

    1 +=

    (3)

    De modo que, bajo la hiptesis nula de que no existe diferencia entre ambas( )0= cb

    , la ecuacin(3) se reduce a:

    ( ) cbn

    ppSE +=1

    21

    El estadstico de contraste se construye as de la forma siguiente:

    ( ) cb

    cb

    cbn

    n

    cb

    ppSE

    ppz

    +

    =

    +

    =

    =

    121

    21(4)

    que sigue una distribucin normal N(0,1).

    Alternativamente, se puede considerar el estadstico de contraste:

    ( )cb

    cb

    +

    =

    22

  • 7/28/2019 Test Fisher y Mcnemar

    5/7

    Metodologa de la Investigacin 5/7

    www.fisterra.com Atencin Primaria en la Red

    que sigue una distribucin chi-cuadrado con un grado de libertad y proporciona el mismo valor de la pasociado.

    A su vez, se puede aplicar una correccin de continuidad para trabajar sobre muestras pequeas:

    cb

    cb

    z+

    =

    1

    refiriendo el valor de dicho estadstico al de una distribucin normal N(0,1) , equivalentemente, a unadistribucin chi-cuadrado con un grado de libertad si se trabaja con su valor al cuadrado:

    ( )cb

    cb

    +

    =

    2

    21

    De modo anlogo, es posible obtener un intervalo de confianza para la diferencia de proporciones como:

    ( )2121 96.1 ppSEpp

    Para ilustrar los clculos anteriores, se dispone de informacin acerca de 20 pacientes a los que se lesadministr un determinado tratamiento para tratar el dolor tras una intervencin quirrgica. En cadaindividuo, se realiz una valoracin del dolor inmediatamente despus de la operacin y al cabo de 1hora tras la administracin del analgsico. Los datos observados se muestran en la Tabla 6. En primerlugar se construye la tabla 2 x 2 con las frecuencias observadas en el estudio (Tabla 7). Segn estos

    datos, el porcentaje de pacientes que manifiestan dolor inicialmente es de%60

    2012 =

    , frente al

    %1520

    3 =de los enfermos que dicen tener dolor una vez administrado el analgsico. El estadstico

    de contraste se construye segn la expresin (4) como:

    49.213

    9

    211

    211==

    +

    =

    +

    =

    cb

    cbz

    El valor obtenido del estadstico (z=2.49) se compara con los valores de una distribucin normalestndar (Tabla 8). El valor crtico correspondiente para =0.01 es de z=2.576 y para =0.02 es de2.326. Como quiera que en el clculo del test de McNemar en el ejemplo obtuvimos un valor de 2.49,que supera al valor para =0.02, podremos concluir que las dos variables no son independientes, sinoque estn asociadas (p

  • 7/28/2019 Test Fisher y Mcnemar

    6/7

    Metodologa de la Investigacin 6/7

    www.fisterra.com Atencin Primaria en la Red

    En definitiva, el uso generalizado de la metodologa estadstica ha contribuido a dotar de un mayor rigora la investigacin clnico-epidemiolgica en los ltimos aos. Sin embargo, tambin ha hecho que estastcnicas se apliquen en ocasiones de una manera un tanto superficial. Es extremadamente importantetener en cuenta las asunciones subyacentes a los distintos mtodos estadsticos, como en el caso del

    test2

    , para comprender cundo es adecuado o no su uso y disponer de las tcnicas estadsticas

    alternativas que deben utilizarse en cada ocasin.

    Bibliografa

    1. Pearson K. On a criterion that a given system of deviations from the probable in the case ofcorrelated system of variables is Duch that it can be reasonably supposed to have arisen fromrandom sampling. Philosophical Magazine 1900, Series 5, No. 50: 157-175.

    2. Pearson, K. On the 2 testo f goodness of fit. Biometrika 1922; 14: 186-191.3. Pita Fernndez S, Prtega Daz S. Asociacin de variables cualitativas: Test de chi-cuadrado.

    Cad Aten Primaria 2004 (en prensa). [Texto completo]4. Altman DG. Practical statistics for medical research. London: Chapman & Hall; 1991.5. Armitage P, Berry G. Estadstica para la investigacin biomdica. Madrid : Harcourt Brace;

    1999.6. Juez Martel P. Herramientas estadsticas para la investigacin en Medicina y Economa de la

    Salud. Madrid: Ed. Centro de Estudios Ramn Areces; 2001.7. Agresti A. Categoriacl Data Analisis. New York: John Wiley & Sons; 1990.Tabla 6. Datos de 20 pacientes intervenidos quirrgicamente en losque se valor el dolor tras la ciruga y al cabo de 1 hora tras laadministracin de un analgsico.

    Individuo Dolor tras la intervencin Dolor 1 horas despus del Tto.

    1 No No

    2 S No

    3 No No

    4 No No

    5 S No

    6 S No

    7 No No

    8 S S

    9 No S

    10 No No

    11 S No

    12 S No

    13 S No

    14 S No

    15 S No

    16 No S

    17 No S

    18 S No19 S No

    20 S No

    Tabla 7. Tabla de contingencia con los datos de 20 pacientesintervenidos quirrgicamente en los que se valor el dolor tras laciruga y al cabo de 1 hora tras la administracin de un analgsico.

    Dolor 1 hora despus deltratamiento

    Dolor tras laintervencin

    S No Total

    S 1 (a) 11 (b) 12 (a+b)

    No 2 (c) 6 (d) 8 (c+d)

    Total 3 (a+c) 17 (b+d) 20 (n)

  • 7/28/2019 Test Fisher y Mcnemar

    7/7

    Metodologa de la Investigacin 7/7

    www.fisterra.com Atencin Primaria en la Red

    Tabla 8. Tabla de valores de la distribucin normal. La tabla muestra los valores de z para los que laprobabilidad de observar un valor mayor o igual (en valor absoluto) es igual a . La cifra entera y elprimer decimal de se buscan en la primera columna, y la segunda cifra decimal en la cabecera dela tabla.