SPSS Inferencia2 Notas 03 2007

9
SPSS ESTADÍSTICA INFERENCIAL (2) Tests de comparación 1. Tests de normalidad (Kolmogorov-Smirnof)  Antes de realizar cualquier análisis estadístico se deben tener presentes las condiciones de aplicación del mismo. En casi todos los análisis estadísticos, la suposición de normalidad es un común denominador. De ahí que se inicie este apartado con el test estadístico de normalidad. Éste se denomina test de Kolmogorov– Smirnov (KS) y se halla en el menú de Análisis, dentro de la opción de Pruebas no paramétricas y finalmente bajo el nombre abreviado de K-S de una muestra... El cuadro de diálogo permite seleccionar la variable a analizar y la ley de probabilidad que se propone como de la población de la que ha sido extraída la muestra. Es importante notar que a veces los supuestos se refieren a la normalidad de las poblaciones que se comparan, por lo que este test KS debe repetirse para cada una de las muestras a comparar. De nuevo, la segmentación del archivo de datos de acuerdo a la variable que define los grupos a comparar es una herramienta de gran utilidad. Ejemplo 1 Se ha diseñado un ensayo clínico aleatorizado, doble-ciego y controlado con placebo, para estudiar el efecto de dos alternativas terapéuticas en el control de la hipertensión arterial. Se han reclutado 100 pacientes hipertensos y estos han sido distribuidos aleatoriamente en tres grupos de tratamiento. A uno de los grupos (control) se le administró un placebo, a otro grupo se le administró un inhibidor de la enzima conversora de la angiotensina (IECA) y al otro un tratamiento combinado de un diurético y un antagonista del calcio. Las variables respuesta final fueron las presiones arteriales sistólica y diastólica. Los datos con las claves de aleatorización han sido introducidos en una base de datos que reside en la central de aleatorización, mientr as que los datos clínicos han sido archivados en dos archivos distintos, uno para cada uno de los dos centros participantes en el estudio. Las variables almacenadas en estos archivos clínicos son las siguientes: nombre tipo ancho decimales descripción CLAVE Número 4 0 Clave de aleatorización NOMBRE Cadena 3 Iniciales del paciente F_NACIM Fecha 10 0 Fecha de nacimiento F_INCLUS Fecha 10 0 Fecha de inclusión SEXO Número 1 0 Sexo (0: hombre 1: mujer)  ALTURA Número 3 0 Altura en cm

Transcript of SPSS Inferencia2 Notas 03 2007

Page 1: SPSS Inferencia2 Notas 03 2007

 

SPSSESTADÍSTICA INFERENCIAL (2)

Tests de comparación

1. Tests de normalidad (Kolmogorov-Smirnof)

 Antes de realizar cualquier análisis estadístico se deben tener presentes las condiciones de aplicación delmismo. En casi todos los análisis estadísticos, la suposición de normalidad es un común denominador. Deahí que se inicie este apartado con el test estadístico de normalidad. Éste se denomina test de Kolmogorov–Smirnov (KS) y se halla en el menú de Análisis, dentro de la opción de Pruebas no paramétricas yfinalmente bajo el nombre abreviado de K-S de una muestra... El cuadro de diálogo permite seleccionar la variable a analizar y la ley de probabilidad que se propone como de la población de la que ha sidoextraída la muestra.

Es importante notar que a veces los supuestos se refieren a la normalidad de las poblaciones que secomparan, por lo que este test KS debe repetirse para cada una de las muestras a comparar.

De nuevo, la segmentación del archivo de datos de acuerdo a la variable que define los grupos a comparar es una herramienta de gran utilidad.

Ejemplo 1

Se ha diseñado un ensayo clínico aleatorizado, doble-ciego y controlado con placebo, para estudiar elefecto de dos alternativas terapéuticas en el control de la hipertensión arterial. Se han reclutado 100pacientes hipertensos y estos han sido distribuidos aleatoriamente en tres grupos de tratamiento. A uno delos grupos (control) se le administró un placebo, a otro grupo se le administró un inhibidor de la enzimaconversora de la angiotensina (IECA) y al otro un tratamiento combinado de un diurético y un antagonistadel calcio. Las variables respuesta final fueron las presiones arteriales sistólica y diastólica.

Los datos con las claves de aleatorización han sido introducidos en una base de datos que reside en lacentral de aleatorización, mientras que los datos clínicos han sido archivados en dos archivos distintos, unopara cada uno de los dos centros participantes en el estudio.

Las variables almacenadas en estos archivos clínicos son las siguientes:

nombre tipo ancho decimales descripciónCLAVE Número 4 0 Clave de aleatorizaciónNOMBRE Cadena 3 Iniciales del pacienteF_NACIM Fecha 10 0 Fecha de nacimientoF_INCLUS Fecha 10 0 Fecha de inclusiónSEXO Número 1 0 Sexo (0: hombre 1: mujer) ALTURA Número 3 0 Altura en cm

Page 2: SPSS Inferencia2 Notas 03 2007

 

2

nombre tipo ancho decimales descripciónPESO Número 3 0 Peso en kgPAD_INI Número 3 0 Presión diastólica basal (inicial)PAD_FIN Número 3 0 Presión diastólica finalPAS_INI Número 3 0 Presión sistólica basal (inicial)PAS_FIN Número 3 0 Presión sistólica final

Tabla I. Variables en los ficheros con los datos del estudio. (“hipertens – Datos”)

El archivo de claves de aleatorización contiene sólo dos variables:

nombre tipo ancho decimales descripción

CLAVE Número 4 0 Clave de aleatorización

FARMACO Número 1 0

Fármaco administrado:0: Placebo1: IECA2: Antagonista Ca + diurético

Tabla II. Variables en el fichero de claves “hipertens – Claves”.

La Tabla con los datos relativos a los 10 de los pacientes enrolados en uno de los centros de investigaciónes la siguiente:

 

ID NOMBRE F_NAC F_INCLUS SEX TALLA PESO PAD_INI PAD_FIN PAS_INI PAS_FIN1 SGL 8-9-41 13-7-98 1 165 78 78 104 176 1752 JCZ 10-7-57 9-5-98 1 154 74 95 114 162 1603 APZ 18-8-67 1-4-00 0 156 81 93 102 141 1504 NDG 8-5-56 13-11-98 0 181 82 86 91 162 1615 CLO 2-11-58 24-2-99 1 184 78 89 94 165 1626 LFZ 13-6-53 16-3-00 0 179 80 74 99 141 1487 OAR 20-7-61 21-8-99 1 159 60 94 95 168 1528 SGH 6-3-70 16-12-99 0 153 70 94 79 133 1439 ZLZ 6-2-62 21-6-00 1 172 57 74 64 149 13510 YSJ 5-4-68 15-10-98 0 154 54 89 87 147 155

Tabla III. Datos de los 10 pacientes reclutados en el centro con 10 pacientes.

NPAR TESTS

/K-S(NORMAL)= imc

/MISSING ANALYSIS.

Page 3: SPSS Inferencia2 Notas 03 2007

 

3

2. Comparación de medias

Dentro del menú Analizar, la opción Comparar medias... permite realizar comparaciones de mediasen distintas situaciones:

• Test t  de una muestra;

• Test t  de muestras independientes;

• Test t  de muestras relacionadas.

 Además de los anteriores tests estadísticos, dentro de este menú se permite realizar una descripción de lamuestra mediante la obtención de una tabla con distintos estadísticos muestrales. Esta descripción serealiza mediante la primera de las opciones denominada medias.

Las tablas de medias y otros estadísticos se pueden estratificar de acuerdo a una o varias variablescategóricas. Esta estratificación se realiza de acuerdo a la definición de distintas capas. Es decir, si seintroducen dos capas, por ejemplo tratamiento y sexo, dentro de cada uno de los tratamientos, losestadísticos solicitados aparecerán desglosados para ambos sexos.

 A continuación se ilustra el procedimiento que permite describir de forma estratificada las variables delejemplo 1, correspondientes a los datos de las tablas I, II y III (ver apartado anterior).

MEANS

TABLES=imc BY farmaco BY sexo

/CELLS MEAN COUNT STDDEV .

Page 4: SPSS Inferencia2 Notas 03 2007

 

4

2.1. Test t de Student para una muestra

Para contrastar si la media de una población difiere significativamente de un valor dado, el contrasteindicado es el test t  para una muestra. En el cuadro de diálogo correspondiente se debe introducir lavariable a analizar y el valor de la media con el que se quiere comparar.

Como opción posible, en éste y el resto de análisis en el menú Comparar Medias, únicamente se puededefinir el nivel de confianza que se desea para los intervalos de confianza para la media.

 A continuación se muestran los resultados de contrastar si la “ presión arterial media”  de los datos delejemplo 1 difiere significativamente del valor 100.

T-TEST

/TESTVAL=100

/MISSING=ANALYSIS

/VARIABLES=pam_ini

/CRITERIA=CIN (.95) .

Page 5: SPSS Inferencia2 Notas 03 2007

 

5

2.2. Test t de Student para muestras independientes

Esta opción debe utilizarse cuando la comparación se realice entre las medias de dos poblacionesindependientes (los individuos de una de las poblaciones son distintos a los individuos de la otra) como por ejemplo en el caso de la comparación de las poblaciones de hombres y mujeres.

La matriz de datos debe estar configurada como es habitual, es decir, existe una columna para los datos dela variable de interés y una segunda columna con los códigos que definen las poblaciones objeto decomparación.

Para el análisis, en el cuadro de diálogo correspondiente se debe configurar el campo relativo a lavariable de agrupación y posteriormente se deben definir los grupos a comparar mediante el botónDefinir.

Esta operación sustituirá los signos de interrogación que aparecen en la casilla de la variable de agrupaciónpor los códigos de los grupos comparados.

En las tablas siguientes se muestran los resultados de la comparación de las medias de la variable ”índicede masa corporal ” del ejemplo 1 según el “sexo” de los pacientes.

T-TEST

GROUPS=sexo(0 1)

/MISSING=ANALYSIS

/VARIABLES=imc

/CRITERIA=CIN(.95) .

Page 6: SPSS Inferencia2 Notas 03 2007

 

6

2.3. Test t de Student para muestras relacionadas

Existe una segunda alternativa para contrastar dos medias. Ésta se refiere al supuesto caso en el que lasdos poblaciones no sean independientes, es decir, el caso en el que se trate de poblaciones relacionadas.Esta situación se encuentra, por ejemplo, en los diseños apareados, diseños en los que los mismosindividuos son observados antes y después de una determinada intervención o en los diseños en los que lasmuestras son emparejadas de acuerdo a una serie de variables para controlar su efecto (como por ejemploen los diseños de casos y controles). Para la realización de este análisis, las dos muestras deben estar endos variables distintas de la matriz de datos y debe formarse la pareja de muestras antes de poder ser añadida la comparación a la lista de variables relacionadas del cuadro de diálogo.

Los resultados siguientes se refieren al contraste de la “ presión arterial sistólica inicial “ y “final” del conjuntode los pacientes del ejemplo 1.

T-TEST

PAIRS= pas_ini WITH pas_fin (PAIRED)

/CRITERIA=CIN(.95)

/MISSING=ANALYSIS.

Page 7: SPSS Inferencia2 Notas 03 2007

 

7

2.4. Procedimiento ANOVA

El análisis de la varianza (ANOVA) es un test estadístico desarrollado para realizar simultáneamente lacomparación de las medias de más de dos poblaciones. A la asunción de normalidad debe añadirse la de lahomogeneidad de las varianzas de las poblaciones a comparar. Esta condición previa de aplicación severificará estadísticamente mediante una de las opciones que se encuentran dentro de la configuración del ANOVA. La configuración del análisis se realiza en el cuadro de diálogo correspondiente.

Page 8: SPSS Inferencia2 Notas 03 2007

 

8

En este cuadro se debe introducir la variable a analizar (variable dependiente) así como la variable quedefine los grupos a comparar (factor). Si el ANOVA resultase en el rechazo de la hipótesis nula de igualdadde medias, se debe proseguir al análisis con la realización de los contrastes a posteriori (Post hoc...).

Finalmente, la aludida test de homogeneidad de varianzas se solicita en las Opciones del análisis.

Si se realiza un contraste simultáneo de la “ presión arterial media final”   de los pacientes del ejemplo 1según el tratamiento recibido, el procedimiento ANOVA genera los siguientes resultados.

ONEWAY

pam_fin BY farmaco

/STATISTICS HOMOGENEITY

/MISSING ANALYSIS

/POSTHOC = SNK DUNCAN SCHEFFE ALPHA(.05).

Page 9: SPSS Inferencia2 Notas 03 2007

 

9