Tema 1. Práctica 4. Inferencia Estadística.pdf
-
Upload
elisa-rescalvo -
Category
Documents
-
view
11 -
download
0
Transcript of Tema 1. Práctica 4. Inferencia Estadística.pdf
Silvia Rescalvo Martín
PRÁCTICA4.INFERENCIAESTADÍSTICA
II.CONTRASTEDEHIPÓTESISSOBREMEDIASDEPOBLACIONES
Consideramos los datos de la muestra de empleados recogidos en el archivo empleados.sav. Comenzamos
realizando un resumen descriptivo de los datos a través de la opción Analizar > Estadísticos descriptivos >
Descriptivos.
Ejemplo 1 Realizar un resumen descriptivo de la variable salario para el grupo de los hombres y de las
mujeres por separado.
Estadísticos descriptivos
Sexo N Mínimo Máximo Media Desv. típ.
Hombre Salario actual 258 $19,650 $135,000 $41,441.78 $19,499.214
N válido (según lista) 258
Mujer Salario actual 216 $15,750 $58,125 $26,031.92 $7,558.021
N válido (según lista) 216
A la vista de los datos obtenidos, observamos que el salario de los varones superior al de las mujeres en una
cantidad considerable. Así, mientras que las mujeres tienen un salario medio de 26.031,92$, el de los
varones es 41.441,7$, lo que supone prácticamente doblar la cantidad.
II.1.CONTRASTESOBRELAMEDIADEUNAPOBLACIÓNNORMAL
Consideramos ahora los contrastes sobre la media de una población (supuesta normal). Para ello utilizamos
el procedimiento test para una sola muestra (Analizar...Comparar Medias...Prueba t para una muestra).
Esto nos permite contrastar si la media difiere o no de un valor asumido en la hipótesis nula. Además nos
dará un intervalo de confianza para la diferencia de la media en la muestra y el valor especificado en la
hipótesis.
Ejemplo 2 Contrastar al nivel de significación del 5% que el salario medio de las mujeres es igual a 41442.
H₀: “el salario medio de las mujeres es igual a 41442”
H₁: “el salario medio de las mujeres distinto de 41442”
Aceptar H₀ supone que el salario de la mujer es igual y solo igual a 41.442$
Estadísticos para una muestra
N Media Desviación típ. Error típ. de la media
Salario actual 216 $26,031.92 $7,558.021 $514.258
El cuadro resumen obtenido, muestra que en el caso de las mujeres, el salario medio es 25.031,92 $ con una
desviación típica de 7.558,02. Según estos datos, la muestra se encuentra en una horquilla de más/menos
7.558,02 $ en torno a la media.
Esto nos lleva a pensar que nos alejamos de H₀.
Prueba para una muestra
Valor de prueba = 41442
t gl Sig. (bilateral) Diferencia de medias
95% Intervalo de confianza para la diferencia
Inferior Superior
Salario actual -29,966 215 ,000 -$15,410.079 -$16,423.71 -$14,396.45
A la vista de los datos obtenidos p‐valor es igual a 0,000, por lo que, siendo inferior al valor de alfa 0,05)
rechazamos la hipótesis nula, lo que significa que el salario medio de las mujeres es distinto de 41442
Ejercicio propuesto 1. Realizar un resumen descriptivo de la variable salario para los empleados que
proceden de una minoría étnica y los que no por separado.
Estadísticos descriptivos
Clasificación de minorías N Mínimo Máximo Media Desv. típ.
No Salario actual 370 $15,750 $135,000 $36,023.31 $18,044.096
N válido (según lista) 370
Sí Salario actual 104 $16,350 $100,000 $28,713.94 $11,421.638
N válido (según lista) 104
A través de los estadísticos utilizados observamos que hecha la agrupación diferenciada entre empleados que
proceden de una minoría étnica y aquellos que no, la media del salario de las personas que no proceden de
una minoría étnica es de 36.023,31$ (con una desviación típica de 18.044.10$) y la de aquellos que si
proceden de minoría étnica es 28.713,94$ (con una desviación típica de 11.421,69$).
De lo que debemos deducir que el salario medio de las personas que pertenecen a una minoría étnica es
menor que el de aquellos otros trabajadores que no pertenecen a ellos.
Contrastar al nivel de significación del 5% que el salario medio de las los empleados de una minoría étnica es
36023.
H₀: “El salario medio de los empleados procedentes de una minoría étnica es igual y solo igual a 36023”
H₁: “El salario medio de los empleados procedentes de una minoría étnica es distinto a 36023”
Estadísticos para una muestra
Clasificación de minorías N Media Desviación típ. Error típ. de la media
Sí Salario actual 104 $28,713.94 $11,421.638 $1,119.984
El cuadro resumen obtenido, muestra que en el caso de los trabajadores incluidos en una minoría étnica, el
salario medio es 28.731,94$ con una desviación típica de 11.421,64. Según estos datos, la muestra se
encuentra en una horquilla de más/menos 11.421,64$ en torno a la media.
Esto nos lleva a pensar que nos alejamos de H₀.
Prueba para una muestra
Clasificación de minorías
Valor de prueba = 36023
t gl Sig. (bilateral)
Diferencia de medias
95% Intervalo de confianza para la diferencia
Inferior Superior
Sí Salario actual -6,526
103 ,000 -$7,309.058 -$9,530.28 -$5,087.83
A la vista de los datos obtenidos p‐valor es igual a 0,000, por lo que, siendo inferior al valor de alfa 0,05)
rechazamos la hipótesis nula, lo que significa que el salario medio de las mujeres es distinto de 36.023$.
La interpretación de los datos de la tabla nos indica que la diferencia entre el salario medio de los empleados
que proceden de una minoría étnica está entre ‐9.530,28$ y ‐5.087,83$ y esto significa que el salario medio
de los empleados procedentes de una minoría étnica no es 36.023$ sino que se encuentra por debajo en al
menos 9.530,28 $
II.2.CONTRASTEPARALAIGUALDADDEMEDIASDEDOSPOBLACIONES
Test T para igualdad de medias de 2 muestras relacionadas o con datos apareados
Consideramos los contrastes sobre dos medias. Comenzamos por el caso de muestras apareadas y para ello
utilizaremos el procedimiento de test para muestras apareadas (Analizar...Comparar Medias...Prueba t
para muestras relacionadas). Por muestras apareadas entenderemos el caso en que se mide dos variables
para el mismo individuo o caso. El objetivo por tanto es contrastar si las medias de dichas variables son
iguales. Un ejemplo de muestras relacionadas son los datos de las variable “salini” y “salario" que recogen,
para cada empleado, los salarios iniciales (al entrar en la empresa) y el salario actual.
Ejemplo 3 Contrastar la hipótesis de que el salario medio actual (variable salario) es igual al inicial (variable
salini) para el grupo de las mujeres a un nivel de significación del 5%.
H₀: “El salario medio actual de las mujeres es igual y solo igual salario medio inicial”
H₁: “El salario medio actual de las mujeres es distinto del salario medio inicial”
Estadísticos de muestras relacionadas
Media N Desviación típ. Error típ. de la media
Par 1 Salario actual $26,031.92 216 $7,558.021 $514.258
Salario inicial $13,091.97 216 $2,935.599 $199.742
Podemos observar que la media del salario actual es más elevada que la media del salario inicial. La media
del salario actual está en $26.031,92 y la media del salario inicial está en $13.091,97. Esas medidas tienen
una dispersión que la desviación típica y éste es elevado por lo que podemos decir que se trata de números
imprecisos. Eso significa que si hubiese cogido otra muestra el resultado sería distinto.
El cuadro resumen obtenido, muestra que en el caso de las mujeres, el salario medio actual es 26.031,92 $
con una desviación típica de 7,558.02, mientras que el salario medio inicial era de 13.091,97$ con una
desviación típica de 2.935,60. Esta desviación típica, que muestra la dispersión de la muestra, es elevada
sobre todo en el caso del salario actual, por lo que tenemos un resultado impreciso.
Todos estos resultados nos llevan a pensar que nos alejamos de H₀.
Prueba de muestras relacionadas
Diferencias relacionadas t gl Sig. (bilateral) Media Desviación
típ. Error típ. de la media
95% Intervalo de confianza para la diferencia
Inferior Superior
Par 1
Salario actual - Salario inicial
$12,939.954 $5,661.085 $385.188 $12,180.725 $13,699.182 33,594 215 ,000
Si nos finamos en el p‐valor, que es 0,000 y esto es menor que 0,05, por lo que se rechaza la hipótesis nula,
es decir, el salario medio actual es muy diferente al salario medio inicial.
El salario a lo largo de los años va aumentando. El salario se incrementa $según nos dice la desviación típica.
A la vista de los datos obtenidos p‐valor es igual a 0,000, por lo que, siendo inferior al valor de alfa (0,05)
rechazamos la hipótesis nula, lo que significa que el salario medio actual de las mujeres es distinto del
salario medio inicial. La interpretación de los datos de la tabla nos indica que la diferencia entre el salario
medio actual y el inical está entre 12.180,73$ y 13.699,18$.
Test de muestras independientes
Consideramos ahora el caso de dos muestras independientes y de nuevo el objetivo es comparar las medias
de las poblaciones de las que proceden. Para ello utilizaremos el procedimiento de test para muestras
independientes (Analizar...Comparar Medias...Prueba t para muestras independientes).
Ejemplo 4 Contrastar la hipótesis de igual tiempo medio en el empleo (variable “tiempemp”) para el grupo
que sí es minoría étnica y el que no lo es. Al mismo tiempo contrastar también la hipótesis de igual media de
años de educación (variable “educ”) para los dos grupos de la variable minoría. Realizar los contrastes a un
nivel de significación del 5%.
Contraste 1
H₀: “La media de “tiempemp” es la misma en ambos grupos independientemente de que procedan de
minorías étnicas o no”
H₁: “La media de “tiempemp” es distinta dependiendo de que el grupo proceda de minorías étnicas o no”
Contraste 2
H₀: “La media de “educ” es la misma en ambos grupos independientemente de que procedan de minorías
étnicas o no”
H₁: “La media “educ” es distinta dependiendo de que el grupo proceda de minorías étnicas o no”
Estadísticos de grupo
Clasificación de minorías N Media Desviación típ. Error típ. de la
media
Meses desde el contrato No 370 80,85 10,082 ,524
Sí 104 82,05 9,978 ,978
Nivel educativo No 370 13,69 2,942 ,153
Sí 104 12,77 2,555 ,251
Según los datos ofrecidos por la tabla de estadísticos podemos observar en la variable “tiempemp” (meses
desde el contrato) para el grupo de trabajadores que pertenecen a minoría étnica, la media de tiempo es de
82,05 meses y para los que no pertenecen a este colectivo, la media es de 80,85 meses. Como se puede
observar hay una diferencia escasa entre ambos.
En el caso de la variable “educ” (nivel educativo), para el grupo de trabajadores que pertenecen a minoría
étnica, la media es de 12,77 y para los que no pertenecen a este colectivo, la media es de 13,69. Como se
puede observar la diferencia entre ambos es pequeña.
Prueba de muestras independientes
Prueba de Levene para la igualdad de varianzas
Prueba T para la igualdad de medias
F Sig. t gl Sig. (bilateral)
Diferencia de medias
Error típ. de la diferencia
95% Intervalo de confianza para la diferencia
Inferior Superior
Meses desde el contrato
Se han asumido varianzas iguales
,015 ,903 -1,077
472 ,282 -1,202 1,116 -3,396 ,992
No se han asumido varianzas iguales
-1,083
166,762 ,280 -1,202 1,110 -3,394 ,989
Nivel educativo
Se han asumido varianzas iguales
6,201 ,013 2,913 472 ,004 ,925 ,318 ,301 1,550
No se han asumido varianzas iguales
3,152 186,843 ,002 ,925 ,294 ,346 1,504
Contraste 1
H₀: varianzas iguales.
Como el p‐valor es 0,903 y este es mayor que 0,05, se acepta la hipótesis nula, que significa que las varianzas
son iguales.
El p‐valor es 0,282 y esto es mayor que 0,05 por lo que se acepta la hipótesis nula, esto significa que la
media de la variable “tiempemp” es igual en el procedente de minorías étnicas del grupo que no procede de
minorías étnicas.
Contraste 2
H₀: varianzas iguales.
Como el p‐valor es 0,013 y esto es menor que 0,05, se rechaza la hipótesis nula y por lo tanto las varianzas
no son iguales.
EL p‐valor es 0,002 y esto es menor que 0,05 por lo que se rechaza la hipótesis nula, es decir, la media de
“educ” no es igual en el grupo procedente de minoría étnica y en el grupo no procedente de minorías
étnicas.
Ejercicio propuesto 2. Contrastar la hipótesis de igual media de años de educación (variable “educ”) para
hombres y mujeres a un nivel de significación del 5%.
H₀: “La media de “educ” es igual y solo igual en hombres y en mujeres”
H₁: “La media de “educ” es distinta en hombres y en mujeres” Estadísticos de grupo
Sexo N Media Desviación típ. Error típ. de la
media
Nivel educativo Hombre 258 14,43 2,979 ,185
Mujer 216 12,37 2,319 ,158
Entre los datos obtenidos con los estadísticos de este grupo podemos observar para la variable “nivel
educativo” que para los hombres, la media es de 14,43 mientras que en el caso de las mujeres, la media es
de 12,37 meses, no hay mucha diferencia ambos es pequeña.
Prueba de muestras independientes
Prueba de Levene para la igualdad de varianzas
Prueba T para la igualdad de medias
F Sig. t gl Sig. (bilateral)
Diferencia de medias
Error típ. de la diferencia
95% Intervalo de confianza para la diferencia
Inferior Superior
Nivel educativo
Se han asumido varianzas iguales
17,884 ,000 8,276 472 ,000 2,060 ,249 1,571 2,549
No se han asumido varianzas iguales
8,458 469,595 ,000 2,060 ,244 1,581 2,538
H₀: varianzas iguales. Como el p‐valor es 0,000 y esto es menor que 0,05, se rechaza la hipótesis nula y esto
significa que las varianzas no son iguales.
EL p‐valor es 0,000 y esto es menor que 0,05 por lo que se rechaza la hipótesis nula (H₀), es decir, la media
de “educ” no es igual para hombres que para mujeres.