1
Bioestadística
Francisco Javier Barón LópezDpto. Medicina PreventivaUniversidad de Málaga, Españ[email protected]
2
Datos, variables y ficheros
3
Categóricas: Frecuencias
4
Nivel de estudios
6 2,0 2,0
89 30,1 32,1
129 43,6 75,7
72 24,3 100,0
296 100,0
Ninguno
Primarios
Medios
Universitarios
Total
VálidosFrecuencia Porcentaje
Porcentajeacumulado
Categóricas: Frecuencias
UniversitariosMediosPrimariosNinguno
Nivel de estudios
140
120
100
80
60
40
20
0
Fre
cuen
cia
72
129
89
6
5
Variables numéricas
6
¿Con media y desviación es suficiente?
45403530252015
Edad materna
50
40
30
20
10
0
Fre
cuen
cia
Media =30,09Desviación típica =5,168N =295
7
¿Cómo interpretar media y desviación?
Centrado en la media y a una desv. típica de distancia hay aproximadamente el 68% de las observaciones.
A dos desviaciones típicas tenemos el 95% (aprox.)
150 160 170 180 190
0.00
0.01
0.02
0.03
0.04
0.05
xs
68.5 %
150 160 170 180 190
0.00
0.01
0.02
0.03
0.04
0.05
x2s
95 %
8
Distribuciones casi normales
-3 -2 -1 0 1 2 3
0.0
0.1
0.2
0.3
dens
idad
-3 -2 -1 0 1 2 3
x s
66 %
x 2s
95 %
-3 -2 -1 0 1 2 3
0.0
0.1
0.2
0.3
dens
idad
-3 -2 -1 0 1 2 3
x s
71 %
x 2s
94 %
-3 -2 -1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
dens
idad
-3 -2 -1 0 1 2 3
x s
68 %x 2s94 %
-3 -2 -1 0 1 2 3
0.0
0.1
0.2
0.3
dens
idad
-3 -2 -1 0 1 2 3
x s
70 %
x 2s
94 %
9
Diagramas de Tukey Si 2 números no
son suficientes… ¡Probemos con 5!
Mínimo, cuartiles y máximo.
La zona central, ‘caja’, contiene al 50% central de los datos.
Diagrama de cajas de Tukey: Resumen en 5 números
Velocidad (Km/h) de 200 vehículos en ciudad
dens
idad
40 45 50 55 60 65
0.00
0.02
0.04
0.06
0.08
40 45 50 55 60 65
Mín. P25 P50 P75 Máx.
Diagrama de cajas de Tukey: Resumen en 5 números
Velocidad (Km/h) de 200 vehículos en autovía
dens
idad
80 90 100 110 120 130 140
0.00
0.01
0.02
0.03
0.04
80 90 100 110 120 130 140
Mín. P25 P50 P75 Máx.
10
¿Media o mediana?
Altura mediana
11
x
8 10 12 14 16 18 20
0.00
0.05
0.10
0.15
0.20
8 10 12 14 16 18 20
x s
78 %
x
-2 -1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
0.5
-2 -1 0 1 2 3
x s
66 %
x
0 2 4 6 8 10 12 14
0.00
0.05
0.10
0.15
0.20
0 2 4 6 8 10 12 14
x s
78 %
Si hay asimetría… mejor usar la mediana
En función del signo del estadístico diremos que la asimetría es positiva o negativa. Distribución simétrica asimetría nula.
12
¿Aplanada o apuntada?
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una distribución con respecto a la distribución normal.
Aplanada
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.5
1.0
1.5
2.0
0.0 0.2 0.4 0.6 0.8 1.0
xs
57 %
Apuntada como la normal
-3 -2 -1 0 1 2 3
0.0
0.1
0.2
0.3
-3 -2 -1 0 1 2 3
xs
68 %
Apuntada
-2 -1 0 1 2
0.0
0.2
0.4
0.6
0.8
-2 -1 0 1 2
xs
82 %
13
El IMC, como medida de la relación entre peso y talla, muestra una población con media ajustada a la sobrecarga ponderal (IMC= 28.1075) con una clara desproporción hacia la obesidad
Poca información… ¿Falta algo?
14
Se resume todo en una tabla
15
Si algo no está en la tabla resumen, hay que describirlo por completo
La media de edad a la Menopausia fue de 47.41 años para el conjunto de mujeres menopaúsicas. El rango de edades fue de 41 años, con mínimo y máximo en 24 y 65 años, respectivamente. El histograma presentó un elevado índice de curtosis con desproporción hacia los valores inferiores consecuencia, de los efectos de intervenciones quirúrgicas sobre el aparato reproductor femenino.
Sólo menopáusicas.
No están en la tabla resumen
16
17
Estudiar dos variables a la vez
Numérica - Numérica
Numérica - Categórica
Categórica – Categórica
18
Numérica - Numérica Los individuos que tienen
mayor puntuación en el test de dificultad emocional, tienen tendencia a puntuar más en el de dificultad de comunicación social. La relación no es perfecta, indicando que hay más factores que influyen en la asociación entre ambas variables.
706050403020100
Emocional
40
30
20
10
0
Co
mu
nic
ació
n s
oci
al
Sq r lineal = 0,641
19
20
Coeficiente de correlación lineal, ‘r’
21
Numérica - Categórica
Mujer
Hombre
Sex
o
250200150100500
Puntuación test
153
247210267 139
Valores generalmente más bajos en hombres Menor dispersión en hombres
22
Tabla de contingencia Grupo * Lactancia breve
111 24 135
82,2% 17,8% 100,0%
117 11 128
91,4% 8,6% 100,0%
228 35 263
86,7% 13,3% 100,0%
Recuento
% de Grupo
Recuento
% de Grupo
Recuento
% de Grupo
No intervención
Intervención
Grupo
Total
más de dossemanas
hasta dossemanas
Lactancia breve
Total
Categórica - Categórica
hasta dos semanasmás de dos semanas
Lactancia breve
120
100
80
60
40
20
0
Rec
uen
to
11
117
24
111
Intervención
No intervenciónGrupo