Seminario 6

Post on 13-Apr-2017

88 views 0 download

Transcript of Seminario 6

SEMINARIO 6:

CRISTINA ROMERO FERNÁNDEZ

Cargamos conjunto de datos, “activossalud.RData”:

Obtener la distribución de frecuencias a partir de las dos variables cualitativas elegidas:

Variable «dulces»:

Variable «fruta»:

Atendiendo a los datos obtenidos en la distribución de frecuencias, se observa que solo un 6,9 % come dulces a diario y un 32,07 % consume fruta a diario. Por lo que, la población lleva una dieta pobre en dulces y comen más fruta con esta comparación, lo cual es bueno para la salud.

Aunque, se observa que una o dos veces en semana comen dulces el 30 % en comparación con el 23,10% de fruta, siendo la diferencia no es muy significativa. Pero, menos de una vez por semana consumen fruta un 11,03%, en relación con el consumo de dulces que es 31,72%.

Por lo que, el consumo de fruta es mayor que el de dulces.

Elección de las dos variables numéricas:

Variable «peso»:

Variable «horaprácticadeportiva»:

En cuanto a la variable peso, podemos observar que la media es 62,75, y la mediana 60, que corresponde al cuartil 2. Por lo que, sería una distribución más o menos simétrica al ser muy similares la media y mediana.

Por otra parte, se observa que la desviación típica es de 12,65 , siendo un poco grande, y por lo tanto los datos estarán más dispersos con respecto a la media.

Hay que decir que faltan 16 datos, pero no será de gran importancia, ya que «n» es grande.

En cuanto a la variable horas de práctica deportiva, la media es 2,48 y la mediana que corresponde con el 50%, es decir con el cuartil 2, es de 2. Por lo que, no hay mucha diferencia entre la media y mediana, siendo una distribución simétrica.

Observando la desviación típica, esta es pequeña, lo que indica que los datos están centrados en la media.

También, hay que decir que el 75% de la población practica 4 horas de deporte, tratándose de una población activa.

Selección de gráficos:

Como mis variables cualitativas elegidas tienen múltiples categorías y los diagramas de sectores no son útiles. Por ello, he elegido la variable «sexo». Se observa que en la muestra, la mayoría son mujeres.

He elegido la variable cualitativa consumo de dulces para representarla en el diagrama de barras. Aquí, podemos observar que la mayoría consumen una o dos veces dulces a la semana, pero diariamente se hace con menor frecuencia.

La variable cuantitativa elegida para representarla en el histograma ha sido «peso». Se puede observar que la puntuación mayor corresponde a la media que es 60. Además, podemos ver que sigue una distribución más o menos simétrica, como dijimos anteriormente al explicar esta variable, ya que coincidía con la mediana.

Para la representación en diagrama de caja, la variable cuantitativa elegida es «hora de práctica deportiva». Se puede observar que el valor máximo es 10 horas y el mínimo 0 horas, que corresponde al cuartil 1(25%). Además, la línea que corta la caja es la mediana y corresponde al valor 2 aproximadamente, representando al 50 % de la población (cuartil 2). Y, el 75% de la población dedica 4 horas a hacer deporte (cuartil 3). Esto, es una representación de lo anteriormente explicado.