2
Índice
1. Introducción
2. Objetivos: generales y específicos
3. Metodología
3.1. Población de estudio. Muestra
3.2. Variables a analizar
3.3. Análisis de datos
4. Resultados
5. Conclusión
3
1. Introducción
La estadística se puede dividir en estadística descriptiva que como su nombre indica,
describe y analiza los datos de un colectivo/muestra o una población, con el fin de
descubrir las regularidades o características existentes en sus elementos. La misma, se
clasifica en descriptiva univariable, que analiza la distribución de una característica o
dimensión en una población, y elabora una serie de medidas que resumen esa
distribución y en descriptiva bivariable que se ocupa de analizar la distribución
conjunta de dos variables en la población y la asociación entre las mismas. Por otro
lado, nos encontramos con la estadística inferencial cuya función es extrapolar las
características al conjunto del colectivo de dónde se extrae el subconjunto.
Sin embargo, algunos autores no distinguen entre las dos ramas y consideran que la
Estadística es la disciplina científica que se ocupa de recoger, ordenar y analizar los
datos de una muestra extraída de cierta población, y que, a partir de esa muestra,
valiéndose de cálculo de probabilidades, se encarga de hacer inferencias acerca de la
población. De este modo, las dos clasificaciones no serían más que dos niveles de la
disciplina: descripción y resumen de los datos, un paso previo para la operación
fundamental de la Estadistica, la inferencia.
2. Objetivos
- General: Utilizar la estadística descriptiva para exponer ordenadamente e
interpretar la información recogida sobre un conjunto de datos.
- Específicos:
Describir en tablas de frecuencia los datos de dos variables cualitativas-
factor del fichero “activossalud.RData” e interpretar al menos 3 aspectos en
relación a la distribución de las mismas.
Describir mediante resúmenes numéricos dos variables numéricas del
fichero “activossalud.RData” e interpretar la distribución de las mismas.
Realizar al menos un gráfico de cada tipo con variables adecuadamente
seleccionadas del fichero “activossalud.RData”, describir e interpretar la
distribución de los mismos.
3. Metodología
3.1. Población de estudio. Muestra.
4
El estudio realizado consta de 291 participantes, estudiantes de primero de
enfermería de la Universidad de Sevilla, centros propios y adscritros, para conocer
sus estilos de vida y activos en salud.
3.2. Variables a analizar.
Dentro de este estudio, tomamos dos variables cualitativas y otras dos
cuantitativas:
Variables cuantitativas
- Altura: variable cuantitativa, vector numérico medida en metros.
- Peso: variable cuantitativa, vector numérico medido en kilogramos.
Variables cualitativas
- Tabaco: variable cualitativa identificada mediante: 0-“a diario”, 1- “solo los
fines de semana”, 2- “2 o 3 veces a la semana”, 3- “2 o 3 veces al mes”, 4-
“Alguna vez anual”, 5- “Nunca”.
- Estudios padre: es una variable cualitativa, con 3 categorías: 1-“ninguno o
primarios”, 2-“bachiller”, 3-“universitarios”.
3.3. Análisis de datos
Para el desarrollo del informe hemos trabajado con el Sofware R versión 3.4.4
para Windows. Adentrándonos en este Sofware, mencionaremos que comenzó en
los años 90 (s. XX), inventado por dos profesores de la universidad Auckland
(Nueva Zelanda): Ross Ihaka y Robert Gentleman, quienes crearon un lenguaje de
programación con el objetivo de desarrollar un programa estadístico que fuese de
utilidad para el alumnado. En cuanto a sus características, R se desarrolla bajo la
licencia de GNU por el equipo central de Rfundation for Stadistical Computing y
es un software libre, que además es gratuito, esto significa que los usuarios tienen
la libertad de ejecutar, copiar, distribuir, estudiar, modificar y mejorar el software.
Por tanto, destacaremos que R es un software estadístico para el análisis de datos
considerados como uno de los más interesantes y utilizados en la investigación por
la comunidad estadística.
Dependiendo del tipo de variable, hemos utilizado una serie de estadísticos: las
variables cualitativas se resumen en tablas de frecuencias que incluyen la
frecuencia absoluta, relativa, relativa en porcentaje, absoluta acumulada y relativa
acumulada. Por otro lado, para las variables cuantitativas hemos optado por un
análisis de la media, desviación típica, moda, cuartiles, recorrido intercuartílico,
mediana y máximos y mínimos de las mismas.
5
Por último, las gráficas utilizadas son: gráfico de barras y de sectores para las
variables cualitativas y el gráfico de cajas e histograma para la representación de
las variables cuantitativas.
Análisis de las variables cualitativas.
- Tabla 1: variable cualitativa “tabaco”
TABACO Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
relativa %
Frecuencia
absoluta
acumulada
Frecuencia
relativa
acumulada
A diario 50 0.173 17.30 50 0.173
Sólo los
fines de
semana
21 0.0727 7.27 71 0.2457
2 o 3 veces
a la semana
20 0.0692 6.92 91 0.3149
2 o 3 veces
al mes
17 0.0588 5.88 108 0.3737
Alguna vez
anual
55 0.1903 19.03 163 0.564
Nunca 126 0.436 43.60 289 1
Total 289 1 100
- Tabla 2: variable cualitativa “estudios padre”.
ESTUDIOS
PADRE
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
relativa %
Frecuencia
absoluta
acumulada
Frecuencia
relativa
acumulada
Ninguno o
primarios
108 0.3816 38.16 108 0.3816
Bachiller 93 0.3286 32.86 201 0.7102
Universitarios 82 0.2898 28.98 283 1
Total 283 1 100
6
En ambas tablas hemos cuantificado y recogido los datos del documento
“activosalud.RData” y plasmamos los resultados pudiendo conocer así los estudiantes
de Enfermería de primer curso de la Universidad de Sevilla, centros propios y
adscritos que fuman a diario, los fines de semana, una o dos veces a la semana, una o
dos veces al mes o si no lo hacen nunca. De igual forma, conocemos qué numero de
padres (de los estudiantes) han cursado estudios primarios, bachillerato o
universitarios o no tienen estudios.
Debemos de tener en cuenta que en ambas recogidas de datos tenemos datos perdidos
o lo que se conoce en RCommander como datos ausentes. En la variable tabaco
contamos con dos, mientras que en la variable cuantitativa estudios padre son 8 los
estudiantes que no respondieron.
Análisis de las variables cuantitativas.
- Variable: altura
Gracias al programa RCommander hemos podido conocer rápidamente los
estadísticos descriptivos univariables de cada una de las variables,
centrándonos en este caso, en la altura hablaremos de:
La media de la altura de todas las personas participantes en el estudio fue
de 1.667 metros, teniendo un máximo de 2 metros (la persona más alta,
100%) y un mínimo (0%) de 1.46. También apreciamos que la desviación
típica (sd) es de 0.08078 y el recorrido intercuartílico (IRQ) de 0.12. De
esta misma forma contamos con los cuartiles: Q1 (25%) 1,6 y el Q3 (75%)
1,72; conociendo así el Q2 (50%) que coincide con la mediana, siendo de
1.655 metros.
Los datos recogidos fueron de 290 personas, contando con un dato ausente
o perdido, una persona que no conocía su altura y por tanto, no dejó
constancia de la misma.
Todo esto puede ser corroborado por la imagen adjunta.
7
- Variable: peso
El peso medio de las personas participantes fue de 62.75 kilos, teniendo un
máximo de 130 kilos y un mínimo de 38. Vemos que la desviación típica es
de 12.65 y el recorrido intercuartílico de 14. De la misma forma apreciamos
los cuartiles Q1 (25%) de 54, Q3 (75%) 68 y Q2 (50% o mediana) 60.
Los datos cuantificados corresponden a 275 personas, contando con un
número importante de datos perdidos (16).
Todo puede ser corroborado por la imagen adjunta.
Para acabar con el análisis de las variables, procedemos a su visión gráfica. Aclararemos
que para el estudio de las variables cualitativas se utilizan el gráfico de sectores o el
diagrama de barras, lo que ocurre, es que los primeros no son útiles cuando la variable
tiene múltiples categorías, como es en nuestro caso.
- Variable tabaco: tanto al observar la tabla presentada anteriormente como
al analizar el gráfico adjunto, vemos que la mayoría de nuestra población
no ha fumado nunca, y que los valores más bajos se encuentran en la
población que lo hace 2 o 3 veces a la semana, al mes o los que lo hacen
8
solo los fines de semana. Por otra parte, los resultados de las personas que
lo hacen a diario y aquellas que lo han hecho alguna vez tienen un valor
igualatorio.
- Variable estudios padre: tanto al observar la tabla como el gráfico de
sectores adjuntos vemos que no existe una diferencia significativa entre las
tres categorías.
- Variable altura: con esta representación gráfica podemos ver como la
mayoría de nuestra muestra se agrupa entre los valores de 1,55-1,70 metros.
9
- Variable peso: al igual que con la anterior variable, podemos ver como la
mayoría de las personas participantes en la encuesta se encuentran entre los
valores de 62-63 kilos.
10
4. Resultados
Una vez realizado el análisis de las variables elegidas, veremos los resultados
obtenidos:
- Tabaco: mi primer objetivo con esta variable era conocer qué número de
participantes de nuestra muestra fumaban a diario, teniendo un resultado de
50 personas. Siguiendo con mis objetivos, el segundo era identificar
cuántos lo hacían sólo los fines de semana, obteniendo un resultado de 21
personas. Por otro lado, también me percaté de cuántas personas lo hacía 2
o 3 veces a la semana (20) y cuántas 2 o 3 veces al mes (17). Por último, en
la frecuencia de alguna vez obtuve 55, sorprendiéndome del alto número de
personas que no habían fumado nunca (126).
El total de participantes en esta variable era de 289, con una ausencia de
datos de dos personas.
Para finalizar con el estudio de esta variable, quise comprobar cuál era la
relación existente entre el consumo de tabaco y el sexo, obteniendo que es
el sexo femenino quién tiene un mayor consumo del mismo. Debemos tener
en cuenta que eso no es totalmente fiable, puesto que si analizamos la
variable sexo, nos encontramos con que la mayoría de la población es
mujer. Cabe destacar también que hay un porcentaje muy alto de mujeres
que no han fumado nunca con respecto a las que sí lo hacen y que en ambas
poblaciones (mujer y hombre) el porcentaje de personas que no fuman
supera al resto.
11
- Estudios padre: en esta variable mi objetivo principal era identificar
cuántos de los padres de los alumnos habían cursado carreras universitarias
y cuántos no tenían estudios o solo la primaria. Obteniendo como resultado
que 108 de los padres no tenían estudios o tan solo tenían la educación
primaria y que eran 82 los padres que tenían carreras universitarias. Por
otro lado, estudié cuantos de los padres tenían bachillerato, como segundo
objetivo, teniendo un número de 93.
- Altura: mi objetivo principal al hacer el estudio de esta variable era hallar
la altura media en la muestra, analizando el máximo y el mínimo de la
misma para compararlo con los parámetros normales de la población.
Obteniendo como resultado que la media de la encuesta es de 1,66 metros,
con un máximo de 2 metros y un mínimo de 1,46.
- Peso: al igual que con la anterior variable, mi objetivo era hallar la media
del peso en la muestra, el máximo y mínimo y hacer una comparación con
los parámetros establecidos, para encontrar problemas de sobrepeso,
malnutrición y otros trastornos alimentarios. Como resultado obtuve una
media de 62,75 kilos, un máximo de 130 kilos y un mínimo de 38.
5. Conclusiones
Con respecto a la variable “tabaco” sacamos en conclusión que más de la mitad de
nuestra muestra no ha fumado nunca. El parámetro estadístico alguna vez y a diario, se
encuentran con valores igualatorios, encontrándose en un rango adecuado (50-55). Por
último destacaremos que los valores más bajos se encuentran en las personas que
fuman 2 o 3 veces a la semana, 2 o 3 veces al mes o sólo los fines de semana (17-21
personas).
En cuanto a la variable “estudios padres” sacamos en conclusión como destaqué
anteriormente, que no hay demasiada diferencia entre estas tres categorías,
mencionando que el máximo se encuentra en los padres que no tienen estudios o que
solo tienen primaria, y el mínimo en aquellos que tienen grados universitarios. Hay 26
personas de diferencia entre el mínimo y el máximo lo que reafirma mi conclusión.
Tratando ahora a las variables cuantitativas: la variable “altura” tiene una media que se
adecua a la población española, de un valor de 1,66 metros, no alejándose mucho de la
máxima (2 metros) y manteniendo una distancia considerable con la mínima (persona
que mide menos: 1,46 metros). Para terminar, la variable “peso” también tiene una
12
media que se adecua a la población, de un valor de 62.75 kilos. En este caso, cabe
destacar que se distancia mucho del peso máximo, teniendo este un valor de 130 kilos
y no tanto, aunque destacable, del mínimo, con un valor de 38. Con esto hacemos
mención a la importancia de los extremos pues son éstos quien influyen en la media
haciendo que esta sea menos realista, esto lo apreciamos porque la desviación típica
tiene un valor de 12,65 (también con este valor podemos decir que los datos son muy
dispersos).
13
14
Top Related