Guia Estadistica Descriptiva 2013 II (1)
-
Upload
anne-horton -
Category
Documents
-
view
148 -
download
1
description
Transcript of Guia Estadistica Descriptiva 2013 II (1)
Escuela de Ciencia Básicas, Tecnología e Ingeniería
UNIDAD DE CIENCIAS BÁSICAS
GUÍA DE ACTIVIDADES
Curso Académico: ESTADISTICA DESCRIPTIVA MODALIDAD ST Créditos: 02 Clase de curso: Básico Habilitable: SI Tutor: MIREYA GOMEZ ARGOTE. Correo Electrónico: [email protected] Skype: mireya.gomez.argote Celular: 311 544 95 68
JUSTIFICACIÓN
Esta primera parte de la estadística, aborda las técnicas de recolección, presentación y análisis de información, las cuales son vitales para apoyar la toma de decisiones, con el fin de resolver innumerables problemas en las diferentes áreas del conocimiento y específicamente en el área de la salud. Además, es paso obligado para lograr introducirnos en técnicas y procedimientos que se abordarán más adelante en el proceso investigativo.
Esta asignatura es el pilar de otras de esta línea como son: Probabilidades, muestreo e inferencia, estadística no paramétrica entre otras, además, de proveer herramientas para abordar satisfactoriamente el tratamiento de datos de otras áreas del conocimiento, posibilitando adquirir destrezas en la construcción de indicadores.
Adelante, pues en tú aprendizaje.
OBJETIVO GENERAL
1. Presentar y describir adecuadamente la información que se obtiene en las Organizaciones, utilizando formas de presentación funcionales e indicadores de resumen apropiado y acorde con el tipo de variables objeto de estudio.
OBJETIVOS ESPECÍFICOS
Nuevos Conocimientos
1. Reconocer la disciplina Estadística como una herramienta fundamental en el manejo de datos.
2. Distinguir la naturaleza de las variables en cualquier estudio y su asociado nivel de medición para efectos de la elección de las medidas más representativas de un conjunto de datos.
3. Aplicar procedimientos de exploración de datos con el fin de garantizar la calidad de los mismos.
4. Utilizar formas apropiadas para la presentación de una información de acuerdo al tipo de variable y a las expectativas definidas en los objetivos de una investigación.
5. Seleccionar adecuadamente las medidas resumen de la estadísticas para la descripción e interpretación de una información.
6. Presentar diferentes métodos de reglas de conteo, con el fin de introducirlos a los temas atinentes a las probabilidades.
Dominio de Herramientas
1. Adquirir destrezas en el manejo de paquetes estadísticos y/o hojas de cálculo en las temáticas definidas anteriormente. (Excel, Epiinfo y SPSS).
2. Promover la lectura y escritura, a través de textos y ensayos realizados por los estudiantes.
3. Mejorar la comunicación mediante la generación de una adecuada participación de los estudiantes.
Valores o actitudes
1. Promover el respeto por los demás, impulsando los debates y las discusiones de temas específicos.
2. Mejorar la solidaridad y la honestidad, impulsando los trabajos grupales y la autoevaluación.
METODOLOGÍA
Es de vital importancia en el proceso de aprendizaje, la participación activa de los estudiantes, para ello, se recomienda que lean lo que se ha denominado lecturas previas y/o complementarias, dado que esas lecturas u otras serán la base de discusión para apropiarse del conocimiento. Con estos insumos, es fundamental escribir ensayos sobre las temáticas abordadas.
Se tendrán sesiones presenciales y algunas no presenciales, en las presenciales, se tendrá una dinámica más de asesoría grupal, dejando la conferencia magistral sólo para aquellos temas que tengan un grado de dificultad alto. En las no
presenciales, se utilizarán herramientas tecnológicas y recursos como el foro y el chat.
La comunicación con los demás actores del proceso es fundamental, por eso es vital que se mantenga una permanente comunicación con el tutor y los compañeros, para ello, debe tener una activa participación en los chats y foros programados para tal fin.
La parte evaluativa, tendrá actividades individuales y de equipo, procurando incentivar la construcción de conocimiento en lugar de favorecer la memoria, por lo tanto, se plantea un ejercicio práctico de temas afines a las preferencias de los matriculados en el curso, logrando así aplicar los conocimientos adquiridos. También, se ponderará la participación de los estudiantes por la red de las diferentes actividades programadas, tanto en número como en pertinencia de la temática abordada.
El compromiso para avanzar en el conocimiento es de todos, ánimo y a leer, escribir y producir!
CONTENIDO DETALLADO DEL CURSO
CM Conferencia magistral LP Lectura previa
SC Sala de cómputo DG Discusión en grupo
Fecha Tema Metodología
Agosto
Capítulo I
Definiciones
básicas: Población,
muestra, muestreo,
parámetros,
variables, etc.
Pasos de una
investigación
estadística.
Clasificación de las
variables, niveles
de medición. Taller
No. 1 y 2, valor
25%.
CM-LP-DG
http://es.wikipedia.org/wiki/Constructivismo_(pedagog%C3%ADa)
http://www.aulafacil.com/CursoEstadistica/Lecc-1-est.htm
http://www.monografias.com/trabajos10/planific/planific.shtml
Septiem
bre
Capítulo II
Presentación de
información.
Distribución de
frecuencias para
datos cualitativos y
cuantitativos.
Frecuencias para
datos agrupados.
CM-LP-DG-SC-PR
http://www.universidadabierta.edu.mx/SerEst/MAP/METODOS%20CUANTITA
TIVOS/Pye/tema_11.htm
Introducción Excel
Primera prueba
valor 15%.
Septiembre
Gráficos: Barras,
pastel,
histogramas,
polígonos, ojivas.
Gráficos
compuestos,
pirámides, de
líneas, de
dispersión, etc.
Tallo y hojas, caja
y sesgo.
Gráficos Excel.
Taller Practico
Laboratorio, valor
15%.
LP- CM- DG-SC
http://html.rincondelvago.com/graficos-estadisticos.html
Capítulo
III.Medidas
Descriptivas.
Computador:
Análisis
exploratorio de
datos, Paquetes
estadísticos SPSS
y Excel.
Taller medidas
descriptivas de
posición. Taller
No. 3, valor 25%.
LP- CM- DG-SC
http://metodosestadisticos.unizar.es/asignaturas/16603/Tema3.pdf
Link descarga Software SPSS : http://www.spssfree.com/spss/instalar1.html
Octubre
Continuación
medidas resumen
(medidas de
variabilidad).
Taller. Entrega
producto final.
Computador:
Paquetes
estadísticos SPSS,
y Excel. Manejo de
calculadora
Segunda prueba
valor 15%.
LP- CM- DG-SC-PR
http://masmatematicas.com/estadisticas/mvar.html
Link descarga Software SPSS : http://www.spssfree.com/spss/instalar1.html
PR Prueba evaluable.
EVALUACIÓN
Se plantean las siguientes actividades donde el estudiante desarrolla de manera individual y grupal, de la siguiente manera.
Aspecto Criterios Instrumento Porcentaje
Apropiación de conceptos
Dominio de los conceptos teóricos y prácticos
3 pruebas, aplicando los conceptos teóricos y prácticos apropiados en las diferentes lecturas y en la información entregada por el docente.
15 % cada una.
Total 45%
Reforzamiento de conceptos realizando estudios de caso y/o aplicaciones con datos obtenidos por los aprehendientes.
Pertinencia en la selección de la temática a desarrollar, selección de procedimientos adecuados, claridad en la argumentación y sustentación de los informes. Presentación del informe con normas estipuladas en el grupo.
1 trabajo en parejas con sustentación individual, que abarque la totalidad de los temas de la estadística descriptiva.
Para obtener mayores logros, se realizará en tres entregas con un valor del 8.3 cada una.
25 %
Participación y aportes individuales y grupales.
Numero de participaciones en las actividades
Observación, conteo de participaciones y pertinencia de las mismas
10%
Técnicas de
recolección de
datos:
Generalidades. El
cuestionario.
Usando SPSS.
Tercera prueba
valor 15%.
LP- CM- DG-SC-PR
Link descarga Software SPSS : http://www.spssfree.com/spss/instalar1.html
noviemb
re
Números Índices
simples y
compuestos
LP- CM- DG-SC-PR
noviemb
re Parcial Final PR
programadas y su pertinencia. Número de definiciones aportadas en la construcción de un glosario y su validez.
por parte del docente, sustentación que haga de sus propuestas y aportes.
Conceptos y habilidades en el manejo de herramientas de cómputo.
Dominio de conocimientos teóricos y prácticos.
Prueba evaluativa de todo el tema visto con las lecturas complementarias.
20%
Total 100%
Bibliografía
Bello, León Darío. Estadística como apoyo a la Investigación. Editorial L.Vieco e Hijas Ltda, abril de 2005.
Grisales Romero Hugo. Estadística Aplicada en Salud Pública: Estadística Descriptiva y Probabilidad. Editorial L-Vieco e Hijas. 2002.
http://guajiros.udea.edu.co/descriptiva/presentacion.htm Daniel, Wayne W. Bioestadística: Base para el análisis de las ciencias de la
salud. Noriega editores. Editorial Limusa. Tercera edición. México. 1998 Marques de Cantú, María José. Probabilidades y Estadística. Para Ciencias
Químico-Biológicas. Editorial McGraw-Hill 1991 Milton, J. Susan, Estadística para la Biología y Ciencias de la Salud.
Editorial McGraw-Hill. Tercera Edición España 2001
Todos los documentos encontrados en la RED.
LECTURAS Y LECCIONES COMPLEMENTARIAS UNIDADES TEMATICAS
UNIDAD I – ETAPA RECONOCIMIENTO
La efectividad del método de muestreo y por ende la validez de los resultados depende en grado
sumo de la imaginación del investigador.
LEÓN DARÍO BELLO PARIAS
Objetivos
Apropiarse de la terminología usada en el área estadística, con el fin de impulsar la
adquisición de cultura estadística por parte de los participantes.
Identificar maneras adecuadas para la presentación de información y adquirir las destrezas
para construir tablas y gráficos estadísticos.
Escalas de Medición
Objetivos
Tener claro los conceptos sobre las diferentes escalas de medición
Identificar la diferencia entre ellas
Reconocer con ejemplos las escalas de medición
Teniendo en cuenta los tipos de variables, identificar sus niveles de medición
Actividad 1
Ubique un instrumento de recolección de datos, puede ser una encuesta y/o un formato que contenga variables cualitativas y cuantitativas, clasifique las variables según las escalas de medición.
Actividad 2
Seleccione una opción según sus conocimientos del tema
Las variables se clasifican en cualitativas y cuantitativas
Verdadero Falso
Las variables cualitativas también se conocen como atributos
Verdadero Falso
El estrato es una variable cuantitativa
Verdadero Falso
Conceptos
Escala Nominal: Aplica para las variables cualitativas o categóricas que no tienen un orden predeterminado, generalmente son las variables de identificación, valga decir, profesión, estado civil, sexo, tipo de institución, procedencia, tipo de crédito, ocupación, etc. La escala nominal es la forma más débil de medición, debido a que se puede calcular un menor número de estimadores que al usar las otras. Como indicadores se utilizan las frecuencias (número de veces que se presenta la variable), porcentajes, tasas y razones, como gráficos, se usa el circular y el de barras preferentemente.
Medida Ordinal: la variable tiene un orden preestablecido, sin embargo, no permite cálculos matemáticos con sentido, es decir, no tiene sentido sumar, restar o cualquier otra manipulación matemática, por ejemplo, estrato, nivel de escolaridad, grado de quemadura, nivel de alcohol, grado de sordera, nivel de estrés, etc.
Preguntas de afianzamiento
Seleccione la opción adecuada según el enunciado.
El lugar de procedencia es una variable con escala de medición ordinal
Verdadero Falso
El nivel de sordera se puede considerar como una variable ordinal
Verdadero Falso
Nivel de Escala: Son variables cuantitativas, bien sean discretas o continuas, por lo tanto, se pueden realizar operaciones matemáticas.
La razón de considerar las variables cuantitativas en una sola categoría es que con ellas se pueden realizar operaciones matemáticas, teniendo en cuenta, eso sí, que existe una diferencia en la redacción, cuando se utilizan escalas definidas por el investigador, valga decir, realice un análisis estadístico para los resultados encontrados a los estudiantes que terminan su etapa de secundaria. En este caso, nadie puede decir que una persona sabe cero de una asignatura, por lo tanto, hay que definir que indicadores son adecuados, por el contrario si se analiza la variable ingresos, el cero equivale a decir que no tiene ingresos y eso es posible, luego se podrán calcular todos los indicadores posibles, si fuese necesario.
Pregunta de Selección Múltiple
Señale las variables cualitativas de la siguiente lista:
Edad
Estrato
Cedula
Estado civil
Estatura
Número de minutos realizados en un celular
A las variables de razón se les puede calcular:
Desviación típica
Mediana
Promedio
Evaluación No. 1
Pregunta Verdadero-Falso
Señale si está de acuerdo o no con los enunciados siguientes:
Las variables sexo, edad y el valor de un medicamento son cuantitativos
Verdadero Falso
La profesión es una variable ordinal
Verdadero Falso
Las variables de percepción como calificar atributos de un producto de 1 a 5 se considera
ordinal
Verdadero Falso
A las variables cuantitativas se les puede calcular todos los indicadores estadísticos, tales
como el promedio, desviación, mediana y moda.
Verdadero Falso
Trabajo de estadística descriptiva
Redacte un cuestionario de mínimo 10 preguntas, 4 cuantitativas (dos discretas y dos continuas) y 6 cualitativas (unas dicotómicas y otras de respuesta múltiple). Para cumplir con el taller, envié un archivo en WORD con el nombre de uno de los componentes del equipo, éste debe tener:
Portada Introducción (decir de qué tema van a hablar y cuál es el objetivo del estudio). Hacer un cuadro con las siguientes columnas: Nombre Variable, Tipo de variable (cuanti o cuali), naturaleza de la V. (discreta o continua), escala de medición, definición conceptual de la variable (que quiere decir, leer sobre el tema). Lo anterior, lo entregan en la próxima tutoría. Valor 10%.
UNIDAD I – ETAPA DE PROFUNDIZACION
Ningún hombre sabe lo que es capaz hasta que lo intenta.
CHARLES DIKENS
Objetivo
Interpretar las medidas de posición y calcularlas con apoyo de software estadístico.
Identificar las medidas de posición y reconocer en qué casos se utilizan.
TALLER DE ESTADÍSTICA
1. La siguiente tabla muestra las ventas, en millones de pesos, de 20 compañías farmacéuticas del país.
40,2 29,3 35,6 88,2 42,9
26,9 28,7 99,8 35,6 37,8
44,2 32,3 55,2 50,6 25,4
31,7 36,8 45,2 25,1 39,7
Para cada una de las filas seleccione el valor correspondiente al parámetro y justifique su respuesta realizando los procedimientos.
Numeral Parámetro a b c d
1 Media 49 46,085 42,56 40,56
2 Mediana 37,3 38,75 39,95 36,50
3 Moda 36,6 99,8 99,8 35,6
4 Desviación estándar 19,4608487 22,9963904 24,7082982 21,6164995
5 Varianza de la muestra 378,724632 528,833974 610,5 467,273053
6 Rango 74,7 74,7 74,7 89,8
7 Mínimo 25,1 25,1 25,1 10
8 Máximo 99,8 99,8 99,8 99,8
2. ¿Qué medidas de tendencia central utilizaría para describir los datos y por qué?
3. Responda verdadero o falso a las siguientes afirmaciones, justifique su respuesta.
a) Al hacer una gráfica, casi siempre la variable a estudiar va en el eje de las abcisas (eje horizontal) y las frecuencias en la ordenada (eje vertical).
b) El polígono de frecuencias se utiliza para representar variables continuas.
c) El número de accidentes según sus causas, es una variable discreta por lo tanto el gráfico más indicado es el pictograma.
4. Calcule la mediana para los siguientes datos:
46, 52, 23, 28, 32, 25, 23, 51
21, 22, 23, 25, 23, 24, 23
EJERCICIOS ESTADÍSTICA DESCRIPTIVA
1. A) Cite tres ejemplos de variables cualitativas y tres de variables cuantitativas.
B) Cuál es la diferencia entre variables discretas y continuas. Dé tres ejemplos de cada una de ellas.
C) Que escala(s) de medición le corresponde a las variables cualitativas y cual a las cuantitativas.
D) En la solicitud de ingreso a la Universidad, le toman la siguiente información:
Nombre edad estatura sexo estrato
estado civil Nº hijos Nº de hermanos tipo de sangre ingresos
Clasifique las variables anteriores, según su naturaleza, el tipo de dato y su escala de medición.
2. Una muestra aleatoria de los pesos de niños, dado en libras presenta los siguientes resultados.
29.9 27.0 27.0 20.0 23.2 29.9 25.3 23.2 25.3 20.0 22.5 25.3 20.1 22.5 22.5 28.2 22.5 28.2 27.0 29.9 20.0 25.7 24.0 20.1 20.0 23.2 29.9 22.5 28.2 28.2 20.0 25.7 24.0 20.1 20.0 23.2 29.9 22.5 28.2 28.2
a). Construya la distribución de frecuencia simple.
b). Al menos cuantos niños tiene un peso de 24.lbs.
c). Qué porcentaje de niños tienen un peso de 27 lbs.
d). Cuál es el promedio del peso de los niños
f) Entre que valores se encuentra el 25%, 75% y el 90% (use percentiles).
g). Encuentre la varianza, la Desviación estándar y el coeficiente de variabilidad e interprételos.
h). Agrupe en seis intervalos y calcule las medidas de posición.
3. Los siguientes datos representan el número de días perdidos por ausencia de trabajadores por incapacidad médica durante el primer semestre del año 2002 en la Empresa Calima.
Nº Trabajador
Días Nº Trabajador
Días Nº Trabajador
Días
1 2 11 5 21 4
2 4 12 6 22 8
3 4 13 7 23 5
4 5 14 8 24 1
5 2 15 3 25 4
6 25 16 4 26 8
7 8 17 5 27 5
8 6 18 4 28 5
9 10 19 1 29 1
10 2 20 3 30 4
a) Construya la distribución de frecuencia simple.
b) Cuantos trabajadores faltaron más de 4 días.
c) Cuál es el número de incapacidad que más se presenta y que nombre toma.
d) Al menos que porcentaje de trabajadores estuvieron incapacitados durante 3 días.
e) Que porcentaje de trabajadores estuvieron incapacitados entre cinco y 10 días.
f) Por políticas de la Empresa, los trabajadores que se incapaciten durante más de 15 días, pierden una bonificación definida para estimular los trabajadores con pocos días de incapacidad. Qué porcentaje de ellos pierden la bonificación?
g) Cuál es el gráfico adecuado para presentar la distribución anterior?. Cuál si se tienen los datos agrupados por intervalos?.
h) Calcule las medidas de posición e interprételas.
i) Calcule las medidas de variabilidad e interprételas.
4. Los siguientes datos corresponden al número de camas disponibles en un hospital por día.
67 75 63 62 65 65 65 62 75 72 61 61 61 65 75 69 70 65 61 72 65 60 70 69 61 78 62 67 65 60
a). Elabore la tabla de frecuencia.
b). El gerente decide colocar solamente 68 camas disponibles por día. Cuál será el porcentaje en que no se pueda satisfacer la demanda.
c). Interprete un valor de cada columna.
d). Está de acuerdo con la decisión del gerente. Por qué?
f). Construya el gráfico adecuado
5. Los aspirantes a ocupar la dirección en el hospital San Juan de Mitú requieren tener como mínimo 270 puntos en las pruebas exigidas para tal cargo. La información obtenida se presenta a continuación.
250 260 278 356 209 265 250 230 240 245 260 250 211 270 280 215 286 312 287 324 321 212 294 275 200 188 314 250 260 198 275 210 256 235 287 298 265 250 230 240 245 285 291 287 265
a) Cuantas personas no pueden aspirar al cargo
b) Que porcentaje de aspirantes sacaron menos de 213 y más de 300.
c) Calcule las medidas resumen adecuadas.
d) Agrupe en cinco intervalos y recalcule las medidas descriptivas. Que conclusiones puede sacar.
6. Los siguientes datos se obtuvieron de una investigación realizada por estudiantes de la especialización en Educación Física en la U de A (1999). Se realizaron algunos cambios para efectos prácticos. Con dichos resultados:
a) Diga cuál es la escala de medición y el gráfico más adecuado para las variables en estudio. Teniendo en cuenta que para la variable sexo se quiere la importancia
relativa de las categorías. Además, se quiere comparar la variable resistencia según sexo (1= hombre, 2= mujer). Cómo lo haría?
b) Puede afirmar que la variable peso tiene un comportamiento en forma de campana? Por qué?. Que porcentaje de los datos se encuentra a una desviación típica.
c) Cuál de las variables: peso, estatura y resistencia presenta mayor homogeneidad?. Se pueden comparar? Por qué?
d) Se descubrió que la báscula utilizada para medir el peso dejaba de anotar 0.5 kilogramos, cuáles son las nuevas medidas?
e) Se quieren los resultados en libras para efectos de análisis, recalcule usando propiedades el promedio y la desviación típica.
SEXO ESTATURA PESO SALTO LARGO RESISTENCIA 1 163,7 56,1 2,14 9,56 1 164,5 56,7 1,84 8,05 1 167,6 60,1 2,01 8,14 1 160,2 48,8 1,85 8,14 1 178 64,8 2,17 8,57 1 170 59,1 2,05 13,05 1 174,7 63,5 2,13 13,05 2 177 64,6 2,08 8,17 2 165,1 65,4 1,71 13,05 2 168,4 47,8 1,71 13,05 2 165,3 53 2,06 7,4 2 168,6 69,9 2 13,05 2 171,5 54,5 2,03 13,05 2 171 54,7 1,8 13,05 2 166,3 64 1,44 10,4
7. El número de pacientes que llegaron por urgencias a cuatro I.P.S se muestra a continuación.
DÍA I.PS 1 I.PS 2 I.P.S 3 I.P.S 4 1 20 15 10 8 2 15 15 12 8 3 16 13 10 8 4 14 12 8 8 5 15 13 10 8 6 18 15 12 8
a) Si le pidiesen un informe gráfico de los datos anteriores, Cuál presentaría Usted?. Por qué?
b) Además, se quiere presentar un gráfico que muestre la participación relativa de cada entidad con respecto al total de la demanda.
8. Responda las siguientes preguntas:
a) Cuando se utiliza el histograma y cuando el de barras verticales?
b) Para que se utiliza el gráfico de Pareto, construya un ejemplo que se acomode a una característica relacionada con la Salud.
c) Investigue sobre los gráficos de áreas y Pictogramas.
d) En que consiste un diagrama de tallo y hojas, dé un ejemplo.
e) Para que se utiliza el diagrama de Caja y Bigotes.
10. Las siguientes distribuciones muestran el número de defunciones reportadas en tres secciónales departamentales. Se le solicita identificar en cual de ellas se presenta mayor homogeneidad y cual es más heterogénea?.
Xi Frec. Xi Frec. Xi Frec. 10 5 20 10 100 12 12 6 21 12 200 10 14 7 22 14 220 12 16 8 23 15 230 10 18 7 24 14 250 12 20 6 25 10
Trabajo de estadística descriptiva
Para cumplir con el taller, envié un archivo en WORD con el nombre de uno de los componentes del equipo, éste debe tener: Portada Introducción Desarrollo Conclusiones Lo anterior, lo entregan en la próxima tutoría. Valor 25%.
UNIDAD I – ETAPA DE PROFUNDIZACION
Obrar es fácil, pensar es difícil, pero obrar según se piensa es aún más difícil GOETHE
Objetivo
Interpretar las medidas de variación y calcularlas con apoyo de softwareestadístico.
Identificar las medidas de variación y reconocer en que casos se utilizan.
Introducción Medidas de Variación.
En todos los casos se va a necesitar más información que la obtenida con las medidas de
posición. Debido a esto se necesita encontrar las medidas de variación, las cuales sirven
para medir el grado en que los datos de una muestra o población tienden a concentrase o
alejarse alrededor de un valor central. También son útiles para comparar la variabilidad
de varias muestras o poblaciones.
El despreciar la existencia de la variación, puede conducir a decisiones incorrectas, es
más, entregar el sólo promedio aritmético estariamos en muchos casos desinformando en
lugar de informar. De ahí, la importancia de apropiarnos de los conceptos de medidas
como: La desviación típica, el rango, el rango intercuartilico, el coeficiente de variación
entre otras.
Adelante, pués, a completar el estudio de las medidas descriptivas, las cuales serán
siempre las primeras a utilizar en cualquier tipo de investigación de corte cuantitativo.
Taller: conceptos básicos.
Ejercicios:
Señale dentro de las siguientes proposiciones, cuáles son verdaderas y cuáles son
falsas. Justifique las respuestas de las falsas.
a. Cuando hablamos de la estadística nos referimos a los métodos de recolección,
organización, clasificación, presentación y análisis de datos.
b. Las mediciones hechas sobre variables cuantitativas conllevan información sobre
los atributos.
c. La estadística inferencial se basa en la estadística descriptiva.
d. La estadística no nos permite hacer inferencias.
e. Si en un población se estudia la característica edad y la procedencia de los
individuos, esta población es de carácter univariante.
f. Un parámetro es una medida que resume el comportamiento de los individuos
de la muestra.
g. El término univariante se refiere al estudio de una sola muestra.
h. Las mediciones hechas sobre variables cuantitativas conllevan información
respecto a la cantidad.
i. Las características sexo, ingreso, etnia, son datos ordinales.
j. La temperatura en grados centígrados es un ejemplo de una escala de
proporción.
k. Una escala que mide el nivel de satisfacción de un grupo de personas
manifestada como: excelente, bueno, regular, malo es una escala de nominal.
2. Coloque en el paréntesis del lado izquierdo la respectiva letra según como se
relacionen las frases o conceptos del lado derecho.
Estadístico ( ) a. Se estudian varias características.
Parámetro ( ) b. Asume cualquier valor en un intervalo
Multivariante ( ) c. Tiene cero absoluto
Escala nominal ( ) d. Medida basada en la población
Cualitativa ( ) e. conllevan información sobre los atributos
Escala de proporción ( ) f. Medida basada en la muestra
Variable continua ( ) g. El rasgo estudiado solo puede agruparse en clases de
naturaleza cualitativa.
3. Enumere 4 ejemplos para cada uno de los siguientes casos: variable discreta,
variable continua, escala de medición nominal, escala de medición ordinal,
escala de razon o proporción.
UNIDAD I – ETAPA DE PROFUNDIZACION
Proceso Investigativo
Conocimientos previos
Lea con detenimiento, le sugiero leer el capítulo 2 del ebook "Estadística como apoyo a la
investigación-primera parte-"antes de contestar. Seleccione una de las dos opciones.
Una investigación se inicia cuando se detecta o percibe un problema
Verdadero Falso
Luego de tener claro la idea de nuestra investigación, se debe empezar a definir los
objetivos de la misma
Verdadero Falso
Objetivo del OA
Disponer de una guía sencilla y práctica para abordar una investigación científica. Orientar en el desarrollo de un estudio de corte cuantitativo principalmente
Presentar el aporte de la estadística en los pasos sugeridos para llevar a cabo una investigación.
Etapas sugeridas en una investigación cuantitativa
Conceptual. Su nombre es claro, se debe colocar los argumentos y justificación que nos llevan a sustentar el porqué llevar a cabo el trabajo y sustentarlo conceptualmente. Se aborda el tema de las teorías a trabajar y el mostrar que se tiene conocimiento de la actualidad del tema, revisando la bibliografia actualizada sobre el particular, con el fin de desarrollar el marco teórico. Es la base conceptual del estudio. Es la parte donde la estadística aporta
menos, sin embargo, el que haga las veces de analista de datos, deberá esta al tanto de esta parte y sugerir que posibles procedimientos estadísticos se pueden aplicar, además, de organizar las preguntas de investigación que surgan para avanzar en la futura elaboración de cuestionarios e instrumentos de recolección de datos.
Diseño y planeación. Acá es donde se juega gran parte de la calidad del trabajo, y por lo tanto, su credibilidad, el aporte de los expertos en metodología de investigación es fundamental en esta etapa de la investigación. Se requiere definir el tipo de estudio (exploratorio, descriptivo o analítico). Además, se requiere identificar la población objetivo, especificar los métodos para medir las variables de investigación, diseñar el plan de muestreo.
El aporte de la estadística es clave en esta etapa de la investigación, el sólo aporte en la definición del procedimiento de recolección de datos, es decir, la definición del diseño de muestreo es un aporte importantisimo en el buen desarrollo del estudio.
El ebook "Estadística como apoyo a la investigación-segunda parte-", "Muestreo en estudios descriptivos e inferencia estadística paramétrica", presenta los diferentes procedimientos estadísticos de muestreo con ejemplos prácticos y usando el software gratuito Epidat. Para tener más información visite el sitiohttp://www.leondariobello.com
Empírica. De nuevo la estadística aporta sustancialmente en el desarrollo de la captura de datos en campo. Ilustra sobre como se preparan loss datos para el análisis. Se debe tener en cuenta en primer lugar, el análisis exploratorio de datos, esta acción es ineludible y siempre se debe realizar independiente del tipo de investigación que aborde. No se le olvide primero "Análisis Exploratorio de Datos". En el ebook guía se aborda el tema adecuadamente (visite el sitio http://ciemonline.info/blog )
Analítica. La parte clave en este punto es analizar e interpretar los resultados encontrados con los procedimientos adecuados según los objetivos del estudio, por lo tanto, el aporte del estadístico y de los conocedores del tema objeto de estudio es necesario para lograr generar conocimiento y llevar a cabo recomendaciones viables y útiles que al fin de cuentas debe ser un producto inexcusable en cualquier investigación científica.
Luego viene la difusión de los hallazgos, si no se comunica lo que se hace, de verdad, no se hizo nada, bueno o casi nada. Con la difusión se promueve la construcción de conocimiento y se aporta a una comunidad avida de conocimiento productivo y útil.
Tipos de muestreo
Existen diversas técnicas de muestreo, tales como:
NO PROBABILISTICOS PROBABILISTICOS
Conveniencia Aleatorio Simple
Por Juicio u Opinión. Estratificado
Cuotas o Prorrateo. Conglomerados
Con Fines Especiales. Sistemático en Fases.
Bola de Nieve Conglomerados Monoetápico
Conglomerados Bietapico
Conglomerados Bietapico Estratificado
No se puede decir apriori cual es el mejor, todo dependerá del objetivo de la investigación.
Tamaño de muestra
La pregunta más común y más trivialmente contestada es: “Cuántos elementos debo seleccionar?”, la respuesta usual es 384, contestada como ya se dijo en muchos casos de manera mecánica. Lo anterior, originada por paradigmas consolidados y que consideran que la muestra se requiere para analizar variables dicotómicas, donde la probabilidad de éxito y la de fracaso son iguales (p=q=0.5), además, se sugiere casi indistintamente de los objetivos del estudio una confiabilidad del 95%, que si bien es buena, no siempre tiene que ser así. Por último, es usual que los no estadísticos consideren que el error de estimación es complementario a la confiabilidad y por ende lo
asumen como e= 5%. Con estos valores y como se verá más adelante, la muestra sugerida es de 384. Lo que se pretende con esta disertación, es llamar la atención sobre éste particular. Pensando que el objetivo de la investigación será lo que prime para determinar el tamaño de muestra.
Los casos más usuales se dan para trabajos donde la distribución Binomial es la que interesa y por ende se requiere estimar la proporción de éxitos y cuando lo determinante es una variable cuantitativa y el interés es estimar un promedio. Para ambos casos, se presenta los requerimientos previos
Proporciones
Promedios
Definir la confiabilidad del estudio Definir la confiabilidad del estudio
Definir el error admisible (que tanto se acepta desviarnos del parámetro real). Se da en porcentaje.
Definir el error admisible (que tanto se acepta desviarnos del parámetro real). Se da en valor absoluto.
Estimar la proporción de éxitos (P). Estimar la desviación de la variable clave (Sx).
Para el caso de poblaciones finitas, se requiere conocer N (tamaño de la población)
Actividad de cierre
Presumiendo que lo expresado anteriormente fue lo suficientemente claro para que
avance en la manera de abordar un trabajo de investigación, lo invito a que conteste los
siguientes interrogantes.
Preguntas de cierre
Decir si cada una de las siguientes afirmaciones es verdadera o falsa.
Lo primero que se debe abordar en un documento de informe de investigación, es la
metodología o diseño de la misma.
Verdadero Falso
La siguiente frase es correcta: "El análisis exploratorio de datos es lo primero que se debe
realizar luego de tener la base de datos."
Verdadero Falso
¿Realmente son útiles las frecuencias simples en un análisis de una investigación
medianamente útil?
Verdadero Falso
El error admisible es complementario a la confiabilidad del estudio.
Verdadero Falso
Mientras más grande es el n, mejor es el resultado del estudio
Verdadero Falso
UNIDAD I – ETAPA DE PROFUNDIZACION
Frecuencias simples
Objetivos
Presentar información de manera adecuada y entendible para apoyar la toma de decisiones.
Sintetizar datos en forma de tablas
Interpretar las diferentes frecuencias y colocarlas en términos entendibles. Diferenciar las tablas simples para variables cualitativas y cuantitativas.
Actividad
Tome información a 12 compañeros del grupo de estudio, sobre la zona de procedencia y el tiempo que tardan en llegar a la universidad, en minutos. Para efectos de desarrollar éste objeto de aprendizaje se suponen los siguientes datos.
Procedencia Tiempo de llegada
Sur 40
Sur 30
Sur 30
Norte 15
Norte 40
Oeste 20
Sur 15
Oeste 25
Norte 20
Sur 25
Oeste 25
Norte 20
Tablas variables cualitativas
Coloque las categorias de las variables en la columna 1,en la columna 2 coloque el número de veces que se repite la variable, y en la 3, el porcentaje correspondiente, así:
Procedencia (columna 1) Número de personas
(columna 2)
Porcentaje (columna 3)
Sur 5 41,66
Norte 4 33.34
Oeste 3 25,00
Total 12 100,00
Se observa que 5 personas pertenecen o provienen de la zona sur, lo que equivale al 41,66%, siendo el sector que más aporta al grupo seleccionado. además, se encontró que una cuarta parte de las personas encuestadas provienen de la zona oeste. Tenga en cuenta que para las variables cualitativas no es pertinente construir las frecuencias acumuladas. Para el caso anterior, la columna 2, toma el nombre de frecuencia absoluta y la 3, la de frecuencia relativa, sin embargo, para entregar un informe es recomendable colocar encabezados afines al tema que se trate.
Preguntas de refuerzo
Seleccione la opción adecuada según el enunciado.
Es valido afirmar que el 75% de las personas encuestadas provienen del norte o menos.
Verdadero Falso
El porcentaje se calcula dividiendo el número de veces que está la variable sobre el total de datos.
Verdadero Falso
Tablas variables cuantitativas
En este caso, se coloca en la primera columna la variable ordenada de menor a mayor, en la segunda, tal como se hizo en el caso de la variable cualitativa, se presenta el número de personas
que se demoran lo mismo para llegar a la universidad. En la tercera, se van sumando los valores ya encontrados en la columna anterior con el fin de determinar cuantas personas tardan en llegar un determinado tiempo o menos, útil para tomar decisiones. La columna 4, entrega los resultados ya analizados en la columna 2, pero de manera porcentual, al igual que la última columna, son porcentajes acumulados.
Tiempo de llegada
Nº personas Nº personas acumuladas
Porcentaje Porcentaje acumulado
15 2 2 6.66 16.66
20 3 5 25.00 41.66
25 3 8 25.00 66.66
30 2 10 16.66 83.34
40 2 12 16.66 100.00
Total 12 100.00
Preguntas de interpretación
Teniendo en cuenta la tabla anterior, diga si esta de acuerdo con las siguientes afirmaciones:
8 personas se demoran 25 minutos para llegar a su destino
Verdadero Falso
El 41.66% de las personas se demoran 20 minutos o menos para llegar a la universidad.
Verdadero Falso
El 33.34% de las personas se demoran más de 25 minutos.
Verdadero Falso
Generalidades
El primer paso en la recolección de información, es obviamente tomar datos, los cuales se conocen como datos en bruto, sin orden, y por lo tanto, no son útiles para describirlos y mucho menos para apoyar la toma de decisiones. Las tablas de frecuencia simple como ya se observó, permiten sintetizar los valores y percibir
tendencias de ellos. Claro está, cuando el número de observaciones es alto, puede ser más de 50, las tablas de frecuencia construidas como se planteó en las páginas previas, deja de ser útil y da paso al uso de software estadístico.
En el lenguaje estadístico, se tienen los siguientes términos y sus definiciones.
Frecuencia absoluta: número de veces que se repite la variable
Frecuencia absoluta acumulada: Suma parcial de la frecuencia absoluta
Frecuencia relativa: Cociente entre la frecuencia absoluta y el número total de observaciones
Frecuencia relativa acumulada: Suma parcial de la frecuencia relativa
De nuevo por causa del apoyo de los computadores y de los programas estísticos, la teoría de agrupar datos manualmente en intervalos con el fin de sintetizar la información ya no es pertinente, al menos desde mi punto de vista. En otros objetos de aprendizaje se mostrará como se agrupan datos en intervalos usando el programa gratuito G_Stat, el cual se puede bajar gratuito de la dirección web, www.leondariobello.com
Promedio Aritmético y Desviación Estándar
Conocimientos previos
Lea con detenimiento, si requiere de información adicional, por favor busquela antes de contestar.
Seleccione una de las dos opciones.
¿A las variables genero, estrato y lugar de residencia es útil calcularles el promedio aritmético?
Verdadero Falso
¿A variables cualitativas se les calcula las medidas resumen o descriptivas?
Verdadero Falso
Objetivo del OA
Entender el concepto de la media aritmética y su interpretación dentro del contexto de
los participantes
Contenido
Se entenderá como cálculo manual, aquel que se realiza utilizando formulas, aún con el apoyo del Excel, es decir, construyendo la fórmula.
Media aritmética simple y ponderada. Calculo de la media de manera manual. Calculo de la media utilizando el Excel. Interpretación del promedio aritmético y su aplicación. Interpretación de la desviación estándar y su aplicación.
El promedio o media aritmética, sólo es la suma de los valores dividido por el total de ellos, valga decir, si el precio del dolar en los últimos 5 días fueron de: 1800,1795, 1805, 1820 y 1800, el cálculo se realiza así: 1800+1795+1805+1820+1800 = 9023. Esto dividido 5 datos, se llega a: 1804.6.
Se afirma que en promedio el precio del dólar por día para ese periodo fue de $1804.60. No obstante, para completar el análisis se requiere tener una medidad de variabilidad.
Media manual
Si los datos se tienen en forma de frecuencia, se calcula lo que se conoce como media ponderada. Asuma que los datos son el número de accidentes de tránsito y la ponderación o frecuencia es el número de días que se presentaron ese número de accidentes.
Nº accidentes Nº días Acc * Días
6 8 48
7 3 21
8 6 48
10 4 40
12 3 36
14 3 42
15 2 30
Totales 29 265
n = 29/265
_
X = ∑xi fi / n = 265 / 29 = 9.14
Concluyendo, en ese sector, ocurren en promedio aproximadamente 9 accidentes por día.
Actividad de cierre
Teniendo claro a que tipo de variables se les calcula el promedio aritmético conteste los
siguientes interrogantes.
Pregunas de cierre
Se tiene los siguientes tiempos para que un grupo de personas lleguen de realizar sus actividades
diarias a su residencia (minutos): 42,30,15,40,25,35.
El promedio da 35 minutos
Verdadero Falso
La siguiente frase es correcta: "En promedio el grupo de personas se demoran para regresar a sus
casas 31.16 minutos".
Verdadero Falso
¿El promedio por si sólo es útil para apoyar la toma de decisiones?
Verdadero Falso
Actividad de repaso 1
1. Según lo comprendido hasta ahora, cuál es la utilidad de la estadística en las Ciencias de la Salud?
2. Considera usted que la estadística descriptiva es importante en la toma de decisiones. Sustente su respuesta y dé un ejemplo.
3. Cuá es la diferencia entre parámetro y estadístico?
4. Cuál es la diferencia entre la definición conceptual y la operacional?
5. Cite tres ejemplos de variables ordinales.
6. Con dos ejemplos muestre la diferencia entre la escala de razón y la de intervalo.
7. Mire la prensa del próximo fin de semana y haga un análisis sobre la pertinencia de los títulos colocados a algunas tablas y gráficos (si los hay).
Socialice sus opiniones de manera presencial, no es calificable está actividad.
Actividad de repaso 2
2. El siguiente marco muestral se obtuvo en una investigación realizada por estudiantes de la especialización en Educación Física en la U de A (año 2004). Se eliminaron algunas variables para efectos de presentación. Identifique el tipo de variable y la escala de medición para cada una de las columnas, además, realice las tab
las de frecuencia simple para estrato, sexo y salto largo. Que conclusiones puede sacar.
Realice un cruce entre el sexo y el estrato, interprete la tabla y diga si el sexo influye en el estrato socioeconómico.
Agrupe en 4 intervalos las variables: salto largo y abdominales. Que concluye.
Estrato Edad Sexo Estatura Peso Abdominales Salto Largo Sprint 4 16 1 173,8 57,4 46 1,93 7,55 3 15 1 166,5 56 55 2,28 7,67 3 15 1 162,1 64,9 56 1,91 6,82 3 15 1 158,2 46,6 60 1,84 8,83 3 15 1 178,1 60,3 46 1,72 7,48 4 16 1 163,7 56,1 50 2,14 7,49 3 16 2 164,5 56,7 83 1,84 7,4
3 14 1 167,6 60,1 42 2,01 7,1 3 15 1 160,2 48,8 49 1,85 7,82 3 16 2 178 64,8 43 2,17 6,84 4 15 2 170 59,1 54 2,05 7,23 3 15 1 174,7 63,5 54 2,13 7,35 3 14 1 177 64,6 57 2,08 7,79 2 14 2 165,1 65,4 29 1,71 8,22 3 14 2 168,4 47,8 50 1,71 8,93 3 16 1 165,3 53 50 2,06 7,11 3 16 2 168,6 69,9 40 2 7,9 4 16 2 171,5 54,5 49 2,03 7,61 3 14 1 171 54,7 34 1,8 8,03 3 15 1 166,3 64 20 1,44 9,91 3 16 2 169,6 52,8 40 2,12 7,92 2 15 2 167,4 48,7 55 2,47 7,31 2 14 2 167,6 53,1 11 1,52 9,62 2 14 1 150,6 38,3 21 1,73 8,67 2 14 2 34 1,8 8,1 3 16 1 66 1,89 7,56 3 16 2 60 2,1 7,3 2 15 1 161,5 52,7 61 2,05 7,9
En caso de preferirlo, use los resultados obtenidos de otra investigación que usted considere y/o utilice datos que usted pueda contextualizar fácilmente. No es calificable.