Jornada 1 y 2
-
Upload
pablo-jurado -
Category
Documents
-
view
96 -
download
0
Transcript of Jornada 1 y 2
MAESTRÍA EN DOCENCIA UNIVERSITARIA
ESTADÍSTICA APLICADA A LA EDUCACIÓN
8-9 /15-16 Febrero 2014
Ing. Edmundo Recalde Posso, MBA
• Objetivos del curso:
1. Aplicar la estadística básica en el tratamiento de datos.
2. Interpretar los resultados estadísticos.
3. Desarrollar experimentos simples aplicados a la educación.
• Metodología:– Para cada tema a tratar se utilizará la siguiente
distribución: • Presentaciones power point
• Ejemplos
• Ejercicios para los participantes
• Aplicaciones en Excel
• Formar grupos de máximo 3 personas
Contenido y distribución del tiempoMAÑANA: 8H00-13H00TARDE: 14H00-18H00
• Jornada 1(8 de febrero 2014)– Bases de la estadística, Medidas de tendencia central,
medidas de dispersión. Aplicaciones con Excel
• Jornada 2 (9 febrero 2014)– Medidas de posición, medidas de forma, distribución
normal. Aplicaciones con excel
• Jornada 3 (15 febrero 2014)– Muestreo, Hipótesis, correlación y regresión, t student,
chi cuadrado, aplicaciones con excel
• Jornada 4 (16 febrero 2014) – Diseño e implantación de experimento, análisis de
varianza de uno y dos factores. Aplicaciones con excel
Que debe tener el participante
• Calculadora.
• Computador.
• Tablas estadísticas.
Evaluación:
– Talleres: 20% (D1, D2, D3, D4): (10 p)
– Tareas: 20% (D1, D2, D3): (10 p)
– Pruebas: 20% (D2, D3, D4): (10 p)
– Pr. de Inv.: 40% (D4): (20 p)
NOTA: 50/50.
Bibliografía
• Triola, M. 2004 Probabilidad y Estadística
Pearson Educación Novena Edición México 648 p.
• Pérez, C. 2002 Estadística aplicada a través
de Excel Pearson Educación S.A. Madrid-España 596 p.
• Reyes, C. 1999 Diseño de experimentos
aplicados Editorial Trillas México 348 p.
• Gutiérrez, H. 2003 Análisis y Diseño de
Experimentos Editorial McGraw Hill México 559 p.
8
La Estadística es la Ciencia de la
• Sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de
• deducir las leyes que rigen esos fenómenos,
• y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.
9
10
� La estadística en el diseño de los experimentos:� Es una colección de métodos para planear
experimentos, obtener datos, y después organizar, resumir presentar, analizar interpretar y llegar a conclusiones basadas en los datos.
11
� Herramienta indispensable para la toma de decisiones.
12
� Investigación de mercados.� Control de la Calidad� Medicina e Investigación� Agricultura� Censos poblacionales� Sociología.� Ingeniería
13
� Indice de Precios al Consumidor Urbano IPC - SEPTIEMBRE 2007
� Variación Mensual: 0,71%� Variación Anual: 2,58%� En lo que va del año: 2,09%� Canasta Analítica Fam. Básica464,90� Canasta Analít.Familiar Vital323,87
14
POBLACION:Es la colección completa de
todos los elementos (puntuaciones, personas, mediciones, etc) a estudiar.
MUESTRA:Es un subconjunto de los
miembros seleccionados de una población.
15
16
17
� Tamaño de la muestra:� Número de unidades que constituyen una muestra.
� Variable: Característica de interés acerca de cada elemento de una población o m.
� Dato: Valor de la variable� Datos: Conjunto de valores de la variable� Observaciones: conjunto de modalidades o
valores de cada variable estadística medidos en un mismo individuo
18
� Experimento: Actividad realizada según un plan definido cuyos resultados producen un conjunto de datos.
19
� Parámetro: Número que describe algunas propiedades de la población
� Estadístico: Número que describe algunas propiedades de la muestra.
LA ESTADISTICA ES PARA LA MUESTRA LO QUE EL PARAMETRO ES PARA LA
POBLACION.
20
Variable es la cantidad o carácter que puede ser medido y se halla sujeto a variación.
- Cualitativas- Cuantitativas
- Discretas (Si toman valores enteros)- Número de hijos, Número de plantas,
- Contínuas ( si entre dos valores, son posibles infinitos valores)- Altura, presión sanguínea, dosis de medicamento.
21
� NOMINAL: Datos consistentes en nombres, etiquetas o categorías.� Ej. SI/NO.� ORDINAL: Cuando pueden agruparse por algún orden, aunque
no es posible establecer diferencias entre ellos.� Ej. Calificación de A, B, C, D.
� INTERVALO: Semejante al ordinal pero que los datos si tienen significado. Los datos no tienen un punto de partida natural desde cero.� Ej. La temperatura.
� RAZÓN: Semejante al nivel de intervalo pero este tiene un punto de partida o cero inherente.� Ej. Precios del litro de leche.
22
SIMBOLOGIA
DESCRIPCION
X, Y, Z Variables
.a, b, c Constantes
∑ Sumatoria
i
Elementos de un conjunto ( iésima)
j Elementos de un conjunto ( jésima)
23
24
Varianza de la población
Media aritméticaMedia aritmética ponderada
Moda Desviación media
iXn
i
∑= 1
25
Desde
Hasta Observaciones
26
Presentación ordenada de datos
0
1
2
3
4
5
6
7
Hombre Mujer
• Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Las dos exponen ordenadamente la información recogida en una muestra.
Género Frec.
Hombre 4
Mujer 6
Agrupamiento de los datos en clases condensa los datos originales.
Frecuencia absolutaFrecuencia relativaFrecuencia acumulada
27
28
• Diagramas de barras– Alturas proporcionales a las frecuencias (abs. o
rel.)
– Se pueden aplicar también a variables discretas
• Diagramas de sectores (tartas, polares)– No usarlo con variables ordinales.
– El área de cada sector es proporcional a su frecuencia (abs. o rel.)
• Pictogramas– Fáciles de entender.
– El área de cada modalidad debe ser proporcional a la frecuencia. ¿De los dos, cuál es incorrecto?.
29
30
� Distribucion binomial
31
32
33
34
35
� Graficas en 3D
36
� Modelos en 3D
37
� Ternary plots
38
39
40
41
� Reduccion de datos
42
� Rotacion de datos en un espacio de 3D
43
� Si no hay variación no existiría la estadística.� Bastaría solo una medición para obtener lo que
estamos buscando
44
45
46
“Todo tiene una causa, no hay causa sin efecto, ni efecto que no tenga una causa”
47
VARIABLE INDEPENDIENTE
VARIABLE
DEPENDIENTE
CAUSA EFECTO
EJEMPLOS EJEMPLOS
FACTOR EN ESTUDIO VARIABLES
� APLICADO A LOS PROCESOS
48
� Las personas no son recordadas por el número de veces que fracasan, sino por el número de veces que tienen éxito.
� Thomas Alva Edison
49
50
Antes de
involucrarse en el
proceso de
investigación
Después de
involucrarse en el
proceso de
investigación
Tema 2:Medidas de tendencia central
Maestría en Docencia UniversitariaEstadística Aplicada a la Educación
Ing. Edmundo Recalde Posso, MBA
La media
Valor que pretende representar en un solo número las características mas relevantes de un conjunto de datos.
Media de la población
Media de la muestra
NiX /∑
niX /∑
=
=
Ejemplo:
5 6 10 14 18 20 22
13.6
La media
5 6 10 14 18 20 22
13.6
5 6 10 14 18 20 45
16.9
Media ponderada
Ejemplo:
Las calificaciones obtenidas por 26 estudiantes de un curso de estadística fueron:
Calificaciones No. Estudiantes10 59 48 67 46 35 24 2
Xi f
∑ NXif
Desarrollo del ejemplo:
La mediana
• Valor de la variable que ocupa el lugar central.
– Ventajas. No influye en ella los valores extremos (estadístico robusto).
– Tiene utilidad en los gráficos de control de procesos.
2 5 7 9 12
Media ?
Mediana ?
2 5 7 9 125
Media ?
Mediana ?
2 5 7 9 12
Media 7
Mediana 7
2 5 7 9 125
Media 29.6
Mediana 7
• Ejemplo:
– Hallar la mediana de los siguientes datos:
• 15,12, 20, 18, 22.
• PASOS:
• 1. Ordenar: 12 – 15 – 18 – 20 – 22.
• 2. Valor central: 18 (Me).
Mediana con datos no agrupados
Calificaciones No. estudiantes
10 5
9 4
8 6
7 4
6 3
5 2
4 2
Me = ?
Pasos:1. Calcular fa.
2. Calcular N/2.
3. Localizar la primera fa > N/2
4. La Me es entonces el valor de la variable correspondiente.
Mediana con datos no agrupados
Calificaciones No. estudiantes
10 5
9 4
8 6
7 4
6 3
5 2
4 2
Me = 8
Pasos:1. Calcular fa.
2. Calcular N/2.
3. Localizar la primera fa > N/2
4. La Me es entonces el valor de la variable correspondiente.
Mediana con datos agrupados
Intervalos No.
75-79 3
80-84 4
85-89 8
90-94 10
95-99 15
100-104 20
Pasos:1. Calcular fa.
2. Calcular N/2.
3. Localizar la primera fa > N/2
4. Aplicar la fórmula:
La Moda (Mo)
• Es el valor de la variable que más veces se repite.– Tipos: Bimodal, trimodal, multimodal
La Moda (Mo)
• Es el valor de la variable que más veces se repite.– Tipos: Bimodal, trimodal, multimodal
2 7 6 5 7 8 Mo
4 3 1 4 3 6 Mo
9 6 3 5 2 Mo
5 5 8 7 8 5 6 8 7 2 7 Mo
?
?
?
?
5 8 9 4 5 Mo= ?
La Moda (Mo)
• Es el valor de la variable que más veces se repite.– Tipos: Bimodal, trimodal, multimodal
2 7 6 5 7 8 Mo
4 3 1 4 3 6 Mo
9 6 3 5 2 Mo
5 5 8 7 8 5 6 8 7 2 7 Mo
7
3 y 4
-
5, 7, 8
5 8 9 4 5 Mo= 5
Moda con datos no agrupados
Calificaciones No. estudiantes
10 5
9 4
8 6
7 4
6 3
5 2
4 2
Mo = ?
Pasos:1. Localizar la mayor f.2. La variable correspondiente a la mayor frecuencia es la moda.
Resolución Mo
Calificaciones No. estudiantes
10 5
9 4
8 6
7 4
6 3
5 2
4 2
Mo = 8
Moda con datos agrupadosEdad No. trabajadores
61-65 4
56-60 7
51-55 16
46-50 27
41-45 41
36-40 67
31-35 99
26-30 191
21-25 83
Pasos:1. Localizar el intervalo
con mayor frecuencia.
2. Aplicar la siguiente fórmula:
Donde:d1= diferencia entre frecuencia modal y frecuencia del intervalo menor de la serie.d2= Diferencia entre la frecuencia modal y la frecuencia del intervalo mayor de la serie
Resolución de Moda
Edad No. trabajadores
61-65 4
56-60 7
51-55 16
46-50 27
41-45 41
36-40 67
31-35 99
26-30 191
21-25 83
Mo = 28.2 años
Tema 3:Medidas de dispersión
Maestría en Docencia UniversitariaEstadística Aplicada a la Educación
Ing. Edmundo Recalde Posso, MBA
Medidas de Dispersión
Si los valores están próximas entre sí o si por el contrario están muy dispersos.
Medidas de dispersión
• Rango
• Desviación media
• Varianza
• Desviación estándar
• Coeficiente de variación
• RANGO: Diferencia entre el mayor y el menor valor
• Ejemplos:
8 23 4 30 7 6 10
14 20 11 8 6 11 16 5
R =?
R = ?
• Resolución:
8 23 4 30 7 6 10
14 20 11 8 6 11 16 5
R = 30-4 = 26
R = 20-5 = 15
• DESVIACION MEDIA:
• EJEMPLO:
• Los siguientes son las calificaciones de un grupo de estudiantes:
• 12, 14, 16, 12, 15, 14, 17, 19, 16
– Cuál es la desviación media?
– RESOLVAMOS
• EJEMPLO:
• 12, 14, 16, 12, 15, 14, 17, 19, 16
• DM= 1.90
LA VARIANZA:
Medida de variación igual al cuadrado de la desviación estándar
σ 2S
2
Unidades elevadas al cuadrado?
Y su uso?ANALISIS DE VARIANZA
(ADEVA)
La varianza
8 cms.
8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8
9=
72
9= 8
…Consideremos el siguiente cambio
¿Cuál es el nuevo promedio de estos 9 rectángulos?
8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8
9=
72
9= 8 cm
... ¡el mismo promedio! Pero... ¿ha habido variación?
8 cms.
10 cm
6 cm
…la varianza
Rojo +2
Azul -2
8 cms.
10 cm
6 cm
Si sumamos estas diferencias de la altura respecto del promedio, tenemos
0 + 0 + 0 + 0 + 2 + 0 + 0 – 2 + 0 = 0
Este valor nos parece indicar que ¡no ha habido variabilidad! Y sin
embargo, ante nuestros ojos, sabemos que hay variación.
…la varianza
8 cms.
10 cms
6 cms
Una forma de eliminar los signos negativos:
es elevar al cuadrado todas las diferencias, y luego sumar...
02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 8
Y este resultado repartirlo entre todos los rectángulos, es decir lo
dividimos por el número de rectángulos que es 9
02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 =
9 9
8= 0,89
…la varianza es entonces?
8 cms.
10 cms
6 cms
Se dice entonces que la varianza fue de 0,89 cm2
La desviación estándar
• Medida de variación de todos los valores con respecto a la media.
• Simbología s (para la muestra)
• Positivo y si es cero lo valores son el mismo número.
• Las unidades de desviación estándar son las mismas de los datos originales (kg, pie, minutos, etc.)
Fórmulas para Desviación estándar
Fórmula para la población
Fórmula para la muestra
σ
s =
=
…Regresemos a los rectángulos
8 cm
10 cm
6 cm
La varianza fue de 0,89
0,89 0,943=
La raíz cuadrada de la varianza se llama desviación estándar
Que nos dice la desviación estándar?
8 cm
10 cm
6 cm
Que la desviación estándar haya sido de 0,943 significa que en promedio la
altura de los rectángulos variaron (ya sea aumentando, ya sea
disminuyendo) en 0,943 centímetros.
Es claro que esta situación es “en promedio”, puesto que sabemos que
los causantes de la variación fueron los rectángulos quinto y octavo.
Esta variación hace repartir la “culpa” a todos los demás rectángulos
que se “portaron bien”.
La desviación estándar mide la dispersión de los datos respecto del
promedio
…la varianza
8 cm
10 cm
6 cm4 cm
8 cm 8 cm 8 cm7 cm
8 cm
¿Cuál es la varianza y la desviación estándar de las alturas de los rectángulos?
En primer lugar debemos calcular el promedio
8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8
9= 7,44
Luego debemos calcular la varianza
…la varianza
8 cm
10 cm
6 cm4 cm
8 cm 8 cm 8 cm7 cm
8 cm
Promedio
7,44
0,56-3,44
0,56 0,56 2,56 0,56 -0,44 -1,44
0,56
0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562
9
22,2224
9=
= 2,469Este es el valor de la varianza
…la varianza10 cm
8 cm
6 cm4 cm
8 cm 8 cm 8 cm7 cm
8 cm
Promedio
7,44
Si la varianza fue de 2,469, entonces la desviación estándar es de...
2,469 1,57=
Lo que significa que, en promedio, los rectángulos se desviaron más o
menos (más arriba o más abajo) en 1,57 cm.
• COEFICIENTE DE VARIACION (%)
– Grado de precisión del diseño y la conducción del experimento.
100xS
CV =
Ejemplo de interpretación de CV
• Si el CV 0-10 %
• Si el CV 10-15%
• Si el CV 15-25 %
• Si el CV >25 %
MUY BUENO
BUENO
MALO
A DESECHAR
Tema 4:Medidas de posición
Maestría en Ciencias de la EducaciónEstadística en Educación
Mgs. Edmundo Recalde Posso
MEDIDAS DE POSICIÓN
- Cuartiles
- Quintiles
- Centiles
Cuartiles
Q1 Q3Q2
0% 50% 75% 100%25%
�� � �� �
��4 �� � 1�
������ � �� �
��4 �� � 1�
����
K = 1, 2, 3
Quintiles
Q1 Q3Q2
0% 40% 60% 100%20%
�� � �� �
��5 �� � 1�
������ � �� �
��5 �� � 1�
����
K = 1, 2, 3, 4
Q4
80%
Centiles
0% 100%
�� � �� �
��100
�� � 1�
������ � �� �
��100
�� � 1�
����
K = 1, 2, 3, …, 99
Medidas de forma
- Medidas de asimetría
- Curtosis.
Medidas de asimetría
Medidas de asimetría
g1=0g1>0
g1<0
http://www.spssfree.com/spss/analisis3.html
Curtosis
http://www.uv.es/ceaces/base/descriptiva/curtosis.htm
Curtosis
Fórmula de cálculo (g2)
• g2=0 (MESOCÚRTICA) +/- 0,5.
• g2>0 (LEPTOCÚRTICA)
• g2<0 (PLATICÚRTICA)
Asimetría y curtosis
Si g1= +/- 0,5
Y g2= +/- 0,5
Distribución normal
Distribución NO normal
SI
NO
INFERENCIA
La distribución normal
Estadística en Educación
Ing. Edmundo Recalde, MBA
Distribución normal
• Distribucion de poisson
Medidas de posicionamiento relativo
Introducción
- Abraham Moivre (1667-1754). -Desarrollo
- Friedrich Gauss (1777-1855) –Ecuación de la curva.
Es la distribución de probabilidad más importante en estadística.
En Educación la mayoría de los casos se aproximan a una distribución normal.
Características
• Asintótica.
• Area total =1.
• Simétrica.
• Se debe transformar cualquier valor de la variable a una variable normal tipificada.
Fuente de la imagen: http://www.uv.es/ceaces/pdf/normal.pdf
Características
La campana de Gauss
Fuente de imagen: http://rudy-gonzalez.blogspot.com/2010/09/distribucion-normal.html
Distribución normal tipificada
Fuente imagen: http://www.disfrutalasmatematicas.com/datos/distribucion-normal-estandar.html
Puntuación z
• Se calcula convirtiendo un valor a una escala estandarizada
Número de desviaciones estándar que un valor x
se encuentra por arriba o por debajo de la media
σ
µ−=
XZ
s
XZ
−=
Criterios de puntuaciones z
Valores infrecuentes Valores infrecuentesValores comunes
-1-2-3 0 1 2 3
Ejemplo
• Michael Jordan mide: 78 pulgadas (NBA)
• Rebecca Lobo mide 76 pulgadas (WNBA)
• Los hombres: media 69 pulgadas (S = 2.8 )
• Las mujeres: Media 63.6 pulg. (s= 2.5)
• Para comparar sus estaturas con respecto a las poblaciones de hombres y mujeres hay que estandarizar dichas estaturas.
Resolución de ejemplo
• Transformamos a puntuaciones z:
– Jordan:z = 3.21
– Lobo: z = 4.96
• INTERPRETACION:– La estatura de Jordan está a 3.21 desviaciones estándar por arriba de
la media, pero la estatura de Lobo está a 4.96 desviaciones estándar
por arriba de la media.
• Es decir:– La estatura de Lobo entre las mujeres es relativamente mayor que la estatura
de Jordan entre los hombres.
• Otro ejemplo:– Mugsy Bogues alcanzó el éxito con una
estatura de 5 pies y 3 pulgadas
– Estatura media de los hombres 69 pulg.
– Desviación estándar de 2.8 pulg.
– Quien desea calcular z =?.
• Primero debemos tener las mismas unidades de medida, entonces:– 5 pies y 3 pulgas = 63 pulgadas.
QUE OBTENEMOS DE AQUÍ:
Siempre que un valor sea menor que la media, su puntuación z correspondiente será negativa.