Estadística aplicada a la Educación
Transcript of Estadística aplicada a la Educación
Estadística aplicada a la Educación
Universidad Nacional Mayor de San Marcos
Facultad de Educación
Mg. Jessica G. Zavaleta M.
Introducción
Estadística J. Neyman (1977: 58) «Estadistica trata de
problemas relativos a las caracteristicas operatorias de las reglas de comportamiento inductivo basado en experimentos aleatorios»
H. Crammer (1985:46) afirma que «el principal objeto de la teoría estadística consiste en la investigación de la posibilidad de obtener inferencias válidas a partir de datos estadisticos y en la construcción de metodos para realizar dichas inferencias»
Estadística
Es un método científico por medio del cual podemos recolectar, organizar, presentar y analizar datos numéricos relativos a un conjunto de individuos u observaciones que nos permiten extraer conclusiones válidas y efectuar decisiones basadas en dichos análisis.
Historia de la Estadistica
Se pueden distinguir tres etapas: Censos y empadronamientos (abarca
hasta el siglo XV)
De la descripción de poblaciones , a la aritmética política ( desde el siglo XVI hasta el siglo XVIII)
Teoría estadística y el cálculo de probabilidades (desde el siglo XIX hasta la actualidad)
Conceptos básicos
Población
Conjunto de elementos (personas, plantas, organismos, objetos, etc.) que contienen una o más características o atributos comunes observables, acerca del cual deseamos obtener conclusiones o tomar decisiones.
Para la investigación, es el conjunto sobre el que recae la investigación y de cuyos elementos obtendremos datos de sus características o atributos.
Toda población debe delimitarse temporal y espacialmente.
Ejemplos de población
Todos los empleados del sector público .
Todos los docentes de la UGEL 05
Todos los estudiantes de una institución educativa.
Censo
Implica la recolección de datos de toda la población bajo investigación.
Un censo se realiza generalmente por política de estado. Son costosos y sus resultados son la base para investigaciones mas especificas.
Muestra
Subconjunto de la población seleccionada de acuerdo a una planificación previa.
La muestra debe ser representativa de la población y esto significa que debe ser de tamaño adecuado y que tenga las mismas propiedades de la población.
Ejemplo de muestra: 100 docentes del sector educación
Unidad Estadística
Objeto elemental o elemento invisible sobre la base del cual se obtienen los datos.
También se le llama unidad de observación si los datos han sido recolectado mediante la observación y se le llama unidad experimental si los datos han sido recolectados a través de la experimentación.
Dato
Según el diccionario de la Lengua Española, es un antecedente para llegar al conocimiento exacto de un hecho.
Es una magnitud o caracterización de algo.
Son exactos, no cambian una vez obtenidos. Cuando se les procesa y presenta en un contexto apropiado pueden generar entendimiento.
Información
Es la reseña, representación o concepción derivada de la observación, lectura o instrucción.
Variable
Caracteristica o atributo que posee la poblacion.
Puede tomar diferentes valores o expresados en varias categorias
Ejemplo: Variable : «edades» de los alumnos de una
institucion educativa y los valores de la variable serian: 13, 14, 15 años de edad
Variable: «profesión» y los valores a adoptar serían : abogado, médico, profesor, etc
Escalas de medición de una variable
Nominal
Ordinal Intervalar
De razón
Escala Nominal
Son las variables que establecen la distinción de los elementos en diversas categorías, sin implicar algún orden entre ellas.
Distribuye a la unidad de análisis en dos o más categorías.
Ejemplos: Sexo Estado civil Deporte que práctica Religión Lugar de nacimiento.
Escala Ordinal
Variables que implican orden entre ellas, están referidas a un orden o jerarquía, donde las categorías expresan una posición de orden.
Ejemplos: Grado de instrucción Clases sociales Grado de simpatía Rango de agresividad.
Escala Intervalar
Suponen orden y grado de distancia iguales entre las diversas categorías, pero no tienen un origen natural, sino convencional.
La unidad de medida no necesariamente tiene que partir del valor cero, solo sirve como punto o valor de comparación.
Ejemplos: Coeficiente de inteligencia Temperatura Puntuación obtenida en una escuela. Presión arterial. Rendimiento escolar.
Escala de Razón
Comprenden a la vez a todos los casos anteriores, distinción, orden, distancia.
Es de origen natural único, el valor se expresa con un número real. ( la unidad de medida necesariamente tiene que partir del valor cero)
Ejemplos: Edad Peso Ingresos Número de hijos Accidentes de tránsito.
Clasificación de las variables
Variables
Variable Cualitativa
Variable Cuantitativa
Variable Cuantitativa
Discreta
Variable Cuantitativa
Continua
Variable Cualitativa o Categórica o De atributos
Si la variable expresa mediante una característica, cualidad o atributo.
Se mide mediante escala nominal u ordinal
Ejemplos: Lugar de Nacimiento Estado civil Religión
Variables Cuantitativas o Numéricas
Es cuando esta asociado a un valor numérico. Se miden mediante escala intervalar o de razón
Pueden ser de dos clases: discretas y continuas
Ejemplos: Número de carpetas de un aula Las estaturas de los estudiantes de una institución
educativa. Número de instituciones educativas Número de docentes de inglés de una UGEL
Variables Cuantitativas Discretas
Sus valores se expresan en números enteros.
Ejemplos
Número de alumnos por sección Número de libros en la biblioteca de
Educación Número de registros por docente
Variables Cuantitativas Continuas
Sus valores pueden expresarse mediante números reales
Ejemplos: Los pesos de los niños: 48,5 kg; 56,25
kg, etc Los haberes mensuales de los docentes
S/. 625,78; S/. 1235,50 ; etc Las tallas de los alumnos: 1,56 m; 1,62
m ; etc.
Practiquemos …..
En el siguiente enunciado: «En una institución educativa se aplicó una encuesta a 70 alumnos para averiguar el número de hermanos que tiene cada uno».
Averiguar : Población, muestra, variable, clase de variable, dato
Solución
• Todos los alumnos de la institución educativa Población
• 70 alumnos de la institución educativa Muestra
• Número de hermanos Variable
• Cuantitativa discreta Clase de variable
• Podría ser 3 hermanos Dato
Clasificación de la Estadística
• Trata del resumen y presentación de datos, mediante métodos adecuados.
• Su objetivo la caracterización de los datos (mediante gráficos o de forma analítica) donde se resalta las propiedades de los elementos bajo estudio.
Estadística
Descriptiva
• Estudia el comportamiento y propiedades de las muestras, pero de carácter aleatoria.
• Su objetivo generalizar las propiedades de la población bajo estudio, basado en los resultados de la muestra aleatoria.
Estadística
Inferencial
Estadística Descriptiva
Tablas y Gráficos de Frecuencia
Tabla de frecuencia o distribucion de frecuencia. Presenta datos recolectados donde se puede observar las diferencias para los posibles valores de las variables o niveles o categorias. Condensan datos obtenidos.
Los gráficos es una representacion visual de la totalidad de datos. Transmiten informacion cuantitativa
Tablas de Frecuencia o Distribución
Son tablas de trabajo estadístico, que presentan la distribución de un conjunto de elementos de acuerdo a las categorías de una variable.
En ella se observa la frecuencia o repetición de cada uno de los valores de la variable, que se obtienen después de realizar la operación de tabulación.
Las tablas presentan diversos tipos de frecuencia (Absoluta simple, Absoluta acumulada, Relativa simple, Relativa acumulada).
Ejemplo
Cuadro N° 1
Edades fi Fi hi Hi
[10 – 15> 12,5 8 8 0.16 0.16
[15 – 20> 17,5 12 20 0.24 0.40
[20 – 25> 22,5 2 22 0.04 0.44
[25 – 30> 27,5 3 25 0 0.50
[30 – 35> 32,5 10 35 0.20 0.70
[35 – 40> 37,5 5 40 0.10 0.80
[40 – 45> 42,5 10 50 0.20 1.00
50 1.00
x
Frecuencia absoluta (fi).
Se llama frecuencia absoluta de un valor de variable, al número de veces que se repite dicho valor en el conjunto de datos.
Frecuencia absoluta acumulada (Fi).
Es la suma de las frecuencias relativas correspondientes a los datos menores e iguales al dato en referencia.
Frecuencia Relativa (hi).
La frecuencia relativa de un valor, es el cociente de su frecuencia absoluta entre el tamaño de la muestra.
hi=
Frecuencia Relativa Acumulada (Hi).
La frecuencia relativa acumulada de un dato, es el cociente de su frecuencia absoluta acumulada entre el tamaño de la muestra
Hi=
Practiquemos
El número de hijos por familia de un grupo de docentes de inglés de la UGEL 02 es como sigue:
Elaborar una tabla de frecuencias e interpretar
Graficar las frecuencias empleando el gráfico circular.
1,2,4,0,2,3,1,4,3,5,2,2,3,2,2,3,1,2,3,2,0,1,1,
2,0,3,2,3,3,2
Distribución de número de hijos de los docentes de inglés de la UGEL 02.
Número de hijos
Frecuencia (fi)
Frecuencia Absoluta
Acumulada (Fi)
Frecuencia Relativa (hi)
Frecuencia Relativa
Acumulada (Hi)
Frecuencia Porcentual
(hi *100)
0 3 3 0.100 0.100 10%
1 5 8 0.167 0.267 17%2 11 19 0.367 0.633 37%3 8 27 0.267 0.900 27%4 2 29 0.067 0.967 7%5 1 30 0.033 1.000 3%
30 1.000
Interpretación : La mayoría de docentes de inglés de la UGEL 02 , 37% tienen 02 hijos
Gráfico 1.1: Distribución de número de hijos de los docentes de inglés de la UGEL 02
10%
17%
37%
27%
7% 3%
Número de hijos
012345
Medidas de Resumen para datos de una variable cuantitativa
Medidas de Posición
Medidas de Dispersión
Medidas de Forma
Medidas de Posición o Medidas de Tendencia Central También se les conoce como estadígrafos de
posición, su propósito es de obtener valores que representen dicho punto central o centro de gravedad de los datos, es decir, describen la posición que ocupa una distribución de frecuencias respecto a un solo valor de la variable.
Representan en un solo valor, a una serie de datos y además describe en forma resumida al conjunto de observaciones.
Los de uso más frecuente son la media, la mediana y la moda, existen además los cuartíles, deciles, percentiles, etc.
Media aritmética ()
Se denomina simplemente Media o Promedio.
Viene a ser la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante la expresión:
Media Aritmética =
En términos matemáticos: Para una variable x Valor de la variable: x1; x2; x3; x4; ……xn
Media aritmética ()
Para datos sin agrupar , se utiliza :
Media aritmética ()
Características de la media aritmética
Para su cálculo
intervienen todos
los datos.
Toma en cuenta el número
de datos.
Es afectada por los valores
extremos.
Media aritmética ()
La media aritmética
de una constante es
igual a la misma
constante.
La media aritmética
del producto de una
constante por una
variable, es igual al
producto de la constante por la media
de la variable.
La media aritmética de la suma
de dos o más variables, es
igual a la suma de las medias de
cada una de dichas
variables.
La media de una variable
mas una constante,
es igual a la media de la variable más la constante.
Propiedades de la Media Aritmética
Ejemplo 1
Los puntajes obtenidos en 5 exámenes de estadística por Francoise son:
x1 = 13; x2 = 10; x3 = 14; x4 = 11; x5 = 10
Halla el promedio de notas e interpreta.
Solución:
Interpretación: El puntaje promedio obtenido por Francoise en el curso
de estadística es 11.6.
Ejemplo 2
El sueldo mensual de 5 profesores del Programa de Licenciatura en Lenguas Extranjeras sin titulo pedagógico son S/ 5 400, S/ 4 800, S/ 1 200, S/ 800, S/ 800 soles. Halla el promedio de los sueldos e interpreta.
Solución:
Interpretación El sueldo promedio mensual de los 5 profesores del
Programa de Licenciatura en Lenguas Extranjeras sin titulo pedagógico es de S/ 2 600.
Mediana (Me)
Es el valor que divide al total de las observaciones, previamente ordenadas o tabuladas, en dos partes de igual tamaño, en donde cada una de las partes contiene el mismo número de elementos.
Mediana (Me)
Para datos sin agrupar:
Cuando se tiene un número impar de datos▪ Entonces la mediana es igual al valor del término
central.
Cuando se tiene un número par de
datos▪ Entonces la mediana es igual al promedio de los
dos términos centrales.
Mediana (Me) C
ara
cte
rísti
cas d
e
la M
ed
ian
a
Para su cálculo no intervienen todos los datos.
No está afectada por los valores extremos.
La mediana depende del número de datos y no de los valores de estos datos.
La mediana no necesariamente será un valor de los datos de la lista original.
Como estadígrafo de posición, la mediana le sigue en importancia y usos a la media.
Es una medida única, es decir, una distribución de datos tiene solamente una mediana.
Ejemplo 1
Dado las edades de 7 profesores 27, 30, 26, 24, 35, 25, 40 años. Halla la mediana e interpreta.
Solución:1º Ordenamos los datos en forma ascendente: 24, 25, 26, 27, 30, 35, 40.
2º Ubicamos el valor central: Me = 27 INTERPRETACIÓN
El 50% inferior de los profesores tiene edades iguales o menores que 27 y el otro 50% superior tiene edades iguales o mayores a 27 años.
Ejemplo 2
Los siguientes datos corresponden a las calificaciones obtenidas por Peter en el ciclo 2009-1 del curso de Gramática: 12 – 13 – 08 – 10 – 10 – 14 – 14 – 16 – 11 – 18.
Solución:1º ordenamos los datos: 08 – 10 – 10 – 11 – 12 – 13 – 14 – 14 – 16 – 18. 2º como el número de datos es par realizamos la semisuma de los valores centrales
Interpretación El 50% inferior de las calificaciones obtenidas por Peter en el
curso de Gramática son menores o iguales a 12,5 puntos y el otro 50% superior de las calificaciones son mayores o iguales a 12,5.
Moda (Mo)
La moda es el valor que se repite con más frecuencia absoluta en un conjunto de datos de una variable.
También puede suceder que la distribución no tenga moda, en este caso se dice que la distribución es amodal.
Moda (Mo) – Características
Le sigue en
importancia a la
media y la mediana.
Es un estadígrafo muy útil cuando los datos son
de tipo cualitativo
s.
No es una medida única.
El cálculo de la moda
es independiente del valor de
los datos.
Ejemplos
EJEMPLO 1 El conjunto de valores 2, 2, 5, 7, 9, 9, 9, 10, 10, 11
tiene una moda igual a 9▪ Es decir, Mo = 9 ( es unimodal)
EJEMPLO 2 El conjunto de valores 12, 13, 13, 13, 13, 14, 14, 14,
15, 15, 15, 15 tiene dos modas el 13 y el 15, es decir, es bimodal.
EJEMPLO 3
El conjunto de valores 5, 7, 8, 9, 11, 24, 31, 35 no tiene moda, es decir, es amodal.
Cuartiles, Deciles , Percentiles
Los cuartíles, deciles y percentiles son estadígrafos de posición que dividen al total de datos, previamente ordenados o tabulados, en proporciones.
Se usan frecuentemente para describir el comportamiento de una población. Los valores se expresan en forma porcentual
Cuartiles ( Qk )
Son estadígrafos que dividen al total de la información previamente ordenados (en forma ascendente o descendente) o tabulados en cuatro partes iguales.
Deciles ( Dk )
Son estadígrafos que dividen al total de la información previamente ordenados (en forma ascendente o descendente) o tabulados en diez partes iguales.
Percentiles ( Pk )
Son estadígrafos que dividen al total de la información previamente ordenados (en forma ascendente o descendente) o tabulados en cien partes iguales.
Percentiles ( Pk )
• Del grafico se puede inferir que la mediana ocupa el mismo lugar que el cuartíl Q2, el decil D5 y el percentil P50
Me = Q2 = D5 = P50
• Para hallar el percentil Pk se sigue el siguiente procedimiento.
1º Primero se ordenan los datos en forma ascendente o descendente.2º Se calcula el k% de n. (ubicación del dato nk)3º Si el resultado es un número entero. Pk = 4º Si el resultado no es entero Pk =
Medidas de Dispersión
Las medidas de dispersión con respecto al centro tienen una finalidad de ampliar la descripción de los datos, de comparar dos o más conjuntos de datos. Estas medidas de dispersión son números que miden el grado de separación de los datos con respecto a un valor central, que generalmente es la media aritmética.
Clasificación de las Medidas de Dispersión
MEDIDA DE
DISPERSIÓN ABSOL
UTA
• Se expresan en unidades de la variable, siendo las más usadas: Rango o Amplitud, Varianza, Desviación Estándar llamada también Desviación Típica, y Rango Intercuartílico.
MEDIDA DE
DISPERSIÓN RELAT
IVA
• No se expresan en unidades de la variable, siendo la más usada, el Coeficiente de Variación.
• Permiten identificar la concentración de los datos, respecto a una medida de posición, indica que a menor dispersión o variabilidad, mayor es la concentración de los datos respecto alrededor de esa medida de posición
Rango o Amplitud (R)
Es la diferencia entre el valor máximo y y el valor mínimo de las observaciones, es decir:
Características del Rango
El rango es de fácil manejo.
Para su cálculo no
intervienen todos los
datos, solo los valores extremos.
No toma en cuenta el
número de datos.
Ejemplo 1
El ingreso mensual de 4 profesores de estadística, contratados en un colegio particular son S/424, S/ 424.50, S/424 y S/ 423.50.
Solución:R = X Máximo – X mínimo
R = 424.50 – 423.50 R = 1
Interpretación Los datos tienen un rango o amplitud igual a 1. Es
decir es una muestra homogénea.
Ejemplo 2
El ingreso mensual de 4 profesores de estadística, contratados en un colegio estatal son S/424, S/ 373, S/424 y S/ 475
Solución:R = X Máximo – X mínimo
R = 475 - 373 R = 102
Interpretación Los datos tienen una amplitud igual a 102. Es decir es
una muestra dispersa.
Varianza ( S2)
Es el promedio de la suma de los cuadrados de las desviaciones de los valores de una variable respecto a su media aritmética.
Mide la dispersión de los datos respecto a su media aritmética.
Se calcula:
Varianza ( S2)
Cuanto mayor sea la varianza de una variable mayor dispersión existirá y por tanto menor representatividad tendrá la media aritmética. Esto sucede sobretodo cuando la media aritmética está afectada por valores extremos.
La varianza se expresa en las mismas unidades de la variable analizada, pero elevadas al cuadrado.
Características de la varianza
Es un número real no negativo.
Se expresa en unidades cuadráticas.
Ejemplo 1
Los datos corresponden a la estatura de 5 profesores 1.70, 1.64, 1.60, 1.62, 1.64. Halla la varianza e interpreta.
Solución: 1º Necesitamos el valor de la media aritmética.
Ejemplo 1
Luego, la varianza estará dado por:
Interpretación Las estaturas de los profesores se dispersan en promedio
0.00112 m2, con respecto al valor central.
Ejemplo 2 Halla la varianza de los siguientes números 2, 3, 6, 8, 11.
Solución: 1º Hallamos la media aritmética
2º Una vez hallado la media reemplazamos en la fórmula:
Interpretación Los datos se dispersan en promedio 10.8 u2, con respecto al valor
central.
Desviación Estándar ( S )
Se define como la raíz positiva de la varianza.
Ejemplo 1
El tiempo que utilizan 6 niños de igual edad para desarrollar la misma tarea es 16, 12, 15, 18, 13, 14 minutos.
Solución:
1º
2º Hallamos
Interpretación El tiempo utilizado por los niños para desarrollar las tareas se dispersa en promedio
1.97 minutos con respecto al valor central.
Rango intercuartílico ( IQR )
Se define como la diferencia que existe entre los cuartíles Q3 y Q1, por lo tanto es el intervalo que contiene el 50% central de los datos.
IQR = Q3 – Q1
Se usa como medida de dispersión cuando se ha empleado la mediana como medida de posición.
Ejemplo 1
El curso de estadística se dicta en 2 grupos, se desea determinar la dispersión del rendimiento en este curso a partir de la siguiente información:
Calcula el rango intercuartílico para ambos turnos e interpreta.
TURNO Q1 Q3
MAÑANA
12.3 22.7
NOCHE 15.6 21.6
Solución del ejemplo 1
Turno Mañana:1º IQRM = Q3 – Q1
2º IQRM = 22.7 – 12.3
3º IQRM = 10.4
Turno Noche:1º IQRN = Q3 – Q1
2º IQRN = 21.6 – 15.6
3º IQRN = 6
Interpretación
El grupo que tiene rendimiento más homogéneo con respecto a la mediana es el turno de la noche por tener menor rango intercuartílico.
Coeficiente de variación
Es la desviacion estandar como un porcentaje de la media aritmetica.
CV (X) =
Características del coeficiente de variación
Se puede expresar sin considerar la unidad de la
variable
Compara la dispersión
de datos de variables
diferentes
No es recomendabl
e calcular cuando la
media tiende al valor cero o variables con valores negativas
Ejemplo 1
Las calificaciones de la primera unidad del curso de Literatura Inglesa de dos alumnos es como sigue :
¿Quién rinde en forma mas heterogénea?
Obs 1 2 3 4 5 6 7 8 9 10Alumno 1 12 16 12 11 10 14 10 10 15 12Alumno 2 11 12 15 10 16 16 15 16 16 16
Solución
Para el alumno 1 1° Calculamos la media aritmetica
= 12,27 2° Calculamos la desviación estandar
S= 1,95 Luego el coeficiente de variacion para el alumno 1 es :
CV (X) = = x 100 = 15,88%
Solución
Para el alumno 21° Calculamos la media aritmetica
= 14,602° Calculamos la desviación estandar
S= 1,99 Luego el coeficiente de variacion para el alumno 1 es :
CV (X) = = x 100 = 13,65 %
Interpretación del ejemplo 1
Se observa que el CV del alumno 2 es menor que el alumno 1, por tanto es más homogeneo o menos disperso, respecto a su media
Medida de Forma
Permite tener una idea de la forma de la distribucion de una variable cuantitativa