EstadisticabasicaI

30
Universidad César Vallejo Facultad de Educación MAESTRÍA EN EDUCACIÓN CON MENCIÓN EN DOCENCIA Y GESTIÓN EDUCATIVA DISEÑO DEL TRABAJO DE INVESTIGACIÓN Mg. Edmundo José Barrantes Ríos

Transcript of EstadisticabasicaI

UniversidadCésar Vallejo

Facultad de Educación

MAESTRÍA EN EDUCACIÓNCON MENCIÓN EN DOCENCIA Y GESTIÓN EDUCATIVA

DISEÑO DEL TRABAJODE INVESTIGACIÓN

Mg. Edmundo José Barrantes Ríos

Es una ciencia aplicada que está vinculada con el MÉTODO CIENTÍFICO, y trata sobre las técnicas de recopilación, análisis e interpretación de datos numéricos que sirven de base para la toma de decisiones.

ESTADESTADÍÍSTICA STICA BBÁÁSICASICA

I. Clasificación :I. Clasificación :

1.1 Estadística Descriptiva o Deductiva1.1 Estadística Descriptiva o Deductiva.-.-

Es el conjunto de técnicas que posibilitan la recolección, presentación y caracterización de un conjunto de datos a fin de describirlos y analizarlos en forma apropiada. Permite presentar la información contenida en una población o muestra mediante el uso de tablas de frecuencias gráficas e indicadores o medidas que permitan resumirlas de tal forma que den importancia a los mismos datos.

1.2 Estadística Inferencial o Inductiva1.2 Estadística Inferencial o Inductiva

Sirve para extrapolar o inferir los resultados obtenidos en el análisis de los datos y a partir de ello predecir acerca de la población, con un margen de confianza conocido.

II. Variable Estadística.-II. Variable Estadística.-

Es una característica de la población que toma diferentes valores o atributos.

III. Organización de los Datos.-III. Organización de los Datos.-

El manejo de la información requiere de la ordenación de datos de forma que permita la tención de una forma más fácil de conclusiones acerca de la muestra.

Tabla de Distribución de Tabla de Distribución de Frecuencias UnidimensionalFrecuencias Unidimensional

Variable Cuantitativa:Variable Cuantitativa:

- Discreta: se agrupan los datos en:

a) Valores Originales si el rango es pequeño

b) Intervalo de clase (I.C) si el rango es grande.

- Contínua: generalmente se presentan los datos en I.C.

Variable CualitativaVariable Cualitativa

Nominales u Ordinales: Se presentan en sus categorías tal como se recoge la información.

Las frecuencias más comunes son:

1. Frecuencia Absoluta ( fi )

Es el número de veces que se repite un valor, del conjunto de la variable estadística X.

2. Frecuencia Absoluta Acumulada ( Fi )

Para un determinado valor se considera como la frecuencia de cada dato xi ( i = 1,2,3,…k) donde k es la cantidad de valores que puede tomar la variable x más la suma de los valores anteriores a dicha suma.

Para hallar dicha frecuencia es imprescindible que los valores x, estén ordenados en forma creciente.

Fi = ∑ fi

k

i =1

F = frecuencia I = índice X = variable fi = frecuencia absoluta

Fi = frecuencia absoluta acumulada K = cantidad de valores de X ∑ = sumatoria

X = Variable estadística Xi (i = 1,2,3,4, … k)

Suma de las frecuencias absolutas

= f1 + f2+ f3+ f4…fkFi = ∑ fi

k

i =1

3.Porcentaje ( pi ).- Es el cociente (fi / n)*100% donde n = número total de observaciones y representa el porciento de veces en que ocurre un dato y sirve para conocer la posición relativa de los datos.

pi = (fi / n) * 100%

4. Porcentaje acumulado ( Pi ).- Es la suma de los valores acumulados de los porcentajes.

Pi= ( pi+ p2+ p3 … pk )

Pi = ∑ pi

k

i =1

= ∑ * 100%

k

i =1

fi

n( ) , donde k ≤ n

Valor de la Variable

X

Frecuencia Absoluta

( fi )

Frecuencia Acumulada

Porcentaje

( pi )Porcentaje Acumulad

( Pi )

X1f( X1 ) = f1 F1= f1

p1=(f1 / n)* 100% P1 = p1

X2f( X2 ) = f2 F2= f1+ f2

p2=(f2 / n)*100% P2= p1+ p2

X3f( X3 ) = f3 F3= f1+f2+ f3

p3= (f3 / n)*100% P3= p1+ p2+ p3

-

-

-

X k-1f ( Xk – 1 ) = f k – 1 Fk-1=f1+f2+…+fk-1

pk-1=(fk-1 / n)*100% Pk-1 = p1+ p2+ …+ pk-1

X kf ( Xk ) = f k Fk=F1+f2+…+fk

pk=(fk / n)*100% Pk= p1 + p2…+ pk

Total n 100%

Fi = ∑ fi k

i =1

( )

Ejemplo 1:

Las notas del curso de Estadística en la Institución Educativa X han sido:

3,4,1,2,8,9,8,7,6,6,7,9,8,7,7,1,0,1,5,9,9,8,0,8,8,8,9,5,7,5.

Construir la Tabla de Distribución de Frecuencias

Calificaciones( Xi )

Frecuencia Absoluta

( fi )

Frecuencia Acumulativa

( Fi )

Porcentaje( pi )

Porcentaje Acumulativo

( Pi )

0 2 2 6.7 % 6.7 %

1 3 5 10.0 % 16.7 %

2 1 6 3.3 % 20.0 %

3 1 7 3.3 % 23.3 %

4 1 8 3.3 % 26.7 %

5 3 11 10.0 % 36.7 %

6 2 13 6.7 % 43.3 %

7 5 18 16.7 % 60.0 %

8 7 25 23.3 % 83.3 %

9 5 30 16.7 % 100.0 %

Total 30 100 %

Interpretación de los Datos:

En Frecuencia Absoluta notamos que 3 estudiantes obtuvieron nota 5.

El % de estudiantes que obtuvieron nota 5 son 10% (3/30)*100% del total de alumnos que llevan el curso de Estadística.

En Porcentaje Acumulado, observamos que el 36.7% (11/30)*100% de estos alumnos tuvieron a lo más una nota de 5 en este curso.

IV. IV. Frecuencia de Datos Agrupados en Frecuencia de Datos Agrupados en Intervalos de Clase.Intervalos de Clase.

4.1. Recorrido o Rango (R).- Se utiliza en el caso de variables cuantitativas y es la

diferencia entre el mayor y menor valor de los datos y se determina a partir de las observaciones de estos datos.

R = max (X) – min (x)

Ejemplo 2:

En la población de alumnos de secundaria de la Institución Educativa “José María Arguedas”, el menor de los alumnos tiene 12 años y el mayor tiene 19 años de edad. Determinar el Rango.

R= 19- 12 = 7 Rango encontrado es 7

4.2. Intervalo de Clase.- Es el espacio o rango en el que se ubica la variable.

Ejemplo 3:

Las calificaciones vigesimales se pueden dividir en los intervalos.

[0-5] , [6-10] , [11-15] , [16-20]

¿Dónde se ubicará la nota 16?

4.3. Limite de Clase.-

Vienen a ser los valores extremos de cada intervalos de clase: Limite inferior y limite

superior.

Ejemplo 4:

En el intervalos de clase [20, 40]. Determine sus limites.

Limite inferior = 20 Limite superior = 40.

4.4. Amplitud de Clase.-Es la diferencia entre el extremo superior

y el extremo inferior de cada intervalo de clase y pueden ser intervalos de amplitud constante o de amplitud variable.

Ejemplo 5:1. [20-40) A = 40-20 = 202. [20-40] A = 40-20+ 1= 213. (20-40) A = 40-20- 1 = 19 …

4.5. Marca de Clase o Punto Medio de un

_

intervalo ( Xi ).

Es la semisuma de los valores extremos del intervalo de clase.

_

[a-b] , [a-b ) , (a-b) Xi =(a+b)/2

Ejemplo 6:

_

[20-40) Xi = (20+40)/2 = 30

2

a + b

20+40

2

4.6. Determinación del Número de Intervalos de clase ( K ):

Consiste en dividir el rango en un número conveniente de intervalos de clase,

generalmente del mismo tamaño.

Es conveniente tener entre 5 y 20 intervalos de clase.

Entre más datos se tengan, más intervalos de clase deben considerarse. No hay una formula exacta para calcular los intervalos de clase. Este número es determinado por tentativas y aproximaciones.

Presentamos 2 formas de obtener la cantidad de intervalos a considerar

1) Si n ≤ 100, se utiliza la formula de Norclife: K = Raiz Cuadrada de n

• Si n > 100, se utiliza la formula de Sturges: K = 1 + 3.32193 * Log10 n

Ejemplo 7:Las calificaciones finales en un curso de 80 estudiantes. Determine el rango, número de clases y la amplitud de clase.

n

8.3 6.6 7.5 7.98.2 7.8 8.5 7.9 7.9 8.5

7.2 6.6 8.8 6.68.3 7.7 7.9 7.8 8.4 9.3

6.6 7.6 7.5 8.67.9 7.4 7.9 7.8 7.9 9.0

7.4 7.5 7.0 7.17.7 7.3 8.5 8.2 6.6 7.5

6.7 7.7 6.7 6.68.4 6.8 7.9 8.0 7.8 9.0

8.7 8.7 8.2 6.78.3 7.3 7.9 6.7 8.5 9.1

9.0 9.3 8.4 6.67.2 6.6 7.2 7.5 7.9 9.8

10 8.7 7.2 9.67.4 8.5 7.9 7.8 8.5 8.5

Solución: 1ra Forma: El nº de datos es de 80 el nº de intervalos de

clases a trabajar es la siguiente manera K = 80 = 8.9, es decir 9 intervalos.

El rango de recorrido de los datos es de R = 10 -6.6 = 3.4

La amplitud de clase es A = 3.4/9 = 0.4 de lo que obtendremos la siguiente tabla:

Intervalos decalificaciones

fi Fi pi

decimalpi%

Pi

decimalPi%

6.6 - 7.0) 13 13 0.163 16.3 0.163 16.3

7.0 - 7.4) 8 21 0.100 10.0 0.263 26.3

7.4 - 7.8) 12 33 0.150 15.0 0.413 41.3

7.8 - 8.2) 17 50 0.213 21.3 0.625 62.5

8.2 - 8.6) 16 66 0.200 20.0 0.825 82.5

8.6 – 9.0) 5 71 0.063 6.3 0.888 88.8

9.0 – 9.4) 6 77 0.075 7.5 0.963 96.3

9.4 – 9.8) 1 78 0.013 1.3 0.976 97.5

9.8 – 10.2) 2 80 0.025 2.5 1.000 100.00

TOTAL 80 1.000 100.00

Segunda Forma: Usando la formula de Sturges. El número de

intervalos de clase es:

K = 1 + 3.322Log80 = 7.32 ~ 7 clases. El intervalo de variación es de

R = 10 – 6.6 = 3.4, por lo que la amplitud de clase es igual a:

A = 3.4/7 = 0.5, por lo que obtenemos la siguiente tabla:

Intervalos decalificaciones

fi Fi pi

decimalpi%

Pi

decimalPi%

6.6 - 7.1) 14 14 0.175 17.5 0.175 17.5

7.1 - 7.6) 15 29 0.188 18.8 0.363 36.3

7.6 – 8.1) 21 50 0.263 26.3 0.625 62.5

8.1 - 8.6) 16 66 0.200 20.00 0.825 82.5

8.6 – 9.1) 8 74 0.100 10.00 0.925 92.5

9.1 – 9.6) 3 77 0.038 3.8 0.963 96.3

9.6 – 10.1) 3 80 0.038 3.8 1.000 100.0

TOTAL 80 1.000 100.00

Interpretación de los datos: En frecuencias absolutas ( fi ) 15 estudiantes tienen

notas superiores o iguales a 7.1 e inferiores a 7.6 De las frecuencias absolutas acumuladas

( Fi ) 74 estudiantes tienen notas que no superan de 9.1.

En este caso tenemos el intervalo 8.6 ≤ x <9.1 y observando la columna de %, podemos decir que el 10% del total de alumnos tienen una nota ≥ a 8.6 y menores a 9.1

En porcentaje acumulados, encontramos que el 92.5% de estos alumnos tienen menos de 9.1 como nota.