Tema 1: Conceptos básicos y presentación de datos
MSc. Víctor Sánchez Cáceres
INTRODUCCIÓN
CONCEPTOS BASICOS
ORGANIZACIÓN DE DATOS
OBJETIVOS: Comprender qué es y porqué se estudia la
estadística.
Comprender los conceptos básicos de la estadística.
Explicar lo que significan estadística descriptiva y estadística inferencial.
Diferenciar entre una variable cualitativa y cuantitativa.
¿Qué es estadística?Recolecta
Organiza
Presenta
Analiza
interpreta
¿Para que sirve la estadística?
La Estadística se utiliza como tecnología al servicio de las ciencias.......
OBJETIVOS DE LA ESTADISTICA LA DESCRIPCION: Conjunto de datos presentados a
través de Cuadros y Gráficos para describir el comportamiento u composición de las variables.
EL ANALISIS: Generalización de resultados basándose en una muestra.
LA PREDICCION: Proyección de resultados, basándose en datos del pasado.
Tipos de estadísticaEstadística Descriptiva: Se ocupa de la
colección y clasificación de información, de suresumen en cuadros y gráficos adecuados queresuman en forma apropiada la información captada.
Estadística Inferencial: se ocupa de losprocesos de estimación, análisis y prueba de hipótesis,con el propósito de llegar a conclusiones que brindenuna adecuada base científica para la toma dedecisiones tomando como base la información
captada por la muestra.
CONCEPTOS BÁSICOS Población Muestra Unidad de Estudio Variable, Tipos y escala de medición Dato Observación Información Censo Parámetro Estadígrafo
Ejemplo: Se desea hacer un estudio sobre elingreso familiar de Cajamarca
Identifique: Población, una posible muestra,la característica en estudio y la unidad elemental.
Solución:
1. Población: Familias de Cajamarca
2. Muestra: 400 familias de Cajamarca
3. Variable: Ingreso familiar
4. Unidad elemental: Familia de Cajamarca
EJEMPLO
Se ha hecho un estudio para determinar la preferencia de una marca especial de aditivos por parte de los ingenieros metalúrgicos. Entre 50 ingenieros entrevistados, 30 dijeron que preferían marca Bayer.
a. ¿Qué constituye la muestra?.
Rpta:
b. ¿Qué constituye la población?.
Rpta:
c. ¿Cuál es la proporción, dentro de la muestra?
Rpta: p=30/50=0,60 (60% …prefieren la marca…)
VariablesSon las características que se desea apreciar de los elementos de la población.
CUALITATIVAS CUANTITATIVAS
DISCRETANOMINAL ORDINAL CONTINUA
ATRIBUTO NUMERICO
TIPOS DE VARIABLES
Cualitativas Nominales: Si sus categorías no se pueden ordenar
Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)
Ordinales: Si sus categorías se pueden ordenarGrado de satisfacción, Intensidad del color
Cuantitativas o Numéricas Discretas: Si toma valores enteros
Número de hijos, Número de desempleados
Continuas: Si entre dos valores, son posibles infinitos valores intermedios.
Altura, ingreso mensual,
EJEMPLOClasificar cada una de las siguientes variables:
Distancia diaria recorrida por cada estudiante para ir de su casa a la universidad. (Cuantitativa. Continua)
Tiempo que requiere un estudiante para responder a un examen(Cuantitativa. Continua)
Llamadas que llegan a la central telefónica de la UPN en un día. (Cuantitativa. Discreta)
Preferencia de consumidores por cierta marca de refresco. (Cualitativa -Nominal)
Sexo de los estudiantes que toman el curso de estadística en el semestre. (Cualitativa -Nominal)
Número de acciones vendidas en un día en la Bolsa de Valores. (Cuantitativa. Discreta)
Nivel educativo de pobladores de cierta comunidad. (Cualitativa -Ordinal)
Pasos en un estudio estadístico
Plantear hipótesis sobre una población
Decidir qué datos recoger (diseño de experimentos)
• Qué individuos pertenecerán al estudio (muestras)
• Qué datos recoger de los mismos (variables)
Recoger los datos (muestreo)
• ¿Simple? ¿Estratificado? ¿Sistemático? ¿Agrupado?
Describir (resumir) los datos obtenidos
Realizar una inferencia sobre la población
Cuantificar la confianza en la inferencia
• Nivel de confianza
• Margen de error:
ORGANIZACIÓN DE DATOS
OBJETIVOS:
ƒOrganizar los datos en un cuadro de distribución de frecuencias
ƒPresentar los datos en gráficos de distribución de frecuencias.
ORGANIZACIÓN DE DATOSCUADRO DE VARIABLE CUALITATIVA
Variable frecuencia Porcentaje %
C1 f1 (f1/n)x100
C2 f2 (f2/n)x100
… … …
Ck fk (fk/n)x100
Total n 1
ORGANIZACIÓN DE DATOS
VARIABLE CUALITATIVA
Para representar gráficamente la distribución de
frecuencias de una variable cualitativa se utilizan las
barras y los sectores circulares.
Nota
Si trabajamos con variables nominales las categorías pueden ser colocadas en cualquier orden. En el caso de escala ordinal las categorías deberán ser colocadas en orden(Grafico de barras)
Gráficos para v. cualitativas
Diagramas de barras Alturas proporcionales a las frecuencias
(abs. o rel.) Se pueden aplicar también a variables
discretas
Diagramas de sectores (tartas, polares) No usarlo con variables ordinales. El área de cada sector es proporcional a su
frecuencia (abs. o rel.)
Pictogramas Fáciles de entender. El área de cada modalidad debe ser
proporcional a la frecuencia. ¿De los dos, cuál es incorrecto?.
21
EJEMPLO:
En una planta embotelladora seregistraron 54 accidentes y de acuerdocon la parte del cuerpo lesionada,dedos (D), ojos (O), brazo (B), ypiernas (P); se registraron los datos(cuadro 1). Se pide organizar losdatos.
Datos:
D
D
B
P
B
B
D
D
D
P
D
O
D P D O D P
O
B
B
O
B
D
D
B
B
D
O
B
P
B
P
D
D
P
D
P
D
D
P
B
D
D
D
B
O
P
B
P
B
O
D
D
CUADRO 1:
PARTE LESIONADA DEL CUERPO EN
ACCIDENTES DEEMBOTELLADORA
FUENTE: Registros de accidentes en embotelladora
ELABORACION: Departamento de Personal
PARTE
LESIONADA
NÚMERO DE
ACCIDENTES
%
BRAZOS 14 25,93
DEDOS 22 40,74
OJO 7 12,96
PIERNA 11 20,37
Total 54 100
Grafico de Barras:
Grafico N° 1
FUENTE: Registros de accidentes en embotelladora
ELABORACION: Departamento de Personal
26
41
13
20
0
5
10
15
20
25
30
35
40
45
BRAZOS DEDOS OJO PIERNA
%
Parte lesionada
PARTE LESIONADA DEL CUERPO EN ACCIDENTES EN EMBOTELLADORA
Grafico de Sectores Circulares:
Grafico N° 2
FUENTE: Registros de accidentes en embotelladora
ELABORACION: Departamento de Personal
26%
41%
13%
20%
PARTE LESIONADA DEL CUERPO EN ACCIDENTES EN EMBOTELLADORA
BRAZOS
DEDOS
OJO
PIERNA
ORGANIZACIÓN DE DATOS
VARIABLE CUANTITATIVA DISCRETA
Xi fi hi Fi Hi
X1 f1 h1 F1 H1
X2 f2 h2 F2 H2
… … … … …
Xk fk hk Fk Hk
TOTAL n 1
Ejemplo
Construir la distribución de frecuencias del número de trabajadores que se ausentaron en 20 días laborales:
2 1 2 4 1
3 2 3 2 0
3 2 1 3 2
3 3 1 2 4
Ausencias de
Trabajadores
N° de días Porcentajes
0 1 0.05x100=5%
1 4 0.20x100=20%
2 7 0.35x100=35%
3 6 0.30x100=30%
4 2 0.10x100=10%
20 100%
CUADRO N 2
NUMERO DE AUSENCIAS DE TRABAJADORES
FUENTE: Registro de control de asistencia de trabajadores
ELABORACION: Departamento de Personal
Ausencias de
Trabajadores
N° de días (fi) hi% Fi Hi%
0 1 5 1 5
1 4 20 5 25
2 7 35 12 60
3 6 30 18 90
4 2 10 20 100
Total 20 100
Grafico de Bastones:
GRAFICO N 3
FUENTE: Registro de control de asistencia de trabajadores
ELABORACION: Departamento de Personal
5
20
35
30
10
0
5
10
15
20
25
30
35
40
0 1 2 3 4
%
Ausencias
AUSENCIAS DE TRABAJADORES
Grafico de Escalones:GRAFICO N 4
FUENTE: Registro de control de asistencia de trabajadores
ELABORACION: Departamento de Personal
5
25
60
90
100
0
20
40
60
80
100
120
0 1 2 3 4
%
Ausencias
AUSENCIAS DE TRABAJADORES
Ejemplo ¿Cuántos individuos tienen
menos de 2 hijos? frec. indiv. sin hijos
+ frec. indiv. con 1 hijo = 419 + 255= 674 individuos
¿Qué porcentaje de individuos tiene 6 hijos o menos? 97,3%
¿Qué cantidad de hijos es tal que al menos el 50% de la población tiene una cantidad inferior o igual? 2 hijos
Número de hijos
419 27,8 27,8
255 16,9 44,7
375 24,9 69,5
215 14,2 83,8
127 8,4 92,2
54 3,6 95,8
24 1,6 97,3
23 1,5 98,9
17 1,1 100,0
1509 100,0
0
1
2
3
4
5
6
7
Ocho+
Total
Frec.
Porcent.
(válido)
Porcent.
acum.
33
≥50%
ORGANIZACIÓN DE DATOS
VARIABLE CUANTITATIVA CONTINUA
Intervalo [Li ; Ls>
Marca de Clase (Xi)
fi hi Fi Hi
I1 X1 f1 h1 F1 H1
I2 X2 f2 h2 F2 H2
… … … … … …
Ik Xk fk hk Fk Hk
Total n 1
Ejemplo. En la oficina de un diario, el tiempo que setardan en imprimir la primera plana fue registradodurante 50 días. A continuación se transcriben losdatos, aproximados a décimas de minuto:
20,8
22,8
21,9
22,0
20,7
20,9
25,0
22,2
22,8
20,1
25,3 20,7 22,5 21,2 23,8 23.3 20,9 22,9 23,5 19,5
23,7
20,3
23,6
19,0
25,1
25,0
19,5
24,1
24,2
21,8
21,3 21,5 23,1 19,9 24,2 24,1 19,8 23,9 22,8 23,9
19,7
24,2
23,8
20,7
23,8
24,3
21,1
20,9
21,6
22,7
Construya con los datos una tabla de distribución de frecuencia, usando la regla de sturges.
PROCEDIMIENTO
•Calcular el rango (R) o recorrido, el cual se define de la siguiente manera:
R = Obs. máxima – Obs. Mínima
R = 25.3 - 19.0 = 6.3
•Determine el número de intervalos (k)
K = 1 + 3.3 log (n) (Fórmula de Sturges) K = 1 + 3.3 log (50) = 6.607 = 7 (entero) (Redondeo simple)
•Determinar la amplitud del intervalo (a=R/K) (Redondeado por exceso) Se redondea según el número de decimales que se tiene en la muestra : a=6.3/7=0.9
Cuadro N3Tiempo que se tardan en imprimir la primera plana
de un diario
FUENTE: observación de impresión de primera planaELABORACION: Departamento de Logística
Tiempo
(minutos)
Xi fi hi Fi Hi
[19.0-19.9> 19.45 5 0.10 5 0.10
[19.9-20.8> 20.35 6 0.12 11 0.22
[20.8-21.7> 21.25 9 0.18 20 0.40
[21.7-22.6> 22.15 5 0.10 25 0.50
[22.6-23.5> 23.05 7 0.14 32 0.64
[23.5-24.4> 23.95 14 0.28 46 0.92
[24.4-25.3] 24.85 4 0.08 50 1.00
Total 50 1
Grafico de Histograma:GRAFICO N 5
FUENTE: observación de impresión de primera plana del Diario
ELABORACION: Departamento de Logística
10%
12%
18%
10%
14%
28%
8%
0%
5%
10%
15%
20%
25%
30%
18.55 19.45 20.35 21.25 22.15 23.05 23.95 24.85 24.75
%
Tiempo
TIEMPO DE IMPRESION DE PRIMERA PLANA DE UN DIARIO
Grafico de Polígono:
GRAFICO N 6
FUENTE: observación de impresión de primera plana del Diario
ELABORACION: Departamento de Logística
10%
12%
18%
10%
14%
28%
8%
0%
5%
10%
15%
20%
25%
30%
18.55 19.45 20.35 21.25 22.15 23.05 23.95 24.85 24.75
%
Tiempo
TIEMPO DE IMPRESION DE PRIMERA PLANA DE UN DIARIO
Grafico de Ojiva:GRAFICO N 7
FUENTE: observación de impresión de primera plana del Diario
ELABORACION: Departamento de Logística
10%
22%
40%
50%
64%
92%
100%
0%
20%
40%
60%
80%
100%
120%
19.0 19.9 20.8 21.7 22.6 23.5 24.4 25.3 26.2
%
Tiempo
TIEMPO DE IMPRESION DE PRIMERA PLANA DE UN DIARIO
Organización de los Datos
Variable Numérica
Diagrama de Tallos y Hojas (Stem & Leaf)
Se ubican en una columna, en orden ascendente, todos los números queforman los datos una vez que se ha eliminado la última cifra (de lasunidades o de los décimos) . Estos valores son los “tallos”.
Se separa con una línea vertical estos números y a la derecha de cadauno de ellos se localizan en filas las cifras de las unidades (o de susdécimos) de cada dato (hojas) que comienza con ese número.
En cada fila, las hojas se ordena también de menor a mayor.
Ejemplo
Variable Numérica
Gráfico de Tallos y Hojas de la variable “Edad del Jefe de Familia”
¿Qué hemos visto?
Definición de estadística Población Muestra Variables
Cualitativas Numéricas
Presentación ordenada de datos Tablas de frecuencias
absolutas relativas acumuladas
Representaciones gráficas Cualitativas Numéricas
Diferenciales Integrales
Tallos y hojas43
Top Related