Descriptiva
-
Upload
francisco-gallardo-pizarro -
Category
Documents
-
view
173 -
download
3
Transcript of Descriptiva
Prof.: David Becerra Rojas 1
Contenidos
1. Introducción2. Estadística Descriptiva:
Univariante Bivariante3.- Probabilidades4.- Distribución de probabilidades
5.- Distribución en el Muestreo6.- Estimación de Parámetros7.- Dócimas de Hipótesis
Prof.: David Becerra Rojas 2
Bibliografía
1. Murray y Espieges “ Estadística”2. Paul Newbold “ Estadística para los negocios”3. Mario Triola “ Probabilidad y Estadística”4. L. Chao5. R. Levin6. Mongomery7. www.elprisma.com ( Matemática,….)
3
ESTADISTICA
CIENCIA QUE NOS PERMITE TOMAR DECISIONES BAJO CIERTA INCERTIDUMBRE
Prof.: David Becerra Rojas 4
Términos ComunesProceso de realizar una observación o una medición.
Característica o fenómeno, que puede tomar distintos valores.
Resultado de la observación de una variable.
Conjunto total de elementos o individuos, que poseen unacaracterística común, acerca de la cual se quiere información
Subconjunto de la población, seleccionada de acuerdo a una regla o un plan.
Obtención de todos los datos de interés que posee la población
Función o formula que depende de los datos de la muestra
Estimación del parámetro a través del estadístico
Función o formula que depende de los datos de la población
Muestra
CensoEstadísticoParámetroInferencia
Experimento
VariableDatoPoblación
Prof.: David Becerra Rojas 5
Método Científico
1. Planteamiento del Problema2. Diseño del Experimento3. Experimentación y Recolección4. Organización y Descripción de
Resultados5. Inferencia Estadística
Prof.: David Becerra Rojas 6
Muestreo
Notación:
N : Tamaño de la Poblaciónn : Tamaño de la Muestra
Prof.: David Becerra Rojas 7
Tipos de Muestreos Aleatorios
Aleatorio SimpleEstratificadoSistemáticoPor Conglomerado
Prof.: David Becerra Rojas 8
Muestreo Aleatorio Simple
Todos los elementos de la población, tienen la misma oportunidad de estar contenidos en la muestra.
Se enumeran todos los elementos, y luego se extraen de uno en uno, aleatoriamente, hasta completar el tamaño de la muestra.
Cuando la población es muy grande, se puede recurrir a los números aleatorios.
Prof.: David Becerra Rojas 9
Muestreo Estratificado
Método de selección, utilizado cuando la población, está dividida en grupos llamados estratos, cada uno, formado por una gran cantidad de elementos homogéneos.
Se toma una muestra aleatoria simple, en cada estrato.
Los estratos, pueden ser de igual o distinto tamaño, si son distintos, una manera posible de determinar el tamaño de la muestra al interior de cada estrato, es que esta sea proporcional al tamaño del mismo, a este tipo de asignación, se le conoce como Afijación Proporcional, que no siempre resulta la mejor, debido al costo de muestreo en cada estrato.
Prof.: David Becerra Rojas 10
Muestreo Sistemático
Este método, se utiliza cuando la población tiene sus elementos ordenados. Se divide la población (de tamaño N) en tantas sub poblaciones, como sea el tamaño de la muestra (n), todas de igual tamaño (k = N/n).
Se selecciona al azar un elemento de la primera sub población, y de ahí en adelante, de las sub poblaciones siguientes, se extrae el elemento correspondiente.
Prof.: David Becerra Rojas 11
Muestreo por Conglomerado
Se utiliza, cuando la población, está dividida en una gran cantidad de pequeños grupos, llamados Conglomerados, cada uno formado por elementos heterogéneos. Se toma una muestra aleatoria de Conglomerados, y luego se censan todos los conglomerados seleccionados.
Prof.: David Becerra Rojas 12
Tipos (Género) de Variable
1.- Numéricas : a.- Discretasb.- Continuas
2.- Categóricas: a.- Ordinalesb.- Nominales
Prof.: David Becerra Rojas 13
Organización de Datos
Consideremos que la variable X, se divide
En k clases o categorías, denominadas:
C1 , C2 , …………… C i ,……… Ck
Dando origen a la Siguiente tabla de Frecuencia
Prof.: David Becerra Rojas 14
Tablas de Frecuenciai X ni fi Ni Fi
1 C1 n1 f1 N1 F1
2 C2 n2 f2 N2 F2
: : : : : :
i Ci ni fi Ni Fi
: : : : : :
k Ck nk fk Nk Fk
T o t a l n 1 /// ///
Prof.: David Becerra Rojas 15
Tablas de Frecuencias
Frecuencia Absoluta: (ni )
Frecuencia Relativa : ( fi =ni/n )
Frecuencia Acumulada Absoluta: (Ni)
Frecuencia Acumulada Relativa : (Fi =Ni/n )
Prof.: David Becerra Rojas 16
Ejemplo 1:
M MB B B R M MM R MB MB R B B M R B B R MB B B B R M MM B R R B R B R
Tablai X1 MM2 M3 R4 B5 MBTotal
Determine: a.- La variable x:b.- El típo de Variable:c.- Una tabla de frecuencia
ni 2 41012 432
fi
.06
.13
.31
.38
.121.0
Ni
2 6162832//
Fi
.06
.19
.50
.881.0//
Opinión de alumnos por una bebida nueva
d.- Determine e Interprete k= f4=
n3= N3=
n= F3=e.- ¿Cuantos alumnos consideran que
la bebida es al menos regular?
5
1032
.38
16
.50
26 alumnos
Opinión de los alumnos…..
Categórica Ordinal
Prof.: David Becerra Rojas 17
Ejemplo 2:
4 3 5 8 3 6 3 2 2 4 4 3 3 5 8 6 8 3 6 6 4 3 5 2 2 4 6 6 3 5
Tabla
i X
1 22 33 44 55 66 77 8Total
Determine: a.- La variable X:b.- El típo de Variable:c.- Una tabla de frecuencia
ni
485460330
fi
.13
.27
.17
.13
.20
.00
.101.0
Ni
4121721272730//
Fi
.13
.40
.57
.70
.90
.901.0//
Número de artículos defectuosos por día.
d.- Determine e Interprete k= f4=
n3= N4=
n= F3=
e.- ¿En cuantos días el número de artículos defectuosos fue de al
menos 4?
75
30
.1321
.57
18 días
Número de artic. Defec. Por día
Numérica Discreta
f.- ¿Cuál fué el número máximo de artículos def. por día en los 15 días que hubieron menos?
4 artículog.- ¿Cuántos artículos en total, se juntaron en Los 6 días en que hubieron más? 42 art.
Prof.: David Becerra Rojas 18
Tabla de Frecuencia con Intervalos de Clase
1. Rango: R = Valor Máx. – Valor mín. + 1u (1u:
Una unidad de medida)
2. Cantidad de Intervalos, Según Sturger´s: k = 1 + 3.3 log(n) kN
3. Amplitud: a = Rk (a valor superior cuando no es exacto)
Aparentes (XA)
6. Marcas de Clases (Xi)
Ej. Si 1u = 0.01
y a= R/k = 4.571 4.58 ( se expresa en la unidad de medida)4. Adicionales: p = a*k –R5. Intervalos :
Xi = ( Ls + Li ) 2
Características (XA):
1.- Limite inferior del primer intervalo corresponde al valor mínimo menos las p* unidades adicionales correspondientes .
2.- Limite superior del último intervalo corresponde al valor máximo más las p** unidades adicionales correspondientes.3.- Se expresan en la unidad de medida.4.- Están separados por una unidad de medida.
Reales (XR)
Características ( XR):
Se obtienen a partir de los Intervalos Aparentes, ampliando estos en media unidad de medida hacia cada extremo, de tal manera, que el limite superior de un intervalo, corresponda al inferior del intervalo siguiente.
Obs.: La amplitud (a), se puede obtener de la diferencia entre dos limites
inferiores o superiores consecutivos, o entre dos marcas de clases consecutivas
Prof.: David Becerra Rojas 19
Ejemplo
Sea Valor mínimo= 4.7Valor Máximo = 12.6n = 42
Determine los intervalos aparentes y reales con sus respectivas marcas de clase.
Prof.: David Becerra Rojas 20
1. Rango R = 12.6 – 4.7 + 0.1 = 8.02. K = 1 +3.3 log(42) = 6.4 63. a = 8.0 6 = 1.33 1.44. P = 1.4*6 -8.0=0.4
5.=Intervalos : i XA XR Xi
123456
4.5 – 5.8
5.9 – 7.2
7.3 – 8.6
8.7 – 10.0
10.1 – 11.4
11.5 – 12.8
4.45 – 5.855.85 – 7.257.25 – 8.658.65 – 10.0510.05 – 11.4511.45 – 12.85
5.15 6.55 7.95 9.3510.7512.15
Prof.: David Becerra Rojas 21
Ejemplo 2:
Considere los siguientes datos:0.94 1.05 0.86 0.94 0.96 1.03 1.010.78 0.84 0.86 1.04 0.76 0.65 0.70
Confeccione una tabla de frecuencia Con 5 intervalos.
Prof.: David Becerra Rojas 22
1. Rango R = 1.05 – 0.65 + 0.01 = 0.412. K = 53. a = 0.41/5=0.082 0.094. P = 0.09*5 -0.41=0.04
5.=Intervalos : i XA XR Xi ni fi Ni Fi
12345
0.63 – 0.71
0.72 – 0.80
0.81 – 0.89
0.90 – 0.98
0.99 – 1.07
0.625 – 0.715
0.715 – 0.805
0.805 – 0.895
0.895 – 0.9850.985 – 1.075
0.670.760.850.941.03
2 2 3 3 414
0.140.140.210.210.291.00
2 4 71014
0.140.280.490.701.00
Prof.: David Becerra Rojas 23
Complete la siguiente Tabla
1 - 12
2 - 0.20 12.6
3 - 48
4 - 0.80
18.4
5 - 120
Total //// ///// /////
i XR ni fi Ni Fi Xi
24
12
9648
24
9.7
21.3
15.5
8.25
11.15 14.05
14.05 16.95
16.95 19.85
19.85 22.75
36
12
120
Luego como a = 2.9
11.15
Prof.: David Becerra Rojas 24
TIPOS de GRÁFICOS
Gráfico de BarrasGráfico de SectoresHistogramaPolígonoOjiva PíctogramaDiagrama de Caja y Bigote (Tarea)
Categóricas y Numéricas Discretas
Categóricas
Numéricas Continuas
Numéricas Continuas
Numéricas
Numéricas y Categóricas
Principalmente en variables :
Prof.: David Becerra Rojas 25
Gráfico de Barras
0
5
10
15
20
25
30
H A K M B
ni
xi
Prof.: David Becerra Rojas 26
Gráfico de Sectores (ó Circular)
1234
Prof.: David Becerra Rojas 27
Histograma
3.5 5.5 7.5 9.5 11.5 13.5 XR
| | | | | | | _________________________
ni
120
100
80
60
40
20
Prof.: David Becerra Rojas 28
0
20
40
60
80
100
120
Polígono
2.5 4.5 6.5 8.5 10.5 12.5 X i
ni
Prof.: David Becerra Rojas 29
Ojiva
,00%
20,00%
40,00%
60,00%
80,00%
100,00%
1 2 3 4 5 6 7 8 9 10
Fi
Prof.: David Becerra Rojas 30
Pictograma
1990199520002005
1000 ejemplares
Consumo de carne de vacuno
Prof.: David Becerra Rojas 31
Ejemplo 1i xi ni fi
1 H 10 .143
2 A 18 .257
3 K 12 .171
4 M 5 .071
5 B 25 .357
To tal 70 1.00
fix360
51.4
92.5
61.6
25.6
128.5
360
Confeccione un gráfico de Barras y uno de Sectores
()ºac
51.4
143.9
205.5
231.1
360.0
/////
Prof.: David Becerra Rojas 32
i 1234
X 4 - 5 6 - 7 8 - 910 - 11T otal
ni407510530250
fi.16.30.42.121.0
Ni40115220250
Fi.16.46.881.0
Xi4.56.58.510.5
Ejemplo 2
Confeccione un: Histograma, un Polígono, y un Ojiva
Prof.: David Becerra Rojas 33
Ejercicio Supongamos que los datos siguientes representan
los tiempos, que demoran unos atletas en terminar una maratón.
1:35 1:28 1:45 1:52 1:40 1:30 1:381:47 1:37 1:30 1:40 1:36 1:29 1:35 1:37 1:36 1:40 1:36 1:48 2:05 1:322:28 1:45 1:50 1:47 2:29 1:44 1:49
1. Identifique la variable2. Indique el género ( tipo)3. Construya una tabla de frecuencia de 5 intervalos4. Confeccione un; Histograma, Ojiva
Prof.: David Becerra Rojas 34
ESTADISTICOS ( o
Estimadores)
CUANTILES ( Estadísticos de Orden)MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE DISPERSIÓN
Prof.: David Becerra Rojas 35
CUANTILES: ( ESTADÍSTICOS DE
ORDEN)
Cuartíles : ( Kk )
Quintíles : (Qq)
Decíles : ( Dd )
Percentíles : ( Pp )
Prof.: David Becerra Rojas 36
Cuartiles:
K1 K2 K3
25%
50%
75%
k = 1, 2, 3
Prof.: David Becerra Rojas 37
Quintiles:
q x 20%
Q = 1, 2, 3, 4
Prof.: David Becerra Rojas 38
Deciles:
Dd
(10*d)%
d = 1, 2, ….., 9
Prof.: David Becerra Rojas 39
Percentíles:
Pp
p%
p = 1, 2, …., 99
Prof.: David Becerra Rojas 40
EjercicioLa tabla siguiente, representa los años deServicio de los trabajadores de una empresa.
i Xi ni
1 3 152 6 183 9 264 10 385 12 306 18 25Total 152
1.- Calcular : K1 , Q3 , D2 , P45Ni
15335997127152
Fi
0.090.220.390.640.841.00
2.- ¿Cuál es el año de servicio mínimo
de los 30 trabajadores más antiguos
12 años
K1 = 9
P45 = 10
Q3 = 10
D2 = 6
Prof.: David Becerra Rojas 41
Cuantiles:
Li : Limite real inferior del intervalo que contiene el cuantil t, que es aquel donde por primera vez la frecuencia acumulada pasa el (t/Sx100)%.S : 4, 5, 10, 100 ( Cuartil, Quintil, Decíl, Percentil , respectivamente)Nt-1: frec. Acumulada anterior al intervalo que contiene el Ct.nt : frec. Absoluta del intervalo que contiene el Ct.a : Amplitud del intervalo. n : Tamaño de Muestra ( Total de Datos)
ttt n
aN
S
ntLiC *
*1
t : 1,2,3 Cuartiles 1,2,3,4 Quintiles 1,2…..9 Deciles 1,2,……99 PercentilesCuando los datos están ordenados en una tabla de frecuencia
Con intervalos de clase, se puede utilizar la siguiente expresión
Prof.: David Becerra Rojas 42
Ejemplo
8
6.0*4
10
50*195.21
D
5
6.0*37
4
50*375.43
K
i X 1 2.4 - 2.92 3.0 - 3.53 3.6 - 4.14 4.2 - 4.75 4.8 - 5.36 5.4 - 5.9 Total
ni
4 81510 5 850
Ni
41227374250
fi
.08
.16
.30
.20
.10
.161.0
Fi
.08
.24
.54
.74
.841.0
= 4.81
= 3.025
Determine : K3 , D1 , P35, y P74 , Q3
= 3.77
Si la variable X representa la utilidad en M$ por día determine: i.- ¿Cuál fue la utilidad máxima de los 15 días que ganó menos?
ii. ¿En cuántos días la utilidad fue de al menos M$ 5.0? 11 días
P74 = 4.75
M$ 3.67
15
6.0*12
100
50*3555.335
P
Q3 = 4.33
Prof.: David Becerra Rojas 43
MEDIDAS DE TENDENCIA CENTRAL
MODAMEDIANAMEDIA ARITMÉTICAMEDIA ARMÓNICAMEDIA GEOMÉTRICA
Prof.: David Becerra Rojas 44
MODA ( ó MODO)
La denotaremos por : Mo
a.- Está dada por la observación que más se repite ó la de mayor frecuencia.
b.- Es posible calcularla para cualquier tipo de variable.
c.- Pueden existir muchas o ninguna.
Prof.: David Becerra Rojas 45
MODA Ejemplo 1: Sean los siguientes datos:
F D R F T D R U D U U D
i Xi ni
1 F 22 D 43 R 24 T 15 U 3Total 12
Luego; en este caso la Moda es: Mo = D
Prof.: David Becerra Rojas 46
MODAEjemplo 2 : 2 3 5 1 1 5 2 5 4 2 4 2 5 1 6
i Xi ni
1 1 32 2 43 3 14 4 25 5 46 6 1Total 15
En este caso tenemos dos Mo:Mo1= 2 Mo2 = 5
Prof.: David Becerra Rojas 47
MODALa moda para datos tabulados, se obtiene a partir de la siguiente expresión:
Donde: Li : Limite real inferior del intervalo que contiene la Mo que es aquel que tiene mayor frecuencia
1 : Diferencia entre las frecuencias absolutas del intervalo modal y
el intervalo anterior.
2 : Diferencia entre las frecuencias absolutas del intervalo modal y
el intervalo posterior.
a : Amplitud del intervalo.
aLiM o *21
1
Prof.: David Becerra Rojas 48
i 1234
X 4 - 5 6 - 7 8 - 910 - 11T otal
ni
42 68102 38250
Ejemplo :
2*6434
345.7
oM = 8.19
Calcule la Moda
aLiM o *21
1
Prof.: David Becerra Rojas 49
MEDIANALa denotaremos como : MdPuntuación que divide la distribución de los datos (ó la muestra) en dos partes iguales.Es decir nos indica el punto hasta donde se tiene acumulado el 50% de las observaciones.Nota: - Para su determinación, los datos se ordenan previamente. - No tiene sentido cuando la variable es categórica nominal.
Prof.: David Becerra Rojas 50
MEDIANA
Si el número de observaciones impar, entonces la Md estará dada por la observación central.Si el número de observaciones par, entonces la Md estará dada por el promedio de las dos observaciones centrales.
Prof.: David Becerra Rojas 51
MEDIANAEjemplo: 1 2 3 5 7 9 10 27 29 30 38 40 n=11
En este caso la Md = 10
Ejemplo: 2 2,3 2,6 3,6 5,8 6,8 7,9 n=6
Luego ; Md = (3,6+5,8)/2 = 4,7
Prof.: David Becerra Rojas 52
MEDIANALa mediana para datos tabulados, se obtiene a partir de la siguiente expresión:
Donde: Li : Limite real inferior del intervalo que contiene la Md, que es aquel donde por primera vez la frecuencia acumulada pasa el 50%.
n : Tamaño de la muestra
N d-1 : Frec. acumulada anterior al intervalo que contiene la Mediana. n d : Frec. Absoluta del intervalo que contiene la Md
a : Amplitud del intervalo.
ddd n
aN
nLiM *
2 1
Prof.: David Becerra Rojas 53
Ejemplo: dado los siguientes datos:
MEDIANA
i Xi 1 42 53 64 75 86 9 Total
ni
3 2 2 3 4 317
Determine; Md
4 4 4 5 5 6 6 7 7 7 8 8 8 8 9 9 9
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Ni
3 5 7101417
Fi
.18
.29
.41
.59
.821.0
Md = 7
Prof.: David Becerra Rojas 54
Ejemplo de Mediana
i X 1 4 - 52 6 - 73 8 - 94 10 - 115 12 - 136 14 - 15 Total
ni
4 81518 2 350
Ni
41227454750
fi
.08
.16
.30
.36
.04
.061.0
Fi
.08
.24
.54
.90
.941.0
Luego la Md = 9.23
y la Moda Mo = 9.82
Determine; Md , Mo
15
2*12
25.7
n
M d
Prof.: David Becerra Rojas 55
Ejercicio.4.8 3.6 5.2 6.1 6.0 2.9 3.5 4.8 4.3 4.24.8 3.1 4.8 2.9 5.55.0 4.8 5.6 6.01.Calcular Mo , Md
2.Construya una tabla de frecuencia3.Calcule de la tabla Mo , Md.4.Comente.
Prof.: David Becerra Rojas 56
MEDIA ARITMÉTICALa media Aritmética también llamada Promedio ó simplemente Media, y esta dada para datos no tabulados por : (Se calcula solamente en variables numéricas)
Donde: Xi : Corresponde a las Observaciones
n : Tamaño de la Muestra
N : Tamaño de la Población
n
XX
n
ii
1
N
XN
ii
1
MuestralPoblacional
Prof.: David Becerra Rojas 57
Donde: Xi : Observación ó Marca de Clase
n : Tamaño de la muestra
ni : Frecuencia Absoluta de la observación o del intervalo
k : Número de intervalos
MEDIA ARITMÉTICA
Para datos Tabulados la Media está dada por :
n
XnX
k
iii
1
k
iiixf
1
Prof.: David Becerra Rojas 58
Ejemplo: La tabla siguiente representa una muestra de los años de servicio de trabajadores.
i12345
Xi 510121520
ni 4 7 8 3 224
Xi*ni 20 70 96 45 40271
fi0.1670.2920.3330.1250.0831.00
fixxi0.8352.9203.9961.8751.66011.286
--------------------------------------------
--------------------------------------------Total
Determine la Media:
5
1iiixfX = 11.286
5
1i
ii
n
xnX
286.1124
271X
Prof.: David Becerra Rojas 59
Ejemplo 2: Se toma una muestra de 21 observaciones, calcule la Media.
807.221
95.58
2.021
1595.2
i X1 2.3 - 2.42 2.5 - 2.63 2.7 - 2.84 2.9 - 3.05 3.1 - 3.26 3.3 - 3.4 Total
ni
4 5 3 2 4 321
xi
2.352.552.752.953.153.35
ni*xi
9.4012.758.255.9012.6010.0558.95
Luego como
ui
-3-2-1012
ni*ui
-12-10 -3 0 4 6-15
= 2.807an
unAX
k
iii
1
6
1i
ii
n
xnX
Prof.: David Becerra Rojas 60
MEDIA PONDERADA _ _ __ n1x1 + n2x2 +….+nkxk
xT = --------------------------------- n1 + n2+ …….+ nk
_ 100x480 + 300x320 + 400x Xc290 = --------------------------------------- 100 + 300 + 400
Ejemplo: En una empresa donde se distinguen tres tipos de trabajadores, el salario medio es de 290. Los 100 trabajadores de la categoría A tienen un salario medio de 480, los 300 de la categoría B tienen un salario medio de 320, ¿ Cuánto es el salario medio de los 400 de la categoría C?
_Luego Xc = 220
k
1i
x*nn
ii
Prof.: David Becerra Rojas 61
Tarea NºVentajas y Desventajas de: Moda, Mediana y Media.Defina y de un ejemplo de :Media Geométrica : (G)Media Armónica : (H)SesgoCurtosis
Prof.: David Becerra Rojas 62
Media Geométrica:
nnn xxxi
n
iG x *.....**
121
Media Armónica:
n
i ix
nH
1
1
Prof.: David Becerra Rojas 63
MEDIDAS DE DISPERSIÓN
Desviación Media: (DM)
Desviación Intercuartílica: (K)
Desviación Típica: ( s )
Varianza: ( s2 )
Rango: (R)
Prof.: David Becerra Rojas 64
MEDIDAS DE DISPERSIÓN
Rango: (R)
R = V. Máximo – V. Mínimo + 1 Unidad de Medida
Prof.: David Becerra Rojas 65
MEDIDAS DE DISPERSIÓN
Desviación Intercuartílica: (K)
213 KKK
Prof.: David Becerra Rojas 66
MEDIDAS DE DISPERSIÓN
Desviación Media: (DM)
Para datos No Tabulados
Para datos Tabulados
n
XX
DM
n
1i
i
n
XXnDM
k
iii
1
Prof.: David Becerra Rojas 67
MEDIDAS DE DISPERSIÓN
Varianza: (s2 ,2)
Poblacional
Muestral : Para datos No Tabulados
1
1
2
2
n
XXS
n
ii
)1n(n
xxn
2n
1i
i
n
1i
2i
21
2
1
2
2
)(
N
x
N
xN
ii
N
ii
Prof.: David Becerra Rojas 68
MEDIDAS DE DISPERSIÓN
1
1
2
2
n
XXnS
k
iii
)1(
2
11
2
nn
xnxnnk
iii
k
iii
Muestral : Para datos Tabulados
Prof.: David Becerra Rojas 69
Ejemplo
65
30X
5.7
4
30
11
2
2
n
XXS
n
ii
25
101
n
XXDM
n
ii
Obs. : x1 x2 x3 x4 x5 TotalXi : 2 5 6 8 9 30
Determinar: Desv Media Varianza
___
xi - x : - 4 -1 0 2 3 0 _ xi - x : 4 1 0 2 3 10 _(xi - x)2: 16 1 0 4 9 30
Sean las edades ( en año) de 5 niños
X2i : 4 25 36 64 81 210
5.7
4*5
30210*5
)1(
2
2
11
2
2
nn
xxn
S
n
ii
n
ii
Prof.: David Becerra Rojas 70
MEDIDAS DE DISPERSIÓNDesviación Típica: (S , σ)
1n
XX
S
n
1i
2i
)1(
2
11
2
nn
xxnn
ii
n
ii
21
2
1
2)(
N
x
N
xN
ii
N
iiPoblacional:
Muestral : Para datos No Tabulados
Prof.: David Becerra Rojas 71
MEDIDAS DE DISPERSIÓN
Para datos Tabulados
1
1
2
n
XXnS
k
iii
)1(
2
11
2
nn
xnxnnk
iii
k
iii
Prof.: David Becerra Rojas 72
COEFICIENTE DE VARIACIÓN
X
SCV
Mide la homogeneidad que existe en los datosRespecto a la variable en estudio.Mientras más pequeño, más homogéneo.
Prof.: David Becerra Rojas 73
Ejemplo 2
75.219
25.52: 1
n
xnXqueSabemos
k
iii
)119(19
25.52)61.145(19 2
i123456
X2.3 - 2.42.5 - 2.62.7 - 2.82.9 - 3.03.1 - 3.23.3 - 3.4
ni
45324119
xi
2.352.552.752.953.153.35
nixxi
9.4012.758.255.9012.603.3552.25
= 0.327
nixxi2
22.09 32.51 22.69 17.41 39.69 11.22145.61
Calcule: la Media , Desv. Típica
)1(
2
11
2
nn
xnxnn
S
n
iii
n
iii
119.075.2
327.0
x
sCV
Prof.: David Becerra Rojas 74
Ejemplo 2
an
unAX
k
iii
1
)119(19
19)67(192.0
2
)1(
2
11
2
nn
ununn
aS
n
iii
n
iii
i123456
X2.3 - 2.42.5 - 2.62.7 - 2.82.9 - 3.03.1 - 3.23.3 - 3.4
ni
45324119
xi
2.352.552.752.953.153.35
ui
-3-2-1012
ni*ui
-12-10 -3 0 4 2-19
= 2.75
ni*ui2
3620 3 0 4 467
= 0.327
Calcule: la Media , Desv. Típica por el Medio Provisorio
2.019
)19(95.2
Prof.: David Becerra Rojas 75
Coeficiente de Asimetría ( Sesgo )
Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existe asimetría a la izquierda.
de Pearson
de Fisher33
1
331 )(
1
Sxxn
S
k
iii
Prof.: David Becerra Rojas 76
Coeficiente de Curtosisi
caPlaticúrti
aMesocúrtic
caLeptocúrti
:0
:0
:0
2
2
2
33)(
144
1
442
Sxxn
S
k
iii
Prof.: David Becerra Rojas 77
Estadística Descriptiva Bivariante
Prof.: David Becerra Rojas 78
Sean las siguientes variables:
X : A1, A2, ...................Af
Y : B1, B2,.....................Bc
Estas variables, se pueden ordenar en una tabla de doble entrada llamada Tabla de Contingencia:
Estadística Descriptiva Bivariante
Prof.: David Becerra Rojas 79
Tabla de Contingencia
X \ Y B1 B2 ..Bj .. Bc Total A1 n11 n12 : n1. A2 n21 n22 : n2. Ai ……. ……. nij ……. ni. : : : Af : nf. Total n.1 n.2 ... n.j ..... n.c n
Prof.: David Becerra Rojas 80
Frecuencia Absoluta(Conjunta)
Se denota por nij y se define como: Cantidad de elementos que cuentan simultáneamente con la característica Ai de la variable X y Bj de la variable Y
Prof.: David Becerra Rojas 81
Frecuencia AbsolutaMarginal
ni.: Total de la fila i = nij
n.j : Total de la Columna j = nij
n.. : Total General = nij = n ( Tamaño muestra) i=1 j=1
j=1
c
f
f c
i=1
Prof.: David Becerra Rojas 82
Frecuencia RelativaConjunta
Se denota por fij = nij
n
Prof.: David Becerra Rojas 83
Frecuencia Marginal Relativa
fi. = fij =
f.j = fij =
f.. = fij = 1 i=1 j=1
j=1
c
f
f c
i=1
n
n
n.j
ni.
Prof.: David Becerra Rojas 84
Frecuencia Condicional
.. i
ij
i
ij
ij n
n
f
ff
j
ij
j
ij
ji n
n
f
ff
..
De x dado y ( x/y):
De y dado x ( y/x):
Prof.: David Becerra Rojas 85
Independencia de Variables
Diremos que dos variables X e Y son independientes si y solo si, la conjunta es igual al producto de las marginales, para todo i, y para todo j. Es decir;
n
nnno
fff
jiij
jijiij
..
..
*
,*
Prof.: David Becerra Rojas 86
Estadística Descriptiva Bivariante
Ejemplo: Considere una muestra de contenedores en un recinto portuario.
Sea X : Peso (toneladas) Y : País de origen
Determine e Interprete : f = n51 =
f34 =
n.. =n.3 =n2. =
fj=4/i=3 =fi=4/j=3 =f.2 =f4. =
c=5 4 8 27 24 121
10/121 24/121 33/121 7/24 10/25
0.083 0.20 0.27 0.29 0.40
X \ Y Francia Alemania Japón España Total
5 – 10 4 5 4 10 23
10 - 15 8 7 10 2 27
15 - 20 3 9 3 10 25
20 - 25 1 10 7 6 24
25 - 30 8 2 0 12 22
Total 24 33 24 40 121
Prof.: David Becerra Rojas 87
Asociación de Variables Numéricas
i12...n
Xx1
x2
.
.
.xn
Yy1
y2
.
.
.yn
Diagrama de Disperción
Variable X
Y
Prof.: David Becerra Rojas 88
Tipos de Asociación
Favorable :
. .
. . .
....
..
y
x
Inversa:
... ..
....
.
x
y
xi xj xjxi
yj
yi
yi
yj
Prof.: David Becerra Rojas 89
Sea X: Remuneración Y: Cargas
Familiares
1 1 3 4 4 5
2 3 3 5 2 6
-2 -1.5 -2 -0.5 0 -0.5 1 1.5 1 -1.5 2 2.5
123456
Ejemplo:
3 1 0 1.5 -1.5 5
)()( yyxx ))(( yyxx yxi
Total 18 21
Media 3.0 3.5 --------- 1.50 0 9
Prof.: David Becerra Rojas 90
Covarianza ( cov (x,y) )
n
yyxxyxCov
))((
),(
5.16
9),( yxCov
Prof.: David Becerra Rojas 91
Coeficiente de Correlación
-1 r 1r : Se expresa en porcentaje
yx ss
yxCovr
*
),(
))()()(( 2222 yynxxn
yxxynr
Prof.: David Becerra Rojas 92
X11344518
Y23352621
XY 2 3 920 830 72
i 1 2 3 4 5 6Total
X2
1 1 916162568
En nuestro caso tenemos:
Y2
4 9 925 43687
= 0.65)2187*6)(1868*6(
21*1872*622
))()()(( 2222 yynxxn
yxxynr
Prof.: David Becerra Rojas 93
Regresión Lineal
Y = a + bX
Consiste en ajustar a los datos (representados en el diagrama de Dispersión, una línea, que puede ser rectao curvilínea .
En esta oportunidad analizaremos el caso de la línea recta.Esta recta, también sirve para marcar la tendenciaDe los datos, para hacer proyecciones, y para estimaralgún valor de y dado un valor de x.
Prof.: David Becerra Rojas 94
Error: iii yye ˆ
Varianza del Error: (2)cuyo estimador está dado por:
2
)ˆ( 222
n
yySS ii
xye
Oyye iii )ˆ(
Prof.: David Becerra Rojas 95
Debemos minimizar la varianza del Error
Para tal efecto debemos minimizar:
22 )()ˆ( iiii bxayyyA
Es decir derivar A
Prof.: David Becerra Rojas 96
0
0
b
Aa
A
Sistema de Ecuaciones Normales
Prof.: David Becerra Rojas 97
ii
ii
yxbna
bxaya
A0)1()(2
Luego tenemos:
iiii
iii
yxxbxa
xbxayb
A
2
0))((2
Prof.: David Becerra Rojas 98
xyxbxa
yxbna
ii
i
2
Por lo tanto, el sistema de Ecuaciones Normalesqueda de la siguiente forma:
Prof.: David Becerra Rojas 99
Por determinante tenemos;
222 xxn
xx
xn
xyxxy
xxy
xya
22
yxxyn
xyx
ynb
aa
bb
Prof.: David Becerra Rojas 100
Estimadores Mínimos Cuadrado
22
2
)x(xn
xyxxya
22 )x(xn
yxxynb
a
b
XbY
Prof.: David Becerra Rojas 101
X11344518
Y23352621
XY 2 3 920 830 72
i 1 2 3 4 5 6Total
X2
1 1 916162568
En el caso que estamos analizando tenemos:
Y2
4 9 925 43687
^
Y2.22.23.54.14.14.8
( e )
^
Y - Y-0.2 0.8-0.5 0.9-2.1 1.2 0.0
( e2 )
^
(Y – Y)2
0.04 0.64 0.25 0.81 4.41 1.44 7.59
y la varianza del error es 898.14
59.7
2
)ˆ( 22
n
yyS ii
xy
Luego tenemos que;
57.1
18)68(
)72)(18()68)(21(2
n
a 64.0
18)68(
)21)(18()72(62
n
b
Prof.: David Becerra Rojas 102
Error Típico: ( )
38.1898.14
59.7
2
)ˆ( 22
n
yySS ii
exy
2
2
n
xybyaySS
xye
También se puede obtener a partir de:
Prof.: David Becerra Rojas 103
Coeficiente de Determinación
El coeficiente de Determinación, nosindica la variabilidad explicada por la rectade regresión lineal, es decir que tan buenoes el ajuste de la recta.
Esta dado por: r2
0 r2 1
Nota: Referencia para el ajuste, también lo da
el error típico Sy/x
Prof.: David Becerra Rojas 104
Ejemplo:Supongamos que tenemos dos variables: X : Años de servicio de vendedores.
Y : Ventas en M$
Vendedor 1 2 3 4 5 6Total
X22344520
Y1.22.44.13.12.43.817.0
XY2.44.8
12.312.4
9.619.060.5
X2
449
16162574
Y2
1.445.76
16.819.615.76
14.4453.82
1. Confeccione un diagrama de dispersión2. Determine el grado de asociación entre las variables3. Estime a través de una recta de m. c. ¿cuanto debiera vender
un vendedor con siete años de servicio?. 4. Estime a través de una recta de m. c. ¿cuanto años de servicio
debería tener, un vendedor que vende m$ 4.0?.
Prof.: David Becerra Rojas 105
)2.)17(.)82.53(6)(2.)20(.)74(6(
.)17.)(20()5.60(6
)2)y(2yn)(2)x(2xn(
yxxynr
222 )20()74(6
)17)(20()5.60(6
)x(xn
yxxynb
222
2
)20()74(6
)5.60)(20()74)(17(
)x(xn
xyxxya
Luego:
1.09
.523
=.5954
Prof.: David Becerra Rojas 106
Varianza del Error:
Error Típico:
22
)ˆ( 222
n
xybyay
n
yyS ii
xy
22
)ˆ( 22
n
xybyay
n
yyS ii
xy =.9552
=.9124
Prof.: David Becerra Rojas 107
Las propiedades de la media son las siguientes:- La media de una constante es la propia constante.- La media de la suma o diferencia de variables es igual a la suma o diferencia de las medias de dichas variables.- La media del producto de una constante por una variable, es igual a la constante por la media de la variable.- La media de una combinación lineal de dos o más variables es igual a la combinación lineal de las medias de dichas variables.- La media es el centro de gravedad de la distribución, ya que las desviaciones respecto a la media suman 0.
- Mediana: La mediana es el valor del elemento que ocupa el lugar central, si los datos están ordenados, bien de forma creciente o de forma decreciente.- Moda: La moda es el valor más frecuente, es decir es el valor de la variable que se repite un mayor número de veces.En el caso de una distribución totalmente simétrica, la media y la mediana coinciden. Si la media y la mediana difieren mucho significa que hay heterogeneidad entre los datos y que la distribución, por tanto será asimétrica.
Prof.: David Becerra Rojas 108
Las propiedades de la varianza son:- La varianza es siempre positiva o cero.- La varianza de una constante es cero.- La varianza de la suma o diferencia de una variable y una constante es igual
a la varianza de la variable.- La varianza de un producto de una constante por una variable es igual al
cuadrado de la constante por la varianza de la variable.
Las propiedades de la desviación típica son:- La desviación típica es siempre positiva o cero.- La desviación típica de una constante es cero.- La desviación típica de una constante por una variable es igual a la
constante por la desviación típica de la variable.- La desviación típica de la suma o diferencia de una variable y una constante
es igual a la desviación típica de la variable.
Prof.: David Becerra Rojas 109
Teorema 3.5.5. (Propiedades de ) Para una distribución bien definida, el operador de valor esperado cumple:
Escala:
Adición:
Independencia: si X e Y son independientes.
Composición:
No desviado:
Prof.: David Becerra Rojas 110
Teorema 3.5.6. (Propiedades de la varianza) Para una distribución bien definida, la varianza cumple:
Origen:
Adición: si X e Y son independientes.
Escala:
Prof.: David Becerra Rojas 111
Ejercicio:X \ Y Chilena Argentina Peruana Brasileña Total 5 – 10 4 2 4 10 20 10 – 15 8 3 1 12 24 15 – 20 3 9 3 10 25 20 – 25 0 10 1 10 21 25 - 30 5 2 0 15 22 Total 20 26 9 57 112
Determine:1.- Cuántos turistas chilenos app llevan un peso no superior a 12kr.2.- ¿Podemos decir que el comportamiento del peso que llevan los turistas argentinos , es mas homogéneo del que llevan los brasileros? 3.- Determine e interprete:4.- Determine el grado de asociación respecto al peso de equipaje, entre los turistas chilenos y argentinos.5.- A través de una recta de m. c. estime cuántos turistas deberían llevar un peso 27.5kr
Se toma una muestra de 112 turistas registrando el peso de equipaje y nacionalidad.
fj=1/i=2 =
Prof.: David Becerra Rojas 112
Cuartiles
Li : Limite real inferior del intervalo que contiene el cuartil t, que es aquel donde por primera vez la frecuencia acumulada pasa el (k/4x100)%.
kkk n
aN
nkLiK *
4
*1
Prof.: David Becerra Rojas 113
Quintiles( Qq ) q = 1,…..,99
Li : Limite real inferior del intervalo que contiene el percentil q, que es aquel donde por primera vez la frecuencia acumulada pasa el (q%)
qqq n
aN
nqLiQ *
5
*1
Prof.: David Becerra Rojas 114
Deciles( Dd ) d = 1,….,9
Li : Limite real inferior del intervalo que contiene el decil d, que es aquel donde por primera vez la frecuencia acumulada pasa el (d*10)%
ddd n
aN
ndLiD *
10
*1
Prof.: David Becerra Rojas 115
Percentiles( Pp ) p = 1,…..,99
Li : Limite real inferior del intervalo que contiene el percentil p, que es aquel donde por primera vez la frecuencia acumulada pasa el (p%)
ppp n
aN
npLiP *
100
*1