UNIVERSIDAD SALESIANA DE BOLIVIA
INGENIERÍA DE SISTEMAS
DOSSIER
Docente : Dr. Ing. NICOLÁS SALVADORAsignatura : Inferencia Probabilística
Gestión : 2 / 2012
La Paz – Bolivia
ÍNDICE
I. INTRODUCCIÓN. ............................................................................................ 1
1. PRESENTACIÓN........................................................................................ 2
BASES PEDAGÓGICAS DEL PRESENTE DOSSIER. ................................... 2
2. OBJETIVO .................................................................................................. 3
II. CONTENIDO DEL DOSSIER .......................................................................... 4
1. INFERENCIA PROBABILÍSTICA ................................................................ 4
ESTADÍSTICA.- ............................................................................................... 4
ESTADÍSTICA DESCRIPTIVA.- ...................................................................... 4
ESTADÍSTICA INFERENCIAL......................................................................... 4
TIPOS DE VARIABLES BIDIMENSIONALES.- ............................................... 6
2. INFERENCIA ESTADÍSTICA.-.................................................................... 6
POBLACIÓN.-.................................................................................................. 7
MUESTRA.- ..................................................................................................... 7
3. FORMAS DE ANOTACIÓN DE LOS PARÁMETROS Y ESTADÍGRAFOS. 8
PARÁMETRO.- ................................................................................................ 8
ESTADÍGRAFO.- ............................................................................................. 8
4. VARIABLES ALEATORIAS.-....................................................................... 8
NOTACIÓN DE PROBABILIDAD.- .................................................................. 8
ESPACIO MUESTRAL.- .................................................................................. 9
SUCESO O EVENTO.- .................................................................................... 9
5. VARIABLES ALEATORIAS....................................................................... 11
INTRODUCCIÓN.-......................................................................................... 11
DESVIACIÓN ESTÁNDAR DE UNA VARIABLE ALEATORIA.- .................... 15
VARIABLE ALEATORIA BIDIMENSIONAL DISCRETA.- .............................. 17
FUNCIÓN DE DISTRIBUCIÓN ACUMULADA BINARIA.- ............................. 18
DISTRIBUCIONES MUESTRALES................................................................... 24
DIFERENCIA ENTRE ESTADÍSTICA Y PARÁMETROS: ............................. 24
DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE MEDIAS:....................... 33
6. ESTIMACIONES ....................................................................................... 35
7. TEORÍA DE TCHEBITCHEB.- .................................................................. 42
8. FRECUENCIA DE OBSERVACIÓN QUE SE ENCUENTRA A K
DESVIACIÓN STANDARD DE LA MEDIA PARA LOS DATOS DE LA TABLA
ANTERIOR.-...................................................................................................... 45
9. DETERMINACIÓN DEL TAMAÑO DE UNA MUESTRA........................... 46
TEORÍA DE LA DECISIÓN ESTADÍSTICA (DOCIMA O DOCIMASIA).- ....... 50
DISTRIBUCIÓN DE PROBABILIDAD: ........................................................... 54
PROBLEMAS DE DOCIMACÍA: .................................................................... 57
REGRESIÓN LINEAL Y CORRELACIÓN:..................................................... 61
CARACTERÍSTICAS DE LAS RECTAS: ....................................................... 66
HIPÓTESIS SOBRE LA DISTRIBUCIÓN DE PROBABILIDAD: .................... 67
ANÁLISIS DE REGRESIÓN: ......................................................................... 68
ANÁLISIS DE CORRELACIÓN:..................................................................... 73
III. GLOSARIO .................................................................................................. 78
IV. ANEXOS
1
I. INTRODUCCIÓN.
En el campo de la educación la sociedad actual tiende a la Sociedad del
Conocimiento.
El hecho de aprender a administrar y controlar el proceso de aprendizaje en la
transición hacia esa Sociedad del Conocimiento es un reto constante y dinámico.
En éste sentido aquellas organizaciones dedicadas a la Educación deben revisar y
analizar sus procesos educativos, adaptando currículos a las necesidades del
momento, a los nuevos retos y situaciones.
Educar es un modo de cooperar entre educadores y educandos para que
transformen sus vidas, en un proceso permanente de aprendizaje; educar es
ayudar a que los alumnos construyan su propia identidad, su futuro, a que llenen
sus aspiraciones en un plano personal y profesional; educar es también el
desarrollo de sus habilidades de comprensión y comunicación que permitan a que
los alumnos lleguen a ser ciudadanos realizados. Entonces la acción de educar
mejor, se reflejará en una reacción, que ofrecerá la posibilidad de tener menor
corrupción, menor delincuencia, menor atraso, es decir, desarrollar una sociedad
más competitiva, un país positivo en su avance hacia una sociedad libre.
Cooperar personalmente a la realización de éste plan, es la política educativa que
como docente, se desea llevar a cabo en la U.S.B.
Es evidente que un grano de arena puede ser muy poco en la playa de la
indiferencia y el estatismo, pero la gota de agua horada la roca y juntos todos los
docentes podemos cumplir la meta.
2
1. PRESENTACIÓN
BASES PEDAGÓGICAS DEL PRESENTE DOSSIER.
a. Así como a su tiempo tanto la escritura, como la imprenta al constituirse en
grandes revoluciones técnicas, transformaron a la educación, actualmente la
autística virtual con una estructura muy distinta a la de los entornos reales o
naturales, donde tradicionalmente se ha desarrollado la educación, conduce
inexorablemente a la “Sociedad del Conocimiento”.
El espacio virtual (“Aula sin paredes”) siendo en su naturaleza:
representacional, distal, multicrónico, dependiente no de recintos espaciales,
sino de redes electrónicas, como entorno de multimedia, no se constituye sólo
en un nuevo medio de información y comunicación, sino más aun, en el espacio
para la interacción, en este sentido como un nuevo camino para la educación,
como un aula sin paredes.
Actualmente no basta con enseñar a leer, escribir, contar y a comportarse,
dentro de los espacios naturales y urbanos en los que tradicionalmente se ha
desarrollado la vida social; a esto al presente es preciso implementar la escuela
digital y virtual, requiriendo la sociedad de la información, un nuevo tipo de
alfabetización, esto involucra la necesidad de adquirir nuevas habilidades y
destrezas, para intervenir competitivamente en el espacio cibernético.
En este sentido nuestra condición de “Analfabetos Funcionales” en el nuevo
espacio social nos impele a buscar conocimientos en estos caminos virtuales,
es decir aplicar SISTEMAS INFORMÁTICOS como sendas nuevas para la
educación.
b. Llevar a cabo el proceso anteriormente indicado y orientarlo en su aplicación a
grupos de APRENDIZAJE COOPERATIVO, precisamente basados en la
3
interacción entre pares y entre estos y el conductor. En nuestro caso entre
alumnos y entre alumnos y el docente, es un segundo componente de éste
modelo.
c. Y si a éstos dos predicamentos se añaden los valores del ESPÍRITU
SALESIANO, nacidos del sistema preventivo de Don Bosco donde la opción
prioritaria esta dedicada a los jóvenes y sobre todo a los provenientes de
clases populares, acomodando en la educación virtual los preceptos que
indican: Una estrecha relación entre cultura, educación y una experiencia
comunitaria con espíritu de familia, de los profesores con y para los alumnos,
demostrando un estilo educativo basado en la: “Amorevoleza”, entonces se
habrá tratado de implementar una nueva forma de enseñanza y aprendizaje
acorde a los tiempos.
Esta es nuestra proposición pedagógica, conjuncionar los tres criterios
mencionados: Métodos Informáticos, Aprendizaje Cooperativo y Estilo
Salesiano, aplicado a un área especifica de Ingeniería de Sistemas, es decir a
una asignatura particular de la malla curricular como es la “Inferencia
Probabilística” con el objeto de programar un plan que pueda ser aplicable en
la practica en la Universidad Salesiana.
2. OBJETIVO
Siendo un Dossier una Memoria Pedagógica que en general contiene los
lineamientos primordiales para la ejecución de un programa de estudios, un primer
objetivo fundamental del presente Dossier conjunto, es servir de guía al alumno en
la consecución de su programa de estudios en la asignatura de Inferencia
Probabilística mediante su consulta, el estudiante, podrá hacer un seguimiento de
los temas comprendidos en el plan de estudios para su propio control. Además
este Dossier puede servir como medio de orientación ya que al conocer de
antemano un tema determinado podrá por consulta en Internet, profundizar el
4
mismo ya sea por su importancia o por la necesidad de ampliar la base temática o
la ejecución de prácticas, ejercicios o problemas.
Luego un tercer objetivo del Dossier, consiste en oficiar de programador de
actividades en base a la descripción de temas mediante la cual el alumno podrá
programar sus clases de antemano en relación a exámenes parciales o finales
combinando el Dossier con los Planes de Disciplina respectivos.
II. CONTENIDO DEL DOSSIER
1. INFERENCIA PROBABILÍSTICA
ESTADÍSTICA.-
La estadística es una ciencia que proporciona métodos para recolectar, resumir,
dosificar, tabular, analizar, interpretar y presentar el comportamiento de los datos
de una materia de estudio investigación permitiendo generalizar y dar estrategias
de solución a los problemas emergentes siendo el motivo fundamental tratar de
descubrir diferencias que surgen de todas las variaciones en un problema. Como
ciencia y como arte la estadística está clasificada en dos grupos:
ESTADÍSTICA DESCRIPTIVA.-
La estadística descriptiva concretamente se refiere a recolectar y analizar los
datos de un problema.
ESTADÍSTICA INFERENCIAL
La estadística inferencial permite la toma de decisiones que den solución a un
problema.
La siguiente tabla nos da una idea de los propósitos de la información en la
5
Estadística General.
En el siguiente resumen mostraremos la clasificación de las series temporales y
atemporales:
Atemporales:
Frecuenciales:
Cualitativas:
Nominales
Ordinales
Cuantitativas:
Discretas
Continuas
Espaciales: Espacio Geográfico)
Temporales o Cronológicas
Problema
Realidad Estadística Descriptiva
RecolecciónOrganizaciónPresentación
Censo
Muestreo
EstadígrafoTrabajo Preparatorio
InferenciaEstadística
DecisiónEstadística
EstimaciónDocimasiaPredicción
Parámetro Conclusión
Información
Toma de Decisiones
6
TIPOS DE VARIABLES BIDIMENSIONALES.-
1. Variables bidimensionales cualitativas:
Grado de estudio – Nivel de conocimiento
Belleza – Popularidad
2. Variables bidimensionales cualitativas y cuantitativas:
Ocupación - Remuneración
Calidad – Precio
3. Variables bidimensionales cuantitativas:
Horas de trabajo – Horas de descanso
Precio – Tiempo de garantía
4. Variables bidimensionales cuantitativas-discretas:
Cantidad de empleados – Número de ropa de trabajo
Número de computadoras – Cantidad de fallas
5. Variables bidimensionales cuantitativas discretas y continuas:
Edad – Grado de envejecimiento
Número de hijos – Presupuesto para cada uno
6. Variables bidimensionales cuantitativas ambas continuas:
Densidad – fricción
Radio – Alcance o volumen
2. INFERENCIA ESTADÍSTICA.-
Si la estadística descriptiva tiene el fin de tratar los datos recogidos resumiéndolos
y describiéndolos la inferencia estadística se ocupa de analizar dichos datos para
obtener conclusiones para la toma de decisiones.
7
En la mayoría de los análisis estadísticos la descriptiva no es más que el trabajo
preliminar para la inferencia estadística.
Para comprender lo que quiere decir la inferencia estadística es necesario conocer
dos conceptos: muestra y población.
POBLACIÓN.-
Se usa indistintamente con el de universo y se refiere a la totalidad de posibles
observaciones o medias que se consideran en determinado problema. En concreto
la población son un conjunto de objetos, alumnos, edificios definidos con relación
a todos los miembros.
MUESTRA.-
Es un subconjunto de la población puesto que es una colección de observaciones
tomadas de una población en la cual toda característica se llama estadígrafo, por
lo tanto la inferencia estadística es una técnica mediante la cual se sacan
conclusiones o generalmente acceder de los parámetros de la población. Sin
embargo es necesario que dicha generalización puede estar equivocada porque
su cálculo o media puede estar basado en las probabilidades.
Las características de una población se llaman parámetros considerándose como
el verdadero valor. Calcular el verdadero valor de una población es difícil en la
investigación estadística por o general se considera la colección de información
parcial o incompleta
8
3. FORMAS DE ANOTACIÓN DE LOS PARÁMETROS Y ESTADÍGRAFOS.-
PARÁMETRO.-
Este es un valor verdadero y es una media de la población general, los valores de
los parámetros se desconocen.
ESTADÍGRAFO.-
Se conoce el valor del estadígrafo con el propósito de estimar un parámetro
desconocido. Un estadígrafo es conocido también como estadístico, medida de la
muestra, entre los más conocidos se tienen los promedios y los grados de
variabilidad.
· La media en la población: u
· La media de la muestra: x
· La varianza en la población: 2
· La varianza en la muestra: S2
· La desviación standard en la población: 2 =∑(x - u)2/N
· La desviación standard en la muestra: S2=∑(x - x)2/n
4. VARIABLES ALEATORIAS.-
NOTACIÓN DE PROBABILIDAD.-
En general si A es subconjunto d S, donde el suceso A puede ocurrir de n
maneras y S de N maneras entonces la probabilidad de un evento A está definida
por:
P(A)=n/N
O sea el número de elementos de A sobre el número de elementos de S.
9
En esta definición que corresponde a la teoría clásica de la probabilidad la misma
compara espacios equiprobables en la moderna teoría de la probabilidad las
relaciones son axiomáticas.
En un experimento probabilístico los casos posibles son todas las probabilidades y
casos favorables son aquellos casos que para posibilidades cumplen una
condición es decir:
P = casos favorables / casos posibles
ESPACIO MUESTRAL.-
Es el conjunto de todos los resultados posibles de un experimento dado
usualmente asignado por S o en algunos casos por 12 representado también
como conjunto universal.
Un elemento de S se llama punto muestral para describir correctamente un
espacio muestral asociado con un experimento debe tener una idea muy clara de
lo se requiere medir. Todo espacio muestral está asociado a un experimento por lo
tanto se debe decir correctamente Un espacio muestral.
SUCESO O EVENTO.-
Un suceso es simplemente un subconjunto de resultados posibles es decir es un
subconjunto del espacio muestral asignado como A.
El suceso que consta de un elemento se llama suceso elemental. El conjunto
vacío y el conjunto universo se llama suceso seguro.
De las definiciones anteriores resulta la siguiente relación de probabilidad:
O <= P <= 1
10
EJEMPLO.- Se hace rodar un dado correcto donde obtenemos como resultado
1,2,3,4,5,6 casos posibles, es decir la probabilidad es de 1 – 6 de que salga
cualquiera de los números indicados: P=1/6
Si el conjunto S = 1,2,3,4,5,6 deseamos obtener números pares A =2,4,6
entonces la probabilidad es:
P=3/6, entonces P=1/2
EJEMPLO.- Sea el experimento lanzar dos dados el espacio muestral será:
S=(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),
(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),
(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),
(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),
(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),
(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)
Donde A es la suma de punto igual o mayor a diez:
A=(4,6),(5,5),(5,6),(6,4),(6,5),(6,6)
Entonces: P = 6 / 36
EJEMPLO.- Sea el experimento lanzar dos monedas y un dado.
S=cc1,cc2,cc3,cc4,cc5,cc6,cs1,cs2,cs3,cs4,cs5,cs6,sc1,sc2,sc3,sc4,sc5,sc6,ss1,
ss2,ss3,ss4,s s5,ss6
Encontrar dos caras y un número par:
A=cc2,cc4,cc6
Entonces: P= 3/24
11
5. VARIABLES ALEATORIAS
INTRODUCCIÓN.-
En los ejemplos anteriores introducimos algunos modelos probabilísticos con
espacios muéstrales simples facilitando la comprensión del concepto de
probabilidad. Sin embargo en el estudio de situaciones más general precisamos
cumplir estos conceptos, estas variables numéricas con las cuales asociamos
modelos probabilísticos son llamadas variables aleatorias. La definición de
variable aleatoria está definida si consideramos a E como experimento y Ω un
espacio muestral en este experimento entonces una función x: Ω àR donde a
cada elemento W que pertenece a sigma W€Ω donde W€Ω se le asocia un
número real X = X (W)
El gráfico siguiente nos da una idea: f(x):Ω€R donde W€Ω se le asocia un número
real X donde X = X (W)
02516910082516899842516889600
EJEMPLO.-Sea el experimento:
S=(c,c,c),(c,c,s),(c,s,c),(s,c,c),(c,s,s),(s,c,s),(s,s,c),(s,s,s)
La variable aleatoria x toma los siguientes valores cuando están compuestos de
las tres caras.
X = X (W)
R
W
WW
W
W
W WW
WWW
12
X =x(c,c,c)= 3
X =x(c,c,s)=x(c,s,c)=x(s,c,c)=2
X =x(c,s,s)=x(s,c,s)=x(s,s,c)=1
X=x(s,s,s)=0
Rx = x/x=0,1,2,3
El concepto de variable aleatoria queda definido cuando un experimento aleatorio
asociado a Suna función x que asigna a cada elemento W uno y solamente un
número real x. El siguiente gráfico nos ilustrara.
R = 0,1,2,3
El nuevo conjunto R está conformado por números real es y nos permite el cálculo
de probabilidades del siguiente modo:
P [3] = P [(ccc)] =1/8
P [2] = P [(csc)] + P[ccs] + P[scc] =3/8
P [1] = P [(css)] + P[scs] + P[ssc] =3/8
P [0] = P [(sss] =1/8
OBSERVACIÓN 1.- En la definición de variable aleatoria observamos que dado un
punto W que pertenece al espacio muestral donde x pertenece a los
números reales este valor es un número real.
OBSERVACIÓN 2.- El rango conformado por todos los valores de las
variables aleatorias estará dado por el siguiente conjunto x=xi=WE Ω/x(W)=xi.
El dominio de la variable aleatoria x es Ω y el rango es un subconjunto que lo
denominamos Rx.
3210
ccs csc
ccs scc scc
css ssc
ssc
13
FUNCIÓN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA.- Sea x
un espacio muestral que pertenece a R con una variable aleatoria que toma los
valores x1,x2,...,entonces se dice que p(xi) es la función de probabilidad de una
variable aleatoria x. Si a cada valor de xi se asocia su valor de probabilidad
entonces expresamos la siguiente relación:
P(xi) = P[x=xi] = P[WE Ω /x(W)=xi]; i=1,2,...
EJEMPLO.- Sea el experimento de lanzar dos dados y observamos los números
que aparecen en la superficie o caras superiores de los dados bajo las siguientes
condiciones:
1) Encontrar la probabilidad x de la suma de los números que aparecen en los
dados. En este experimento los posibles valores serán: x(W)=i + j entonces: W
=(i,j)=2,3,4 Si tenemos x=2 corresponde al evento (1,1) con la probabilidad 1/36 es
decir: P[x=2]=P(1,1)=1/36. Considerando en forma similar para la suma de los
otros eventos, para los otros casos tenemos:
X 2 3 4 5 6 7 8 9 10 11 12P 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
2) Encontrar la función de probabilidad de la variable aleatoria y como
diferencia de los números que aparecen en las caras superiores de los
dados.
Análoga los valores de la variable aleatoria y(W)=i - j donde W=(i,j) son:
Y=-5 si ocurre (1,6)=1 Probabilidad
Y=-4 sí ocurre (1,5) o (2,6)=2 Probabilidad
Y=-3 si ocurre (1,4) o (2,5) o (3,6)=3 Probabilidad
Y=-2 si ocurre (1,3) o (2,4) o (3,5) o (4,6)=4 Probabilidad
Y=-1 si ocurre (1,2) o (2,3) o (3,4) o (4,5) o (5,6)=5 Probabilidad
14
Y=0 si ocurre (1,1) o (2,2) o (3,3) o (4,4) o (5,5) o (6,6)=6 Probabilidad
Y=1 si ocurre (2,1) o (3,2) o (4,3) o (5,4) o (6,5)=5 Probabilidad
Y=2 si ocurre (3,1) o (4,2) o (5,3) o (6,4)=4 Probabilidad
Y=3 si ocurre (4,1) o (5,2) o (6,3) =3 Probabilidad
Y=5 si ocurre (6,1) = 1 Probabilidad
Según el espacio muestral S la distribución de probabilidad de la variable
aleatoria está conformada de la siguiente manera:
Y -5 -4 -3 -2 -1 0 1 2 3 4 5P(Y)=P(Y=y) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Ry= -5,-4,-3,-2,-1,0,1,2,3,4,5
VARIABLE ALEATORIA DISCRETA.- Si el rango de la variable aleatoria x es un
conjunto finito se llama variable aleatoria.
EJEMPLO.- Lanzar una moneda tres veces, encontrar la distribución de
probabilidad en forma tabular y gráfica.
S= ccc,ccs,csc,scc,css,scs,ssc,sss
P[x=3]=1/8
P[x=2]=3/8
P[x=1 ]=3/8
P[x=0]=1/8
La representación tabular será:
x P(x)0 0.1251 0.3752 0.3753 0.125P(x) 1
15
De la tabla obtenemos el siguiente gráfico:
ESPERANZA DE LA VARIABLE ALEATORIA.- Definida por E(x) del producto de
la probabilidad p y del valor de x entonces:
E(x)= ∑ xi P(x)
X P(x) ∑xiP(x)0 0.125 01 0.375 0.3752 0.375 0.7503 0.125 0.375
1.5
VARIANZA DE VARIABLES ALEATORIAS.- Es la diferencia entre la sumatoria
del cuadrado de la variable x por su probabilidad menos el valor de la esperanza
al cuadrado:
Var(x)=∑ xi2P(x) –E(x)2
DESVIACIÓN ESTÁNDAR DE UNA VARIABLE ALEATORIA.-
= Var (X)
VARIABLE ALEATORIA BIDIMENSIONAL.- En los ejemplos anteriores hemos
considerado que el resultado de un evento es registrado por un único número real.
Sin embargo existen situaciones que en un experimento aleatorio genera dos
características en forma simultánea. En el siguiente ejemplo observaremos este
fenómeno.
16
EJEMPLO.- Estamos interesados en el estudio de la composición de familias con
tres hijos y tomando en cuenta el sexo. Consideramos las variables x, y, z con las
siguientes condiciones:
1) x es el número de niños (hombres)
2) y : 1-si el primer hijo es hombre.
0-si el primer hijo es mujer.
3) z es el número de veces que hubo variación den sexo entre nacimientos.
S=HHH,HH M,HMH,MHH,HMM,MHM, MMH,MMH
Construimos una tabla en base a los eventos, probabilidades y características x,
y, z:
Evento Probabilidad "xyz"HHH 1/8 310HHM 1/8 211HMH 1/8 212MHH 1/8 201HMM 1/8 111MHM 1/8 102MMH 1/8 101MMM 1/8 000
En la tabla anterior observamos que las variables x, y, z tienen sus respectivas
distribuciones de probabilidad del siguiente modo:
P(x) X1/8 03/8 13/8 21/8 3
P(x) Y4/8 04/8 1
P(x) Z2/8 04/2 11/4 2
17
La siguiente tabla denominada Distribución Conjunta solo toma un evento
esta vez a x, y obteniendo la siguiente representación si consideramos que:
P(x,y)= =P[X0x,Y=y] o también: P(x,y)= X=x ^ Y=y
Obteniendo una tabla de entrada conjunta que puede ser dispuesta de dos
maneras:
Forma (a)
(x , y) P(x , y)(0,0) 1/8(1,0) 2/8(1,1) 1/8(2,0) 1/8(2,1) 2/8(3,1) 1/8
Forma (b)
Y
X0 1 P(y)
0 1/8 0 1/81 2/8 1/8 3/82 1/8 2/8 3/83 0 1/8 1/8
P(x) 1/2 1/2 1
VARIABLE ALEATORIA BIDIMENSIONAL DISCRETA.-
Sea E un experimento y S el espacio muestral, a este experimento donde x, y
pertenecen a S son dos números reales es decir dos funciones asociadas a un
número real a cada resultado ósea W pertenece a S (W son los resultados) al
vector x, y se la denomina Variable Aleatoria Bidimensional el siguiente gráfico
nos ilustrara mejor.
W
Ω
X(W)=X
Y(W)=Y
18
OBSERVACIÓN.- Si x1,...,xn son k funciones tal que cada función k siempre
asocia a un número real entonces el vector x1,...,xk se denomina Variable
Aleatoria Multidimensional. Una variable aleatoria bidimensional discreta es
aquella donde los posibles valores de xi y de yj son valores finitos.
La función de probabilidad conjunta de una variable aleatoria bidimensional
discreta está definida por: 76757267 2732234
P(xi,yi)= P[x= xi, y= yj]
Sujeta a las condiciones:
1) ∑∑P(xi,yj)= ∑∑P[x=xi,y=yj]
2) La probabilidad debe ser menor o igual a 1 y mayor o igual a 0.
FUNCIÓN DE DISTRIBUCIÓN ACUMULADA BINARIA.-
La distribución acumulada x, y que se denota por F es una función R2 entre 0 y 1 y
se define por la regla de correspondencia.
F(x, y) = P[ X<x;Y<y ], x, y € R
Sí (x,y) corresponde a una variable bidimensional discreta entonces su función de
distribución acumulada es:
F(x, y)= P[X<x;Y<y]= ∑∑ P(xi,yj)
EJEMPLO.- Sea el experimento E lanzar dos dados al aire donde la variable
x denota el número de puntos obtenidos por el primer dado, y la variable
denota los puntos del segundo dado.
19
1) Hallar la distribución de probabilidad conjunta (x, y) y graficar.
S= (1,1),(1,2),(1,3),(1,4),(1,5),(1,6),
(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),
(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),
(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),
(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),
(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)
P(1,1)= P[X=1,Y=1]=1/6
P(1,2)= P[X=1,Y=2]=1/6, y así sucesivamente.
Por lo tanto la distribución de probabilidad conjunta será:
Y
X1 2 3 4 5 6
1 1/36 1/36 1/36 1/36 1/36 1/362 1/36 1/36 1/36 1/36 1/36 1/363 1/36 1/36 1/36 1/36 1/36 1/364 1/36 1/36 1/36 1/36 1/36 1/365 1/36 1/36 1/36 1/36 1/36 1/366 1/36 1/36 1/36 1/36 1/36 1/36
Cuya representación gráfica es:
0251704320
Xn……….. Y2 Y1
Z
Y1 Y2 Y3 Y4 Y5 ……. Yn
X
Y
20
2) Hallar la función de distribución acumulada.
Observamos nuevamente los valores del espacio muestral Ω veremos que la
distribución gráfica tiene la forma: ΩàF:R2 la representación en plano x, y tiene la
siguiente forma:
0251786240251785216251783168251784192
Por ejemplo x<2, y<3 tendrá como función de distribución acumulada bivariada los
puntos que se encuentran dentro y su probabilidad será:
F(2,3)=P[X<2,Y<3]=6/36
DISTRIBUCIÓN MARGINAL.- Teniendo la siguiente tabla.
X
Y1 2 3 P[Y=y]
1 0.03 0.06 0.06 0.152 0.02 0.04 0.04 0.53 0.09 0.18 0.18 0.454 0.06 0.12 0.12 0.3
0.2 0.4 0.4 1
La distribución marginal cuando x varia:
Px(1)=P[x=1,y=1]=0.03+0.02+0.09+0.06=0.2
Px(2)=P[x=2,y=1]=0.06+0.04+0.18+0.12=0.4
1 2
3 4
5
1 2
3 4
5
y
21
Px(3)=P[x=3,y=1]=0.06+0.04+0.18+0.12=0.4
La distribución marginal cuando y varia:
Py(1)=P[x=1,y=1]=0.03+0.06+0.06=0.15
Py(2)=P[x=1,y=2]=0.02+0.04+0.04=0.5
Py(3)=P[x=1,y=3]=0.09+0.18+0.18=0.45
Py(4)=P[x=1,y=4]=0.06+0.12+0.12=0.3
Con los anteriores valores conformamos las siguientes tablas:
"x" Px1 .22 0.43 0.4
1"x" Py1 0.152 .23 0.454 0.3
DISTRIBUCIONES CONDICIONALES.- Estas distribuciones tienen las siguientes
relaciones:
P(x, y)/Py=P[X=x/Y=y]=P[X=x*Y=y]/P[Y=y]
Función de probabilidad condicional de x está dado por [Y=y] Función de
probabilidad condicional de y está dado por [X=x]
22
EJEMPLO.- De la siguiente distribución de probabilidad conjunta encontrar la
distribución condicional indicada:
X
Y-1 1 P[Y=y]
0 0.17 0.25 0.421 0 0.33 0.332 0.08 0.17 0.25
P[X=x] 0.25 0.75 1
a) P[x=1/y=0]
P[x=1/y=0]=0.25/0.42
=0.6
b) P[y=2/x=-1]
P[y=2/x=-1]=0.08/0.25
=0.32
VARIANZA.-
Var(x)= ∑xi2P(xi)-E(x)2;Var(y)=∑yi2P(yi)-E(y)2
VARIABLES ALEATORIAS INDEPENDIENTES.- Son aquellas donde el
parámetro de probabilidades marginales no altera el resultado de las variables,
es decir:
Sí P(x,y)= P(x) P(y) considerando: P[X=x, Y=y]=P[X=x]P[Y=y]
EJEMPLO.- De la siguiente tabla calcular las variables independientes.
X
Y2 4 P[Y=y]
0.1 0.1 0.15 0.250.2 0.2 0.3 0.50.1 0.1 0.15 0.250.4 0.4 0.6 1
23
Comprobando la independencia tenemos la probabilidad de la variable x cuando:
Px2Py1=0.4*0.25=0.1
Px2Py3=0.4*0.5=0.2
Px2Py5=0.4*0.25=0.1
Px4Py1=0.6*0.25=0.15
Px4Py3=0.6*0.5=0.3
Px4Py5=0.6*0.25=0.15
ESPERANZA.- En algunos casos es preciso calcular el valor esperado de la
función de dos o más variables aleatorias. El valor de las esperanzas está
definido por:
E(x)=∑xi*P ; E(y)=∑yi*P
VARIANZA.-
Var(x)=∑xi2P(xi)-E(x)2 ; Var(y)=∑yi2P(yi)-E(y)2
COVARIANZA.-
Cov(x,y)=E(x,y)-E(x)E(y) ; Cov(x, y)=E(x,y) - E(x)E(y)
COEFICIENTE DE CORRELACIÓN.- Variables x, y de un sistema de variables
bidimensionales pueden estar relacionadas por un coeficiente que tome en cuenta
la covarianza y varianza.
P(x,y)=Cov(x,y) / Var(x) Var(y)
EJEMPLO.- Calcular el coeficiente de correlación tomando la siguiente tabla:
x
Y0 1 2 3 P[Y=y]
0 0 0 0 1/8 1/81 0 0 3/8 0 3/82 0 3/8 0 0 3/83 1/8 0 0 0 1/8
PjX=x] 1/8 3/8 3/8 1/8 1
24
E(x)=0(1/8)+1(3/8)+2(3/8)+3(1/8)
=3/2
E(y)=0(1/8)+1(3/8)+2(3/8)+3(1/8)
=3/2
Var(x)=12(1/8)+12(3/8)+22(3/8)+32(1/8)
=3/4
Var(y)=02(1/8)+12(3/8)+22(3/8)+32(1/8)
=3/4
E(x,y)=0*0*0+0*1*0+0*2*0+0*3*1/8+1*0*0+1*1*0+1*2*3/8+1*3*0+2*0*0+2*1*3/8+2
*2*0+2*3*0+3*0*1/8+3*1*0+3*2*0+3*3*0+3*3*0
= 3 / 2
Cov(x,y)=3/2-(3/2*3/2)
= - 3 / 4
P(x,y)=-3/4/(3/4*3/4)1/2
=-1
DISTRIBUCIONES MUESTRALES
La distribución de probabilidad de una estadística se llama distribución muestras
en general la palabra población es muy común y de uso general entro de la
inferencia población es el conjunto de todas las observaciones a resultados
posibles que puede tomar un variable aleatorio x en determinados casos o es
imposible o necesario tener todos los datos de una población por que los datos
de una sola parte de la población pueden dar la información necesaria para
generalizar acerca de los parámetros de la población que por lo general son
desconocidas una parte de la población se llama muestra.
DIFERENCIA ENTRE ESTADÍSTICA Y PARÁMETROS:
Un parámetro es una característica de la población una estadística es una
característica de una muestra el siguiente cuadro nos muestra algunas
25
designaciones particulares de los parámetros y la estadística.
Población
o Número total de elementos
considerados.
o Está determinada por parámetros
o Sus símbolos son:
N-tamaño de la población
µ-media de la población
-desviación estándar
Muestra
o Porción de la población que se
escoge.
o Está determinada por estadísticas,
o Sus símbolos son:
n-tamaño de la muestra
x-media de la muestra
s-desviación estándar
Las así llamadas estadísticas especialmente la media de las muestras y la "S"
sirven para estimar los parámetros "µ y " de la población mediante las
distribuciones muestrales.
Para poder definir el concepto de estimaciones se tienen que definir en forma
general las siguientes estimaciones:
ū: Estimación de la media poblacional.
σ2:Estimación de la varianza de poblacional.
: Estimación del total de la población.
: Estimación de la razón de los medios muestrales.
Estas estimaciones son determinadas luego de definir las distribuciones
muestrales. Consideramos algunos ejemplos de distribución muestrales (con
repetición o sin repetición).
Supongamos que extraemos una muestra al azar con reemplazamiento de una
población finita o extraemos la muestra de una población infinita o por último
tenemos una muestra que es pequeña con respecto a la población se cumple la
siguiente definición:
26
Una muestra aleatoria de tamaño "n" de una variable aleatoria x con una función
de probabilidad f(x) es el conjunto de n variables, y tiene las siguientes
condiciones:
1. Cada Xi tiene la misma distribución de x es decir que la variable: Fxi(x) =
Fx(x) se llama función de densidad.
2. Las variables aleatorias Xi son independientes como cada Xi tiene la misma
distribución de x se cumple que: E(xi) =E(x) ; 2xi= 2x.
Y finalmente la función de probabilidad conjunta de la muestra aleatoria está dada
por: fx1, x2,..., xt, (X1, X2,..., Xr,) = fx2(X2) fxn(Xn).
DISTRIBUCIÓN MUESTRAL DE X:
Las probabilidades de las estadísticas se llaman distribuciones muestrales (media
muestral).
Sea X1, X2,..., Xn una muestra que se obtiene remplazando de una variable
aleatoria x que es una población donde:
E(x) =µ y var(x) = 2
La media de la muestra está definida por:
Donde tos Xi son independientes distribuidos idénticamente con media y varianza
común es decir µi = E(xi) =µ y i= var(xi) = 2 donde: i =1,2,...n.
Aplicando el teorema del límite central tenemos la siguiente relación:
Donde: N número total de población.
27
Para una muestra siendo la población finita y sin reemplazamiento las variables
aleatoria “x”ya no son independientes por lo tanto:
El promedio -Tiene una distribución hipergeometrica con un factor de corrección
de población finita calculada del siguiente modo:
Ejemplo: sea una población Ω =2,4,6,8,10
Hallar la media µ y la desviación estándar σ:
Solución:
1. El tamaño N =5 =>µ = (2+4+6+8+10)/5 =>µ =6
Para σ = => σ = 2,83
2. Formar todas las muestras del tramo 2 que se extraen sin remplazamiento de
la población total:
µx
28
Solución:
Como la población es igual a 5 elementos y solo
debemos obtener muestras tamaño 2 sin
remplazamiento tenemos:
C52 = = 10
3. Hallar la media de cada muestra de los
calculados anteriormente:
4. Hallar la esperanza de la desviación estándar
de la media es decir determinar µx, y σx,.
Solución:
µx=(3+4+5+6+5+6+7+7+8+9)/10
àµx=6=µ
σ= = = 2.73
Muestra Media
(2,4) (2+4)/2=3
(2,6) 4
(2,8) 5
(2,10) 6
(4,6) 5
(4,8) 6
(4,10) 7
(6,8) 7
(6,10) 8
(8,10) 9
29
Ejemplo2: Efectuar los mismos cálculos pero considerando que la extracción en
con reemplazamiento:
Solución:
µx= 6 y x=2.83 (ver ejemplo anterior)
El cuadro a la derecha nos muestra las
muestras del tamaño 2 que se extraen con
remplazamiento:
El cálculo de x medía de f, y de hi nos
muestra la siguiente tabla:
Ejemplo: Sea la población A =1,2,3,4,5,6 donde N =6 hallar:
a). Conformar la distribución muestral de las medias de muestra de tamaño =2
b). Calcular la media, varianza y desviación estándar muestral y poblacional.
Condición: se trata de muestras con reemplazo o repetición:
Muestra Media(2,4)(4,2) 3 3(2,6) (6,2) 4 4(2,8) (8,2) 5 5
(2,10) (10,2) 6 6(4,6) (6,4) 5 5(4,8) (8,4) 6 6
(4,10) (10,4) 7 7(6,8) (8,6) 7 7
(6,10) (10,6) 8 8(8,10) (10,8) 9 9
(2,2) 2 2
(4,4) 4 4(6,6) 6 6(8,8) 8 8
(10,10) 10 10
X fi Hi = f/252 1 0.043 2 0.084 3 0.125 4 0.166 5 0.27 4 0.168 3 0.129 2 0.08
10 1 0.04
30
Solución:
1 2 3 4 5 6
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)1 1.5 2 2.5 3 3.5
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)1.5 2 2.5 3 3.5 4
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)2 , 2.5 3 3.5 4 4.5
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)2.5 3 3.5 4 4.5 5
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)3 3.5 4 4.5 5 5.5
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)3.5 4 4.5 5 5.5 6
a).Con esta tabla calculamos otros factores para lo cual conformamos la siguiente
tabla:
Para calcular u: se sabe que:
0251813888b µ
µ=126/62=> µ = 3.5:
La media poblacional también:
µ = µ
µ=(1+2+3+4+5+6)/6=3.5
La varianza muestras:
σ2 = =2.92
=> =52.5 / 36 => =1.46
000i ni 000i+ni(Xi - µ)2 (Xi - µ)2
1 1 1 6.25 6.251.5 2 3 4 82 3 6 2.25 6.752.5 4 10 1 43 5 15 0.25 1.253.5 6 21 0 04 5 20 0.25 1.254.5 4 18 1 45 3 15 2.25 6.755.5 2 11 4 86 1 6 6.25 6.25
36 126 52.5
in
31
Luego: La varianza poblacional es = 2.92/2=1.46
Desviación estándar muestral: σ = = 2.21, y la desviación estándar
tendrá el mismo valor por repetición.
Ejemplo: Calculo de medias sin reemplazo (sin repetición).
Para el cálculo de medias se toma en cuenta las muestras que están por encima
de la diagonal de la tabla.
Una población consiste en las edades de unos niños de una determinada
familia. Estas edades son A= 9,4,6,8 cuando n =2 y N =4, calcular la
media, varianza, desviación estándar muestra! y poblacional:
1. Calculamos la cantidad de combinaciones posibles: C42 = = 6
2. Conformamos la tabla:
4. Medía muestral: u = =5
5. Media poblacional: µ =(2+4+6+8)/4 =5
6. Varianza muestral : σ2= = 1.67
2 4 6 82 (2,2) (2,4) (2,6) (2,8)
2 3 4 54 (4,4) (4,6) (4,8)
4 5 66 (6,6) (6,8)
6 78 (8,8)
8
i ni *ni (Xi -11)2
3 1 3 4 44 1 4 1 15 2 10 0 06 1 6 1 17 1 7 4 4
6 30 10
3. µ = 30/6 = 5
32
7. Varianza poblacional : σ2= =
= 5
8. Desviación estándar σ =
Distribución muestral de proporciones:
Para algunos cálculos es necesario determinar proporciones de muestras para lo
cual se extraen todas las posibles muestras de tamaño n y luego se determina las
proporciones P =éxito; Q =fracaso este tipo de muestras puede conformar una
distribución de frecuencias que facilitan el cálculo, en el siguiente ejemplo
trataremos un cálculo de proporciones.
Sea la población formada por los siguientes elementos A =m1,m2,m3,h1,h2
Donde(N =5, y n =3) con m =mujer (éxito), y h = hombre (fracaso).
Determinar la proporción P y Q, la distribución muestral de proporciones será
construida con muestras de tamaño n =3.
P +Q = 0.6+0.4 = 1 con P =3/5 =0.6 ; Q = 2/5= 0.4
Previamente el cálculo del número de muestras posibles tiene la forma:
33
De la tabla se obtiene la siguiente distribución
muestral
1. Con la distribución muestra calculamos la media
muestral : E(x) =
2. Media poblacional: 3/5=0.6
3. Varianza muestral: var(x) =
è Var(x) =
4. Varianza poblacional: VarPob =
5. Desviación estándar muestral y desviación estándar poblacional:
σ =
DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE MEDIAS:
En muchos problemas es necesario comparar parámetros particularmente de
medias de dos poblaciones en el ejemplo siguiente tenemos la diferencia de dos
Muestras Proporción P
m1 m2 m3 3 / 3m1 m2 h1 2 / 3ml m3 h2 2 / 3m1 m3 h1 2 / 3m1 h1 h2 1 / 3m2 h1 h2 1 / 3m3 h1 h3 1 / 3m2 m3 h1 2 / 3m2 m3 h2 2 / 3
X P(x)1/3 3/102/3 6/103/3 1/10
1
34
medias:
Ejemplo: Si A=1,2 y B =3,4 con n=2
1. Conformamos las siguientes tablas
3 4
3 (3,3)3
(3,4)3,5
4 (4,3)3.5
(4,4)4
Para el cálculo precisamos las diferencias elemento por elemento de las medias
respectivas entre ambas poblaciones es decir:
1-3=-2;1-3.5=-2.5;1-3.5=-2.5;1-4=-3
1.4-3=-1.5;1.5-3.5=-2;1.5-3.5=-2;1.5-4=-2.5
2-3=-1;2-3.5=-1.5;2-3.5=-1.5;2-4=-2
Con los datos de las diferencias conformamos o construimos la tabla de
distribución muestral:
Con estos valores es ahora posible calcular la media
muestral:
Si calculamos la media muestral tomando la muestra de los elementos de la
población tenemos los siguientes valores:
1.-Media poblacional: = 1.5 ; = (3+4)/2 = 3.5
2.-Por lo tanto su diferencia es: = 1.5 - 3.5 = -2
3.-Varianza muestral: varA = 0.25
4.-Varianza poblacional: tomando datos originales de las poblaciones
calculamos: varA = 0.25 varb = 025
1 2
1 (1,1)1
(1,2)1,5
2 (2,1)1.5
(2,2)2
A- B P( A- B)
-1 1/16-1.5 4/16-2 6/16-2.5 4/16-3 1/16
1
35
var = =0.25
5.-Desviación estándar:
Muestral: σ = = 0.5 Poblacional: σ = = 0.5
6. ESTIMACIONES
INTRODUCCIÓN.- Es un proceso de la estadística probabilística que tiene por
finalidad aproximar al parámetro poblacional a partir de los datos obtenidos en una
encuesta representativa poblacional. En general se conocen dos formas de
estimación:
ESTIMACIÓN PUNTUAL.- Es la estimación de un parámetro poblacional realizado
en base a un solo número de la muestra por ejemplo la estimación del salario
medio de una población de trabajadores. En este caso se confunde la media.
ESTIMACIÓN OR INTERVALOS.- Precisa determinar un conjunto de números
que representa un intervalo numérico entre A y B por ejemplo de acuerdo a una
probabilidad establecida dentro del cual se encuentra el parámetro poblacional
que nos interesa.
NIVEL DE CONFIANZA.- Es la probabilidad de que el parámetro se encuentre
dentro del intervalo determinado en general los niveles de confianza usuales son
del 95% y 99%.
NIVEL DE CONFIANZA EL 95%.- Significa que de 100 casos 95 de ellos se
encuentran dentro del intervalo construido esperamos que 5% de ellos estén fuera
del intervalo.
NIVEL DE CONFIANZA EL 99%.- Significa que de 100 casos 99 de ellos se
encuentran dentro del intervalo.
36
INTERVALO DE CONFIANZA PARA LA MEDIA MUESTRAL.- Este intervalo
también referido para la media poblacional, para tal cálculo se toma una muestra
aleatoria y con la misma se calcula la media y error standard de la media su
relación general es:
X =
Donde:
Media aritmética de la muestra: x
Coeficiente de confianza o valor crítico cuya determinación es dependiente del
nivel de confianza: Zo
Error estándar de la media, su valor depende de la desviación estándar
poblacional: x
En general se tiene los siguientes símbolos de estimación:
Estimación de la media poblacional: u
Estimación de la varianza poblacional:
Estimación de la razón de las medias
muéstrales: R Estimación total de la
población: y
ESTIMACIÓN PUNTUAL DE LA MEDIA DE UNA POBLACIÓN E INTERVALODE CONFIANZA PARA u.- La media poblacional denotada por u se estima
puntualmente por media muestral denotada por x es decir: u=x donde u es el
estimador de la media poblacional o x=(x1+... +xn)/ n.
La media muestral x tiene cuatro propiedades fundamentales como estimador
puntual:
1) No es sesgada.
2) Es eficiente, determinante.
37
3) Consistente.
4) Suficiente.
COTA DE ERROR.-Es el límite de error. Queda graficada del siguiente modo.
La cota de error para x está dado por:
Si se conoce la desviación poblacional entonces se estima con la desviación
standard de la distribución muestral llamado Error Standard del Estadístico por la
siguiente relación:
ESTIMACIÓN POR INTERVALOS DE LA MEDIA DE UNA POBLACIÓN.- En
muchos problemas es preferible determinar la media poblacional calculando por
intervalos que se llaman Intervalos de Confianza u y en general se observan dos
casos:
MUESTRA GRANDE.- Cuando n=>30 muestras y conocida. El intervalo es:
Esta relación concuerda con el siguiente gráfico:
Entonces la probabilidad queda determinada por:
P[Z 2]=1-( 2+1- )=1- 2
-2 -2
-z 0
T(X)
z
38
1) Dónde: Z /2 es desconocida.
2) Dónde: 1- ,Es el área bajo la curva normal estandarizada que indica el
coeficiente de confianza.
3) ,Es el área total de las colas.
4) n, Tamaño de la muestra.
5) x, Es la desviación standard de la población, debe ser conocida.
6) Z , Un punto en el eje horizontal de la distribución normal standard.
7) En casos prácticos se trabaja con la siguiente tabla:
Coeficiente de
Correlación (1- )Z
0.9 0.1 1.6450.95 0.05 1.960.99 0.01 2.58
MUESTRA PEQUEÑA.- Intervalo de confianza cuando n<30, desconocido. Con
una distribución aproximada normal, este intervalo es de la forma:
Entonces la probabilidad es: P[t ≤to]=1-(
Dónde:
Área bajo la curva t- student desde to hasta to indica el nivel de confianza:
-t0 0 t0
39
Tamaño de la muestra: n
Estimador de x: x=S= 1/2
Punto en eje horizontal de la distribución t -student un n-1 que corresponde al área
1- /2 que es necesario ubicarlo mediante tablas: To=tn-1,1- /2
En la práctica se trabaja un =90 o =95 porciento.
EJEMPLO.- Debido a la escasez de agua por efecto del verano, el gobierno de la
ciudad selecciona al azar 100 viviendas para observar el medidor de agua durante
un día y estimar el consumo diario promedio por vivienda. De las muestras se
obtiene una media y desviación standard de 117.5 galones y 16.8 galones
respectivamente. Estimar u, el consumo promedio por vivienda y determinar la
cota para el error de estimación.
Datos:
N=100, u=x=117.5, S= x=16.8
40
La cota de estimación de error es: 2 x=2( x/(n)1/2)
=2(16.8/(100)1/2)
=3.36
u∈ (117.5-3.36,117.5+3.36)
u∈ (114.14,120.8)
Graficando:
114.14 120.8 "Cota de Error"
EJEMPLO.- De acuerdo a un trabajo de auditoria para el estudio de libros
contables de una empresa se obtuvo 50 transacciones con una media y
desviación standard de 2160 y 575 respectivamente, estimar u y determinar la
cota de error.
Datos:
N=50, u=x=2160, S=575
La cota de error estimada: 2 x=2( x/(n)1/2)
41
=2(575/(50)1/2
=162.63
Graficando: u∈ (2160-162.63,2160+162.63)
u∈ (1997.4,2322.6)
1997.4 2322.6 "Cota de Error"
EJEMPLO.- Supongamos que la media de la población de utilidades después de
los impuestos durante un cierto periodo es 4.8 centavos de $ de ingreso,
S=1.5 centavos. ¿Cuál es la probabilidad de que la utilidad media después de
pagar los impuestos, con una muestra de 100 fabricantes excede en 5 centavos?
Datos:
u=4.8, S=1.5; n=100.
Se pide hallar P[x>5] de los datos sabemos que:
E(x)=u=4.8;
x= /(n)1/2=1.5/(100)1/2
=0.15
42
Estandarizando para poder definir las probabilidades:
P[x>5]=P[(x-E(x))/ x>(5-E(x))/ x]
=P[Z>(5-4.8)/15]
=P[Z>1.33]
Estandarizando tenemos que hacer la diferencia de:
=1-P[Z≤1 .33]
=1-0.9082
Entonces: P=0.0918
7. TEORÍA DE TCHEBITCHEB.-
También llamado Desigualdad de Tchebitcheb considera como hipótesis que
dado un numero k =>1 y dado un conjunto de observaciones: x1,...,xn entonces
su tesis enuncia que al menos I1-1/k2|% de las observaciones hechas caen dentro
de las k observaciones de la media es decir: lx-ul<k o también que x∈(u-
k ,u+k ). Esta desigualdad tiene mayor importancia cuando se expresa en
43
forma de probabilidad: P[|x-ul<k ]≥1-1/k2...(a).
El indicador (1-1/k2)*100 denota a las observaciones que caen dentro del
intervalo u-k ,u+k . El siguiente gráfico representa la desigualdad indiada.
a) Sí en la relación (A) k=1 entonces, P[lx-ul< ]≥0
b) Si en la relación (A) k=2 entonces, P[ix-ul<2 ]≥1-1/4=0.75
c) Si en la relación (A) k=3 entonces, P[lx-ul<3 ]≥1-1/9=0.89
Area representada
≥1-x
u-k3 k2 u k2 u+6x
44
Entonces indica que 0 % o más cae dentro del intervalo u-k ,u+k
EJEMPLO.- La media y varianza de una muestra de tamaño 30 son 50 y 80
respectivamente. Por el teorema de Tchebitcheb describir las distribuciones de las
observaciones.
Datos:
x=30; S2=81
S =9
a) Por lo menos el 75%(k=2) de las observaciones caen el siguiente intervalo:
[x±25]=[50±18]=[50+18.50-18]=[68.32]
b) Al menos 89% de las 30 observaciones caen dentro del intervalo:
[x±35]entonces, [50±3.9]123.77]
REGLA PRÁCTICA PARA DETERMINAR LOS VALORES DEL TEOREMATCHEBITCHEB.- Cuando un conjunto de observaciones se distribuye
normalmente, el intervalo que se representa es el siguiente:
(u± ) contiene aproximadamente 68 de las observaciones.
(u± ) contiene aproximadamente 95 de las observaciones.
45
(u± ) contiene aproximadamente casi todas las observaciones.
En el siguiente ejemplo determinaremos los valores de los intervalos de las
observaciones:"mi" "fi" "hi" Fi Hi
Clase Intervalo
de
Clase
Marca
de
clase
Frecuencia
Absoluta
Simple
Frecuencia
Relativa
Simple
"mi*
fi"
Frecuencia
Absoluta
Acumulada
Frecuencia
Relativa
Acumulada
∑mi
fi
1 5.00-8.99 7 3 3/25 147 3 3/25 212 9.00-12.99 11 5 5/25 605 8 8/25 553 13.00- 15 7 7/25 1575 15 15/25 1054 17.00- 19 6 6/25 2166 21 21/25 1145 21.00- 23 3 3/25 1587 24 24/25 696 25.00- 27 1 1/25 729 25 25/25 27TOTALES 25 6809 391
Calculando la media: x =∑mi*fi)/∑fi
=391/25
=15.64
Calculando la varianza: S2 = (∑ mi2* fi-(∑fi*mi)2 /n)/n-1
=(6809-(391)2/25)/24
=2891
S =5.37
Con los cálculos anteriores de las observaciones las dos penúltimas columnas,
siete y ocho, observamos cómo se distribuyen las muestras sabiendo que la
media es 75.64 y la varianza 5.37: Ahora definimos la siguiente tabla:
8. FRECUENCIA DE OBSERVACIÓN QUE SE ENCUENTRA A K DESVIACIÓNSTANDARD DE LA MEDIA PARA LOS DATOS DE LA TABLA ANTERIOR.-
Previamente los siguientes cálculos:
46
Si k=1, entonces x ± ks=15.64 ± 5.377: 10.263
21.017
Si k=2, entonces x ± 2ks=15.64 ± 2(5.377): 4.886
26.394
Si k=3, entonces x ± 3ks=15.64 ± 3(5.377): 0.491
31.771
9. DETERMINACIÓN DEL TAMAÑO DE UNA MUESTRA
Este capítulo es muy importante para el cálculo de niveles de confianza
para este fin utilizaremos una simbología adecuada:
Estimación de θ: θ
Desviación standard del estimador puntual para θ: θ
Cota para error de estimación: e
Coeficiente de confianza: 1-
El tamaño de la muestra puede ser definida aplicando los siguientes pasos:
1) Escoger o determinar dos cotas(niveles): e y 1-
47
2) Resolver la ecuación: Z /2 θ = e...(*)
En la práctica tenemos las siguientes relaciones:
La distribución muestral de la media se tiene ux = u y x= /(n)1/2
sustituyendo en la ecuación anterior tenemos (*) tenemos:
Z /2 /(n)1/2=e
Despejando n:
n=( (Z /2 )/e)2
Desviación standard de la población, si este no es conocido:
=S=((xi-x)2/n-1)1/2
48
EJEMPLO.- Es medido el contenido de nicotina de 36 cigarrillos de una marca y
se obtuvo los siguientes resultados:
x = contenido de nicotina medido en miligramos.
∑x =756 miligramos; ∑(x-x)2=315 miligramos
Obtener un nivel de confianza de 0.95 para estimar el contenido promedio de
nicotina de esta manera:
En el promedio se pide hallar la siguiente relación: X± x/(n)1/2Z /2
Datos:
n=36; ∑x=756 miligramos; ∑(x-x)2=315 miligramos
Para calcular el intervalo de confianza precisamos resolver:
x=∑xi/n
=756/36
=21
x = S =(∑ ( x i - x ) 2 / n - 1 ) 1 / 2
= (315/35)1/2
= 3
Además como la confianza es de .95 entonces: Z=1.96(de tablas) Ahora:
49
=x± x/(n)1/2Z /2
=21±3/(36)1/2 * (1.96)
=21±0.98
=21+0.98 =21-0.98
=21.98 =20.02
Entonces el contenido promedio es: µ∈<20.02,21.98>
EJEMPLO.- Una asociación de ahorro y préstamo desea determinar la cantidad
de préstamos que tienen los clientes en su cuenta sí la desviación standard es
4000.
a) Que tamaño de muestra se requiere para afirmar con una confianza de 0.95
que el error la estimación no excede de 200.
Se determina n mediante la relación: n =(Z2 2)/e2
=((1.69)2(4000)2)/2002
=1536.64
b) Que tamaño de muestra se requiere para afirmar con una confianza de 0.95
que el error la estimación no excede de 400.
50
N =(Z2 2)/e2
= ((1.96)2(4000)2)/4002
= 385
c) Comparando los tamaños muestrales y errores máximos permitidos ¿Qué
sucede con el tamaño muestral cuando el error máximo se duplica?
R.- El tamaño muestral se reduce cuatro veces menos cuando el error se duplica.
3.-Hipótesis acerca de la diferencia de medias:
000000
Hi: ux– uy≠ C
Si H0: ux- uy=c=>Hi Hi: ux– uy< C
Hi: ux– uy> C
4.-Hipótesis acerca de la diferencia de proporciones:
000000
Hi: Px– Py≠ C
Si H0: Px- uy=D=>Hi Hi: Px– Py< C
Hi: Px– Py> C
El objetivo de una muestra estadística es el de examinar una hipótesis relacionada
con los valores de una o más parámetros poblacionales.
TEORÍA DE LA DECISIÓN ESTADÍSTICA (DOCIMA O DOCIMASIA).-
Una hipótesis estadística es una suposición o una afirmación tentativa acerca de
-Z -Z1- -Z Z1-
-Z -Z1- -Z Z1-
51
un valor de un parámetro o parámetros de una población.
También podemos definir como una decisión estadística que se hace respecto al
parámetro de una población en base a la muestra que se selecciona de la indicada
población.
Los criterios más importantes para realizar este análisis podemos reunirlos en los
siguientes:
1.-Decisión estadística: Para la toma de una decisión estadística es necesaria
entre todo identificar el patrón de distribución y nos referimos si la población
tiene distribución normal o binomial o sigue otro patrón de distribución. Un
procedimiento estadístico que requiere la identificación de la distribución
probabilística se denomina, enfoque paramétrico; mientras que un enfoque no
paramétrico es un enfoque libre de distribución que no requiere especificación
acerca de esa distribución.
En nuestro análisis hacemos referencia al enfoque paramétrico es decir nos
referimos al enfoque paramétrico.
2.-Tipos de hipótesis: En toda decisión estadística se plantean dos hipótesis.
Ho – Hipótesis nula que es la hipótesis en consideración.
Hi – Hipótesis alternativa lo contrario de la hipótesis nula también
llamada hipótesis de trabajo.
3.-Nivel de significación ( ):Que es el subconjunto del espacio muestral que nos
conduce a rechazar la hipótesis nula cuando es verdadero. Es decir es
la posibilidad de cometer el error tipo1 en términos de probabilidad tenemos la
siguiente notación alpha = P[rechazar Ho / Ho es verdadero], en la práctica se
trabaja con valores alpha =0.05 y alpha =0.01 como constantes.
52
4.-Tipos de dócimas: Estos dependen del enunciado de la hipótesis alternativa
Hi Es decir que la dócima está en función de Hi y entre estas existen dos: las
unilaterales y las bilaterales.
En los siguientes gráficos observamos el valor crítico, la región de rechazo y la
región de aceptación para tres tipos de pruebas para las medias muestrales
(poblacional).
Modelos unilaterales Modelos bilaterales
0251911168251907072251906048251905024251910144251909120251908096
0251954176251953152251952128251951104
El valor de alpha nos indica el margen de error (nivel de error, sección crítica,
nivel de rechazo), que analizaremos mediante la decisión estadística en forma de
probabilidad.
5.-Planteamiento de la regla de decisión: Para aceptar o rechazar la hipótesis
nula debemos determinar claramente 3 aspectos la región crítica o de rechazo,
valor crítico y el estadístico de prueba.
m Región de rechazo: Es el conjunto de valores para el estadístico de
prueba que nos llevara a rechazar la hipótesis nula y está dado por el
valor de alpha.
m El valor crítico: Es el valor que separa a la región de rechazo de la región de
aceptación y constituye el 1er valor de la región crítica dependiendo del valor
de "alpha" y del enunciado de la hipótesis alternativa Hi.
1µ0
µ >µ0
Valorcrítico
1µ0
µ >µ0
Región deaceptación
Región derechazo
Región derechazo
Región deaceptación
1µ0
µ <>µ0Valorcrítico Valor
crítico
Región deaceptación
Región derechazo
Región derechazo
53
m Estadístico de prueba: Es una variable aleatoria cuyo valor se utiliza para
rechazar o para aceptar H0 si el estadístico de prueba cae en la regióncrítica
entonces rechazamos, si el estadístico de prueba cae en la región de
aceptación entonces aceptamos H0.
Cuando la hipótesis nula se rechaza con( = 0.05 ) diremos que el resultado
es significativo.
Cuando la hipótesis nula se rechaza con =0.01 diremos que el resultado es
muy significativo.
Gráficamente el nivel de significación a es un área pequeña bajo la curva (que
puede ser normal, t-student, ji-cuadrado) dependiente de las formas de
distribución, y aparecen a la derecha, izquierda, o ambas, sobre todo
depende del tipo de docimasia que se realiza es decir la ubicación de
depende del enunciado de Hi.
54
6.-Errores que se cometen al tomar una decisión: Estas pueden ser:
Tabla de decisión
Hipótesis nula H0DecisiónVerdadera Falsa
Rechazar Error tipo I Decisión correctaAceptar Decisión correcta Error tipo II
DISTRIBUCIÓN DE PROBABILIDAD:
Para describir el comportamiento de una variable aleatoria es necesario conocer la
distribución de probabilidad, porque cuando se estudian los resultados de un
experimento aleatorio necesariamente se busca un modelo probabilistico; es decir
una forma de distribución tomando en cuenta a las variables aleatorias discretas y
continuas podemos clasificar las distribuciones en dos grupos obteniendo o
conociendo la siguiente tabla
DISCRETAS CONTINUAS
Bernoulli Pxq1-x Uniformea>=x>=b
Binomial Normal
Geométrica Q1-xp exponencial x>=0
Pascal Ji - cuadrado
poisson T de student
Hipergeometrica
55
Distribución de poisson: La distribución de poisson se aplica cuando la variable
aleatoria es el número de eventos independientes que ocurren que suceden en
intervalo de tiempo o en una variable aleatoria X tiene distribución de poisson un
parámetro lambda (lambda>0) y su función deprobabilidades es la siguiente:
F(k) = P(x=k) = (e- k) con k=0,1,2,...
La variable aleatoria x cuando posee la distribución de poisson verifica que la
esperanza E(x) = lambda y además su varianza es V(x) = .
A veces es necesario adecuar el promedio o
valor de lambda al periodo t(tiempo) con el que
se trabaja es decir: (k)! que se trabaja es decir:
Ejemplo: En el puente de las américas como promedio mensual existen 6 intentos
de suicidio asumiendo que el número de estos intentos tiene una distribución de
poisson calcular la probabilidad de que ocurran los siguientes casos:
a) 2 intentos de suicidio por mes
b) Un intento, dos intentos.
c) Ningún intento
d) 0,1,2 o 3 intentos
56
1µ0
µ >µ0
Valorcrítico
1µ0
µ <µ0
Región deaceptación
Región derechazo Regiónde
rechazoRegión deaceptación
Puntos de inflexion
Solución: donde =6
a) Para 2 intentos k=2 P(x=k) = = 0.0446
b) Para 1 intentos k=1 P(x=1) = =0.014
c) Para 3 intentos k=3 P(x=3) = = 0.0892
d) Para O intentos k=0 P(x=0) = = 0.0025
e) Sumando : P[x = 0] + P[x = 1] + P[x =2] + P[x = 3]
0.0025 + 0.0149 + 0.0446 + 0.0892 = 0.1512
Distribución normal:
La variable aleatoria continua "x" posee distribución normal con media (µ) y
varianza, si su función de probabilidad o función de densidad de probabilidad es:
La grafica de la curva normal tiene la forma
característica de la campana de gauss donde
se tiene un máximo en µ con 2 puntos de
inflexión, la notación normal es N(µ, σ2 ).
0
Si "x" posee la distribución normal entonces se
verifica que la esperanza o media será igual
aE(x)=p y la varianza V(x)=.
57
Propiedades:
Teorema 1:
Teorema 2: f(µ + x) = f(µ - x)
Significa que p es simétrica.
Teorema 3: La probabilidad máxima de µ( f( max (σ)) = 1/( σ*sgr(2*pi) )]1 el valor
máximo o modo sucede cuando (x = µ).
Para facilitar el cálculo de una distribución normal se usa la distribución
normal estándar donde se emplea la variable estándar z = (x - µ) /
Con la introducción de este parámetro (z) la
función de densidad i y la d i st r ibución
acumulada Fi tiene la siguiente forma.
La función de densidad ( ) es la curva que se observa en el gráfico, a su vez §
es el área encerrada entre la curva y el eje de abscisas cuando se trata
de calcular una distribución normal estándar debemos calcular §(z).
Ejemplo: Esta integral no es resoluble en términos de cálculo es por eso que
mediante métodos numéricos se tabula por lo tanto se obtiene su valor en tablas.
PROBLEMAS DE DOCIMASIA:
1. Los salarios diarios en una empresa particular tiene una distribución normal
con una media de 23.20 pesos y su desviación estándar de 4.50 pesos. Esta
empresa ocupa 40 trabajadores a quienes paga 21.20 pesos. ¿Esta compañía
58
puede ser acusada de pagar salarios inferiores con un nivel de significación del
1%?
Solución:
1er paso: Identificar los datos:
Población: µ =23.20 desviación estándar
= 4.50 muestra: n =40 media = 21.20
alpha =0.01 (1%)
2do paso:identificar la hipótesis alternativa:
Hi: µ < 23.20 Este valor resulta de analizar la pregunta del problema,
donde se anota que la empresa puede ser acusada de pagar salarios inferiores a
la media.
3er paso: El valor critico está definido por tablas Zc =-2.33.
4 t o p a s o : P a r a n u e s t r o e je mp l o d e b e mo s comprobar
mediante un estadístico de prueba el valor de z, y comparar con
el valor encontrado en el paso tres y para la prueba de una hipótesis sobre la
media tenemos:
Conclusión.-Por los datos encontrados siendo z=-2.811 encontrándose en la
región de rechazo la compañía debe ser acusado por pagar salarios menores.
=0.01
ZA=Z 0,01= - 2.33
59
2. Una máquina que llena botellas de leche se supone que debe llenar un
volumen de 32 onzas con una desviación estándar de 0.06 de onza.
Mediante una comprobación sistemática se toman aleatoriamente 36
botellas l lenas y se advierte que contienen una media de 32.1
¿Funciona la maquina adecuadamente con un nivel de 0.05 de error?
Solución:
Población: µ =32 desviación estándar = 0.06
Muestra: n =36 media = 32.1 alpha =0.05 (5%)
¿Cómo identificar la hipótesis alternativa?
Según (a interrogante funciona la maquina adecuadamente:
000Hi: µ<>32 Ho: µ=32
A continuación determinamos los valores críticos y el estadístico
de prueba. Los valores críticos Zc son simétricos por ser la tabla de distribución
normal y para un valor de 0.025 en tablas encontramos que z = 1.96. El
estadístico de prueba que calculamos tiene la siguiente estructura.
Conclusión: Como Z =-10 y cae en la Región del Rechazo, Ho, por lo tanto la
máquina no funciona adecuadamente.
=0.02
-Zc - Zc
=0.02
60
En los Estados Unidos el número medio de años de escuela terminados por
adultos mayores a 21 años es de 10.4 con una desviación estándar de 2. El
consejo de educación de una ciudad cualquiera hace una encuesta aleatoria de
200 adultos, y advierte que el número medio de años escolares es de 11.3 con
una desviación estándar de 1.8 si se tiene un grado de significación de 0.05 ¿Los
adultos de esta ciudad encuestada difieren del promedio nacional con referencia
a los años de estudio (esta pregunta define H0)?
Solución:
Población: µ =10.4 desviación estándar = 2
Muestra: n =200 media = 11.3 S =1.8
alpha =0.05 (5%)
Identificando 1Hi:
Según difieren los adultos de la ciudad encuestada del promedio
nacional
Definimos el valor crítico y el estadístico de prueba de acuerdo a tablas el valor
crítico es (+ o - 1.96) y el estadístico de prueba es:
Como z =6.36 se encuentra en la región del rechazo por lo tanto concluimos que
los habitantes de la ciudad encuestada si difieren del promedio nacional
-Zc Zc 1.96
61
REGRESIÓN LINEAL Y CORRELACIÓN:
Introducción: Se estudió la relación entre dos variables "XY" suponiendo Y
=f(x) de acuerdo a esta relación se tienen los siguientes tipos de funciones:
1. Función lineal: Y =α+ βx2. Función exponencial: Y = α*3. Función potencial: Y = α * xβ4. Función hiperbólica: Y= α +β*1/x5. Función parabólica: Y = ax2 + bx + c
De estos tipos de relaciones más utilizados analizaremos con profundidad las
funciones lineales: Y=α +βx previamente las siguientes características:
1. Se presenta un conjunto de datos de n pares ordenados (Xi, Yi) al graficar
estos pares ordenados en el plano cartesiano.
2. Obtenemos diversos diagramas de dispersión ver figura a).
3. El analista o investigador debe decidir qué clase de curva se ajusta a los
datos.
4. El analista por algún método debe calcular los parámetros A, B.
5. El analista debe interpretar los resultados mediante estimaciones y las
décimas de hipótesis.
62
Análisis del error: Sean las tablas
000000252045312
000
000252054528
000252056576252055552252054528
Observaciones: Diferencias en ambos gráficos:
1. En general 1ro se observa una nube de puntos cuya particularidad es
que pertenecen a una sola recta en el gráfico.
2. En general 2do la nube de puntos Q2,Q3,05 pertenecen a la recta
Y=5+32*5x los otros puntos están por debajo de dicha recta. Para graficar
(1) solo existe una recta que pasa por los puntos P1,P2 para graficar (2) hay
más de dos rectas que pasan por un mismo punto Q1,Q2,C13,etc donde
X1 Y1
1 5
2 7
3 9
4 11
5 13
6 15
X Y
1 30
1 40
2 70
2 80
3 100
3 100
1
1
x
Y
x x
Y
Figura a)
1
2
y
468
1012
2 3 4 5 6
y=3+2x
x
14 y
y=5+32.5
15
3045456075
1 2 3 4 5 6
90
x
Graficando las tablas respectivamente (de 1 y 2):
Cuadro N° 1 Cuadro N°2
63
ninguna recta pasa por todos los puntos.
3. En general (1) cuando X =1, Y =5 es decir (1,5) pertenece tanto a la recta
como al gráfico al contrario en el grafico 2 cuando X =1, Y =30 y 40 de tal
manera que un solo punto aparece 3 valores que son X =1, Y =40; y
=37.5 ; y =30 donde los datos (1.30)(1.40) pertenecen a los datos de
la tabla y cuando (1, 37.5) pertenecen a la recta "11 " consecuentemente
surgen los siguientes tipos de error:
Dónde: y = valor verdadero =valor estimado. e1,e2 = error estimado
El propósito de nuestro análisis es buscar una recta que se ajuste a los
datos donde los errores e1, e2 sean lo mínimo posible.
4. En el gráfico (1) los 20 componentes de los datos son exactamente de la
forma Y = 3+2x para toda x que pertenece a los datos es el 2do
grafico, los 20 componentes son de la forma y = +e esta notación se lee de
la siguiente forma :
"El valor verdadero y" = valor estimado "y” + un error
64
252058624En grafico (1) la ecuación es de la forma y =α+βx llamado
método matemático (determinístico o exacto).
252066816
252068864252067840252066816
Observaciones: Diferencias en ambos gráficos:
1. En general 1° se observa una nube de puntos cuya particularidad es
que pertenecen a una sola recta en el gráfico.
2. En general 2° la nube de puntos Q2, Q3, Q5 pertenecen a la recta Y = 5 +32
* 5x los otros puntos están por debajo de dicha recta. Para graficar (1) solo
existe una recta que pasa por los puntos P1, P2 para graficar (2) hay más de
dos rectas que pasan por un mismo punto Q1, Q2,03,etc. donde ninguna recta
pasa por todos los puntos.
X1 Y1
1 5
2 7
3 9
4 11
5 13
6 15
X Y
1 30
1 40
2 70
2 80
3 100
3 100
1
1
x
Y
x x
Y
1
2
y
468
1012
2 3 4 5 6
y=3+2x
x
14y
15
3045456075
1 2 3 4 5 6
90
=5+32.5x
x
Figura a)
Graficando las tablas respectivamente (de 1 y 2):
Cuadro N° 1Cuadro N° 2
65
3. En general (1) cuando X=1, Y=5 es decir (1,5) pertenece tanto a la recta como
al gráfico al contrario en el grafico 2 cuando X=1, Y=30 y 40 de tal manera que
un solo punto aparece 3 valores que son X=1, Y=40; =37.5; y =30
donde los datos (1.30)(1.40) pertenecen a los datos de la tabla y
cuando (1,37.5) pertenecen a la recta "|1 " consecuentemente surgen los
siguientes tipos de error:
;
Dónde: y= valor verdadero = valor estimado e1, e2 = error estimado
El propósito de nuestro análisis es buscar una recta que se ajuste a los
datos donde los errores e1,e2 sean lo mínimo posible.
4. En el gráfico (1) los 2° componentes de los datos son exactamente de
la forma Y=3+2x para todo x que pertenece a los datos es el 2do grafico,
los 20 componentes son de la forma y= +e esta notación se lee de la siguiente
forma :
"El valor verdadero y" = valor estimado “y" + un error
En grafico (1) la ecuación es de la forma llamado método
matemático (deterministico o exacto).
En grafico (2) la ecuación es de la forma llamado modelo
matemático probabilístico.
En las ciencias naturales y ciencias sociales no se presenta fenómenos cuyo
comportamiento se ajuste a modelos matemáticos sino más bien se ajustan
a modelos matemáticos determinísticos probabilísticos.
En la información estadística el modelo y = representa
teóricamente a la relación entre X, Y para un conjunto de datos (XI,
Y1)(X2,Y2)... , (Xn,Yn) que es una población donde A, B son parámetros de
una recta, sin embargo en la practica estos parámetros no son fáciles de
determinar por lo tanto lo que se hace es buscar las estimaciones de estos
parámetros extrayendo una muestra y calculando los parámetros A, B por
66
1
2
y
1
3
2 3 4 5 6
y= + x
x
δδ
+ ++ +
algún método.
0252072960252070912252071936 Si denotamos por o la estimación de
y por el estimador de a la estimación de β entonces se obtendrá la
forma y1= + βx1 que es la estimación de la recta medía
población que también se expresa de la siguiente forma
considerando además que "ei", son errores
o perturbaciones a la recta , lo llamaremos recta de
regresión lineal.
Dónde: : ordenada en el origen: la pendiente.
Son estimaciones de parámetros de gráficamente la pendiente β representa
el valor del incremento de "Y" y para cada unidad de “X”.
Los valores de Xi se fijan previamente y son constantes arbitrarias por lo tanto
no tienen errores de observación. La variable dependiente "Y" como su nombre lo
indica toma un valor asociado para "X" y de esta manera se convierte en una
variable aleatoria.
CARACTERÍSTICAS DE LAS RECTAS:
1. Recta de regresión poblacional (RRP):
Forma general: yi
= -
: media aritmética de un número teóricamente infinito de
"Y". : parámetros
: Desviación de Yi alrededor del vector
esperado.
67
2. Recta de regresión muestral (RRM):
Forma general:
:estimador de α
: estimador de β
es el error análogo de yi
Nota: Hacer análisis de regresión consiste en estimar la RRP en base a
RRM.
Para X = Xi el valor de una observación es Y =Yi y en té r minos de RRP
que Y i=E( x /y)+µ i
HIPÓTESIS SOBRE LA DISTRIBUCIÓN DE PROBABILIDAD:
Previamente es necesario en la recta Y = determinar los valores de
para este efecto recurriremos al método de mínimos cuadrados la
determinación por este método ya fue analizado en estadística
descriptiva para abreviar el análisis anotaremos las ecuaciones normales que
son la base de este método con la notación de A y B las ecuaciones serán:
De este sistema se puede mediante simplificaciones obtener valores de
Para B podemos definir también por la covarianza.
RRP=α+βxi
µi
ei
RRM= xiyi
Xi X
68
ANÁLISIS DE REGRESIÓN:
Se propone estimar o predecir el valor medio poblacional de la
variable dependiente y en base a valores fijos de "X" que es la variable
explicatoria. Y =f(x) (x: variable explicatoria).
En la relación lineal y= llamada recta de regresión poblacional no
solo basta con calcular valores de (método mínimos cuadrados) es de más
interésdeterminar µ es decir estimar su desviación estándar y también
nos interesa las hipótesis de βy también los intervalos de confianza de E(x/y).
Estimación de la desviación estándar: ( )
Dado el modelo probabilístico donde E(µ)=0 y
var(µ)=desviación estándar al cuadrado tenemos que cada valor observado de
Yiestá sujeto a erroresaleatorios de µ que debe dar incluido en cálculos de
por lo tanto se necesita medir la dispersión de los valores de "Y" alrededor
de la recta E(x/y) = y el parámetro que mide, esa dispersión es la
desviación estándar de µ.
La varianza está definida por:
Ejemplo: Utilicemos el cálculo del problema
sobre las maquinas remplazando valores
tenemos:
S2=
La esperanza y la varianza de α son La esperanza y la varianza de β
son
69
Por lo tanto:
var
Dónde:
Yo es el predictor del valor medio de "Y" que corresponde a un determinado valor
de "X", por Ej.: Xo que puede estar o no dentro del recorrido de las
observaciones muestrales X1,X2,....,Xn y además esta predicción puede ser
puntual o de intervalos porque Yo es combinación lineal de las Yi.
Inferencia acerca de B:
B es la pendiente de E(x/y) = x es una recta de regresión nos interesa inferir
acerca de esta pendiente para este fin podemos aplicar 2 conceptos:
1.-Realizar una prueba de hipótesis acerca de β.
2.-Determinar un intervalo de confianza β.
Desarrollo:
1. Utilizamos los conceptos generales de hipótesis cuando Ho : B = Bo,
entonces Hi: B<>Bo, B>Bo, B<Bo. Para los correspondientes cálculos por
teoría de valores <30 usamos t - student.
t =valor critico que se define sabiendo alpha para "n-2" en la distribución t.
70
Estimación de un valor estimado de y para un valor de x dado:
La recta teórica E(y/x)=α+βx en realidad representa la media de un
conjunto de datos yi para cada Xp fijo (yiàXp) Supongamos que Xp tiene
ocho imágenes: Xp X1,X2,...,X8 la probabilidad de escoger un y i para Xp
es de 1/8 es decir:
E(y/Xp)= p(yi)
=1/8 y1+1/8 y2+...+1/8 y8
=1/8
Sus medias yi, y2, yp no necesariamente están sobre la línea recta por lo
tanto en general la línea de regresión puede llamarse Curva de Regresión
de y/x.
La recta y=α+βx se constituye en el estimador directo de E(y/x)=α+βx donde
un valor particular d y puede ser determinado por “y”, por ejemplo:
Sea Xp= 2.5. Cuánto valdrá y si tenemos si tenemos una recta y=5+32.5Xp.
y=5+32.5*2.5
y=86.25àE(y/x)=2.5
El método tiene algunas observaciones:
1. Siempre abra un error en la estimación de valor esperado de y.
2. El valor esperado de “y” cuando x= Xp es la imagen de Xp en la recta y=α+βx.
Para este tipode rectas ajustadas la varianza es igual a la relación:
Var(y)= [1/n + (Xp-x)2/(nS2x)]
Es decir y tiene distribución normal con una media y, con una varianza y.
De estos conceptos interese la prueba de hipótesis respecto al valor
estimado de y. Tenemos para esto las siguientes relaciones:
71
Ho: E(y/x= Xp)=Eoàx1 E(y/x=Xp)Eo
E(y/x=Xp)>Eo
E(y/x= Xp)<Eo
Como son pruebas pequeñas el estadístico de prueba es:
t=y-Eo
s(1/n+(xD-x)2/(nS2x))1/2
Donde los valores para a se encuentra de la rtabla t- student con n-2 grados de
libertad.
Ejemplo.- Calcular el intervalo de confianza para E(y/x=2.5) si α=0.05.
Para determinar el intervalo de confianza usamos:
y±tα/2S(1/n+(xD-x)2/(n S2X))1/2
86.5±2.77(26.997) (1/6+(2.5-2)2/(6*0.667))1/2
86.25±35.87
E(y/x=2.5) (50.38,122.12)
Predicción de un valor particular de y para un valor de x:
Hasta el momento hemos "ajustado" una muestra de n pares ordenados
(xi,yi)….(xn,yn) a una recta habiendo obtenido la ecuación de predicción
y=α+βx nuestro principal interés es usar esta ecuación para poder predecir
el valor de y dado un valor de x seleccionado por lo tanto surgen dos
preguntas:
¿Será posible hallar el verdadero valor de y? No es posible lo que se hace
es estimar el valor de “y” y esta estimación puede ser mayor o menor que
el valor de y por lo tanto siempre hay un error: e=y-y.
1) ¿Cuál de las estimaciones: puntual o intervalica conviene para este fin?
Para predecir el valor de “y” es mejor usar la estimación intevalica.
72
Intervalo de predicción para Y:
El intervalo de predicción está dado por la siguiente relación:
Ejemplo: Calcular el intervalo de predicción para los siguientes datos
=xp=2.55 + 32.5*2.5à86.25 por tablas student: S=27
=2.76 n=6
Remplazando valores: 86.25 ±2.76*27
E) intervalo de predicción "y" pertenece <3.17, 169.33>
Con los valores hallados podemos determinar un gráfico que nos muestra
los limites comparando la varianza (e) y var( ) observamos que var(e)>
var( ) esta diferencia indica que "la variabilidad del error al predecir un solo valor
de y es mayor que la variabilidad de la estimación del valor esperada de y"
como observamos en el siguiente gráfico: en un sistema de coordenadas x,y
tenemos:
000252128256252127232252126208252125184
Dónde:
L.C.I.:Limite de confianza inferior
L.C.S.:Limite de confianza superior
Existe un límite de confianza superior e inferior.
Existe un límite de predicción superior e inferior.
Entre los límites de confianza superior e inferior existe un intervalo de confianza
73
xp
y
E(Y/X)=α+βx
µ
E(Y/X)
e
X
del 95% paraE(x/y).
Entre los límites de predicción existe un intervalo de predicción del 95% para y.
252130304252132352252131328Las diferencia
que existen entre µ,e, y la recta E(y/x) se puede
observar en el siguiente gráfico:
Observando el gráfico:
Significando además:
Considerando por otra parte que la varianza del
error es "e" y está determinado por:
ANÁLISIS DE CORRELACIÓN:
Coeficiente de Determinación y Coeficiente de Correlación
El análisis de correlación es una herramienta que se aplica para describir el grado
en el que una variedad está linealmente relacionada con otro. El análisis de
correlación se usa conjuntamente con el análisis de regresión para medir la
variación de la variable dependiente "y" alrededor de la recta de regresión, pero
además la correlación se usa por sí misma para medir el grado de asociación
entre dos variables (X,Y).
Existen dos medidas para describir la correlación entre dos variables:
a) Elcoeficiente de determinación y
b) Elcoeficiente de correlación.
74
a) ¿Qué es el coeficiente de determinación?
El coeficiente de determinación se define de la forma sgte:
b) ¿Qué es el coeficiente de correlación?
Es un indicador que mide el grado de intensidad a fuerza de la lineal entre
dos variables "Y" y "X", que sea independiente de sus respectivas escalas
de medición.
El coeficiente de correlación, denotado por “r”, se define de la sigte. Forma:
Donde 0<=r2<=1
1. Si r2 es cercano a 1 indica una fuerte correlación entre X e Y.
Si r2 está cercano a "0", indica una pobre correlación entre X e Y.
75
OBSERVACIONES
1. El valor de “r” indica la dirección de la relación entre las dos variables “X” y “Y”.
i) Si:0<r<1, entonces la recta de regresión es creciente (Su
pendiente es positiva).A su vez cuando “r” está cerca de 1,
diremos que existe correlación lineal positiva fuerte.
ii) Si -1<r<0, entonces la recta de regresión es decreciente (de
pendiente negativa).A su vez, cuando“r” está cerca de -1,
diremos que existe correlación lineal negativa fuerte.
iii) Si “r” está cerca de cero, diremos que aparentemente no haycorrelación lineal.
0252135424252137472
00252144640252147712252145664
x
Y
Correlación linealpositiva FUERTEr está cerca a 1
x
Y
Correlación linealnegativa FUERTEr está cerca de -1
x
Aparentemente NOhay correlación linealr está cerca de “0”
x
YY
CorrelaciónVILINEAr está cerca de “0”
76
000252147712252149760252148736
PROBLEMA: El número de crímenes por 100,000 habitantes aumento en una
ciudad, en un periodo de 6 años, en la siguiente forma.
AÑO X 1 2 3 4 5 6
CRÍMENES Y 8 11 16 19 25 29
a). Encuentre a recta de cuadrados mínimos que relaciona Y con X.
b). A manera de verificación de los cálculos, represente los seis puntos y la
recta.
c). Calcule S2.
d). ¿Representan tan solo los datos suficiente evidencia que indique que "Y" y
"X" están relacionadas linealmente?
Solución.
a) Fórmulas
1)
Dónde:
y
Un valor observado de la variable dependiente Y
77
De Xi Obtenemos
De Xi Obtenemos
Luego : cov(x,y)=
= 12.5
2) =18-4.286(3.5)
=2.999
3) Luego: la recta de regresión será:
1) Hágalo Ud.
2) S2 =
=
= 0.6375 à S=0.798
3) Se debe probar la hipotesis HD=β=0, frente a
H1=β≠0 con α=0.05
00
-z z
78
2) El valor critico es
3) El estadístico de prueba es:
t = =
t = 22.415
Se Rechaza HD
III. GLOSARIO
. AJUSTE
Conjunto de técnicas que se emplean después de la recopilación de datos para
controlar el efecto de las variables de confusión sean conocidas o potenciales.
.ALEATORIO
Al azar, a la suerte
.ANÁLISIS
Comparación del desenlace del grupo de estudio con el grupo de control o testigo
.APAREAMIENTO
Análisis simultaneo de dos o más observaciones realizadas en el mismo individuo
o en individuos similares
.ASIGNACIÓN
Selección de individuos para los grupos de estudio y de control
.ASIGNACIÓN AL AZAR
Método de asignación probabilística conocida no necesariamente igual a un grupo
determinado sea el del estudio o de control
.COEFICIENTE DE CORRELACIÓN
Estadístico utilizado para analizar el grado de asociación entre dos variables ,cada
una de las cuales se ha extraído por muestreo de la población de interés.
.COEFICIENTE DE DETERMINACIÓN
Es el cuadrado del coeficiente de correlación, que permite medir la bondad de
ajuste entre la variable regresada(Y) y el o los regresores (Xs)
79
.DATOS CONTINUOS
Tipo de datos con un número ilimitado de valores espaciados uniformemente
.DATOS NOMINALES
Datos que sólo diferencian las observaciones o características ,que no guardan
ninguna categoría
.DATOS ORDINALES
Datos que significan o representan un número limitado de categorías que tienen
un orden inherente de menor a mayor.
.DESVIACIÓN ESTÁNDAR
Medida de dispersión de un conjunto de datos ,que se obtiene sacando la raíz
cuadrada de la varianza
.DISTRIBUCIÓN DE FRECUENCIAS
De frecuencias absolutas o relativas de todos los posibles valores de una
característica, que oralmente se presentan en tablas y /o gráficas
.DISTRIBUCIÓN GAUSIANA
La distribución de la Normal representación gráfica en una curva simétrica
continua y acampanada, cuya media representa la el punto más alto
.DOCIMASIA
Proceso por el cual se realiza la prueba de hipótesis estadística
.ERROR DE MUESTREO
Error introducido por la diferencia debidas al azar entre la estimación obtenida en
la muestra y el verdadero valor de la población.
.ERROR ESTÁNDAR
Grado de dispersión de las estimaciones puntuales obtenidas en muestras de un
determinado tamaño.
.ESTADÍSTICO
Valor determinado en base a los datos de una muestra y utilizado para estimar el
valor de un parámetro de la población de la que se ha extraído la muestra.
80
.ESTIMACIÓN
Un valor o intervalo de valores calculados a partir de una muestra de
observaciones que se emplea como aproximación al valor correspondiente en la
población es decir al parámetro
.ESTIMACIÓN PUNTUAL
Valor único calculado a partir de las observaciones muestrales que se utiliza
como estimación del valor poblacional o parámetro.
.ESTRATIFICACIÓN
Generalmente se entiende la división en grupos o estratos una población
heterogénea y muy grande
.GRADOS DE LIBERTAD
Permite tomar en cuenta el número de parámetros poblacionales que se deben
estimar en una muestra para poder aplicar ciertas pruebas estadísticas
.HIPÓTESIS NULA
Afirmación de que no existe una asociación o diferencia verdadera entre las
variables en la población de la que se extrajo la muestra estudiada.
.HIPÓTESIS ALTERNA
Proposición que se acepta cuando se rechaza la hipótesis nula
.INFERENCIA
Es el proceso lógico que tiene lugar durante las pruebas de significación
estadística
.INTERVALO DE CONFIANZA
Es el intervalo de valores numéricos en el que se encuentra el valor poblacional
que se está estimando con un nivel de confianza alta
.INTERPRETACIÓN
Extracción de conclusiones sobre el significado de cualquier diferencia observada
entre el grupo de estudio y el de control incluidos en la investigación
.MEDIA
Suma de todas las mediciones dividida entre el número total de observaciones,
forma especial del promedio
81
.MEDIANA
Punto medio de la distribución, dejando la mitad de los valores por arriba y la otra
mitad por debajo.
.MUESTRA
Subgrupo de una población obtenido por un investigador para extraer
conclusiones o para realizar estimaciones sobre la población
.MUESTRA ALEATORIA
grupo de observaciones obtenidas de una población de manera que la distribución
muestral de los valores de la variable independiente es representativa de su
distribución en la población
.NO SESGADO
Sin error sistemático asociado
.PARÁMETRO
Valor que sintetiza la distribución o característica de una población
.POBLACIÓN
Grupo numerosos compuesto con frecuencia que tienen por lo menos algo en
común.
.POBLACIÓN OBJETIVO
Grupo de individuos a los que se desea extrapolare o aplicar los resultados de una
investigación, que a veces es distinta de la población de la que se extrae la
muestra de una investigación
.PRECISO
Sin error aleatorio asociado
.PROBABILIDAD
Proporción en la cual el numerador es el número de veces que ocurre un suceso y
el denominador, ese mismo número sumado al número de veces que no ocurre el
suceso.
.RECORRIDO
Diferencia entre los valores máximo y mínimo de una población o de una
muestra(sinónimo de amplitud)
82
.VARIABLE
Característica medible en una muestra o población de datos
.VARIANZA
Medida de dispersión medido en unidades al cuadrado, se obtiene haciendo el
cuadrado de la desviación.
.ROBUSTO
Se dice que una prueba estadística es robusta si se pueden transgredir sus
supuestos ,sin que ello repercuta sustancialmente en las conclusiones
.TÉCNICAS DE REGRESIÓN
Métodos estadísticos útiles para describir la asociación entre una variable
dependiente y una o más variables independientes .
.VALOR P
Probabilidad de realizar una observación al menos tan alejada de la condición
descrita en la hipótesis nula como la observada en nuestro conjunto de datos si la
hipótesis nula fuera cierta
ANEXO 1
LECTURAS COMPLEMENTARIAS
ANEXO 2
ANEXO 3
ANEXO 4
Top Related