Download - UNIVERSIDAD SALESIANA DE BOLIVIA INGENIERÍA DE …virtual.usalesiana.edu.bo/web/contenido/dossier/22012/1599.pdf · la consecución de su programa de estudios en la asignatura de

UNIVERSIDAD SALESIANA DE BOLIVIA

INGENIERÍA DE SISTEMAS

DOSSIER

Docente : Dr. Ing. NICOLÁS SALVADORAsignatura : Inferencia Probabilística

Gestión : 2 / 2012

La Paz – Bolivia

ÍNDICE

I. INTRODUCCIÓN. ............................................................................................ 1

1. PRESENTACIÓN........................................................................................ 2

BASES PEDAGÓGICAS DEL PRESENTE DOSSIER. ................................... 2

2. OBJETIVO .................................................................................................. 3

II. CONTENIDO DEL DOSSIER .......................................................................... 4

1. INFERENCIA PROBABILÍSTICA ................................................................ 4

ESTADÍSTICA.- ............................................................................................... 4

ESTADÍSTICA DESCRIPTIVA.- ...................................................................... 4

ESTADÍSTICA INFERENCIAL......................................................................... 4

TIPOS DE VARIABLES BIDIMENSIONALES.- ............................................... 6

2. INFERENCIA ESTADÍSTICA.-.................................................................... 6

POBLACIÓN.-.................................................................................................. 7

MUESTRA.- ..................................................................................................... 7

3. FORMAS DE ANOTACIÓN DE LOS PARÁMETROS Y ESTADÍGRAFOS. 8

PARÁMETRO.- ................................................................................................ 8

ESTADÍGRAFO.- ............................................................................................. 8

4. VARIABLES ALEATORIAS.-....................................................................... 8

NOTACIÓN DE PROBABILIDAD.- .................................................................. 8

ESPACIO MUESTRAL.- .................................................................................. 9

SUCESO O EVENTO.- .................................................................................... 9

5. VARIABLES ALEATORIAS....................................................................... 11

INTRODUCCIÓN.-......................................................................................... 11

DESVIACIÓN ESTÁNDAR DE UNA VARIABLE ALEATORIA.- .................... 15

VARIABLE ALEATORIA BIDIMENSIONAL DISCRETA.- .............................. 17

FUNCIÓN DE DISTRIBUCIÓN ACUMULADA BINARIA.- ............................. 18

DISTRIBUCIONES MUESTRALES................................................................... 24

DIFERENCIA ENTRE ESTADÍSTICA Y PARÁMETROS: ............................. 24

DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE MEDIAS:....................... 33

6. ESTIMACIONES ....................................................................................... 35

7. TEORÍA DE TCHEBITCHEB.- .................................................................. 42

8. FRECUENCIA DE OBSERVACIÓN QUE SE ENCUENTRA A K

DESVIACIÓN STANDARD DE LA MEDIA PARA LOS DATOS DE LA TABLA

ANTERIOR.-...................................................................................................... 45

9. DETERMINACIÓN DEL TAMAÑO DE UNA MUESTRA........................... 46

TEORÍA DE LA DECISIÓN ESTADÍSTICA (DOCIMA O DOCIMASIA).- ....... 50

DISTRIBUCIÓN DE PROBABILIDAD: ........................................................... 54

PROBLEMAS DE DOCIMACÍA: .................................................................... 57

REGRESIÓN LINEAL Y CORRELACIÓN:..................................................... 61

CARACTERÍSTICAS DE LAS RECTAS: ....................................................... 66

HIPÓTESIS SOBRE LA DISTRIBUCIÓN DE PROBABILIDAD: .................... 67

ANÁLISIS DE REGRESIÓN: ......................................................................... 68

ANÁLISIS DE CORRELACIÓN:..................................................................... 73

III. GLOSARIO .................................................................................................. 78

IV. ANEXOS

1

I. INTRODUCCIÓN.

En el campo de la educación la sociedad actual tiende a la Sociedad del

Conocimiento.

El hecho de aprender a administrar y controlar el proceso de aprendizaje en la

transición hacia esa Sociedad del Conocimiento es un reto constante y dinámico.

En éste sentido aquellas organizaciones dedicadas a la Educación deben revisar y

analizar sus procesos educativos, adaptando currículos a las necesidades del

momento, a los nuevos retos y situaciones.

Educar es un modo de cooperar entre educadores y educandos para que

transformen sus vidas, en un proceso permanente de aprendizaje; educar es

ayudar a que los alumnos construyan su propia identidad, su futuro, a que llenen

sus aspiraciones en un plano personal y profesional; educar es también el

desarrollo de sus habilidades de comprensión y comunicación que permitan a que

los alumnos lleguen a ser ciudadanos realizados. Entonces la acción de educar

mejor, se reflejará en una reacción, que ofrecerá la posibilidad de tener menor

corrupción, menor delincuencia, menor atraso, es decir, desarrollar una sociedad

más competitiva, un país positivo en su avance hacia una sociedad libre.

Cooperar personalmente a la realización de éste plan, es la política educativa que

como docente, se desea llevar a cabo en la U.S.B.

Es evidente que un grano de arena puede ser muy poco en la playa de la

indiferencia y el estatismo, pero la gota de agua horada la roca y juntos todos los

docentes podemos cumplir la meta.

2

1. PRESENTACIÓN

BASES PEDAGÓGICAS DEL PRESENTE DOSSIER.

a. Así como a su tiempo tanto la escritura, como la imprenta al constituirse en

grandes revoluciones técnicas, transformaron a la educación, actualmente la

autística virtual con una estructura muy distinta a la de los entornos reales o

naturales, donde tradicionalmente se ha desarrollado la educación, conduce

inexorablemente a la “Sociedad del Conocimiento”.

El espacio virtual (“Aula sin paredes”) siendo en su naturaleza:

representacional, distal, multicrónico, dependiente no de recintos espaciales,

sino de redes electrónicas, como entorno de multimedia, no se constituye sólo

en un nuevo medio de información y comunicación, sino más aun, en el espacio

para la interacción, en este sentido como un nuevo camino para la educación,

como un aula sin paredes.

Actualmente no basta con enseñar a leer, escribir, contar y a comportarse,

dentro de los espacios naturales y urbanos en los que tradicionalmente se ha

desarrollado la vida social; a esto al presente es preciso implementar la escuela

digital y virtual, requiriendo la sociedad de la información, un nuevo tipo de

alfabetización, esto involucra la necesidad de adquirir nuevas habilidades y

destrezas, para intervenir competitivamente en el espacio cibernético.

En este sentido nuestra condición de “Analfabetos Funcionales” en el nuevo

espacio social nos impele a buscar conocimientos en estos caminos virtuales,

es decir aplicar SISTEMAS INFORMÁTICOS como sendas nuevas para la

educación.

b. Llevar a cabo el proceso anteriormente indicado y orientarlo en su aplicación a

grupos de APRENDIZAJE COOPERATIVO, precisamente basados en la

3

interacción entre pares y entre estos y el conductor. En nuestro caso entre

alumnos y entre alumnos y el docente, es un segundo componente de éste

modelo.

c. Y si a éstos dos predicamentos se añaden los valores del ESPÍRITU

SALESIANO, nacidos del sistema preventivo de Don Bosco donde la opción

prioritaria esta dedicada a los jóvenes y sobre todo a los provenientes de

clases populares, acomodando en la educación virtual los preceptos que

indican: Una estrecha relación entre cultura, educación y una experiencia

comunitaria con espíritu de familia, de los profesores con y para los alumnos,

demostrando un estilo educativo basado en la: “Amorevoleza”, entonces se

habrá tratado de implementar una nueva forma de enseñanza y aprendizaje

acorde a los tiempos.

Esta es nuestra proposición pedagógica, conjuncionar los tres criterios

mencionados: Métodos Informáticos, Aprendizaje Cooperativo y Estilo

Salesiano, aplicado a un área especifica de Ingeniería de Sistemas, es decir a

una asignatura particular de la malla curricular como es la “Inferencia

Probabilística” con el objeto de programar un plan que pueda ser aplicable en

la practica en la Universidad Salesiana.

2. OBJETIVO

Siendo un Dossier una Memoria Pedagógica que en general contiene los

lineamientos primordiales para la ejecución de un programa de estudios, un primer

objetivo fundamental del presente Dossier conjunto, es servir de guía al alumno en

la consecución de su programa de estudios en la asignatura de Inferencia

Probabilística mediante su consulta, el estudiante, podrá hacer un seguimiento de

los temas comprendidos en el plan de estudios para su propio control. Además

este Dossier puede servir como medio de orientación ya que al conocer de

antemano un tema determinado podrá por consulta en Internet, profundizar el

4

mismo ya sea por su importancia o por la necesidad de ampliar la base temática o

la ejecución de prácticas, ejercicios o problemas.

Luego un tercer objetivo del Dossier, consiste en oficiar de programador de

actividades en base a la descripción de temas mediante la cual el alumno podrá

programar sus clases de antemano en relación a exámenes parciales o finales

combinando el Dossier con los Planes de Disciplina respectivos.

II. CONTENIDO DEL DOSSIER

1. INFERENCIA PROBABILÍSTICA

ESTADÍSTICA.-

La estadística es una ciencia que proporciona métodos para recolectar, resumir,

dosificar, tabular, analizar, interpretar y presentar el comportamiento de los datos

de una materia de estudio investigación permitiendo generalizar y dar estrategias

de solución a los problemas emergentes siendo el motivo fundamental tratar de

descubrir diferencias que surgen de todas las variaciones en un problema. Como

ciencia y como arte la estadística está clasificada en dos grupos:

ESTADÍSTICA DESCRIPTIVA.-

La estadística descriptiva concretamente se refiere a recolectar y analizar los

datos de un problema.

ESTADÍSTICA INFERENCIAL

La estadística inferencial permite la toma de decisiones que den solución a un

problema.

La siguiente tabla nos da una idea de los propósitos de la información en la

5

Estadística General.

En el siguiente resumen mostraremos la clasificación de las series temporales y

atemporales:

Atemporales:

Frecuenciales:

Cualitativas:

Nominales

Ordinales

Cuantitativas:

Discretas

Continuas

Espaciales: Espacio Geográfico)

Temporales o Cronológicas

Problema

Realidad Estadística Descriptiva

RecolecciónOrganizaciónPresentación

Censo

Muestreo

EstadígrafoTrabajo Preparatorio

InferenciaEstadística

DecisiónEstadística

EstimaciónDocimasiaPredicción

Parámetro Conclusión

Información

Toma de Decisiones

6

TIPOS DE VARIABLES BIDIMENSIONALES.-

1. Variables bidimensionales cualitativas:

Grado de estudio – Nivel de conocimiento

Belleza – Popularidad

2. Variables bidimensionales cualitativas y cuantitativas:

Ocupación - Remuneración

Calidad – Precio

3. Variables bidimensionales cuantitativas:

Horas de trabajo – Horas de descanso

Precio – Tiempo de garantía

4. Variables bidimensionales cuantitativas-discretas:

Cantidad de empleados – Número de ropa de trabajo

Número de computadoras – Cantidad de fallas

5. Variables bidimensionales cuantitativas discretas y continuas:

Edad – Grado de envejecimiento

Número de hijos – Presupuesto para cada uno

6. Variables bidimensionales cuantitativas ambas continuas:

Densidad – fricción

Radio – Alcance o volumen

2. INFERENCIA ESTADÍSTICA.-

Si la estadística descriptiva tiene el fin de tratar los datos recogidos resumiéndolos

y describiéndolos la inferencia estadística se ocupa de analizar dichos datos para

obtener conclusiones para la toma de decisiones.

7

En la mayoría de los análisis estadísticos la descriptiva no es más que el trabajo

preliminar para la inferencia estadística.

Para comprender lo que quiere decir la inferencia estadística es necesario conocer

dos conceptos: muestra y población.

POBLACIÓN.-

Se usa indistintamente con el de universo y se refiere a la totalidad de posibles

observaciones o medias que se consideran en determinado problema. En concreto

la población son un conjunto de objetos, alumnos, edificios definidos con relación

a todos los miembros.

MUESTRA.-

Es un subconjunto de la población puesto que es una colección de observaciones

tomadas de una población en la cual toda característica se llama estadígrafo, por

lo tanto la inferencia estadística es una técnica mediante la cual se sacan

conclusiones o generalmente acceder de los parámetros de la población. Sin

embargo es necesario que dicha generalización puede estar equivocada porque

su cálculo o media puede estar basado en las probabilidades.

Las características de una población se llaman parámetros considerándose como

el verdadero valor. Calcular el verdadero valor de una población es difícil en la

investigación estadística por o general se considera la colección de información

parcial o incompleta

8

3. FORMAS DE ANOTACIÓN DE LOS PARÁMETROS Y ESTADÍGRAFOS.-

PARÁMETRO.-

Este es un valor verdadero y es una media de la población general, los valores de

los parámetros se desconocen.

ESTADÍGRAFO.-

Se conoce el valor del estadígrafo con el propósito de estimar un parámetro

desconocido. Un estadígrafo es conocido también como estadístico, medida de la

muestra, entre los más conocidos se tienen los promedios y los grados de

variabilidad.

· La media en la población: u

· La media de la muestra: x

· La varianza en la población: 2

· La varianza en la muestra: S2

· La desviación standard en la población: 2 =∑(x - u)2/N

· La desviación standard en la muestra: S2=∑(x - x)2/n

4. VARIABLES ALEATORIAS.-

NOTACIÓN DE PROBABILIDAD.-

En general si A es subconjunto d S, donde el suceso A puede ocurrir de n

maneras y S de N maneras entonces la probabilidad de un evento A está definida

por:

P(A)=n/N

O sea el número de elementos de A sobre el número de elementos de S.

9

En esta definición que corresponde a la teoría clásica de la probabilidad la misma

compara espacios equiprobables en la moderna teoría de la probabilidad las

relaciones son axiomáticas.

En un experimento probabilístico los casos posibles son todas las probabilidades y

casos favorables son aquellos casos que para posibilidades cumplen una

condición es decir:

P = casos favorables / casos posibles

ESPACIO MUESTRAL.-

Es el conjunto de todos los resultados posibles de un experimento dado

usualmente asignado por S o en algunos casos por 12 representado también

como conjunto universal.

Un elemento de S se llama punto muestral para describir correctamente un

espacio muestral asociado con un experimento debe tener una idea muy clara de

lo se requiere medir. Todo espacio muestral está asociado a un experimento por lo

tanto se debe decir correctamente Un espacio muestral.

SUCESO O EVENTO.-

Un suceso es simplemente un subconjunto de resultados posibles es decir es un

subconjunto del espacio muestral asignado como A.

El suceso que consta de un elemento se llama suceso elemental. El conjunto

vacío y el conjunto universo se llama suceso seguro.

De las definiciones anteriores resulta la siguiente relación de probabilidad:

O <= P <= 1

10

EJEMPLO.- Se hace rodar un dado correcto donde obtenemos como resultado

1,2,3,4,5,6 casos posibles, es decir la probabilidad es de 1 – 6 de que salga

cualquiera de los números indicados: P=1/6

Si el conjunto S = 1,2,3,4,5,6 deseamos obtener números pares A =2,4,6

entonces la probabilidad es:

P=3/6, entonces P=1/2

EJEMPLO.- Sea el experimento lanzar dos dados el espacio muestral será:

S=(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),

(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),

(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),

(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),

(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),

(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)

Donde A es la suma de punto igual o mayor a diez:

A=(4,6),(5,5),(5,6),(6,4),(6,5),(6,6)

Entonces: P = 6 / 36

EJEMPLO.- Sea el experimento lanzar dos monedas y un dado.

S=cc1,cc2,cc3,cc4,cc5,cc6,cs1,cs2,cs3,cs4,cs5,cs6,sc1,sc2,sc3,sc4,sc5,sc6,ss1,

ss2,ss3,ss4,s s5,ss6

Encontrar dos caras y un número par:

A=cc2,cc4,cc6

Entonces: P= 3/24

11

5. VARIABLES ALEATORIAS

INTRODUCCIÓN.-

En los ejemplos anteriores introducimos algunos modelos probabilísticos con

espacios muéstrales simples facilitando la comprensión del concepto de

probabilidad. Sin embargo en el estudio de situaciones más general precisamos

cumplir estos conceptos, estas variables numéricas con las cuales asociamos

modelos probabilísticos son llamadas variables aleatorias. La definición de

variable aleatoria está definida si consideramos a E como experimento y Ω un

espacio muestral en este experimento entonces una función x: Ω àR donde a

cada elemento W que pertenece a sigma W€Ω donde W€Ω se le asocia un

número real X = X (W)

El gráfico siguiente nos da una idea: f(x):Ω€R donde W€Ω se le asocia un número

real X donde X = X (W)

02516910082516899842516889600

EJEMPLO.-Sea el experimento:

S=(c,c,c),(c,c,s),(c,s,c),(s,c,c),(c,s,s),(s,c,s),(s,s,c),(s,s,s)

La variable aleatoria x toma los siguientes valores cuando están compuestos de

las tres caras.

X = X (W)

R

W

WW

W

W

W WW

WWW

12

X =x(c,c,c)= 3

X =x(c,c,s)=x(c,s,c)=x(s,c,c)=2

X =x(c,s,s)=x(s,c,s)=x(s,s,c)=1

X=x(s,s,s)=0

Rx = x/x=0,1,2,3

El concepto de variable aleatoria queda definido cuando un experimento aleatorio

asociado a Suna función x que asigna a cada elemento W uno y solamente un

número real x. El siguiente gráfico nos ilustrara.

R = 0,1,2,3

El nuevo conjunto R está conformado por números real es y nos permite el cálculo

de probabilidades del siguiente modo:

P [3] = P [(ccc)] =1/8

P [2] = P [(csc)] + P[ccs] + P[scc] =3/8

P [1] = P [(css)] + P[scs] + P[ssc] =3/8

P [0] = P [(sss] =1/8

OBSERVACIÓN 1.- En la definición de variable aleatoria observamos que dado un

punto W que pertenece al espacio muestral donde x pertenece a los

números reales este valor es un número real.

OBSERVACIÓN 2.- El rango conformado por todos los valores de las

variables aleatorias estará dado por el siguiente conjunto x=xi=WE Ω/x(W)=xi.

El dominio de la variable aleatoria x es Ω y el rango es un subconjunto que lo

denominamos Rx.

3210

ccs csc

ccs scc scc

css ssc

ssc

13

FUNCIÓN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA.- Sea x

un espacio muestral que pertenece a R con una variable aleatoria que toma los

valores x1,x2,...,entonces se dice que p(xi) es la función de probabilidad de una

variable aleatoria x. Si a cada valor de xi se asocia su valor de probabilidad

entonces expresamos la siguiente relación:

P(xi) = P[x=xi] = P[WE Ω /x(W)=xi]; i=1,2,...

EJEMPLO.- Sea el experimento de lanzar dos dados y observamos los números

que aparecen en la superficie o caras superiores de los dados bajo las siguientes

condiciones:

1) Encontrar la probabilidad x de la suma de los números que aparecen en los

dados. En este experimento los posibles valores serán: x(W)=i + j entonces: W

=(i,j)=2,3,4 Si tenemos x=2 corresponde al evento (1,1) con la probabilidad 1/36 es

decir: P[x=2]=P(1,1)=1/36. Considerando en forma similar para la suma de los

otros eventos, para los otros casos tenemos:

X 2 3 4 5 6 7 8 9 10 11 12P 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

2) Encontrar la función de probabilidad de la variable aleatoria y como

diferencia de los números que aparecen en las caras superiores de los

dados.

Análoga los valores de la variable aleatoria y(W)=i - j donde W=(i,j) son:

Y=-5 si ocurre (1,6)=1 Probabilidad

Y=-4 sí ocurre (1,5) o (2,6)=2 Probabilidad

Y=-3 si ocurre (1,4) o (2,5) o (3,6)=3 Probabilidad

Y=-2 si ocurre (1,3) o (2,4) o (3,5) o (4,6)=4 Probabilidad

Y=-1 si ocurre (1,2) o (2,3) o (3,4) o (4,5) o (5,6)=5 Probabilidad

14

Y=0 si ocurre (1,1) o (2,2) o (3,3) o (4,4) o (5,5) o (6,6)=6 Probabilidad

Y=1 si ocurre (2,1) o (3,2) o (4,3) o (5,4) o (6,5)=5 Probabilidad

Y=2 si ocurre (3,1) o (4,2) o (5,3) o (6,4)=4 Probabilidad

Y=3 si ocurre (4,1) o (5,2) o (6,3) =3 Probabilidad

Y=5 si ocurre (6,1) = 1 Probabilidad

Según el espacio muestral S la distribución de probabilidad de la variable

aleatoria está conformada de la siguiente manera:

Y -5 -4 -3 -2 -1 0 1 2 3 4 5P(Y)=P(Y=y) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

Ry= -5,-4,-3,-2,-1,0,1,2,3,4,5

VARIABLE ALEATORIA DISCRETA.- Si el rango de la variable aleatoria x es un

conjunto finito se llama variable aleatoria.

EJEMPLO.- Lanzar una moneda tres veces, encontrar la distribución de

probabilidad en forma tabular y gráfica.

S= ccc,ccs,csc,scc,css,scs,ssc,sss

P[x=3]=1/8

P[x=2]=3/8

P[x=1 ]=3/8

P[x=0]=1/8

La representación tabular será:

x P(x)0 0.1251 0.3752 0.3753 0.125P(x) 1

15

De la tabla obtenemos el siguiente gráfico:

ESPERANZA DE LA VARIABLE ALEATORIA.- Definida por E(x) del producto de

la probabilidad p y del valor de x entonces:

E(x)= ∑ xi P(x)

X P(x) ∑xiP(x)0 0.125 01 0.375 0.3752 0.375 0.7503 0.125 0.375

1.5

VARIANZA DE VARIABLES ALEATORIAS.- Es la diferencia entre la sumatoria

del cuadrado de la variable x por su probabilidad menos el valor de la esperanza

al cuadrado:

Var(x)=∑ xi2P(x) –E(x)2

DESVIACIÓN ESTÁNDAR DE UNA VARIABLE ALEATORIA.-

= Var (X)

VARIABLE ALEATORIA BIDIMENSIONAL.- En los ejemplos anteriores hemos

considerado que el resultado de un evento es registrado por un único número real.

Sin embargo existen situaciones que en un experimento aleatorio genera dos

características en forma simultánea. En el siguiente ejemplo observaremos este

fenómeno.

16

EJEMPLO.- Estamos interesados en el estudio de la composición de familias con

tres hijos y tomando en cuenta el sexo. Consideramos las variables x, y, z con las

siguientes condiciones:

1) x es el número de niños (hombres)

2) y : 1-si el primer hijo es hombre.

0-si el primer hijo es mujer.

3) z es el número de veces que hubo variación den sexo entre nacimientos.

S=HHH,HH M,HMH,MHH,HMM,MHM, MMH,MMH

Construimos una tabla en base a los eventos, probabilidades y características x,

y, z:

Evento Probabilidad "xyz"HHH 1/8 310HHM 1/8 211HMH 1/8 212MHH 1/8 201HMM 1/8 111MHM 1/8 102MMH 1/8 101MMM 1/8 000

En la tabla anterior observamos que las variables x, y, z tienen sus respectivas

distribuciones de probabilidad del siguiente modo:

P(x) X1/8 03/8 13/8 21/8 3

P(x) Y4/8 04/8 1

P(x) Z2/8 04/2 11/4 2

17

La siguiente tabla denominada Distribución Conjunta solo toma un evento

esta vez a x, y obteniendo la siguiente representación si consideramos que:

P(x,y)= =P[X0x,Y=y] o también: P(x,y)= X=x ^ Y=y

Obteniendo una tabla de entrada conjunta que puede ser dispuesta de dos

maneras:

Forma (a)

(x , y) P(x , y)(0,0) 1/8(1,0) 2/8(1,1) 1/8(2,0) 1/8(2,1) 2/8(3,1) 1/8

Forma (b)

Y

X0 1 P(y)

0 1/8 0 1/81 2/8 1/8 3/82 1/8 2/8 3/83 0 1/8 1/8

P(x) 1/2 1/2 1

VARIABLE ALEATORIA BIDIMENSIONAL DISCRETA.-

Sea E un experimento y S el espacio muestral, a este experimento donde x, y

pertenecen a S son dos números reales es decir dos funciones asociadas a un

número real a cada resultado ósea W pertenece a S (W son los resultados) al

vector x, y se la denomina Variable Aleatoria Bidimensional el siguiente gráfico

nos ilustrara mejor.

W

Ω

X(W)=X

Y(W)=Y

18

OBSERVACIÓN.- Si x1,...,xn son k funciones tal que cada función k siempre

asocia a un número real entonces el vector x1,...,xk se denomina Variable

Aleatoria Multidimensional. Una variable aleatoria bidimensional discreta es

aquella donde los posibles valores de xi y de yj son valores finitos.

La función de probabilidad conjunta de una variable aleatoria bidimensional

discreta está definida por: 76757267 2732234

P(xi,yi)= P[x= xi, y= yj]

Sujeta a las condiciones:

1) ∑∑P(xi,yj)= ∑∑P[x=xi,y=yj]

2) La probabilidad debe ser menor o igual a 1 y mayor o igual a 0.

FUNCIÓN DE DISTRIBUCIÓN ACUMULADA BINARIA.-

La distribución acumulada x, y que se denota por F es una función R2 entre 0 y 1 y

se define por la regla de correspondencia.

F(x, y) = P[ X<x;Y<y ], x, y € R

Sí (x,y) corresponde a una variable bidimensional discreta entonces su función de

distribución acumulada es:

F(x, y)= P[X<x;Y<y]= ∑∑ P(xi,yj)

EJEMPLO.- Sea el experimento E lanzar dos dados al aire donde la variable

x denota el número de puntos obtenidos por el primer dado, y la variable

denota los puntos del segundo dado.

19

1) Hallar la distribución de probabilidad conjunta (x, y) y graficar.

S= (1,1),(1,2),(1,3),(1,4),(1,5),(1,6),

(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),

(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),

(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),

(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),

(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)

P(1,1)= P[X=1,Y=1]=1/6

P(1,2)= P[X=1,Y=2]=1/6, y así sucesivamente.

Por lo tanto la distribución de probabilidad conjunta será:

Y

X1 2 3 4 5 6

1 1/36 1/36 1/36 1/36 1/36 1/362 1/36 1/36 1/36 1/36 1/36 1/363 1/36 1/36 1/36 1/36 1/36 1/364 1/36 1/36 1/36 1/36 1/36 1/365 1/36 1/36 1/36 1/36 1/36 1/366 1/36 1/36 1/36 1/36 1/36 1/36

Cuya representación gráfica es:

0251704320

Xn……….. Y2 Y1

Z

Y1 Y2 Y3 Y4 Y5 ……. Yn

X

Y

20

2) Hallar la función de distribución acumulada.

Observamos nuevamente los valores del espacio muestral Ω veremos que la

distribución gráfica tiene la forma: ΩàF:R2 la representación en plano x, y tiene la

siguiente forma:

0251786240251785216251783168251784192

Por ejemplo x<2, y<3 tendrá como función de distribución acumulada bivariada los

puntos que se encuentran dentro y su probabilidad será:

F(2,3)=P[X<2,Y<3]=6/36

DISTRIBUCIÓN MARGINAL.- Teniendo la siguiente tabla.

X

Y1 2 3 P[Y=y]

1 0.03 0.06 0.06 0.152 0.02 0.04 0.04 0.53 0.09 0.18 0.18 0.454 0.06 0.12 0.12 0.3

0.2 0.4 0.4 1

La distribución marginal cuando x varia:

Px(1)=P[x=1,y=1]=0.03+0.02+0.09+0.06=0.2

Px(2)=P[x=2,y=1]=0.06+0.04+0.18+0.12=0.4

1 2

3 4

5

1 2

3 4

5

y

21

Px(3)=P[x=3,y=1]=0.06+0.04+0.18+0.12=0.4

La distribución marginal cuando y varia:

Py(1)=P[x=1,y=1]=0.03+0.06+0.06=0.15

Py(2)=P[x=1,y=2]=0.02+0.04+0.04=0.5

Py(3)=P[x=1,y=3]=0.09+0.18+0.18=0.45

Py(4)=P[x=1,y=4]=0.06+0.12+0.12=0.3

Con los anteriores valores conformamos las siguientes tablas:

"x" Px1 .22 0.43 0.4

1"x" Py1 0.152 .23 0.454 0.3

DISTRIBUCIONES CONDICIONALES.- Estas distribuciones tienen las siguientes

relaciones:

P(x, y)/Py=P[X=x/Y=y]=P[X=x*Y=y]/P[Y=y]

Función de probabilidad condicional de x está dado por [Y=y] Función de

probabilidad condicional de y está dado por [X=x]

22

EJEMPLO.- De la siguiente distribución de probabilidad conjunta encontrar la

distribución condicional indicada:

X

Y-1 1 P[Y=y]

0 0.17 0.25 0.421 0 0.33 0.332 0.08 0.17 0.25

P[X=x] 0.25 0.75 1

a) P[x=1/y=0]

P[x=1/y=0]=0.25/0.42

=0.6

b) P[y=2/x=-1]

P[y=2/x=-1]=0.08/0.25

=0.32

VARIANZA.-

Var(x)= ∑xi2P(xi)-E(x)2;Var(y)=∑yi2P(yi)-E(y)2

VARIABLES ALEATORIAS INDEPENDIENTES.- Son aquellas donde el

parámetro de probabilidades marginales no altera el resultado de las variables,

es decir:

Sí P(x,y)= P(x) P(y) considerando: P[X=x, Y=y]=P[X=x]P[Y=y]

EJEMPLO.- De la siguiente tabla calcular las variables independientes.

X

Y2 4 P[Y=y]

0.1 0.1 0.15 0.250.2 0.2 0.3 0.50.1 0.1 0.15 0.250.4 0.4 0.6 1

23

Comprobando la independencia tenemos la probabilidad de la variable x cuando:

Px2Py1=0.4*0.25=0.1

Px2Py3=0.4*0.5=0.2

Px2Py5=0.4*0.25=0.1

Px4Py1=0.6*0.25=0.15

Px4Py3=0.6*0.5=0.3

Px4Py5=0.6*0.25=0.15

ESPERANZA.- En algunos casos es preciso calcular el valor esperado de la

función de dos o más variables aleatorias. El valor de las esperanzas está

definido por:

E(x)=∑xi*P ; E(y)=∑yi*P

VARIANZA.-

Var(x)=∑xi2P(xi)-E(x)2 ; Var(y)=∑yi2P(yi)-E(y)2

COVARIANZA.-

Cov(x,y)=E(x,y)-E(x)E(y) ; Cov(x, y)=E(x,y) - E(x)E(y)

COEFICIENTE DE CORRELACIÓN.- Variables x, y de un sistema de variables

bidimensionales pueden estar relacionadas por un coeficiente que tome en cuenta

la covarianza y varianza.

P(x,y)=Cov(x,y) / Var(x) Var(y)

EJEMPLO.- Calcular el coeficiente de correlación tomando la siguiente tabla:

x

Y0 1 2 3 P[Y=y]

0 0 0 0 1/8 1/81 0 0 3/8 0 3/82 0 3/8 0 0 3/83 1/8 0 0 0 1/8

PjX=x] 1/8 3/8 3/8 1/8 1

24

E(x)=0(1/8)+1(3/8)+2(3/8)+3(1/8)

=3/2

E(y)=0(1/8)+1(3/8)+2(3/8)+3(1/8)

=3/2

Var(x)=12(1/8)+12(3/8)+22(3/8)+32(1/8)

=3/4

Var(y)=02(1/8)+12(3/8)+22(3/8)+32(1/8)

=3/4

E(x,y)=0*0*0+0*1*0+0*2*0+0*3*1/8+1*0*0+1*1*0+1*2*3/8+1*3*0+2*0*0+2*1*3/8+2

*2*0+2*3*0+3*0*1/8+3*1*0+3*2*0+3*3*0+3*3*0

= 3 / 2

Cov(x,y)=3/2-(3/2*3/2)

= - 3 / 4

P(x,y)=-3/4/(3/4*3/4)1/2

=-1

DISTRIBUCIONES MUESTRALES

La distribución de probabilidad de una estadística se llama distribución muestras

en general la palabra población es muy común y de uso general entro de la

inferencia población es el conjunto de todas las observaciones a resultados

posibles que puede tomar un variable aleatorio x en determinados casos o es

imposible o necesario tener todos los datos de una población por que los datos

de una sola parte de la población pueden dar la información necesaria para

generalizar acerca de los parámetros de la población que por lo general son

desconocidas una parte de la población se llama muestra.

DIFERENCIA ENTRE ESTADÍSTICA Y PARÁMETROS:

Un parámetro es una característica de la población una estadística es una

característica de una muestra el siguiente cuadro nos muestra algunas

25

designaciones particulares de los parámetros y la estadística.

Población

o Número total de elementos

considerados.

o Está determinada por parámetros

o Sus símbolos son:

N-tamaño de la población

µ-media de la población

-desviación estándar

Muestra

o Porción de la población que se

escoge.

o Está determinada por estadísticas,

o Sus símbolos son:

n-tamaño de la muestra

x-media de la muestra

s-desviación estándar

Las así llamadas estadísticas especialmente la media de las muestras y la "S"

sirven para estimar los parámetros "µ y " de la población mediante las

distribuciones muestrales.

Para poder definir el concepto de estimaciones se tienen que definir en forma

general las siguientes estimaciones:

ū: Estimación de la media poblacional.

σ2:Estimación de la varianza de poblacional.

: Estimación del total de la población.

: Estimación de la razón de los medios muestrales.

Estas estimaciones son determinadas luego de definir las distribuciones

muestrales. Consideramos algunos ejemplos de distribución muestrales (con

repetición o sin repetición).

Supongamos que extraemos una muestra al azar con reemplazamiento de una

población finita o extraemos la muestra de una población infinita o por último

tenemos una muestra que es pequeña con respecto a la población se cumple la

siguiente definición:

26

Una muestra aleatoria de tamaño "n" de una variable aleatoria x con una función

de probabilidad f(x) es el conjunto de n variables, y tiene las siguientes

condiciones:

1. Cada Xi tiene la misma distribución de x es decir que la variable: Fxi(x) =

Fx(x) se llama función de densidad.

2. Las variables aleatorias Xi son independientes como cada Xi tiene la misma

distribución de x se cumple que: E(xi) =E(x) ; 2xi= 2x.

Y finalmente la función de probabilidad conjunta de la muestra aleatoria está dada

por: fx1, x2,..., xt, (X1, X2,..., Xr,) = fx2(X2) fxn(Xn).

DISTRIBUCIÓN MUESTRAL DE X:

Las probabilidades de las estadísticas se llaman distribuciones muestrales (media

muestral).

Sea X1, X2,..., Xn una muestra que se obtiene remplazando de una variable

aleatoria x que es una población donde:

E(x) =µ y var(x) = 2

La media de la muestra está definida por:

Donde tos Xi son independientes distribuidos idénticamente con media y varianza

común es decir µi = E(xi) =µ y i= var(xi) = 2 donde: i =1,2,...n.

Aplicando el teorema del límite central tenemos la siguiente relación:

Donde: N número total de población.

27

Para una muestra siendo la población finita y sin reemplazamiento las variables

aleatoria “x”ya no son independientes por lo tanto:

El promedio -Tiene una distribución hipergeometrica con un factor de corrección

de población finita calculada del siguiente modo:

Ejemplo: sea una población Ω =2,4,6,8,10

Hallar la media µ y la desviación estándar σ:

Solución:

1. El tamaño N =5 =>µ = (2+4+6+8+10)/5 =>µ =6

Para σ = => σ = 2,83

2. Formar todas las muestras del tramo 2 que se extraen sin remplazamiento de

la población total:

µx

28

Solución:

Como la población es igual a 5 elementos y solo

debemos obtener muestras tamaño 2 sin

remplazamiento tenemos:

C52 = = 10

3. Hallar la media de cada muestra de los

calculados anteriormente:

4. Hallar la esperanza de la desviación estándar

de la media es decir determinar µx, y σx,.

Solución:

µx=(3+4+5+6+5+6+7+7+8+9)/10

àµx=6=µ

σ= = = 2.73

Muestra Media

(2,4) (2+4)/2=3

(2,6) 4

(2,8) 5

(2,10) 6

(4,6) 5

(4,8) 6

(4,10) 7

(6,8) 7

(6,10) 8

(8,10) 9

29

Ejemplo2: Efectuar los mismos cálculos pero considerando que la extracción en

con reemplazamiento:

Solución:

µx= 6 y x=2.83 (ver ejemplo anterior)

El cuadro a la derecha nos muestra las

muestras del tamaño 2 que se extraen con

remplazamiento:

El cálculo de x medía de f, y de hi nos

muestra la siguiente tabla:

Ejemplo: Sea la población A =1,2,3,4,5,6 donde N =6 hallar:

a). Conformar la distribución muestral de las medias de muestra de tamaño =2

b). Calcular la media, varianza y desviación estándar muestral y poblacional.

Condición: se trata de muestras con reemplazo o repetición:

Muestra Media(2,4)(4,2) 3 3(2,6) (6,2) 4 4(2,8) (8,2) 5 5

(2,10) (10,2) 6 6(4,6) (6,4) 5 5(4,8) (8,4) 6 6

(4,10) (10,4) 7 7(6,8) (8,6) 7 7

(6,10) (10,6) 8 8(8,10) (10,8) 9 9

(2,2) 2 2

(4,4) 4 4(6,6) 6 6(8,8) 8 8

(10,10) 10 10

X fi Hi = f/252 1 0.043 2 0.084 3 0.125 4 0.166 5 0.27 4 0.168 3 0.129 2 0.08

10 1 0.04

30

Solución:

1 2 3 4 5 6

1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)1 1.5 2 2.5 3 3.5

2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)1.5 2 2.5 3 3.5 4

3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)2 , 2.5 3 3.5 4 4.5

4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)2.5 3 3.5 4 4.5 5

5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)3 3.5 4 4.5 5 5.5

6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)3.5 4 4.5 5 5.5 6

a).Con esta tabla calculamos otros factores para lo cual conformamos la siguiente

tabla:

Para calcular u: se sabe que:

0251813888b µ

µ=126/62=> µ = 3.5:

La media poblacional también:

µ = µ

µ=(1+2+3+4+5+6)/6=3.5

La varianza muestras:

σ2 = =2.92

=> =52.5 / 36 => =1.46

000i ni 000i+ni(Xi - µ)2 (Xi - µ)2

1 1 1 6.25 6.251.5 2 3 4 82 3 6 2.25 6.752.5 4 10 1 43 5 15 0.25 1.253.5 6 21 0 04 5 20 0.25 1.254.5 4 18 1 45 3 15 2.25 6.755.5 2 11 4 86 1 6 6.25 6.25

36 126 52.5

in

31

Luego: La varianza poblacional es = 2.92/2=1.46

Desviación estándar muestral: σ = = 2.21, y la desviación estándar

tendrá el mismo valor por repetición.

Ejemplo: Calculo de medias sin reemplazo (sin repetición).

Para el cálculo de medias se toma en cuenta las muestras que están por encima

de la diagonal de la tabla.

Una población consiste en las edades de unos niños de una determinada

familia. Estas edades son A= 9,4,6,8 cuando n =2 y N =4, calcular la

media, varianza, desviación estándar muestra! y poblacional:

1. Calculamos la cantidad de combinaciones posibles: C42 = = 6

2. Conformamos la tabla:

4. Medía muestral: u = =5

5. Media poblacional: µ =(2+4+6+8)/4 =5

6. Varianza muestral : σ2= = 1.67

2 4 6 82 (2,2) (2,4) (2,6) (2,8)

2 3 4 54 (4,4) (4,6) (4,8)

4 5 66 (6,6) (6,8)

6 78 (8,8)

8

i ni *ni (Xi -11)2

3 1 3 4 44 1 4 1 15 2 10 0 06 1 6 1 17 1 7 4 4

6 30 10

3. µ = 30/6 = 5

32

7. Varianza poblacional : σ2= =

= 5

8. Desviación estándar σ =

Distribución muestral de proporciones:

Para algunos cálculos es necesario determinar proporciones de muestras para lo

cual se extraen todas las posibles muestras de tamaño n y luego se determina las

proporciones P =éxito; Q =fracaso este tipo de muestras puede conformar una

distribución de frecuencias que facilitan el cálculo, en el siguiente ejemplo

trataremos un cálculo de proporciones.

Sea la población formada por los siguientes elementos A =m1,m2,m3,h1,h2

Donde(N =5, y n =3) con m =mujer (éxito), y h = hombre (fracaso).

Determinar la proporción P y Q, la distribución muestral de proporciones será

construida con muestras de tamaño n =3.

P +Q = 0.6+0.4 = 1 con P =3/5 =0.6 ; Q = 2/5= 0.4

Previamente el cálculo del número de muestras posibles tiene la forma:

33

De la tabla se obtiene la siguiente distribución

muestral

1. Con la distribución muestra calculamos la media

muestral : E(x) =

2. Media poblacional: 3/5=0.6

3. Varianza muestral: var(x) =

è Var(x) =

4. Varianza poblacional: VarPob =

5. Desviación estándar muestral y desviación estándar poblacional:

σ =

DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE MEDIAS:

En muchos problemas es necesario comparar parámetros particularmente de

medias de dos poblaciones en el ejemplo siguiente tenemos la diferencia de dos

Muestras Proporción P

m1 m2 m3 3 / 3m1 m2 h1 2 / 3ml m3 h2 2 / 3m1 m3 h1 2 / 3m1 h1 h2 1 / 3m2 h1 h2 1 / 3m3 h1 h3 1 / 3m2 m3 h1 2 / 3m2 m3 h2 2 / 3

X P(x)1/3 3/102/3 6/103/3 1/10

1

34

medias:

Ejemplo: Si A=1,2 y B =3,4 con n=2

1. Conformamos las siguientes tablas

3 4

3 (3,3)3

(3,4)3,5

4 (4,3)3.5

(4,4)4

Para el cálculo precisamos las diferencias elemento por elemento de las medias

respectivas entre ambas poblaciones es decir:

1-3=-2;1-3.5=-2.5;1-3.5=-2.5;1-4=-3

1.4-3=-1.5;1.5-3.5=-2;1.5-3.5=-2;1.5-4=-2.5

2-3=-1;2-3.5=-1.5;2-3.5=-1.5;2-4=-2

Con los datos de las diferencias conformamos o construimos la tabla de

distribución muestral:

Con estos valores es ahora posible calcular la media

muestral:

Si calculamos la media muestral tomando la muestra de los elementos de la

población tenemos los siguientes valores:

1.-Media poblacional: = 1.5 ; = (3+4)/2 = 3.5

2.-Por lo tanto su diferencia es: = 1.5 - 3.5 = -2

3.-Varianza muestral: varA = 0.25

4.-Varianza poblacional: tomando datos originales de las poblaciones

calculamos: varA = 0.25 varb = 025

1 2

1 (1,1)1

(1,2)1,5

2 (2,1)1.5

(2,2)2

A- B P( A- B)

-1 1/16-1.5 4/16-2 6/16-2.5 4/16-3 1/16

1

35

var = =0.25

5.-Desviación estándar:

Muestral: σ = = 0.5 Poblacional: σ = = 0.5

6. ESTIMACIONES

INTRODUCCIÓN.- Es un proceso de la estadística probabilística que tiene por

finalidad aproximar al parámetro poblacional a partir de los datos obtenidos en una

encuesta representativa poblacional. En general se conocen dos formas de

estimación:

ESTIMACIÓN PUNTUAL.- Es la estimación de un parámetro poblacional realizado

en base a un solo número de la muestra por ejemplo la estimación del salario

medio de una población de trabajadores. En este caso se confunde la media.

ESTIMACIÓN OR INTERVALOS.- Precisa determinar un conjunto de números

que representa un intervalo numérico entre A y B por ejemplo de acuerdo a una

probabilidad establecida dentro del cual se encuentra el parámetro poblacional

que nos interesa.

NIVEL DE CONFIANZA.- Es la probabilidad de que el parámetro se encuentre

dentro del intervalo determinado en general los niveles de confianza usuales son

del 95% y 99%.

NIVEL DE CONFIANZA EL 95%.- Significa que de 100 casos 95 de ellos se

encuentran dentro del intervalo construido esperamos que 5% de ellos estén fuera

del intervalo.

NIVEL DE CONFIANZA EL 99%.- Significa que de 100 casos 99 de ellos se

encuentran dentro del intervalo.

36

INTERVALO DE CONFIANZA PARA LA MEDIA MUESTRAL.- Este intervalo

también referido para la media poblacional, para tal cálculo se toma una muestra

aleatoria y con la misma se calcula la media y error standard de la media su

relación general es:

X =

Donde:

Media aritmética de la muestra: x

Coeficiente de confianza o valor crítico cuya determinación es dependiente del

nivel de confianza: Zo

Error estándar de la media, su valor depende de la desviación estándar

poblacional: x

En general se tiene los siguientes símbolos de estimación:

Estimación de la media poblacional: u

Estimación de la varianza poblacional:

Estimación de la razón de las medias

muéstrales: R Estimación total de la

población: y

ESTIMACIÓN PUNTUAL DE LA MEDIA DE UNA POBLACIÓN E INTERVALODE CONFIANZA PARA u.- La media poblacional denotada por u se estima

puntualmente por media muestral denotada por x es decir: u=x donde u es el

estimador de la media poblacional o x=(x1+... +xn)/ n.

La media muestral x tiene cuatro propiedades fundamentales como estimador

puntual:

1) No es sesgada.

2) Es eficiente, determinante.

37

3) Consistente.

4) Suficiente.

COTA DE ERROR.-Es el límite de error. Queda graficada del siguiente modo.

La cota de error para x está dado por:

Si se conoce la desviación poblacional entonces se estima con la desviación

standard de la distribución muestral llamado Error Standard del Estadístico por la

siguiente relación:

ESTIMACIÓN POR INTERVALOS DE LA MEDIA DE UNA POBLACIÓN.- En

muchos problemas es preferible determinar la media poblacional calculando por

intervalos que se llaman Intervalos de Confianza u y en general se observan dos

casos:

MUESTRA GRANDE.- Cuando n=>30 muestras y conocida. El intervalo es:

Esta relación concuerda con el siguiente gráfico:

Entonces la probabilidad queda determinada por:

P[Z 2]=1-( 2+1- )=1- 2

-2 -2

-z 0

T(X)

z

38

1) Dónde: Z /2 es desconocida.

2) Dónde: 1- ,Es el área bajo la curva normal estandarizada que indica el

coeficiente de confianza.

3) ,Es el área total de las colas.

4) n, Tamaño de la muestra.

5) x, Es la desviación standard de la población, debe ser conocida.

6) Z , Un punto en el eje horizontal de la distribución normal standard.

7) En casos prácticos se trabaja con la siguiente tabla:

Coeficiente de

Correlación (1- )Z

0.9 0.1 1.6450.95 0.05 1.960.99 0.01 2.58

MUESTRA PEQUEÑA.- Intervalo de confianza cuando n<30, desconocido. Con

una distribución aproximada normal, este intervalo es de la forma:

Entonces la probabilidad es: P[t ≤to]=1-(

Dónde:

Área bajo la curva t- student desde to hasta to indica el nivel de confianza:

-t0 0 t0

39

Tamaño de la muestra: n

Estimador de x: x=S= 1/2

Punto en eje horizontal de la distribución t -student un n-1 que corresponde al área

1- /2 que es necesario ubicarlo mediante tablas: To=tn-1,1- /2

En la práctica se trabaja un =90 o =95 porciento.

EJEMPLO.- Debido a la escasez de agua por efecto del verano, el gobierno de la

ciudad selecciona al azar 100 viviendas para observar el medidor de agua durante

un día y estimar el consumo diario promedio por vivienda. De las muestras se

obtiene una media y desviación standard de 117.5 galones y 16.8 galones

respectivamente. Estimar u, el consumo promedio por vivienda y determinar la

cota para el error de estimación.

Datos:

N=100, u=x=117.5, S= x=16.8

40

La cota de estimación de error es: 2 x=2( x/(n)1/2)

=2(16.8/(100)1/2)

=3.36

u∈ (117.5-3.36,117.5+3.36)

u∈ (114.14,120.8)

Graficando:

114.14 120.8 "Cota de Error"

EJEMPLO.- De acuerdo a un trabajo de auditoria para el estudio de libros

contables de una empresa se obtuvo 50 transacciones con una media y

desviación standard de 2160 y 575 respectivamente, estimar u y determinar la

cota de error.

Datos:

N=50, u=x=2160, S=575

La cota de error estimada: 2 x=2( x/(n)1/2)

41

=2(575/(50)1/2

=162.63

Graficando: u∈ (2160-162.63,2160+162.63)

u∈ (1997.4,2322.6)

1997.4 2322.6 "Cota de Error"

EJEMPLO.- Supongamos que la media de la población de utilidades después de

los impuestos durante un cierto periodo es 4.8 centavos de $ de ingreso,

S=1.5 centavos. ¿Cuál es la probabilidad de que la utilidad media después de

pagar los impuestos, con una muestra de 100 fabricantes excede en 5 centavos?

Datos:

u=4.8, S=1.5; n=100.

Se pide hallar P[x>5] de los datos sabemos que:

E(x)=u=4.8;

x= /(n)1/2=1.5/(100)1/2

=0.15

42

Estandarizando para poder definir las probabilidades:

P[x>5]=P[(x-E(x))/ x>(5-E(x))/ x]

=P[Z>(5-4.8)/15]

=P[Z>1.33]

Estandarizando tenemos que hacer la diferencia de:

=1-P[Z≤1 .33]

=1-0.9082

Entonces: P=0.0918

7. TEORÍA DE TCHEBITCHEB.-

También llamado Desigualdad de Tchebitcheb considera como hipótesis que

dado un numero k =>1 y dado un conjunto de observaciones: x1,...,xn entonces

su tesis enuncia que al menos I1-1/k2|% de las observaciones hechas caen dentro

de las k observaciones de la media es decir: lx-ul<k o también que x∈(u-

k ,u+k ). Esta desigualdad tiene mayor importancia cuando se expresa en

43

forma de probabilidad: P[|x-ul<k ]≥1-1/k2...(a).

El indicador (1-1/k2)*100 denota a las observaciones que caen dentro del

intervalo u-k ,u+k . El siguiente gráfico representa la desigualdad indiada.

a) Sí en la relación (A) k=1 entonces, P[lx-ul< ]≥0

b) Si en la relación (A) k=2 entonces, P[ix-ul<2 ]≥1-1/4=0.75

c) Si en la relación (A) k=3 entonces, P[lx-ul<3 ]≥1-1/9=0.89

Area representada

≥1-x

u-k3 k2 u k2 u+6x

44

Entonces indica que 0 % o más cae dentro del intervalo u-k ,u+k

EJEMPLO.- La media y varianza de una muestra de tamaño 30 son 50 y 80

respectivamente. Por el teorema de Tchebitcheb describir las distribuciones de las

observaciones.

Datos:

x=30; S2=81

S =9

a) Por lo menos el 75%(k=2) de las observaciones caen el siguiente intervalo:

[x±25]=[50±18]=[50+18.50-18]=[68.32]

b) Al menos 89% de las 30 observaciones caen dentro del intervalo:

[x±35]entonces, [50±3.9]123.77]

REGLA PRÁCTICA PARA DETERMINAR LOS VALORES DEL TEOREMATCHEBITCHEB.- Cuando un conjunto de observaciones se distribuye

normalmente, el intervalo que se representa es el siguiente:

(u± ) contiene aproximadamente 68 de las observaciones.

(u± ) contiene aproximadamente 95 de las observaciones.

45

(u± ) contiene aproximadamente casi todas las observaciones.

En el siguiente ejemplo determinaremos los valores de los intervalos de las

observaciones:"mi" "fi" "hi" Fi Hi

Clase Intervalo

de

Clase

Marca

de

clase

Frecuencia

Absoluta

Simple

Frecuencia

Relativa

Simple

"mi*

fi"

Frecuencia

Absoluta

Acumulada

Frecuencia

Relativa

Acumulada

∑mi

fi

1 5.00-8.99 7 3 3/25 147 3 3/25 212 9.00-12.99 11 5 5/25 605 8 8/25 553 13.00- 15 7 7/25 1575 15 15/25 1054 17.00- 19 6 6/25 2166 21 21/25 1145 21.00- 23 3 3/25 1587 24 24/25 696 25.00- 27 1 1/25 729 25 25/25 27TOTALES 25 6809 391

Calculando la media: x =∑mi*fi)/∑fi

=391/25

=15.64

Calculando la varianza: S2 = (∑ mi2* fi-(∑fi*mi)2 /n)/n-1

=(6809-(391)2/25)/24

=2891

S =5.37

Con los cálculos anteriores de las observaciones las dos penúltimas columnas,

siete y ocho, observamos cómo se distribuyen las muestras sabiendo que la

media es 75.64 y la varianza 5.37: Ahora definimos la siguiente tabla:

8. FRECUENCIA DE OBSERVACIÓN QUE SE ENCUENTRA A K DESVIACIÓNSTANDARD DE LA MEDIA PARA LOS DATOS DE LA TABLA ANTERIOR.-

Previamente los siguientes cálculos:

46

Si k=1, entonces x ± ks=15.64 ± 5.377: 10.263

21.017

Si k=2, entonces x ± 2ks=15.64 ± 2(5.377): 4.886

26.394

Si k=3, entonces x ± 3ks=15.64 ± 3(5.377): 0.491

31.771

9. DETERMINACIÓN DEL TAMAÑO DE UNA MUESTRA

Este capítulo es muy importante para el cálculo de niveles de confianza

para este fin utilizaremos una simbología adecuada:

Estimación de θ: θ

Desviación standard del estimador puntual para θ: θ

Cota para error de estimación: e

Coeficiente de confianza: 1-

El tamaño de la muestra puede ser definida aplicando los siguientes pasos:

1) Escoger o determinar dos cotas(niveles): e y 1-

47

2) Resolver la ecuación: Z /2 θ = e...(*)

En la práctica tenemos las siguientes relaciones:

La distribución muestral de la media se tiene ux = u y x= /(n)1/2

sustituyendo en la ecuación anterior tenemos (*) tenemos:

Z /2 /(n)1/2=e

Despejando n:

n=( (Z /2 )/e)2

Desviación standard de la población, si este no es conocido:

=S=((xi-x)2/n-1)1/2

48

EJEMPLO.- Es medido el contenido de nicotina de 36 cigarrillos de una marca y

se obtuvo los siguientes resultados:

x = contenido de nicotina medido en miligramos.

∑x =756 miligramos; ∑(x-x)2=315 miligramos

Obtener un nivel de confianza de 0.95 para estimar el contenido promedio de

nicotina de esta manera:

En el promedio se pide hallar la siguiente relación: X± x/(n)1/2Z /2

Datos:

n=36; ∑x=756 miligramos; ∑(x-x)2=315 miligramos

Para calcular el intervalo de confianza precisamos resolver:

x=∑xi/n

=756/36

=21

x = S =(∑ ( x i - x ) 2 / n - 1 ) 1 / 2

= (315/35)1/2

= 3

Además como la confianza es de .95 entonces: Z=1.96(de tablas) Ahora:

49

=x± x/(n)1/2Z /2

=21±3/(36)1/2 * (1.96)

=21±0.98

=21+0.98 =21-0.98

=21.98 =20.02

Entonces el contenido promedio es: µ∈<20.02,21.98>

EJEMPLO.- Una asociación de ahorro y préstamo desea determinar la cantidad

de préstamos que tienen los clientes en su cuenta sí la desviación standard es

4000.

a) Que tamaño de muestra se requiere para afirmar con una confianza de 0.95

que el error la estimación no excede de 200.

Se determina n mediante la relación: n =(Z2 2)/e2

=((1.69)2(4000)2)/2002

=1536.64

b) Que tamaño de muestra se requiere para afirmar con una confianza de 0.95

que el error la estimación no excede de 400.

50

N =(Z2 2)/e2

= ((1.96)2(4000)2)/4002

= 385

c) Comparando los tamaños muestrales y errores máximos permitidos ¿Qué

sucede con el tamaño muestral cuando el error máximo se duplica?

R.- El tamaño muestral se reduce cuatro veces menos cuando el error se duplica.

3.-Hipótesis acerca de la diferencia de medias:

000000

Hi: ux– uy≠ C

Si H0: ux- uy=c=>Hi Hi: ux– uy< C

Hi: ux– uy> C

4.-Hipótesis acerca de la diferencia de proporciones:

000000

Hi: Px– Py≠ C

Si H0: Px- uy=D=>Hi Hi: Px– Py< C

Hi: Px– Py> C

El objetivo de una muestra estadística es el de examinar una hipótesis relacionada

con los valores de una o más parámetros poblacionales.

TEORÍA DE LA DECISIÓN ESTADÍSTICA (DOCIMA O DOCIMASIA).-

Una hipótesis estadística es una suposición o una afirmación tentativa acerca de

-Z -Z1- -Z Z1-

-Z -Z1- -Z Z1-

51

un valor de un parámetro o parámetros de una población.

También podemos definir como una decisión estadística que se hace respecto al

parámetro de una población en base a la muestra que se selecciona de la indicada

población.

Los criterios más importantes para realizar este análisis podemos reunirlos en los

siguientes:

1.-Decisión estadística: Para la toma de una decisión estadística es necesaria

entre todo identificar el patrón de distribución y nos referimos si la población

tiene distribución normal o binomial o sigue otro patrón de distribución. Un

procedimiento estadístico que requiere la identificación de la distribución

probabilística se denomina, enfoque paramétrico; mientras que un enfoque no

paramétrico es un enfoque libre de distribución que no requiere especificación

acerca de esa distribución.

En nuestro análisis hacemos referencia al enfoque paramétrico es decir nos

referimos al enfoque paramétrico.

2.-Tipos de hipótesis: En toda decisión estadística se plantean dos hipótesis.

Ho – Hipótesis nula que es la hipótesis en consideración.

Hi – Hipótesis alternativa lo contrario de la hipótesis nula también

llamada hipótesis de trabajo.

3.-Nivel de significación ( ):Que es el subconjunto del espacio muestral que nos

conduce a rechazar la hipótesis nula cuando es verdadero. Es decir es

la posibilidad de cometer el error tipo1 en términos de probabilidad tenemos la

siguiente notación alpha = P[rechazar Ho / Ho es verdadero], en la práctica se

trabaja con valores alpha =0.05 y alpha =0.01 como constantes.

52

4.-Tipos de dócimas: Estos dependen del enunciado de la hipótesis alternativa

Hi Es decir que la dócima está en función de Hi y entre estas existen dos: las

unilaterales y las bilaterales.

En los siguientes gráficos observamos el valor crítico, la región de rechazo y la

región de aceptación para tres tipos de pruebas para las medias muestrales

(poblacional).

Modelos unilaterales Modelos bilaterales

0251911168251907072251906048251905024251910144251909120251908096

0251954176251953152251952128251951104

El valor de alpha nos indica el margen de error (nivel de error, sección crítica,

nivel de rechazo), que analizaremos mediante la decisión estadística en forma de

probabilidad.

5.-Planteamiento de la regla de decisión: Para aceptar o rechazar la hipótesis

nula debemos determinar claramente 3 aspectos la región crítica o de rechazo,

valor crítico y el estadístico de prueba.

m Región de rechazo: Es el conjunto de valores para el estadístico de

prueba que nos llevara a rechazar la hipótesis nula y está dado por el

valor de alpha.

m El valor crítico: Es el valor que separa a la región de rechazo de la región de

aceptación y constituye el 1er valor de la región crítica dependiendo del valor

de "alpha" y del enunciado de la hipótesis alternativa Hi.

1µ0

µ >µ0

Valorcrítico

1µ0

µ >µ0

Región deaceptación

Región derechazo

Región derechazo


1µ0

µ <>µ0Valorcrítico Valor

crítico


Región derechazo

Región derechazo

53

m Estadístico de prueba: Es una variable aleatoria cuyo valor se utiliza para

rechazar o para aceptar H0 si el estadístico de prueba cae en la regióncrítica

entonces rechazamos, si el estadístico de prueba cae en la región de

aceptación entonces aceptamos H0.

Cuando la hipótesis nula se rechaza con( = 0.05 ) diremos que el resultado

es significativo.

Cuando la hipótesis nula se rechaza con =0.01 diremos que el resultado es

muy significativo.

Gráficamente el nivel de significación a es un área pequeña bajo la curva (que

puede ser normal, t-student, ji-cuadrado) dependiente de las formas de

distribución, y aparecen a la derecha, izquierda, o ambas, sobre todo

depende del tipo de docimasia que se realiza es decir la ubicación de

depende del enunciado de Hi.

54

6.-Errores que se cometen al tomar una decisión: Estas pueden ser:

Tabla de decisión

Hipótesis nula H0DecisiónVerdadera Falsa

Rechazar Error tipo I Decisión correctaAceptar Decisión correcta Error tipo II

DISTRIBUCIÓN DE PROBABILIDAD:

Para describir el comportamiento de una variable aleatoria es necesario conocer la

distribución de probabilidad, porque cuando se estudian los resultados de un

experimento aleatorio necesariamente se busca un modelo probabilistico; es decir

una forma de distribución tomando en cuenta a las variables aleatorias discretas y

continuas podemos clasificar las distribuciones en dos grupos obteniendo o

conociendo la siguiente tabla

DISCRETAS CONTINUAS

Bernoulli Pxq1-x Uniformea>=x>=b

Binomial Normal

Geométrica Q1-xp exponencial x>=0

Pascal Ji - cuadrado

poisson T de student

Hipergeometrica

55

Distribución de poisson: La distribución de poisson se aplica cuando la variable

aleatoria es el número de eventos independientes que ocurren que suceden en

intervalo de tiempo o en una variable aleatoria X tiene distribución de poisson un

parámetro lambda (lambda>0) y su función deprobabilidades es la siguiente:

F(k) = P(x=k) = (e- k) con k=0,1,2,...

La variable aleatoria x cuando posee la distribución de poisson verifica que la

esperanza E(x) = lambda y además su varianza es V(x) = .

A veces es necesario adecuar el promedio o

valor de lambda al periodo t(tiempo) con el que

se trabaja es decir: (k)! que se trabaja es decir:

Ejemplo: En el puente de las américas como promedio mensual existen 6 intentos

de suicidio asumiendo que el número de estos intentos tiene una distribución de

poisson calcular la probabilidad de que ocurran los siguientes casos:

a) 2 intentos de suicidio por mes

b) Un intento, dos intentos.

c) Ningún intento

d) 0,1,2 o 3 intentos

56

1µ0

µ >µ0

Valorcrítico

1µ0

µ <µ0


Región derechazo Regiónde

rechazoRegión deaceptación

Puntos de inflexion

Solución: donde =6

a) Para 2 intentos k=2 P(x=k) = = 0.0446

b) Para 1 intentos k=1 P(x=1) = =0.014

c) Para 3 intentos k=3 P(x=3) = = 0.0892

d) Para O intentos k=0 P(x=0) = = 0.0025

e) Sumando : P[x = 0] + P[x = 1] + P[x =2] + P[x = 3]

0.0025 + 0.0149 + 0.0446 + 0.0892 = 0.1512

Distribución normal:

La variable aleatoria continua "x" posee distribución normal con media (µ) y

varianza, si su función de probabilidad o función de densidad de probabilidad es:

La grafica de la curva normal tiene la forma

característica de la campana de gauss donde

se tiene un máximo en µ con 2 puntos de

inflexión, la notación normal es N(µ, σ2 ).

0

Si "x" posee la distribución normal entonces se

verifica que la esperanza o media será igual

aE(x)=p y la varianza V(x)=.

57

Propiedades:

Teorema 1:

Teorema 2: f(µ + x) = f(µ - x)

Significa que p es simétrica.

Teorema 3: La probabilidad máxima de µ( f( max (σ)) = 1/( σ*sgr(2*pi) )]1 el valor

máximo o modo sucede cuando (x = µ).

Para facilitar el cálculo de una distribución normal se usa la distribución

normal estándar donde se emplea la variable estándar z = (x - µ) /

Con la introducción de este parámetro (z) la

función de densidad i y la d i st r ibución

acumulada Fi tiene la siguiente forma.

La función de densidad ( ) es la curva que se observa en el gráfico, a su vez §

es el área encerrada entre la curva y el eje de abscisas cuando se trata

de calcular una distribución normal estándar debemos calcular §(z).

Ejemplo: Esta integral no es resoluble en términos de cálculo es por eso que

mediante métodos numéricos se tabula por lo tanto se obtiene su valor en tablas.

PROBLEMAS DE DOCIMASIA:

1. Los salarios diarios en una empresa particular tiene una distribución normal

con una media de 23.20 pesos y su desviación estándar de 4.50 pesos. Esta

empresa ocupa 40 trabajadores a quienes paga 21.20 pesos. ¿Esta compañía

58

puede ser acusada de pagar salarios inferiores con un nivel de significación del

1%?

Solución:

1er paso: Identificar los datos:

Población: µ =23.20 desviación estándar

= 4.50 muestra: n =40 media = 21.20

alpha =0.01 (1%)

2do paso:identificar la hipótesis alternativa:

Hi: µ < 23.20 Este valor resulta de analizar la pregunta del problema,

donde se anota que la empresa puede ser acusada de pagar salarios inferiores a

la media.

3er paso: El valor critico está definido por tablas Zc =-2.33.

4 t o p a s o : P a r a n u e s t r o e je mp l o d e b e mo s comprobar

mediante un estadístico de prueba el valor de z, y comparar con

el valor encontrado en el paso tres y para la prueba de una hipótesis sobre la

media tenemos:

Conclusión.-Por los datos encontrados siendo z=-2.811 encontrándose en la

región de rechazo la compañía debe ser acusado por pagar salarios menores.

=0.01

ZA=Z 0,01= - 2.33

59

2. Una máquina que llena botellas de leche se supone que debe llenar un

volumen de 32 onzas con una desviación estándar de 0.06 de onza.

Mediante una comprobación sistemática se toman aleatoriamente 36

botellas l lenas y se advierte que contienen una media de 32.1

¿Funciona la maquina adecuadamente con un nivel de 0.05 de error?

Solución:

Población: µ =32 desviación estándar = 0.06

Muestra: n =36 media = 32.1 alpha =0.05 (5%)

¿Cómo identificar la hipótesis alternativa?

Según (a interrogante funciona la maquina adecuadamente:

000Hi: µ<>32 Ho: µ=32

A continuación determinamos los valores críticos y el estadístico

de prueba. Los valores críticos Zc son simétricos por ser la tabla de distribución

normal y para un valor de 0.025 en tablas encontramos que z = 1.96. El

estadístico de prueba que calculamos tiene la siguiente estructura.

Conclusión: Como Z =-10 y cae en la Región del Rechazo, Ho, por lo tanto la

máquina no funciona adecuadamente.

=0.02

-Zc - Zc

=0.02

60

En los Estados Unidos el número medio de años de escuela terminados por

adultos mayores a 21 años es de 10.4 con una desviación estándar de 2. El

consejo de educación de una ciudad cualquiera hace una encuesta aleatoria de

200 adultos, y advierte que el número medio de años escolares es de 11.3 con

una desviación estándar de 1.8 si se tiene un grado de significación de 0.05 ¿Los

adultos de esta ciudad encuestada difieren del promedio nacional con referencia

a los años de estudio (esta pregunta define H0)?

Solución:

Población: µ =10.4 desviación estándar = 2

Muestra: n =200 media = 11.3 S =1.8

alpha =0.05 (5%)

Identificando 1Hi:

Según difieren los adultos de la ciudad encuestada del promedio

nacional

Definimos el valor crítico y el estadístico de prueba de acuerdo a tablas el valor

crítico es (+ o - 1.96) y el estadístico de prueba es:

Como z =6.36 se encuentra en la región del rechazo por lo tanto concluimos que

los habitantes de la ciudad encuestada si difieren del promedio nacional

-Zc Zc 1.96

61

REGRESIÓN LINEAL Y CORRELACIÓN:

Introducción: Se estudió la relación entre dos variables "XY" suponiendo Y

=f(x) de acuerdo a esta relación se tienen los siguientes tipos de funciones:

1. Función lineal: Y =α+ βx2. Función exponencial: Y = α*3. Función potencial: Y = α * xβ4. Función hiperbólica: Y= α +β*1/x5. Función parabólica: Y = ax2 + bx + c

De estos tipos de relaciones más utilizados analizaremos con profundidad las

funciones lineales: Y=α +βx previamente las siguientes características:

1. Se presenta un conjunto de datos de n pares ordenados (Xi, Yi) al graficar

estos pares ordenados en el plano cartesiano.

2. Obtenemos diversos diagramas de dispersión ver figura a).

3. El analista o investigador debe decidir qué clase de curva se ajusta a los

datos.

4. El analista por algún método debe calcular los parámetros A, B.

5. El analista debe interpretar los resultados mediante estimaciones y las

décimas de hipótesis.

62

Análisis del error: Sean las tablas

000000252045312

000

000252054528

000252056576252055552252054528

Observaciones: Diferencias en ambos gráficos:

1. En general 1ro se observa una nube de puntos cuya particularidad es

que pertenecen a una sola recta en el gráfico.

2. En general 2do la nube de puntos Q2,Q3,05 pertenecen a la recta

Y=5+32*5x los otros puntos están por debajo de dicha recta. Para graficar

(1) solo existe una recta que pasa por los puntos P1,P2 para graficar (2) hay

más de dos rectas que pasan por un mismo punto Q1,Q2,C13,etc donde

X1 Y1

1 5

2 7

3 9

4 11

5 13

6 15

X Y

1 30

1 40

2 70

2 80

3 100

3 100

1

1

x

Y

x x

Y

Figura a)

1

2

y

468

1012

2 3 4 5 6

y=3+2x

x

14 y

y=5+32.5

15

3045456075

1 2 3 4 5 6

90

x

Graficando las tablas respectivamente (de 1 y 2):

Cuadro N° 1 Cuadro N°2

63

ninguna recta pasa por todos los puntos.

3. En general (1) cuando X =1, Y =5 es decir (1,5) pertenece tanto a la recta

como al gráfico al contrario en el grafico 2 cuando X =1, Y =30 y 40 de tal

manera que un solo punto aparece 3 valores que son X =1, Y =40; y

=37.5 ; y =30 donde los datos (1.30)(1.40) pertenecen a los datos de

la tabla y cuando (1, 37.5) pertenecen a la recta "11 " consecuentemente

surgen los siguientes tipos de error:

Dónde: y = valor verdadero =valor estimado. e1,e2 = error estimado

El propósito de nuestro análisis es buscar una recta que se ajuste a los

datos donde los errores e1, e2 sean lo mínimo posible.

4. En el gráfico (1) los 20 componentes de los datos son exactamente de la

forma Y = 3+2x para toda x que pertenece a los datos es el 2do

grafico, los 20 componentes son de la forma y = +e esta notación se lee de

la siguiente forma :

"El valor verdadero y" = valor estimado "y” + un error

64

252058624En grafico (1) la ecuación es de la forma y =α+βx llamado

método matemático (determinístico o exacto).

252066816

252068864252067840252066816

Observaciones: Diferencias en ambos gráficos:

1. En general 1° se observa una nube de puntos cuya particularidad es

que pertenecen a una sola recta en el gráfico.

2. En general 2° la nube de puntos Q2, Q3, Q5 pertenecen a la recta Y = 5 +32

* 5x los otros puntos están por debajo de dicha recta. Para graficar (1) solo

existe una recta que pasa por los puntos P1, P2 para graficar (2) hay más de

dos rectas que pasan por un mismo punto Q1, Q2,03,etc. donde ninguna recta

pasa por todos los puntos.

X1 Y1

1 5

2 7

3 9

4 11

5 13

6 15

X Y

1 30

1 40

2 70

2 80

3 100

3 100

1

1

x

Y

x x

Y

1

2

y

468

1012

2 3 4 5 6

y=3+2x

x

14y

15

3045456075

1 2 3 4 5 6

90

=5+32.5x

x

Figura a)

Graficando las tablas respectivamente (de 1 y 2):

Cuadro N° 1Cuadro N° 2

65

3. En general (1) cuando X=1, Y=5 es decir (1,5) pertenece tanto a la recta como

al gráfico al contrario en el grafico 2 cuando X=1, Y=30 y 40 de tal manera que

un solo punto aparece 3 valores que son X=1, Y=40; =37.5; y =30

donde los datos (1.30)(1.40) pertenecen a los datos de la tabla y

cuando (1,37.5) pertenecen a la recta "|1 " consecuentemente surgen los

siguientes tipos de error:

;

Dónde: y= valor verdadero = valor estimado e1, e2 = error estimado

El propósito de nuestro análisis es buscar una recta que se ajuste a los

datos donde los errores e1,e2 sean lo mínimo posible.

4. En el gráfico (1) los 2° componentes de los datos son exactamente de

la forma Y=3+2x para todo x que pertenece a los datos es el 2do grafico,

los 20 componentes son de la forma y= +e esta notación se lee de la siguiente

forma :

"El valor verdadero y" = valor estimado “y" + un error

En grafico (1) la ecuación es de la forma llamado método

matemático (deterministico o exacto).

En grafico (2) la ecuación es de la forma llamado modelo

matemático probabilístico.

En las ciencias naturales y ciencias sociales no se presenta fenómenos cuyo

comportamiento se ajuste a modelos matemáticos sino más bien se ajustan

a modelos matemáticos determinísticos probabilísticos.

En la información estadística el modelo y = representa

teóricamente a la relación entre X, Y para un conjunto de datos (XI,

Y1)(X2,Y2)... , (Xn,Yn) que es una población donde A, B son parámetros de

una recta, sin embargo en la practica estos parámetros no son fáciles de

determinar por lo tanto lo que se hace es buscar las estimaciones de estos

parámetros extrayendo una muestra y calculando los parámetros A, B por

66

1

2

y

1

3

2 3 4 5 6

y= + x

x

δδ

+ ++ +

algún método.

0252072960252070912252071936 Si denotamos por o la estimación de

y por el estimador de a la estimación de β entonces se obtendrá la

forma y1= + βx1 que es la estimación de la recta medía

población que también se expresa de la siguiente forma

considerando además que "ei", son errores

o perturbaciones a la recta , lo llamaremos recta de

regresión lineal.

Dónde: : ordenada en el origen: la pendiente.

Son estimaciones de parámetros de gráficamente la pendiente β representa

el valor del incremento de "Y" y para cada unidad de “X”.

Los valores de Xi se fijan previamente y son constantes arbitrarias por lo tanto

no tienen errores de observación. La variable dependiente "Y" como su nombre lo

indica toma un valor asociado para "X" y de esta manera se convierte en una

variable aleatoria.

CARACTERÍSTICAS DE LAS RECTAS:

1. Recta de regresión poblacional (RRP):

Forma general: yi

= -

: media aritmética de un número teóricamente infinito de

"Y". : parámetros

: Desviación de Yi alrededor del vector

esperado.

67

2. Recta de regresión muestral (RRM):

Forma general:

:estimador de α

: estimador de β

es el error análogo de yi

Nota: Hacer análisis de regresión consiste en estimar la RRP en base a

RRM.

Para X = Xi el valor de una observación es Y =Yi y en té r minos de RRP

que Y i=E( x /y)+µ i

HIPÓTESIS SOBRE LA DISTRIBUCIÓN DE PROBABILIDAD:

Previamente es necesario en la recta Y = determinar los valores de

para este efecto recurriremos al método de mínimos cuadrados la

determinación por este método ya fue analizado en estadística

descriptiva para abreviar el análisis anotaremos las ecuaciones normales que

son la base de este método con la notación de A y B las ecuaciones serán:

De este sistema se puede mediante simplificaciones obtener valores de

Para B podemos definir también por la covarianza.

RRP=α+βxi

µi

ei

RRM= xiyi

Xi X

68

ANÁLISIS DE REGRESIÓN:

Se propone estimar o predecir el valor medio poblacional de la

variable dependiente y en base a valores fijos de "X" que es la variable

explicatoria. Y =f(x) (x: variable explicatoria).

En la relación lineal y= llamada recta de regresión poblacional no

solo basta con calcular valores de (método mínimos cuadrados) es de más

interésdeterminar µ es decir estimar su desviación estándar y también

nos interesa las hipótesis de βy también los intervalos de confianza de E(x/y).

Estimación de la desviación estándar: ( )

Dado el modelo probabilístico donde E(µ)=0 y

var(µ)=desviación estándar al cuadrado tenemos que cada valor observado de

Yiestá sujeto a erroresaleatorios de µ que debe dar incluido en cálculos de

por lo tanto se necesita medir la dispersión de los valores de "Y" alrededor

de la recta E(x/y) = y el parámetro que mide, esa dispersión es la

desviación estándar de µ.

La varianza está definida por:

Ejemplo: Utilicemos el cálculo del problema

sobre las maquinas remplazando valores

tenemos:

S2=

La esperanza y la varianza de α son La esperanza y la varianza de β

son

69

Por lo tanto:

var

Dónde:

Yo es el predictor del valor medio de "Y" que corresponde a un determinado valor

de "X", por Ej.: Xo que puede estar o no dentro del recorrido de las

observaciones muestrales X1,X2,....,Xn y además esta predicción puede ser

puntual o de intervalos porque Yo es combinación lineal de las Yi.

Inferencia acerca de B:

B es la pendiente de E(x/y) = x es una recta de regresión nos interesa inferir

acerca de esta pendiente para este fin podemos aplicar 2 conceptos:

1.-Realizar una prueba de hipótesis acerca de β.

2.-Determinar un intervalo de confianza β.

Desarrollo:

1. Utilizamos los conceptos generales de hipótesis cuando Ho : B = Bo,

entonces Hi: B<>Bo, B>Bo, B<Bo. Para los correspondientes cálculos por

teoría de valores <30 usamos t - student.

t =valor critico que se define sabiendo alpha para "n-2" en la distribución t.

70

Estimación de un valor estimado de y para un valor de x dado:

La recta teórica E(y/x)=α+βx en realidad representa la media de un

conjunto de datos yi para cada Xp fijo (yiàXp) Supongamos que Xp tiene

ocho imágenes: Xp X1,X2,...,X8 la probabilidad de escoger un y i para Xp

es de 1/8 es decir:

E(y/Xp)= p(yi)

=1/8 y1+1/8 y2+...+1/8 y8

=1/8

Sus medias yi, y2, yp no necesariamente están sobre la línea recta por lo

tanto en general la línea de regresión puede llamarse Curva de Regresión

de y/x.

La recta y=α+βx se constituye en el estimador directo de E(y/x)=α+βx donde

un valor particular d y puede ser determinado por “y”, por ejemplo:

Sea Xp= 2.5. Cuánto valdrá y si tenemos si tenemos una recta y=5+32.5Xp.

y=5+32.5*2.5

y=86.25àE(y/x)=2.5

El método tiene algunas observaciones:

1. Siempre abra un error en la estimación de valor esperado de y.

2. El valor esperado de “y” cuando x= Xp es la imagen de Xp en la recta y=α+βx.

Para este tipode rectas ajustadas la varianza es igual a la relación:

Var(y)= [1/n + (Xp-x)2/(nS2x)]

Es decir y tiene distribución normal con una media y, con una varianza y.

De estos conceptos interese la prueba de hipótesis respecto al valor

estimado de y. Tenemos para esto las siguientes relaciones:

71

Ho: E(y/x= Xp)=Eoàx1 E(y/x=Xp)Eo

E(y/x=Xp)>Eo

E(y/x= Xp)<Eo

Como son pruebas pequeñas el estadístico de prueba es:

t=y-Eo

s(1/n+(xD-x)2/(nS2x))1/2

Donde los valores para a se encuentra de la rtabla t- student con n-2 grados de

libertad.

Ejemplo.- Calcular el intervalo de confianza para E(y/x=2.5) si α=0.05.

Para determinar el intervalo de confianza usamos:

y±tα/2S(1/n+(xD-x)2/(n S2X))1/2

86.5±2.77(26.997) (1/6+(2.5-2)2/(6*0.667))1/2

86.25±35.87

E(y/x=2.5) (50.38,122.12)

Predicción de un valor particular de y para un valor de x:

Hasta el momento hemos "ajustado" una muestra de n pares ordenados

(xi,yi)….(xn,yn) a una recta habiendo obtenido la ecuación de predicción

y=α+βx nuestro principal interés es usar esta ecuación para poder predecir

el valor de y dado un valor de x seleccionado por lo tanto surgen dos

preguntas:

¿Será posible hallar el verdadero valor de y? No es posible lo que se hace

es estimar el valor de “y” y esta estimación puede ser mayor o menor que

el valor de y por lo tanto siempre hay un error: e=y-y.

1) ¿Cuál de las estimaciones: puntual o intervalica conviene para este fin?

Para predecir el valor de “y” es mejor usar la estimación intevalica.

72

Intervalo de predicción para Y:

El intervalo de predicción está dado por la siguiente relación:

Ejemplo: Calcular el intervalo de predicción para los siguientes datos

=xp=2.55 + 32.5*2.5à86.25 por tablas student: S=27

=2.76 n=6

Remplazando valores: 86.25 ±2.76*27

E) intervalo de predicción "y" pertenece <3.17, 169.33>

Con los valores hallados podemos determinar un gráfico que nos muestra

los limites comparando la varianza (e) y var( ) observamos que var(e)>

var( ) esta diferencia indica que "la variabilidad del error al predecir un solo valor

de y es mayor que la variabilidad de la estimación del valor esperada de y"

como observamos en el siguiente gráfico: en un sistema de coordenadas x,y

tenemos:

000252128256252127232252126208252125184

Dónde:

L.C.I.:Limite de confianza inferior

L.C.S.:Limite de confianza superior

Existe un límite de confianza superior e inferior.

Existe un límite de predicción superior e inferior.

Entre los límites de confianza superior e inferior existe un intervalo de confianza

73

xp

y

E(Y/X)=α+βx

µ

E(Y/X)

e

X

del 95% paraE(x/y).

Entre los límites de predicción existe un intervalo de predicción del 95% para y.

252130304252132352252131328Las diferencia

que existen entre µ,e, y la recta E(y/x) se puede

observar en el siguiente gráfico:

Observando el gráfico:

Significando además:

Considerando por otra parte que la varianza del

error es "e" y está determinado por:

ANÁLISIS DE CORRELACIÓN:

Coeficiente de Determinación y Coeficiente de Correlación

El análisis de correlación es una herramienta que se aplica para describir el grado

en el que una variedad está linealmente relacionada con otro. El análisis de

correlación se usa conjuntamente con el análisis de regresión para medir la

variación de la variable dependiente "y" alrededor de la recta de regresión, pero

además la correlación se usa por sí misma para medir el grado de asociación

entre dos variables (X,Y).

Existen dos medidas para describir la correlación entre dos variables:

a) Elcoeficiente de determinación y

b) Elcoeficiente de correlación.

74

a) ¿Qué es el coeficiente de determinación?

El coeficiente de determinación se define de la forma sgte:

b) ¿Qué es el coeficiente de correlación?

Es un indicador que mide el grado de intensidad a fuerza de la lineal entre

dos variables "Y" y "X", que sea independiente de sus respectivas escalas

de medición.

El coeficiente de correlación, denotado por “r”, se define de la sigte. Forma:

Donde 0<=r2<=1

1. Si r2 es cercano a 1 indica una fuerte correlación entre X e Y.

Si r2 está cercano a "0", indica una pobre correlación entre X e Y.

75

OBSERVACIONES

1. El valor de “r” indica la dirección de la relación entre las dos variables “X” y “Y”.

i) Si:0<r<1, entonces la recta de regresión es creciente (Su

pendiente es positiva).A su vez cuando “r” está cerca de 1,

diremos que existe correlación lineal positiva fuerte.

ii) Si -1<r<0, entonces la recta de regresión es decreciente (de

pendiente negativa).A su vez, cuando“r” está cerca de -1,

diremos que existe correlación lineal negativa fuerte.

iii) Si “r” está cerca de cero, diremos que aparentemente no haycorrelación lineal.

0252135424252137472

00252144640252147712252145664

x

Y

Correlación linealpositiva FUERTEr está cerca a 1

x

Y

Correlación linealnegativa FUERTEr está cerca de -1

x

Aparentemente NOhay correlación linealr está cerca de “0”

x

YY

CorrelaciónVILINEAr está cerca de “0”

76

000252147712252149760252148736

PROBLEMA: El número de crímenes por 100,000 habitantes aumento en una

ciudad, en un periodo de 6 años, en la siguiente forma.

AÑO X 1 2 3 4 5 6

CRÍMENES Y 8 11 16 19 25 29

a). Encuentre a recta de cuadrados mínimos que relaciona Y con X.

b). A manera de verificación de los cálculos, represente los seis puntos y la

recta.

c). Calcule S2.

d). ¿Representan tan solo los datos suficiente evidencia que indique que "Y" y

"X" están relacionadas linealmente?

Solución.

a) Fórmulas

1)

Dónde:

y

Un valor observado de la variable dependiente Y

77

De Xi Obtenemos

De Xi Obtenemos

Luego : cov(x,y)=

= 12.5

2) =18-4.286(3.5)

=2.999

3) Luego: la recta de regresión será:

1) Hágalo Ud.

2) S2 =

=

= 0.6375 à S=0.798

3) Se debe probar la hipotesis HD=β=0, frente a

H1=β≠0 con α=0.05

00

-z z

78

2) El valor critico es

3) El estadístico de prueba es:

t = =

t = 22.415

Se Rechaza HD

III. GLOSARIO

. AJUSTE

Conjunto de técnicas que se emplean después de la recopilación de datos para

controlar el efecto de las variables de confusión sean conocidas o potenciales.

.ALEATORIO

Al azar, a la suerte

.ANÁLISIS

Comparación del desenlace del grupo de estudio con el grupo de control o testigo

.APAREAMIENTO

Análisis simultaneo de dos o más observaciones realizadas en el mismo individuo

o en individuos similares

.ASIGNACIÓN

Selección de individuos para los grupos de estudio y de control

.ASIGNACIÓN AL AZAR

Método de asignación probabilística conocida no necesariamente igual a un grupo

determinado sea el del estudio o de control

.COEFICIENTE DE CORRELACIÓN

Estadístico utilizado para analizar el grado de asociación entre dos variables ,cada

una de las cuales se ha extraído por muestreo de la población de interés.

.COEFICIENTE DE DETERMINACIÓN

Es el cuadrado del coeficiente de correlación, que permite medir la bondad de

ajuste entre la variable regresada(Y) y el o los regresores (Xs)

79

.DATOS CONTINUOS

Tipo de datos con un número ilimitado de valores espaciados uniformemente

.DATOS NOMINALES

Datos que sólo diferencian las observaciones o características ,que no guardan

ninguna categoría

.DATOS ORDINALES

Datos que significan o representan un número limitado de categorías que tienen

un orden inherente de menor a mayor.

.DESVIACIÓN ESTÁNDAR

Medida de dispersión de un conjunto de datos ,que se obtiene sacando la raíz

cuadrada de la varianza

.DISTRIBUCIÓN DE FRECUENCIAS

De frecuencias absolutas o relativas de todos los posibles valores de una

característica, que oralmente se presentan en tablas y /o gráficas

.DISTRIBUCIÓN GAUSIANA

La distribución de la Normal representación gráfica en una curva simétrica

continua y acampanada, cuya media representa la el punto más alto

.DOCIMASIA

Proceso por el cual se realiza la prueba de hipótesis estadística

.ERROR DE MUESTREO

Error introducido por la diferencia debidas al azar entre la estimación obtenida en

la muestra y el verdadero valor de la población.

.ERROR ESTÁNDAR

Grado de dispersión de las estimaciones puntuales obtenidas en muestras de un

determinado tamaño.

.ESTADÍSTICO

Valor determinado en base a los datos de una muestra y utilizado para estimar el

valor de un parámetro de la población de la que se ha extraído la muestra.

80

.ESTIMACIÓN

Un valor o intervalo de valores calculados a partir de una muestra de

observaciones que se emplea como aproximación al valor correspondiente en la

población es decir al parámetro

.ESTIMACIÓN PUNTUAL

Valor único calculado a partir de las observaciones muestrales que se utiliza

como estimación del valor poblacional o parámetro.

.ESTRATIFICACIÓN

Generalmente se entiende la división en grupos o estratos una población

heterogénea y muy grande

.GRADOS DE LIBERTAD

Permite tomar en cuenta el número de parámetros poblacionales que se deben

estimar en una muestra para poder aplicar ciertas pruebas estadísticas

.HIPÓTESIS NULA

Afirmación de que no existe una asociación o diferencia verdadera entre las

variables en la población de la que se extrajo la muestra estudiada.

.HIPÓTESIS ALTERNA

Proposición que se acepta cuando se rechaza la hipótesis nula

.INFERENCIA

Es el proceso lógico que tiene lugar durante las pruebas de significación

estadística

.INTERVALO DE CONFIANZA

Es el intervalo de valores numéricos en el que se encuentra el valor poblacional

que se está estimando con un nivel de confianza alta

.INTERPRETACIÓN

Extracción de conclusiones sobre el significado de cualquier diferencia observada

entre el grupo de estudio y el de control incluidos en la investigación

.MEDIA

Suma de todas las mediciones dividida entre el número total de observaciones,

forma especial del promedio

81

.MEDIANA

Punto medio de la distribución, dejando la mitad de los valores por arriba y la otra

mitad por debajo.

.MUESTRA

Subgrupo de una población obtenido por un investigador para extraer

conclusiones o para realizar estimaciones sobre la población

.MUESTRA ALEATORIA

grupo de observaciones obtenidas de una población de manera que la distribución

muestral de los valores de la variable independiente es representativa de su

distribución en la población

.NO SESGADO

Sin error sistemático asociado

.PARÁMETRO

Valor que sintetiza la distribución o característica de una población

.POBLACIÓN

Grupo numerosos compuesto con frecuencia que tienen por lo menos algo en

común.

.POBLACIÓN OBJETIVO

Grupo de individuos a los que se desea extrapolare o aplicar los resultados de una

investigación, que a veces es distinta de la población de la que se extrae la

muestra de una investigación

.PRECISO

Sin error aleatorio asociado

.PROBABILIDAD

Proporción en la cual el numerador es el número de veces que ocurre un suceso y

el denominador, ese mismo número sumado al número de veces que no ocurre el

suceso.

.RECORRIDO

Diferencia entre los valores máximo y mínimo de una población o de una

muestra(sinónimo de amplitud)

82

.VARIABLE

Característica medible en una muestra o población de datos

.VARIANZA

Medida de dispersión medido en unidades al cuadrado, se obtiene haciendo el

cuadrado de la desviación.

.ROBUSTO

Se dice que una prueba estadística es robusta si se pueden transgredir sus

supuestos ,sin que ello repercuta sustancialmente en las conclusiones

.TÉCNICAS DE REGRESIÓN

Métodos estadísticos útiles para describir la asociación entre una variable

dependiente y una o más variables independientes .

.VALOR P

Probabilidad de realizar una observación al menos tan alejada de la condición

descrita en la hipótesis nula como la observada en nuestro conjunto de datos si la

hipótesis nula fuera cierta

ANEXO 1

LECTURAS COMPLEMENTARIAS

ANEXO 2

ANEXO 3

ANEXO 4