2.estadistica

Post on 11-Jun-2015

2.235 views 0 download

Transcript of 2.estadistica

DR. JORGE ACUÑA A.

1

INGENIERIA INDUSTRIALINGENIERIA INDUSTRIAL

CONTROL DE CALIDAD ICONTROL DE CALIDAD I

2. ESTADISTICA2. ESTADISTICA

Muestras correctamente

seleccionadas permiten inferir

sobre la situación real de una

característica en estudio.

Aplicación de la estadística al

control de procesos y de materiales

es solamente un arma para la

toma de decisiones y no la solución

a los problemas existentes.

ING. JORGE ACUÑA A., PhD., PROFESOR

2

Diseño de procedimientos eficientes que suministren datos confiables para su posterior análisis.

Planear la recolección de datos indicando entre otros aspectos tiempo (¿cuándo?, lugar (¿dónde?), responsabilidades (¿quién?), formatos y procedimientos (¿cómo?).

El registro y análisis de la información proveniente de muestras representativas tomadas de pruebas físicas químicas y servicioscon el fin de verificar su estado.

ING. JORGE ACUÑA A., PhD., PROFESOR

3

Datos deben ser veraces y reflejar las condiciones del proceso, datos erróneos generan conclusiones erróneas.

El analista debe tener plena confianza en los datos para que el estudio sea válido.

Mínima desconfianza en los datos o en su procedencia obligan al analista a descartarlos.

Recolección de datos debe ser cuidadosamente planeada y programada asignado los recursos que sean necesarios para garantizar excelente calidad de datos.

ING. JORGE ACUÑA A., PhD., PROFESOR

4

Acciones correctivas y preventivas, con las que se procurará reducir y si es posible eliminar los problemas.

Análisis y aproximaciones de los datos a distribuciones de probabilidad es necesario agruparlos de tal manera que se puedan visualizar comportamientos y tendencias históricas de los procesos que ayuden a interpretar los aspectos que pueden estar causando descontrol y por ende bajos niveles de calidad.

ING. JORGE ACUÑA A., PhD., PROFESOR

5

Visualizar la posible distribución de datos

Cada dato pierde su identidad.

Distribuciones estadísticas teóricas o

empíricas para inferir hacia el problema.

Distribuciones de frecuencia de datos no

agrupados presentan una distribución

que es muy difícil de aproximar.

Cifras significativas de los datos

Selección de un número de clases que

refleje una adecuada distribución. ING. JORGE ACUÑA A., PhD., PROFESOR

6

Recolectar los datos (xi) de acuerdo con el tamaño de muestra previamente calculado.

Ordenar los datos de menor a mayor.

Calcular el rango:

R = ximáx - ximín

Fijar el número de clases (k),

Calcular el intervalo de clase (i), así:

i = R/k

El valor de i debe ser redondeado siempre hacia arriba y a la misma cantidad de decimales que tienen los datos.

ING. JORGE ACUÑA A., PhD., PROFESOR

7

Calcular el rango propuesto (Rp)

Rp = ir * k

Calcular la diferencia (d)

d = Rp – R

Este valor es un número cuya última cifra significativa debe ser impar. Si no lo es, se debe devolver al paso 5 y hacer el cálculo con otro número de clases, hasta que se cumpla la condición.

Calcular la mitad de la diferencia (md)

md = d/2

ING. JORGE ACUÑA A., PhD., PROFESOR

8

Fijar los límites reales de clase (Li, Ls), usando el siguiente procedimiento:

a. Tomar el valor del dato menor y restarle el valor de md; el valor obtenido es el primer Li.

Li1 = ximín – md

b. Sumar i al valor de Li1, para obtener el primer Ls.

Ls1 = Li1 + i

Lsk = ximáx + md

donde Lsk = último límite real superior.

ING. JORGE ACUÑA A., PhD., PROFESOR

9

Completar el cuadro de

frecuencias de datos agrupados.

Construir el histograma para

observar la distribución del

conjunto de datos.

ING. JORGE ACUÑA A., PhD., PROFESOR

10

Se toman doce grupos de cinco unidades de una máquina llenadora de latas de pasta de tomate y se pesan, originando los siguientes datos:

Construir una distribución de frecuencias de datos agrupados.

ING. JORGE ACUÑA A., PhD., PROFESOR

11

ING. JORGE ACUÑA A., PhD., PROFESOR

12

HOJA DE DATOS - DISTRIBUCION DE FRECUENCIAS

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Artículo: Pasta de tomate Código: XY-987

Característica: Peso Especificación: 20,0 2,5 decigramos

Operación: Llenado Máquina: Llenadora n=60

Operario: M. Matamoros Inspector: M. Coto Turno: 1

Fecha:02-12-84 Hora de inicio: 8 am Hoja: 1de 1

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

# 1 2 3 4 5 6 7 8 9 10 11 12

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

1 22,0 23,0 20,0 21,5 19,0 21,5 22,5 25,0 21,5 24,5 22,5 23,5

2 20,5 19,0 19,0 19,0 21,5 24,0 20,0 20,5 23,0 24,0 22,5 20,0

3 20,0 21,5 19,5 21,0 22,5 19,5 21,0 21,5 22,5 23,5 20,5 20,5

4 21,0 21,0 20,0 20,0 22,5 22,0 22,5 21,5 23,5 22,0 22,0 22,5

5 22,5 21,5 22,5 22,0 18,5 22,0 22,0 22,5 21,0 22,0 19,5 23,0

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––-

R = ximáx - ximín

R = 25,0 – 18,5 = 6,5

k = 1 + 3,3 log n

k = 1 + 3,3 log 60

k 7

R 6,5

i = —— = ——— = 0,923 = 1,0

k 7

Rp = ir * k = 7 * 1,0 = 7,0

ING. JORGE ACUÑA A., PhD., PROFESOR

13

d

md = d/2 = ——= 0,25

2

Li1 = ximín - md = 18,5 - 0,25 = 18,25

Ls1 = Li1 + i = 18,25 + 1,0 = 19,25

Li2 = Ls1 = 19,25

Ls2 = Li2 + i = 19,25 + 1,0 = 20,25

ING. JORGE ACUÑA A., PhD., PROFESOR

14

ING. JORGE ACUÑA A., PhD., PROFESOR

15

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

HOJA DE DATOS - DISTRIBUCION DE FRECUENCIAS

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Artículo: Pasta de tomate Código: XY-987

Característica: Peso Especificación: 20,0 2,5 decigramos

Operación: Llenado Máquina: Llenadora n=60

Operario: M. Matamoros Inspector: M. Coto Turno: 1

Fecha:02-12-84 Hora de inicio: 8 am Hoja: 1 de 1

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Li Ls CONTEO nk xk Nk fk Fk

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

18,25 19,25 ||||| 5 18,75 5 8,33 8,33

19,25 20,25 ||||||||| 9 19,75 14 15,00 23,33

20,25 21,25 |||||||| | 9 20,75 23 15,00 38,33

21,25 22,25 |||||||||||||||| 16 21,75 39 26,67 65,00

22,25 23,25 |||||||||||||| 14 22,75 53 23,33 88,33

23,25 24,25 ||||| 5 23,75 58 8,33 96,67

24,25 25,25 || 2 24,75 60 3,33 100

ING. JORGE ACUÑA A., PhD., PROFESOR

16

in

dn

Ax

K

k

k

*

*1

2

11

2 **

*n

dn

n

dn

is

K

k

k

K

k

k

CV=s/x

PROMEDIO

DESVIACION

ESTANDAR

COEFICIENTE DE VARIACION:

Calcular la media aritmética y la desviación

estándar

_ A= 21,75 para d = 0

x = 21,75 + (-12/60) * 1,0 = 21,55 decigramos

ING. JORGE ACUÑA A., PhD., PROFESOR

17

decigramoss 525,160

12

60

142*0,1

2

––––––––––––––––––––––––––––––––––––––––––––––

xk nk d nk*d nk*d2

–––––––––––––––––––––––––––––––––––––––––––––

18,75 5 –3 –15 45

19,75 9 –2 –18 36

20,75 9 –1 – 9 9

21,75 16 0 0 0

22,75 14 1 14 14

23,75 5 2 10 20

24,75 2 3 6 18

––––––––––––––––––––––––––––––––––––––––––––––––––

TOTAL nk*d= –12 nk*d2= 142

Esta distribución conocida por su forma de campana (campana de Gauss) es una de las más importantes en teoría estadística.

Esta distribución tiene propiedades importantes, tales como: › Está definida de - a + . › Es simétrica lo que implica que la probabilidad de

ocurrencia de un valor x menor que la media es igual a la de un valor x mayor que la media.

› El área bajo la curva es 1. › La moda, media y mediana son iguales. › Si se conoce la media ( ) y la varianza ( 2) se

determina la curva

ING. JORGE ACUÑA A., PhD., PROFESOR

18

La distribución muestral es normal aunque la poblacional no lo sea. Tiene promedio y desviación estándar igual a /√n

Puede estandarizarse usando el estadístico Z = (x - )/ .

Las funciones densidad y acumulada son para - x + :

ING. JORGE ACUÑA A., PhD., PROFESOR

19

2

2

1

2

1)(

x

exf

b

a

dxxfxF )()(

Una fábrica especifica que el peso de los tarros de frutas que produce debe obedecer a un peso medio de 2,00 kg con una desviación estándar de 0,05 kg. ¿Cuál es la probabilidad de que un determinado tarro pese entre 1,90 y 2,06 kg, sabiendo que esta variable se distribuye normalmente?

ING. JORGE ACUÑA A., PhD., PROFESOR

20

05.0

29.1

05.0

206.206.19.1 NNxPA

A = N(1,2) – N(–2,0) A = 0,8849 – 0,0228 A = 0,8621 La probabilidad de que un determinado

tarro pese entre 1,90 y 2,06 kg es 0,8621.

ING. JORGE ACUÑA A., PhD., PROFESOR

21

1.9 2.06

A

"Si se toman m-muestras aleatorias de tamaño n de una población cuya distribución puede o no ser normal y que tiene media µ y desviación estándar , la distribución de muestreo correspondiente a los promedios de las m muestras será aproximadamente normal, con media µ igual a µ y desviación muestral igual a / n."

ING. JORGE ACUÑA A., PhD., PROFESOR

22

x

x

Un proceso de llenado de bolsas de

cacao en polvo origina un peso

medio de 50,10 g y una desviación

estándar de 5,25 g. Si se toma una

muestra de 40 bolsas, ¿cuál es la

probabilidad de que su media se

encuentre entre 48,10 y 50,90 g?

ING. JORGE ACUÑA A., PhD., PROFESOR

23

A=P(48,10< <50,9)= N((50,90-50,10)/0,83)

- N((48,10-50,10)/0,83)

A = N(0,96) - N(-2,41)

A = 0,83147 - 0,00798 (Obtenidos de Tablas )

A = 0,8235

La probabilidad de que la media de peso de

una muestra de 40 bolsas se encuentre entre

48,10 y 50,90 gramos es 0,8235.

ING. JORGE ACUÑA A., PhD., PROFESOR

24

x

En una industria se fabrican productos

que deben tener un peso medio

comprendido entre 10,049 y 10,095

g. Se toma una muestra de 15

unidades, originándose un promedio

de 10,072 g y una desviación

estándar de 0,100 g. ¿Cuál es la

probabilidad de cumplir con el peso

fijado?

ING. JORGE ACUÑA A., PhD., PROFESOR

25

P(10,049 10,095)=T((10,095-10,072)/(0,100/ 14))

-T((10,049-10,072)/(0,100/ 14))

= T (0,861) - T (-0,861)

= 0,80 - 0,20

= 0,60

La probabilidad de cumplir con el peso medio fijado es 0,60.

Los valores de T(0,861) y T(-0,861) sirven para calcular las probabilidades usando la Tablas.

ING. JORGE ACUÑA A., PhD., PROFESOR

26

x

Una máquina llenadora ha

ejecutado su operación con una

varianza de 0,83 grms2. Si se toma

una muestra de 15 unidades,

¿cuál es la probabilidad de tener

una varianza:

a. Superior a 1,31 grms2?

b. Inferior a 0,56 grms2?

ING. JORGE ACUÑA A., PhD., PROFESOR

27

n * s2 15 (1,31)

a. 2 = –––––– = –––––––– = 23,7

2 0,83

n * s2 15 (0,56)

b. 2 = –––––– = ———— = 10,1 2 0,83 Los valores de la probabilidad se encuentran en

Tablas.

En conclusión, la probabilidad de obtener una varianza superior a 1,31 grms2 es 0,05 y la de obtener una varianza inferior a 0,56 grms2 es 0,25.

ING. JORGE ACUÑA A., PhD., PROFESOR

28

En un proceso de corte de varillas para un ensamble especial, existen dos máquinas cortadoras tecnológicamente parecidas aunque diferentes en antigüedad. Esta similitud hace pensar que las varianzas de corte generadas por ambas máquinas puedan ser comparadas.

Si se toma una muestra de 16 elementos de cada máquina, calcular la probabilidad de que la razón de varianzas sea:

a. Mayor a 1,97 b. Menor a 0,508

ING. JORGE ACUÑA A., PhD., PROFESOR

29

Utilizando Tablas: v1 = n1 - 1 = 16 - 1 = 15 v2 = n2 - 1 = 16 - 1 = 15 Fv1,v2, 1= F15,15, 1 =1,97 para 1=0,10 Fv1,v2, 2= F15,15, 2 =0,508 para 2=0,10

pues F15,15, 2 = 1 / F15,15, 1 Como respuesta al problema se tiene que

la probabilidad de que la razón de varianzas sea superior a 1,97 es 0,10 y de que sea inferior a 0,508 es también 0,10.

ING. JORGE ACUÑA A., PhD., PROFESOR

30

Una distribución de variable discreta si se ajusta a experimentos que cumplen con cinco propiedades:

Hay n pruebas Existe una probabilidad de éxito p y una de fracaso q=1-p Las pruebas son independientes Interesan x casos del total de casos Las funciones densidad y acumulada así como el valor

esperado ( ) y la varianza ( 2) son las siguientes: f(x) = n px * q n-x para x 0

x (n-x) n’ F(x) = f(x) = np 2= npq X=0

ING. JORGE ACUÑA A., PhD., PROFESOR

31

Un cliente establece que para aceptar un lote de producto que le envía el fabricante, éste debe cumplir con el contrato firmado. Este contrato establece que el lote se acepta si una muestra de 20 unidades extraída de él, contiene dos o menos defectuosos.

Si el fabricante envía un lote 10% defectuoso, ¿cuál es la probabilidad de que sea rechazado?

ING. JORGE ACUÑA A., PhD., PROFESOR

32

Primero que todo se debe analizar si se cumple con las cuatro condiciones fijadas para la distribución binomial.

1. n = 20 3. Hay independencia 2. p = 0,10 4. x 2 Por leyes de probabilidad se tiene que la

probabilidad de rechazo es igual al complemento de la probabilidad de aceptación.

Sea:

P(X > 2) = 1 – P (X 2) 2 P(X 2) = B(2,20,0,10) = b(xi,n,p) i=0

ING. JORGE ACUÑA A., PhD., PROFESOR

33

P(X 2) = B(2,20,0,10) = b(xi,n,p) i=0 P(X 2) = b(0,20,0,10) + b(1,20,0,10) + b(2,20,0,10) 20! 20! 20! P(X 2) = ––––– 0,100 * 0,9020 + ––––––– 0,101 * 0,9019 + –––––– 0,102*0,9018

20! * 0! 19! * 1! 18! * 2!

P(X 2) = 0,1216+0,27+0,2853 = 0,6769 Probabilidad de rechazo = P(X>2) = 1 - P(X 2) = 1-0,6769 = 0,3231 Si se utiliza la Tabla se tiene que: P(X 2) = B (2,20,0,10) = 0,6769 P(X>2) = 1 - P(X 2) = 1 - 0,6769 = 0,3231

Por lo tanto la respuesta es que si se envía un lote

10% defectuoso la probabilidad de que sea rechazado es 0,3231.

ING. JORGE ACUÑA A., PhD., PROFESOR

34

Una compañía farmacéutica afirma que existe una probabilidad de 0,005 de que un paciente que ingiere un nuevo medicamento, sufra una reacción secundaria. Si 2000 pacientes compran este medicamento, ¿cuál es la probabilidad de que:

a. ocho sufran efectos secundarios? b. mas de ocho sufran efectos

secundarios?

ING. JORGE ACUÑA A., PhD., PROFESOR

35

p = 0,005 n = 2000 x= 8 = 2000 * 0,005 = 10 a. Utilizando la fórmula se tiene: 108

p (8,10) = e-10 ——— = 0,1126 8! Utilizando la Tabla p (8,10)= P (8,10)– P (7,10) = 0,333 – 0,220 = 0,113 Por lo tanto, la probabilidad de que ocho de los 2000

pacientes sufran efectos secundarios al ingerir el medicamento es 0,113.

b. P(x>8) = 1 - P( x 8 ) = 1 – 0,333 = 0,667 Por lo tanto, la probabilidad de que mas de ocho de los 2000

pacientes sufran efectos secundarios al ingerir el medicamento es 0,667.

ING. JORGE ACUÑA A., PhD., PROFESOR

36

Para µ, se calculan así:

_

Lc = x Z /2 * ——— si es conocida

n

_ s

Lc = x t /2 * ——— si es desconocida

n-1

Para 2, se calculan así:

ns2 ns2

LIc = ——— LSc = ———

2 1- /2 2

/2

ING. JORGE ACUÑA A., PhD., PROFESOR

37

Se toman 30 varillas cortadas por una

máquina cortadora. Si se tiene una

longitud promedio de 5,35 cm, con una

desviación típica de 0,85 cm.

a. ¿Cuáles son los límites de confianza para µ, con 95% de confianza?

b. ¿Cuáles son los límites de confianza para 2, con 95% de confianza?

c. Si se conociera que 2 es igual a 1,58 cm2,

¿cuál es la respuesta a la pregunta a?

ING. JORGE ACUÑA A., PhD., PROFESOR

38

_ a. n = 30 x = 5,35 cm s = 0,85 cm (1- ) = 0,95

= 0,05 _ s _ s LIc = x – t /2 ——— LSc = x + t /2 ——— n-1 n-1 0,85 0,85 LIc = 5,35 – 2,045 ——— LSc = 5,35 + 2,045 ——— 29 29 = 5,02 cm = 5,67 cm t /2 = t 0,025 = 2,045 de Tablas Esto significa que se puede afirmar con 95% de confianza

que el proceso de corte de varillas tiene un promedio de corte comprendido entre 5,02 cm y 5,67 cm.

ING. JORGE ACUÑA A., PhD., PROFESOR

39

b. s2 = 0,852 = 0,7225 cm2

n s2 30 (0,7225) 21,675 LIc = ——— = —————– = ––———— = 0,474 cm2

20,975 45,7 45,7

n s2 30(0,7225) 21,675 LSc = ——— = ————— = ———— = 1,35 cm2

2 0,025 16 16

Los valores de chi-cuadrado provienen de Tablas. Esto significa que se puede afirmar con 95% de confianza

que el proceso de corte de varillas tiene una varianza de corte comprendida entre 0,474 cm2 y 1,35 cm2.

ING. JORGE ACUÑA A., PhD., PROFESOR

40

c. Si 2 = 1,58 cm2 entonces = 1,257 cm. _ 1,257 LIc = x – Z /2 ——— = 5,35 – 1,96 ———— = 4,9 cm n 30 _ 1,257 LSc= x + Z /2 ——— = 5,35 + 1,96 ———– = 5,8 cm n 30 Los valores de Z se obtuvieron de tablas Esto significa que se puede afirmar con 95% de confianza que el

proceso de corte de varillas tiene un promedio de corte comprendido entre 4,9 cm y 5,8 cm.

ING. JORGE ACUÑA A., PhD., PROFESOR

41

Comportamiento de un proceso con el fin de ejecutar acciones que prevengan problemas de calidad.

Procedimiento mediante el cual, sujeto a un error tipo I denotado por , se contrasta una hipótesis planteada con el fin de probar su veracidad o su falsedad.

Error tipo I ( ) es la probabilidad de rechazar la hipótesis nula siendo esta verdadera.

Error tipo II (ß) es la probabilidad de aceptar la hipótesis nula siendo esta falsa.

ING. JORGE ACUÑA A., PhD., PROFESOR

42

a. Plantear la hipótesis nula H0 y la hipótesis alternativa denotada por Ha.

b. Prueba debe ser unilateral o bilateral.

c. Fijar el nivel de significación ( ) o error tipo I, (1%, 5% ó 10%)

d. Definir el estadístico a usar de acuerdo con la distribución de probabilidad que le corresponde a la variable en estudio y según lo que se desee probar (una media, dos medias, una varianza, dos varianzas, una proporción o dos proporciones).

ING. JORGE ACUÑA A., PhD., PROFESOR

43

e. Definir las áreas donde se cumplirá cada una de las hipótesis.

f. Calcular el valor del estadístico seleccionado

g. Comparar el estadístico obtenido con el estadístico teórico. El resultado permitirá conocer la decisión de aceptación o rechazo

h. Obtener las conclusiones del experimento efectuado. Un valor importante de calcular aquí es el error tipo II.

ING. JORGE ACUÑA A., PhD., PROFESOR

44

ING. JORGE ACUÑA A., PhD.,

PROFESOR 45

EJEMPLO 2.14 pag. 76EJEMPLO 2.14 pag. 76

En un proceso de fabricación de

piezas de precisión se quiere que el

valor nominal del diámetro de una

pieza sea 20,0 mm. Se conoce que la

desviación estándar de esta

característica es 3,0 mm. Se toma una

muestra de 25 piezas obteniéndose un

promedio de diámetro de 19,2 mm.

¿Se ha cumplido con lo requerido?

Use =5%.

ING. JORGE ACUÑA A., PhD.,

PROFESOR 46

SOLUCION Se seguirá el procedimiento planteado.

a. Planteo de la hipótesis

H0: µ = 20,0

Ha: µ 20,0

b. La hipótesis es bilateral puesto que no

se cumple con lo requerido si el promedio de la

muestra es mayor o menor que lo especificado.

c. El nivel de significación es dado, = 5%.

d. El estadístico por usar es el siguiente:

_

x – µ

Z = ––––––

/ n

ING. JORGE ACUÑA A., PhD.,

PROFESOR 47

SOLUCION e. Las áreas de cumplimiento de la hipótesis .

f. Cálculo del estadístico citado en d.

_

x – µ 19,2 – 20,0

Z = ——— = —————— = –1,33

/ n 3,0/ 25

g. El valor de Z calculado (–1,33) se encuentra en

el área de cumplimiento de la hipótesis nula.

h. En conclusión, se puede afirmar, con =5%, que

estadísticamente se cumple con el valor nominal

requerido.

ING. JORGE ACUÑA A., PhD.,

PROFESOR 48

EJEMPLO 2.15 pag. 77EJEMPLO 2.15 pag. 77

Si en el Ejemplo anterior no se

conoce la desviación estándar pero

a partir de la muestra se calcula una

desviación típica de 2,1 mm ¿Qué

conclusiones se obtienen? Use

=5%.

ING. JORGE ACUÑA A., PhD.,

PROFESOR 49

SOLUCIONSOLUCION Se seguirá el procedimiento planteado. a. Planteo de la hipótesis H0: µ = 20,0 Ha: µ 20,0 b. La hipótesis es bilateral puesto que no se

cumple con lo requerido si el promedio de la muestra

es mayor o menor que lo especificado. c. El nivel de significación es dado, = 5%. d. El estadístico por usar es el siguiente: _

x – µ t = ————

s/ n-1

ING. JORGE ACUÑA A., PhD.,

PROFESOR 50

SOLUCIONSOLUCION

e. Las áreas de cumplimiento de la hipótesis.

f. Cálculo del estadístico citado en d. _ x – µ 19,2 – 20,0 t = –––––––––– = —————— = –1,87 s/ n-1 2,1/ 24 g. El valor de t calculado (–1,87) se encuentra

en el área de cumplimiento de la hipótesis nula. h. En conclusión, se puede afirmar, con

= 5%, que estadísticamente se cumple con el valor

nominal requerido.

ING. JORGE ACUÑA A., PhD., PROFESOR

51

Un proveedor envía lotes de producto

que según sus registros son 5%

defectuosos. Un cliente toma una

muestra de 200 unidades y encuentra

16 unidades defectuosas. ¿Es cierto lo

que muestran los registros del

proveedor, con =5%?

Se seguirá el procedimiento planteado. a. Planteo de la hipótesis

H0: p = 0,05 Ha: p > 0,05

b. La hipótesis es unilateral puesto que lo problemático en cuanto a calidad es que el porcentaje de defectuosos supere lo especificado.

c. El nivel de significación es dado, = 5%. d. El estadístico por usar es el siguiente:

x – np Z = –––––––

npq

ING. JORGE ACUÑA A., PhD., PROFESOR

52

e. Las áreas de cumplimiento de la hipótesis. f. Cálculo del estadístico x – np 16 – 200(0,05) Z = ———— = ––––––––––––––– = 1,95 npq 200*0,05*0,95 g. El valor de Z calculado (1,95) se encuentra

fuera del área de cumplimiento de la hipótesis nula.

h. En conclusión, no hay evidencia estadística para aceptar la hipótesis nula con = 5%. Por lo tanto, estadísticamente no es cierto lo que anotan los registros del fabricante.

ING. JORGE ACUÑA A., PhD., PROFESOR

53

Para el mismo producto del Ejemplo 3, existe otro proveedor. Una muestra de 200 unidades extraídas de un lote enviado por él, tenía 12 unidades defectuosas. ¿Se puede decir con 95% de confianza que el proveedor del Ejemplo 3 da peor calidad que el de este ejemplo.

ING. JORGE ACUÑA A., PhD., PROFESOR

54

ING. JORGE ACUÑA A., PhD.,

PROFESOR 55

SOLUCIONSOLUCION

Se seguirá el procedimiento planteado.

a. Planteo de la hipótesis

p1: fracción defectuosa del proveedor A

p2: fracción defectuosa del proveedor B

H0: p1 = p2

Ha: p1 > p2

b. La hipótesis es unilateral pues se

quiere probar si la cantidad de defectuosos

enviada por un proveedor es

significativamente mayor que la del otro.

c. El nivel de significación es dado, = 5%.

ING. JORGE ACUÑA A., PhD.,

PROFESOR 56

SOLUCIONSOLUCION d. El estadístico por usar es:

x1 + x2

p’ = ————— q’ = 1 – p’

n1 + n2 e. Las áreas de cumplimiento

f. Cálculo del estadístico

x1 + x2 16 + 12

p’ = –––––––– = ––––––––– = 0,07

n1 + n2 200 + 200 q’ = 1 – 0,07 = 0,93 g. El valor de Z calculado (0,784) está en el área de

cumplimiento de la hipótesis nula.

h. Se puede afirmar, con =5%, que no hay diferencia

significativa entre las calidades suministradas por ambos

proveedores.

784.0

200

1

200

193.0*07.0

200

12

200

16

11''

21

2

2

1

1

Z

nnqp

n

x

n

x

Z

ING. JORGE ACUÑA A., PhD., PROFESOR

57

• En el corte de una varilla

cromada se genera una

varianza de la longitud de 2,5

mm2. Se toma una muestra de

30 varillas y se mide la varianza

muestral de la longitud, la que

resulta ser 2,0 mm2. ¿Existe

alguna diferencia significativa

con el valor inicial de 2,5 mm2?

Use =5%.

Se seguirá el procedimiento planteado. a. Planteo de la hipótesis

H0: 2 = 2,5

Ha: 2 2,5 b. La hipótesis es bilateral puesto que no se cumple con

lo requerido si la varianza de la muestra es mayor o menor que la especificada.

c. El nivel de significación es dado, = 5%. d. El estadístico por usar es el siguiente:

s2 2= (n-1) ——

2 e. Las áreas de cumplimiento de la hipótesis.

58

f. Cálculo del estadístico citado en d.

s2 2= (n-1) —— = 29 * (2/2,5) = 23,2

2

g. El valor de 2 calculado (23,2) se encuentra en el área de cumplimiento de la hipótesis nula.

h. En conclusión, se puede afirmar, con = 5%, que estadísticamente no existe diferencia con la varianza inicial.

ING. JORGE ACUÑA A., PhD., PROFESOR

59

En un proceso de corte de bolsas plásticas se usan dos máquinas. De la máquina A se toma una muestra de 30 unidades que genera una varianza en la longitud de corte de 3,3 mm2 y de la máquina B se toma una muestra de 25 unidades que genera una varianza en la longitud de corte de 4,1 mm2. ¿Se puede afirmar, con = 5%, que una máquina es mejor en la ejecución de esta operación que la otra?

ING. JORGE ACUÑA A., PhD., PROFESOR

60

Se seguirá el procedimiento planteado. a. Planteo de la hipótesis Sea 2

A la varianza producida por la máquina A 2

B la varianza producida por la máquina B H0:

2A = 2

B

Ha: 2A 2

B

b. La hipótesis es bilateral puesto se desea probar la existencia de diferencias entre las varianzas de ambas máquinas.

c. El nivel de significación es dado, = 5%. d. El estadístico por usar es el siguiente:

s12

F = ——— s2

2

ING. JORGE ACUÑA A., PhD., PROFESOR

61

e. Las áreas de cumplimiento de hipótesis. Los valores de F de

0.53 y 1.94 fueron extraídos de tablas F con /2 = 0.025. f. Cálculo del estadístico citado en d.

s12 3,3

F = ——–– = ——–– = 0,805 s2

2 4,1 g. El valor de F calculado (0,805) se encuentra en el área de

cumplimiento de la hipótesis nula (ver Figura 2.18). h. En conclusión, se puede afirmar, con =5%, que no existe

ninguna diferencia de variabilidad de la longitud de corte entre ambas máquinas.

ING. JORGE ACUÑA A., PhD., PROFESOR

62

Una inspección de calidad efectuada sobre dos marcas de baterías para linterna, reveló que una muestra aleatoria de 61 unidades de la marca A generó un promedio de vida útil de 36,5 horas con una desviación estándar de 1,8 horas, mientras que otra muestra aleatoria de 31 unidades de la marca B generó un promedio de 36,8 horas con una desviación estándar de 1,5 horas.

Con un nivel de significación del 5% se desea saber si hay diferencia significativa entre la vida útil de ambas marcas.

ING. JORGE ACUÑA A., PhD., PROFESOR

63

Para probar si hay diferencia significativa entre los promedios se debe comprobar primero la diferencia entre las varianzas, para así seleccionar el estadístico adecuado.

1. Hipótesis de varianzas Siguiendo los pasos de una prueba de hipótesis se tiene: a. Planteo de la hipótesis

H0: 2

A = 2B

Ha: 2A 2

B

b. Como la hipótesis alternativa es de desigualdad, entonces es bilateral. Esto significa que puede darse una relación mayor o menor.

ING. JORGE ACUÑA A., PhD., PROFESOR

64

c. El nivel de significancia es = 5%.

d. El estadístico por usar es Fc = s12/ s2

2 (distribución F-Fisher), pues lo que se desea es medir la relación de varianzas.

e. Las áreas de la hipótesis que se va a probar. v1 = n1–1 = 61–1=60 v2=n2-1 = 31–1=30 De una Tabla F con /2= 2.5% se tiene:

F 60,30,0.025 = 0,551 F 60,30,0.975 = 1,440

f. Fc= s12/ s2

2 = 1,82/1,52 = 1,44 g. Este valor calculado de Fc cae en el área donde se

cumple Ho, por lo tanto se acepta Ho.

ING. JORGE ACUÑA A., PhD., PROFESOR

65

h. Se concluye que ambas varianzas, al 5% de significancia, son iguales.

Se procede entonces a hacer la hipótesis de promedios.

Siguiendo los pasos de prueba de hipótesis se tiene: a. Planteo de la hipótesis

Ho: µ1 = µ2

Ha : µ1 µ2

b. La hipótesis es bilateral al igual que en la hipótesis anterior.

c. El nivel de significación es del 5%

ING. JORGE ACUÑA A., PhD., PROFESOR

66

d. Según la hipótesis anterior las varianzas son desconocidas pero iguales, además, los tamaños de muestra son mayores que 30. Por lo tanto el estadístico por usar es:

e. Las áreas de cumplimiento y rechazo. v = n1 + n2 – 2 v = 61 + 31 – 2 v = 90

ING. JORGE ACUÑA A., PhD., PROFESOR

67

2

2

2

1

2

1

21

n

s

n

s

xxt

De tablas se obtienen los valores: t 90, 0,025 = –1,987 t90,0,975=1,987

f. El estadístico calculado es:

En este caso ( 1 – 2) = 0 pues es de suponer que tratándose de un mismo producto las medias poblacionales son iguales.

g. No hay evidencia estadística, con = 5%, para concluir que ambas medias sean diferentes.

ING. JORGE ACUÑA A., PhD., PROFESOR

68

845,0355,0

3,0

31

5,1

61

8,1

08,365,3622

t

Permite probar el ajuste de los resultados de un experimento a una distribución de probabilidad teórica sujeto a un error .

El método en cuestión se basa en la comparación de las frecuencias absolutas observadas y las frecuencias absolutas esperadas, calculadas a partir de la distribución teórica en análisis.

Se usa el estadístico chi-cuadrado para n>50, de lo contrario, se debe aplicar otras técnicas tales como Kolgomorov o Shapiro-Wilks

ING. JORGE ACUÑA A., PhD., PROFESOR

69

Ho : f(x) = función densidad de la distribución teórica siendo probada

Ha : f(x) a esa función Ejemplo: e– x

Ho: f(x) = p (x, ) = ––––––– x!

e– x

Ha: f(x) p (x, ) = ———— x!

Se usa el estadístico chi-cuadrado: K

2c = (nk – ek)

2 / ek

k=1

ING. JORGE ACUÑA A., PhD., PROFESOR

70

ING. JORGE ACUÑA A., PhD.,

PROFESOR 71

MUESTREO ESTADISTICOMUESTREO ESTADISTICO • Confianza en los resultados obtenidos a partir del

análisis de muestras.

• Aleatoriedad y representatividad.

• Una muestra es aleatoria cuando los elementos

que la componen fueron extraídos de una población

en la cual todos sus componentes tuvieron la misma

probabilidad de pertenecer a esa muestra.

• Una muestra es representativa cuando sus

elementos reflejan las características de la población

de la cual fueron extraídos.

• Ambas propiedades están ligadas al tamaño de la

muestra y al método usado para su selección.

ING. JORGE ACUÑA A., PhD.,

PROFESOR 72

PROCEDIMIENTOPROCEDIMIENTO • Identificación de la característica por estudiar y

del marco de muestreo.

• Escogencia del tipo de muestreo

• Determinación del tamaño de la muestra,

mediante la fórmula que especifique el tipo de

muestreo.

• Selección aleatoria de la muestra previa

definición del procedimiento adecuado.

• Escogencia del método de estimación del error

estadístico.

• Cálculo de inferencias, errores y grado de

confianza de las conclusiones.

ING. JORGE ACUÑA A., PhD.,

PROFESOR 73

VENTAJASVENTAJAS •Ahorro de dinero al evitar la inspección 100%, la

cual tiene costos más altos.

•Ahorro de tiempo al disminuir la cantidad por

inspeccionar en relación con la inspección 100%.

•Atención de casos individuales

•Recurso indispensable cuando la inspección es

destructiva.

•Unico método posible cuando la población es

infinita.

•Excelente opción cuando los errores no

muestrales, especialmente humanos, son grandes

e imposibles de reducir.

•Error y sesgo

ING. JORGE ACUÑA A., PhD.,

PROFESOR 74

TIPOS DE MUESTREOTIPOS DE MUESTREO

• Muestreo aleatorio simple

• Muestreo sistemático

• Muestreo estratificado

• Muestreo por conglomerados

• Muestreo de aceptación.

ING. JORGE ACUÑA A., PhD.,

PROFESOR 75

MUESTREO ALEATORIO MUESTREO ALEATORIO

SIMPLESIMPLE • ESTIMACION DE PROMEDIOS

• ESTIMACION DE PROPORCIONES

2

2/ *

E

Zn222

2/

22

2/

**

**

ENZ

NZn

22

2/

2

2/

***

***

ENqpZ

qpNZn

2

2/*E

Zqpn

nN

nNx

2

*1 n

x

2

n

qp

N

nNx

**1

n

qpx

*

ING. JORGE ACUÑA A., PhD.,

PROFESOR 76

EJEMPLO 2.28 pag. 113EJEMPLO 2.28 pag. 113

Considérese un lote de producción de 1000

unidades, cuya varianza en el diámetro de

una de sus partes es 250 mm. Se desea

estimar el promedio del diámetro, a partir de

una muestra, con una confianza del 95% y

con error no mayor a 1 mm. ¿Cuál es ese

tamaño de muestra y su error estándar?

ING. JORGE ACUÑA A., PhD.,

PROFESOR 77

SOLUCIONSOLUCION

N = 1000 E = 1

Z /2 = 1,96 (extraído de Tablas)

2 = 250

Para estimar el promedio de diámetro de esta

pieza, se debe extraer una muestra de 481

unidades. El muestreo tiene un error estándar

de 0,52.

481~2,480)1*1000(250*96,1

250*1000*96,1

**

**2

2

222

2/

22

2/

ENZ

NZn

52,0481

250*

11000

4811000 2

x

ING. JORGE ACUÑA A., PhD.,

PROFESOR 78

EJEMPLO 2.29 pag. 113EJEMPLO 2.29 pag. 113

Un fabricante afirma que el 2,5% de los

productos que entrega el comprador son

defectuosos. Si éste recibe los productos en

lotes de 5000 unidades, ¿cuál debe ser el

tamaño de la muestra por usar para verificar

lo expresado por el fabricante? Use 95% de

confianza y un error no máximo del 1% en la

estimación.

ING. JORGE ACUÑA A., PhD.,

PROFESOR 79

SOLUCIONSOLUCION

E = 0,01 p = 0,025 q = 0,975

N = 5000 (1- ) =0,95 Z /2 = 1,96

Lo anterior significa que para estimar el

porcentaje defectuoso de ese producto, se

debe extraer una muestra de 789 unidades.

Este muestreo tiene un error estándar de

0,005.

789)01,0*5000()975,0*025,0*96,1(

975,0*025,0*5000*96,1

***

***22

2

22

2/

2

2/

ENqpZ

qpNZn

005,0789

975,0*025,0*

15000

7895000**1 n

qp

N

nNx

ING. JORGE ACUÑA A., PhD.,

PROFESOR 80

MUESTREO MUESTREO

ESTRATIFICADOESTRATIFICADO • Los elementos poblacionales se dividen primero en k-

grupos y luego se aplica muestreo aleatorio simple

• Este proceso se llama estratificación y a cada grupo

se le llama estrato.

• Se estratifica porque los elementos poblacionales

presentan heterogeneidad, por lo que la obtención de

conclusiones representativas se hace difícil.

• Las probabilidades de selección de los estratos pueden

ser diferentes y no es necesario que todos los elementos

tengan la misma oportunidad de selección, pero se debe

conocer la probabilidad de cada uno.

• La estratificación se ejecuta de tal manera que exista

cierta homogeneidad entre los elementos de cada grupo

y que queden en igual número en cada estrato.

ING. JORGE ACUÑA A., PhD.,

PROFESOR 81

MUESTREO MUESTREO

ESTRATIFICADOESTRATIFICADO • Afijación proporcional: se basa en el tamaño del

estrato

•Afijación óptima

k

i

iixN

NnN

nN

1

**1

**ii N

N

nn *

k

i

ii

iii

N

Nnn

1

*

2

1

2

2

1

*

*1

N

N

N

N

n

k

i

ii

k

i

ii

x

ING. JORGE ACUÑA A., PhD.,

PROFESOR 82

EJEMPLO 2.32 pag. 119EJEMPLO 2.32 pag. 119 La producción de una empresa se ha dividido en tres estratos, de

acuerdo con la fracción defectuosa que presenten. Por registros de

los últimos años se conoce la siguiente información:

–––––––––––––––––––––––––––––––––––––––––––––––––––––––

Estrato No. % Defectuoso No. Lotes i (%)

1 5 ó más 35 0,97

2 1,5 a 4,99 80 0,82

3 Menos de 1,5 15 0,30

–––––––––––––––––––––––––––––––––––––––––––––––––––––––

TOTAL 130 1,25*

* Para el total de la producción.

a. A. Si se desea tomar una muestra de 20 lotes, ¿cuántos lotes de

cada estrato se deben seleccionar?

b. B. Compare los errores estándar correspondientes con el error

estándar de muestreo aleatorio simple.

ING. JORGE ACUÑA A., PhD.,

PROFESOR 83

SOLUCIONSOLUCION Para efectos didácticos este problema se resolverá por

afijación proporcional y por afijación óptima. En

situaciones prácticas se debe escoger el que mejor se

adapte a las condiciones.

• Afijación proporcional

––––––––––––––––––––––––––––––––––––––

Estrato Tamaño de la muestra

–––––––––––––––––––––––––––––––––––––––––––

1 n1 = (20/130) * 35 = 5,38 ³ 5

2 n2 = (20/130) * 80 = 12,3 ³ 12

3 n3 = (20/130) * 15 = 2,3 ³ 3

––––––––––––––––––––––––––––––––––––––––––––

Para completar los 20 lotes seleccionados, se deben

tomar 5 lotes del estrato 1, 12 lotes del estrato 2 y 3

lotes del estrato 3.

ING. JORGE ACUÑA A., PhD.,

PROFESOR 84

SOLUCIONSOLUCION

• Afijación óptima

Los cálculos iniciales para obtener el tamaño de

muestra por este método.

––––––––––––––––––––––––––––––––––––––––––––

Estrato Ni i Ni* i i2 Ni* i2

––––––––––––––––––––––––––––––––––––––––––––

1 35 0,97 33,95 0,94 32,93

2 80 0,82 65,60 0,67 53,79

3 15 0,30 4,50 0,09 1,35

––––––––––––––––––––––––––––––––––––––––––––

TOTALES Ni* i=104,05 Ni* i2= 88,07

–––––––––––––––––––––––––––––––––––––––––––

ING. JORGE ACUÑA A., PhD.,

PROFESOR 85

SOLUCIONSOLUCION Se calculan los tamaños de muestra de la siguiente manera:

b. Comparación de errores

El error estándar para afijación proporcional es:

186,005,104

5,4*20

1361,1205,104

6,65*20

652,605,104

95,33*20

3

2

1

n

n

n

169,0

30,0*1582,0*8097,0*35*130

1*

20*130

20130

**1

**

222

1

x

x

k

i

iixN

NnN

nN

ING. JORGE ACUÑA A., PhD.,

PROFESOR 86

SOLUCIONSOLUCION El error estándar para muestreo por afijación óptima es:

El error estándar si se usa muestreo aleatorio simple

se calcula así:

Los errores del muestreo por afijación proporcional (0,169) y

óptima (0,164) son parecidos, mientras que el error del

muestreo aleatorio simple (0,26)

164,0

130

07,88

130

05,104*

20

1

*

*1

2

2

2

1

2

2

1

x

x

k

i

ii

k

i

ii

x N

N

N

N

n

26,020

25,1*

1130

20130 2

x