estadistica.docx

13
ESTADISTICA ------- REGRESION LINEAL SIMPLE EJERCICIOS - REGRESIÓN LINEAL SIMPLE 1.En una muestra de 10 adultos se registraron las siguientes mediciones de edad en años (X) y la hipertensión arterial (HTA) (Y): X 38 42 43 46 48 50 54 60 65 67 Y 120 124 135 138 135 140 143 150 160 170 a. Indique la tendencia y obtenga la línea recta de regresión de la HTA en función de la edad. ¿Qué opina Ud. del nivel de correlación entre las dos variables? b. Compruebe la idoneidad del modelo lineal de regresión. Si el modelo es apropiado pronostique la HTA de un adulto de 70 años. c. De seguir la tendencia, cuánto se espera aumente la HTA para el próximo año. a. Indique la tendencia y obtenga la línea recta de regresión de la HTA en función de la edad. ¿Qué opina Ud. del nivel de correlación entre las dos variables? 1 PERSONAS EDAD(X) HTA(Y) XY XX YY 1 38 120 4560 1444 14400 2 42 124 5208 1764 15376 3 43 135 5805 1849 18225 4 46 138 6348 2116 19044 5 48 135 6480 2304 18225 6 50 140 7000 2500 19600 7 54 143 7722 2916 20449 8 60 150 9000 3600 22500 9 65 160 10400 4225 25600 10 67 170 11390 4489 28900 513 1415 73913 27207 202319 N = 10 MEDIA DE X = 51.3 MEDIA DE Y = 141.5

Transcript of estadistica.docx

Page 1: estadistica.docx

ESTADISTICA ------- REGRESION LINEAL SIMPLE

EJERCICIOS - REGRESIÓN LINEAL SIMPLE

1. En una muestra de 10 adultos se registraron las siguientes mediciones de edad en años (X) y la hipertensión arterial (HTA) (Y):

X 38 42 43 46 48 50 54 60 65 67Y 120 124 135 138 135 140 143 150 160 170

a. Indique la tendencia y obtenga la línea recta de regresión de la HTA en función de la edad. ¿Qué opina Ud. del nivel de correlación entre las dos variables?

b. Compruebe la idoneidad del modelo lineal de regresión. Si el modelo es apropiado pronostique la HTA de un adulto de 70 años.

c. De seguir la tendencia, cuánto se espera aumente la HTA para el próximo año.

a. Indique la tendencia y obtenga la línea recta de regresión de la HTA en función de la edad. ¿Qué opina Ud. del nivel de correlación entre las dos variables?

Y=A+BX  B = 1.4869A = 65.2214

   Y=65.2214+1.4869X

1

PERSONAS EDAD(X) HTA(Y) XY XX YY

1 38 120 4560 1444 144002 42 124 5208 1764 153763 43 135 5805 1849 182254 46 138 6348 2116 190445 48 135 6480 2304 182256 50 140 7000 2500 196007 54 143 7722 2916 204498 60 150 9000 3600 225009 65 160 10400 4225 2560010 67 170 11390 4489 28900∑ 513 1415 73913 27207 202319

   N = 10

MEDIA DE X = 51.3

MEDIA DE Y = 141.5

Page 2: estadistica.docx

ESTADISTICA ------- REGRESION LINEAL SIMPLE

35 40 45 50 55 60 65 700

20

40

60

80

100

120

140

160

180

f(x) = 1.48691158296821 x + 65.2214357937311R² = 0.938672778468123

Chart Title

Series2Linear (Series2)Linear (Series2)

b. Compruebe la idoneidad del modelo lineal de regresión. Si el modelo es apropiado pronostique la HTA de un adulto de 70 años.

COEFICIENTE DE COREELACION DE PIRSON r= 0.9689

COEFIECIENTE COVARIANZA = 1323.5

r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y

r = 0.9689 ˃0.60, POR LO TANTO LA RECTA DE REGRESION ES CONFIABLEPARA PREDICIR

SI X=70, ENTONCES Y=

169.305247

% VARIANZA TOTAL = 100%% EXPLICADA POR LA RR= 94%%VAR NO EXPLICADA= 6%

c. de seguir la tendencia, cuánto se espera aumente la hta para el próximo año.

la variación del siguiente año es =1.5

2

Page 3: estadistica.docx

ESTADISTICA ------- REGRESION LINEAL SIMPLE

2. Un estudio de mercado trata de averiguar si es efectiva la propaganda televisada de un producto que salió a la venta con relación al tiempo de publicidad (horas/semana). Se recopilaron datos a partir de la segunda semana de iniciada la publicidad resultando la tabla siguiente. No se pudo recopilar datos de la cuarta semana.

Semana 2 3 4 5 6 7Tiempo de propaganda 20 25 22 28 36 40Venta del producto S/. 300 310 - 320 350 420

Semana Tiempo de Venta XX YY XY

 Propaganada (X)

del producto (Y)      

2 20 300 400 90000 60003 25 310 625 96100 77504 22 297 484 88209 65345 28 320 784 102400 89606 36 350 1296 122500 126007 40 420 1600 176400 16800

∑ Total 171 1997 5189 675609 58644

n=6Media X =28.5Media Y =332.8

y = a + bx

b=5.5

a=176.6

a. Es efectiva la publicidad del producto

Y = 176.6 +5.5X

COEFICIENTE DE CORRELACION DE PIRSON r= 0.9309COEFIECIENTE COVARIANZA = 1729.5

r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y

r = 0.9309 ˃0.60, por lo tanto la recta de regresion es confiable para predicir

b. En cuanto estimaría las ventas para la semana 4?

Reemplazando datos ala ecuación 1 del cuadro anterior.

3

Page 4: estadistica.docx

ESTADISTICA ------- REGRESION LINEAL SIMPLE

hallamos la venta para la semana cuarta utilizando la formula siguiente: Media = Y Media= X

(Y)= y (X)= x

y - Y = b (x-X)…….. 1

Reemplazando datos ala ecuación 1 del cuadro anterior.

m -(1700+𝑚)/6= b (22-28.5)

Ahora calculamos la b.

𝑏= (6(52110+22𝑚) −171 (1700+𝑚))/ (6(5189) − (〖171) 〗^2)) 𝑏= (21960−3𝑚)/1893 (6𝑚−1700−𝑚)/6=(21960−39𝑚)/1893(−6.5)

(6𝑚−1700−𝑚)/2=(21960−39𝑚)/631(−6.5)

3155m-631*1700 = (2(21960)-78m) (-6.5m)

3155m-631*(1700) = -285480+507m

2648m = 787220

m = 297.3 = 297.

3. Un editor tomó una muestra de 7 libros, anotando el precio y el número de páginas respectivo, si los resultados:

Nro. de Pago. 630 550 400 250 370 320 610Precio S/. 10 8 7 4 6 6 9

a. Obtenga el modelo de regresión lineal simple entre el precio y el número de páginas, con el fin de predecir precios. ¿Qué porcentaje de la varianza total de precios se explica por esta función?.

b. Estime el precio de un libro de 300 páginas. Si a este libro se le incrementa 20 páginas en una segunda edición. En cuento se incrementaría su precio.

c. Cuántas páginas debería tener un libro cuyo precio se estima en 12.27 soles.

4

Page 5: estadistica.docx

ESTADISTICA ------- REGRESION LINEAL SIMPLE

200 250 300 350 400 450 500 550 600 650 7000

2

4

6

8

10

12

f(x) = 0.0132557145908994 x + 1.21565904721213R² = 0.945421942948628

PRECIO

a. Obtenga el modelo de regresión lineal simple entre el precio y el número de páginas, con el

Fin de predecir precio. ¿Qué porcentaje de la varianza total de precios se explica por esta función?

Y = 1.216+0.01326X

b. Estima el precio de un libro de 300 páginas. Si a este libro se le incrementa 20 paginas en una segunda edición. En cuanto se incrementara su precio.

COEFICIENTE DE CORRELACION DE PIRSON r= 0.9723COEFIECIENTE COVARIANZA =1772.857143

r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y

r = 0.9723 ˃0.60, por lo tanto la recta de regresion es confiablepara predicir

5

N° DE LIBROS

N° de Pagina (X) Precio S/. (Y) XX YY XY

1 630 10 396900 100 63002 550 8 302500 64 44003 400 7 160000 49 28004 250 4 62500 16 10005 370 6 136900 36 22206 320 6 102400 36 19207 610 9 372100 81 5490

∑ Total 3130 50 1533300 382 24130

Page 6: estadistica.docx

ESTADISTICA ------- REGRESION LINEAL SIMPLE

SI X=300, ENTONCES Y= 5.19

Si incrementa en 20 paginas entonces seria 320 hojas, entonces x=320

y= 5.46 y ahora la diferencia es = 0.27

RPTA.

% VARIANZA TOTAL = 100%% EXPLICADA POR LA RR =95%%VAR NO EXPLICADA= 5%

c. Cuántas páginas debería tener un libro cuyo precio se estima en 12.27 soles.

SI Y = 12.27, ENTONCES X= 833.93

4. Una muestra de 5 varones adultos de quienes se observaron las estaturas (X en pies, pulgadas) y los pesos (Y en libras) ha dado los siguientes resultados:

X 5´1´´ 5´2´´ 5´3´´ 5´4´´ 5´5´´Y 125 130 140 145 160

a. Realice una regresión lineal y utilice los datos para verificar que la varianza total de Y es igual a la varianza residual más la varianza explicada por la recta de regresión.

b. Usando la descomposición de la varianza calcule r2 e interprete el resultado.

Varones Publicidad (X) Ventanas (Y) XX YY XY1 0.039 125 0.001521 15625 4.8752 0.077 130 0.005929 16900 10.013 0.116 140 0.013456 19600 16.244 0.154 145 0.023716 21025 22.335 0.193 160 0.037249 25600 30.88

∑Total 0.579 700 0.081871 98750 84.335

Publicidad (X)5´1´´= 0.03855´2´´= 0.0775´3´´=0.11555´4´´=0.1545´5´´= 0.1925

0.579

6

Page 7: estadistica.docx

ESTADISTICA ------- REGRESION LINEAL SIMPLE

1pies*pulg = 7.7*(10*-3)

n=5Media X =0.12Media Y =140.0

y = a + bx

b= 220.94

a=114.41

a. Realice una regresión lineal y utilice los datos para verificar que la varianza total de Y es igual a la varianza residual más la varianza explicada por la recta de regresión.

Y = 114.41+ 220.94 X

0 1 2 3 4 5 6 70

20000

40000

60000

80000

100000

120000

R² = 0.533169941492629f(x) = 12661.4285714286 x − 11398.3333333333

PESO

Ventanas (Y) XX YYLinear (YY) Linear (YY) XY

b. Usando la descomposición de la varianza calcule r2 e interprete el resultado.

COEFICIENTE DE CORRELACION DE PIRSON r= 0.982235323

COEFIECIENTE COVARIANZA =3.275

r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y

r = 0.98224 ˃0.60, POR LO TANTO LA RECTA DE REGRESION ES CONFIABLEPARA PREDICIR

r2 =0.9648

7

Page 8: estadistica.docx

ESTADISTICA ------- REGRESION LINEAL SIMPLE

5. Una compañía de alimentos maneja una cadena de tiendas al menudeo. Para medir la eficiencia de las tiendas se estudió la relación del número de empleados (X) y el promedio del volumen de ventas mensuales (Y) en cientos de dólares para todas las tiendas durante el año pasado. La gráfica de los datos sugiere una relación lineal entre las variables. Se tiene la siguiente información:

n=100, ∑X=600, ∑Y=1600, ∑XY=13600, ∑X2=5200, ∑Y2=37700

a. Obtenga el modelo de regresión lineal simple para predecir las ventas a partir del número de empleados. ¿En cuánto se estiman las ventas para una tienda de 8 empleados?

b. ¿Qué porcentaje de las varianzas de las ventas es explicada por la variabilidad del número de empleados?

c. ¿Cuántos empleados tiene la tienda cuya venta promedio se estima en 1100 dólares.

EMPLEADOS

N. EMPL.(X)

P. VENT. (Y) XY XX YY

∑ 600 1600.00 13600 5200 37700

1.54 1.56 1.58 1.6 1.62 1.64 1.660.00

10.00

20.00

30.00

40.00

50.00

60.00

70.00

80.00

f(x) = 155.308917197452 x − 184.679649681529R² = 0.981335070867806

VENTAS

N = 100MEDIA DE X =6.000MEDIA DE Y =16.000

Y=A+BX

B =2.50A =1.00

Y=2.50X-1.00

Covarianza COVxy=4000coef. Correlación de Pearson r =0.9091copef. De determinación r*r = 0.8264r es positiva, indica que tiene un a tendencia lineal positiva, a mayor X, mayor Y

r=0.9723>0.60, por lo tanto la recta de regresion es confiable para predecir.

8

Page 9: estadistica.docx

ESTADISTICA ------- REGRESION LINEAL SIMPLE

a. Obtenga el modelo de regresión lineal simple para predecir las ventas a partir del número de empleados. ¿En cuánto se estiman las ventas para una tienda de 8 empleados?

si, X=8, entonces Y=21.000el precio incremento se le aumenta 20pag mas si, X=320, entonces Y= 801.000

b. ¿Qué porcentaje de las varianzas de las ventas es explicada por la variabilidad del número de empleados?

% varianza total= 100%% var. Explicada por la RR= 82.6%% var. No explicada= 17.4%

c. ¿Cuántos empleados tiene la tienda cuya venta promedio se estima en 1100 dólares.

El número de empleados que tiene la tienda, si su venta promedio es 1100 dólares es: 440.4

6. Sea Y el índice de precios al consumidor, tomando como base al año 2000 (es decir 2000=100). Para los datos que siguen:

Año 2001 2002 2003 2004 2005 2006 2007Y 106.0 111.1 117.2 121.3 125.2 128.0 132.6

a. Obtenga la recta de mínimos cuadrados que se ajuste a los datos.b. Realice la predicción del índice de precios para el año 2008, y compararlo con el

valor verdadero (144.4). ¿En qué año podemos esperar que el índice de precios sea 150.57, suponiendo que las tendencias presentes continúen?.

N AÑO(X) IND. CONS.(Y) XY XX YY

1 2001 106.0 212106 4004001 112362 2002 111.1 222422.2 4008004 12343.213 2003 117.2 234751.6 4012009 13735.844 2004 121.3 243085.2 4016016 14713.695 2005 125.2 251026 4020025 15675.046 2006 128.0 256768 4024036 163847 2007 132.6 266128.2 4028049 17582.76∑ 14028 841.4 1686287.2 28112140 101670.54

9

Page 10: estadistica.docx

ESTADISTICA ------- REGRESION LINEAL SIMPLE

2000 2001 2002 2003 2004 2005 2006 2007 20080.0

20.0

40.0

60.0

80.0

100.0

120.0

140.0

f(x) = 4.34285714285714 x − 8582.88571428571R² = 0.988453989764212

INDICE DE PRECIOS

N = 7

MEDIA DE X =2004.000

MEDIA DE Y =120.200

Y=A+BX

B =4.3429

A =-8582.9

Y=4.33429X-8582.9

covarianza COVxy=121.6

coef. Correlación de Pearson r = 0.9942

copef. De determinación r*r = 0.9885

r es positiva, indica que tiene un a tendencia lineal positiva, a mayor X, mayor Y

r=0.6337>0.60, por lo tanto la recta de regresión es confiable para predecir.si, Y=150.57, entonces X=2011

% varianza total =100%

% var. Explicada por la RR =98.8%

% var. No explicada =1.2%

10