EJERCICIOS RESUELTOS

14
UNIVERSIDAD NACIONAL DE CAJAMARCA EJERCICIOS CORRELACIÓN Y REGRESIÓN 1.- Suponga que el gerente de comercialización de Bella Holandesa observa el precio y volumen de venta de galones de leche de 10 semanas en forma aleatoria. Los datos obtenidos se presentan en la tabla. Generar el diagrama de dispersión, verificar la tendencia con el coeficiente de correlación, los parámetros de la línea de regresión, el coeficiente de determinación, y la desviación estándar. Semana Venta Semanal de galones Precio de Venta por galón (en US$) 1 10,000 1.30 2 6,000 2.00 3 5,000 1.70 4 12,000 1.50 5 10,000 1.60 6 15,000 1.20 7 5,000 1.60 8 12,000 1.40 9 17,000 1.00 10 20,000 1.10 diagrama de dispersión

Transcript of EJERCICIOS RESUELTOS

Page 1: EJERCICIOS RESUELTOS

UNIVERSIDAD NACIONAL DE CAJAMARCA

EJERCICIOS CORRELACIÓN Y REGRESIÓN

1.- Suponga que el gerente de comercialización de Bella Holandesa observa el precio y volumen de venta de galones de leche de 10 semanas en forma aleatoria. Los datos obtenidos se presentan en la tabla. Generar el diagrama de dispersión, verificar la tendencia con el coeficiente de correlación, los parámetros de la línea de regresión, el coeficiente de determinación, y la desviación estándar.

Semana Venta Semanalde galones

Precio de Ventapor galón (en US$)

1 10,000 1.302 6,000 2.003 5,000 1.704 12,000 1.505 10,000 1.606 15,000 1.207 5,000 1.608 12,000 1.409 17,000 1.0010 20,000 1.10

diagrama de dispersión

5 10 15 20 25 30 35 40 450

2

4

6

8

10

12

14

16

18

Diagrama de dispersion

venta semanal de galones (en miles)

prec

io d

e ve

nta

por g

alon

Page 2: EJERCICIOS RESUELTOS

UNIVERSIDAD NACIONAL DE CAJAMARCA

Verificar la tendencia con el coeficiente de correlación

X Y XY X2 Y2

10 1.3 13 100 1.69

6 2 12 36 4

5 1.7 8.5 25 2.89

12 1.5 18 144 2.25

10 1.6 16 100 2.56

15 1.2 18 225 1.44

5 1.6 8 25 2.56

12 1.4 16.8 144 1.96

17 1 17 289 1

20 1.1 22 400 1.21

∑ 112 14.4 149.3 1488 21.56

r=n∑ xy−∑ x∑ y

√ [n∑ x2−(∑ x )2 ] [n∑ y2−(∑ y)

2 ]

r= 10∗149.30−112∗14.4

√ [10∗1488−(112 )2 ] [10∗21.56−(14.40 )2 ]

r=−0 .8635

Parámetros de la línea de regresión

b=n∑ xy−∑ x∑ y

n∑ x2−(∑ x)2 =

10∗149.30−112∗14.4

10∗1488−1122 =−0.0513

a=∑ y

n−

b∑ x

n=

14.4010

−−0.0513∗112

810=2.0144

y=2.0144−0.0513( x1000

)

Page 3: EJERCICIOS RESUELTOS

UNIVERSIDAD NACIONAL DE CAJAMARCA

5 10 15 20 25 30 35 40 450

2

4

6

8

10

12

14

16

18

f(x) = 0.395348837209302 x + 0.906976744186046R² = 0.806511627906977

venta semanal de galones (en miles)

prec

io d

e ve

nta

por g

alon

Desviación estándar.

COV xy=∑ xy

n−∑ x∑ y

n2 =149.30

10−

112∗14.40

102

COV xy=−1.1980∗1000COV xy=−1198

Se utiliza la covarianza cuando se trata de datos agrupados como lo es este caso.

Page 4: EJERCICIOS RESUELTOS

UNIVERSIDAD NACIONAL DE CAJAMARCA

2.-El gerente general de una planta de producción de materiales de construcción considera que la demanda de embarques de aglomerado puede estar relacionado con el número de permisos de construcción emitidos en el municipio durante el trimestre anterior. El gerente ha recolectado los siguientes datos:

Permisos de Construcción Embarque de Conglomerados15 69 440 1620 625 1325 915 1035 16

a) Revísese el diagrama de dispersión para ver si los datos pueden ser descritos satisfactoriamente por una ecuación lineal.

b) Calcúlese la razón de la variación de los embarques ante una variación de los permisos.c) Determínese una estimación de los embarques cuando el número de permisos de

construcción es de 30.d) Calcular la desviación estándar.e) Calcular el coeficiente de correlación.

SOLUCIÓN

X Y XY X^2 Y^2

15 6 90 225 369 4 36 81 16

40 16 640 1600 25620 6 120 400 3625 13 325 625 16925 9 225 625 8115 10 150 225 10035 16 560 1225 256

∑ 184 80 2146 5006 950

Page 5: EJERCICIOS RESUELTOS

UNIVERSIDAD NACIONAL DE CAJAMARCA

Diagrama De Dispersión

5 10 15 20 25 30 35 40 450

2

4

6

8

10

12

14

16

18

R² = 0.806511627906977

Permisos de Construcción

Emba

rque

de

Cong

lom

erad

os

R=0.8905

Y = a + bx.a = 0.907b = 0.3953R = 0.8981S = 4.6291

Y = 0.907 + 0.3953x.

Y (30) = 0.907 + 0.3953*30. = 13

3.- La población de cierta ciudad tiene el siguiente comportamiento histórico:

Año Habitantes1 1’000,0002 1’020,0003 1’050,0004 1’080,0005 1’120,0006 1’170,0007 1’230,0008 1’300,0009 1’380,000

Page 6: EJERCICIOS RESUELTOS

UNIVERSIDAD NACIONAL DE CAJAMARCA

a) Realizar el diagrama de dispersión.

0 1 2 3 4 5 6 7 8 9 100

200

400

600

800

1000

1200

1400

1600

diagrama de dispersion

años

habi

tant

es e

n m

iles

b) Hallar los parámetros de la tendencia.

Calculo de los parámetros:

b=n∑ xy−∑ x∑ y

n∑ x2−(∑ x)2 =

9∗54560−45∗10350

9∗285−2852 =46.8333

a=∑ y

n−

b∑ x

n=

103509

−46.8333∗45

9=915.8333

y=915.8333+46.8333 x

Coeficiente de correlación:

r=n∑ xy−∑ x∑ y

√ [n∑ x2−(∑ x )2 ] [n∑ y2−(∑ y)

2 ]

r= 9∗54560−45∗10350

√ [9∗285−(45 )2 ] [9∗2039900− (10350 )2 ]

r=0.9787

Como el coeficiente de correlación de acerca a 1 podemos decir que existe una buena o aceptable nivel descriptivo entre las variables x e y.

c) Pronosticar la población en el año 15.

Page 7: EJERCICIOS RESUELTOS

UNIVERSIDAD NACIONAL DE CAJAMARCA

0 1 2 3 4 5 6 7 8 9 100

200

400

600

800

1000

1200

1400

1600

f(x) = 46.8333333333333 x + 915.833333333333R² = 0.957799611838913

años

habi

tant

es e

n m

iles

Como se quiere determinar la población en 15 años reemplazaremos en la ecuación determinada en la tabla anterior:

y=915.83+46.8333 xy=915.83+46.8333∗(15)

y=1618.33 ≈ 1618 hab .

4. ¿Cuál de las siguientes situaciones es inconsistente?

a) Y = 499 + 0.21X y r = 0.75b) Y = 100 + 0.9X y r = -0.7c) Y = -20 + X y r = 0.4d) Y = -7-4X y r = -0.9

Solución

CORRELACIÓN VALOR O RANGO

Perfecta |R| = 1

Excelente 0.9 <= |R| < 1

Buena 0.8 <= |R| < 0.9

Regular 0.5 <= |R| <0.8

Mala |R|< 0.5

Como se puede apreciar en las ecuaciones anteriores, la alternativa que es inconsistente es la “C” por presentar coeficiente de correlación menor de 0.5, lo cual indica que la correlación es mala.

Page 8: EJERCICIOS RESUELTOS

UNIVERSIDAD NACIONAL DE CAJAMARCA

5. Los ingresos de Telefónica se estiman mediante el Producto Nacional Bruto. La ecuación de regresión es Y = 0.078 + 0.06X en donde el PNB se mide en miles de millones de dólares.

a) Interprete la pendiente.b) Interprete la intersección con Y.

Como la pendiente es positiva (ascendente b=0.06) los ingresos de telefónica van en aumento.

6. Considere los datos de la tabla siguiente:

Ventas semanales (en US$) Gastos de publicidad (en US$)1,250.00 41,000.001,380.00 54,000.001,425.00 63,000.001,425.00 54,000.001,450.00 48,000.001,300.00 46,000.001,400.00 62,000.001,510.00 61,000.001,575.00 64,000.001,650.00 71,000.00

a) ¿Existe una relación significativa entre los gastos de publicidad y las ventas?b) Establezca la ecuación de predicción.c) Pronostique las ventas para un gasto de publicidad de US$50.00.d) ¿Qué porcentaje de los gastos en publicidad explican las variaciones en las ventas?

SOLUCIÓN

X Y XY X^2 Y^2

41000 1250 51250000 1681000000

1562500

54000 1380 74520000 2916000000

1904400

63000 1425 89775000 3969000000

2030625

54000 1425 76950000 2916000000

2030625

48000 1450 69600000 2304000000

2102500

46000 1300 59800000 2116000000

1690000

62000 1400 86800000 3844000000

1960000

61000 1510 92110000 372100000 2280100

Page 9: EJERCICIOS RESUELTOS

UNIVERSIDAD NACIONAL DE CAJAMARCA

064000 1575 10080000

0409600000

02480625

71000 1650 117150000

5041000000

2722500

∑ 564000 14365 818755000

3.2604E+10 20763875

Diagrama De Dispersión

40000 45000 50000 55000 60000 65000 70000 750001200

1250

1300

1350

1400

1450

1500

1550

1600

1650

1700

R² = 0.719019259160206

gastos de publicidad

VEN

TAS

SEM

ANAL

R=0.8479

Y = a + bx.a = 828.127b = 0.0108R = 0.8480S = 106.0104

Y(50) = 828.127+ 0.0108*50 = 828.666

Page 10: EJERCICIOS RESUELTOS

UNIVERSIDAD NACIONAL DE CAJAMARCA

7. En la siguiente tabla se presenta la información de una empresa de órdenes por correo para 12 ciudades:

Ciudades Número de Ordenes Recibidas por Correo

Número de Catálogos Distribuidos

A 24,000 6,000B 16,000 2,000C 23,000 5,000D 15,000 1,000E 32,000 10,000F 25,000 7,000G 18,000 15,000H 18,000 3,000I 35,000 11,000J 34,000 13,000K 15,000 2,000L 32,000 12,000

a) Determine si existe una relación lineal significativa entre estas dos variables.b) Determine la línea de regresión.c) Determine el error estándar de la estimación.d) ¿Qué porcentaje de la variación de los datos independientes explica la variación de los

datos dependientes?e) Pronostique las órdenes por correo recibidas cuando se distribuyeron 10,000 catálogos.f) Calcule la varianza explicada para la variable Y.

SOLUCIÓN

X Y XY X2 Y2

6000 24000 144000000 36000000 5760000002000 16000 32000000 4000000 2560000005000 23000 115000000 25000000 5290000001000 15000 15000000 1000000 225000000

10000 32000 320000000 100000000

1024000000

7000 25000 175000000 49000000 62500000015000 18000 270000000 22500000 324000000

Page 11: EJERCICIOS RESUELTOS

UNIVERSIDAD NACIONAL DE CAJAMARCA

03000 18000 54000000 9000000 324000000

11000 35000 385000000 121000000

1225000000

13000 34000 442000000 169000000

1156000000

2000 15000 30000000 4000000 22500000012000 32000 384000000 14400000

0102400000

0

∑ 87000 287000 2366000000

887000000

7513000000

Diagrama De Dispersión

0 2000 4000 6000 8000 10000 12000 14000 1600010000

15000

20000

25000

30000

35000

40000

R² = 0.489326237913721

catalogos distribuidos

Núm

ero

de O

rden

es R

ecib

idas

por

Cor

reo

R=0.6995

Y = a + bx.a = 15846.179b = 1.1132R = 0.6995S = 8491.8261

Page 12: EJERCICIOS RESUELTOS

UNIVERSIDAD NACIONAL DE CAJAMARCA

Y(10000) =15846.179+ 1.1132*10000

Y(10000) = 26977.886 ordenes recibidas