Post on 09-Nov-2015
description
34
Trabajo colaborativo Momento 3
Unidad 3 - Regresin y Determinacin REGRESION LINEAL SIMPLEREGRESION LINEAL MULTIPLE
Leymar Andrs ArdilaCarlos Andrs SandovalJohn Fernando Balln - Cdigo: 80755773Grupo 494
Tutor: Jean-Pierre Lara Arbelez
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNADBOGOTA D.C.10-05-2015
TABLA DE CONTENIDO
TEMAPGINAINTRODUCCION.. 3JUSTIFICACION4OBJETIVOS5
APORTES LABORATORIO.....6
Aporte laboratorio Leymar Ardila.....6Aporte laboratorio John Balln....11
APORTES INDIVIDUALES
Aporte laboratorio Carlos Sandoval18Aporte laboratorio Leymar Ardila....24Aporte laboratorio John Balln....29
APORTES GRUPALES....32
PROPUESTA UNICA35
SUGERENCIAS.36
INTRODUCCIN
El presente trabajo se da con base al estudio de la tercera unidad, correspondiente a regresin y determinacin. En el transcurso del trabajo y correspondiendo a las actividades individuales se da el trabajo realizado por cada uno de los participantes del grupo respecto a identificacin de variables cuantitativas, la realizacin de diagramas de dispersin, los modelos matemticos que permiten los clculos y la determinacin del porcentaje de explicacin del modelo y el grado de relacin de las variables. Cada uno de estos puntos solicitados en la actividad, tienen un soporte escrito y otro soporte en tabla de Excel, con el fin de dar un informe claro respecto a los resultados de los puntos solicitados.
Esto claro, sin perder el enfoque principal consistente en la solucin que requiere el hospital Federico Lleras Acosta para mejorar sus ndices de servicio y la atencin prestada a sus pacientes. Esto conlleva a que las evidencias adjuntas en el presente documentos sean pensadas justamente en esta situacin.
La presentacin dada por cada uno de los estudiantes se dar por secciones para dejar la aclaracin del aporte de cada quien, a su vez que tambin tendr una seccin del trabajo que se realiz grupalmente con la aclaracin del principal autor.
Adicionalmente se adjuntan los informes y el soporte de las tablas de datos en Excel para su respectiva validacin o de quien lo requiera.
Por ltimo se deja la aclaracin que se realiza la propuesta nica de acuerdo a la nica propuesta encontrada en el foro de trabajo colaborativo.
JUSTIFICACIN
El presente trabajo tiene como finalidad presentar las evidencias de los aprendizajes obtenidos en la unidad 3 del curso de Estadstica Descriptiva. Adicionalmente Muestra por medio de dichas evidencias el proceso dado por cada uno de los integrantes del grupo, a su vez que el propsito de adquirir conocimiento con base a la participacin en el foro del curso y el conocimiento compartido respecto a los aportes realizados.
OBJETIVOS
Determinar la relacin entre dos variables cuantitativas del problema de estudio. Realizar e interpretar acertadamente los diagramas de dispersin. Calcular la recta de regresin y el coeficiente de correlacin entre una variable dependiente y varias variables, si es el caso. Realizar el diagrama de dispersin por las variables escogidas por cada uno de los participantes. Calcular la recta de regresin y el coeficiente de correlacin para probar estadsticamente su relacin.
APORTES LABORATORIOS
Laboratorio - Leymar Andrs Ardila
1.Se quiere estudiar la asociacin entre consumo de sal y tensin arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensin arterial un tiempo despus.
X (sal) Y (Presin) 1,8 100 2,2 98 3,5 105 4,0 110 4,3 112 5,0 120
Variable X: gr. de sal diarios (no aleatoria)Variable Y: presin arterial en mm. de Hg
a) Realice el diagrama de dispersin y calcule el coeficiente de correlacin e interprete
b. encuentre el modelo matemtico que permite predecir el efecto de una variable sobre otra. Es confiable?RTA: se utiliza el mtodo de la regresin lineal simple
c. determine el porcentaje de explicacin del modelo y el grado de relacin de las dos variables
Se halla a a y b
Medidas de cada conjunto de datos:
La ecuacin de la recta, esta dada por:
Error estndar de la recta
Se halla el coeficiente de determinacin y el coeficiente de correlacion:
El grado de relacin de las variables es de: 0,97
d. si a un paciente se le suministra una dosis de sal de 6,5 Cul es la tensin arterial esperada?Utilizamos la ecuacin de la recta asi:=(6,31)(6,5)+85,6= 126,615
2. En un nuevo proceso artesanal de fabricacin de cierto artculo que est implantado, se ha considerado que era importante ir anotando peridicamente el tiempo medio (medido en minutos) que se utiliza para realizar una pieza y el nmero de das desde que empez dicho proceso de fabricacin. Con ello, se pretende analizar como los operarios van adaptndose al nuevo proceso mejorando paulatinamente su proceso de produccin.Los siguientes datos representan dicha situacin:
X10203040506070
Y35282320181513
a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las variables
El tipo de asociacin al diagrama es dispersin lineal descendente
b. Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre la otra. Es confiable?
Y= a+bXY= 0.3464x+35.571R=0.9454
La ecuacin de la recta es confiable porque el coeficiente de la determinacin (R) est cercano a 1 y tiene una correlacin excelente
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos variables.
El R afirma que el modelo explica el 94.5% de la informacin. El valor de r confirma el grado de relacin entre las variables: el tiempo empleado en la fabricacin del articulo est directamente relacionado en un 97% con los das empleados
d. Qu tiempo deber tardarse un empleado cuando se lleven 100 das?
Y= -0.3464 (100)+35.571= -34.64+35.571= 0.931Cuando un empleado lleve 100 das deber tardarse 0.931 min
3. Una Nutricionista de un hogar infantil desea encontrar un modelo matemtico que permita determinar la relacin entre el peso y la estatura de sus estudiantes. Para ello selecciona 10 nios y realiza las mediciones respectivas.A continuacin se presentan los resultados:
Estatura (cm)121123108118111109114103110115
Peso ( kg)25221924191820152021
a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las variables
b. Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre la otra. Es confiable?
Y= a+bXY= 0.4212X 27.377R= 0.8102Se puede asegurar que la ecuacin de la recta no es muy confiable porque el coeficiente de determinacin se aleja un poco de 1 y tiene un grado de confiabilidad aceptable
c. Determine el grado de relacin de las dos variables.
El valor de r confirma el grado de relacin entre las variables: peso y estatura de los estudiantes esta directamente relacionado
d. Cul es el peso que debera tener un estudiante que mida 130 cm?
X=1132/10= 113cmY= 203/10= 20.3Kg130cm*20.3Kg= 2639/113Kg= 23.3Kg
R= el peso de un estudiante que mida 130cm debe de ser de 23.3Kg
Laboratorio John Fernando Balln
X(SAL)Y(PRESION)X^2Y^2XY
1,81003,2410000180
2,2984,849604215,6
3,510512,2511025367,5
41101612100440
4,311218,4912544481,6
51202514400600
3,5107,513,3011612,17380,78
Modelos matemticos:METODO REGRECION LINEAL SIMPLEDiferencia respecto al mtodo de los mnimos cuadrados:
Ecuacin del Error estndar de estimacin:
El es confiable, indicando un grado de relacin entre variables de 97%. Los procedimientos matemticos para llegar a dicha conclusin se encuentran en el Excel anexo, en la pestaa Sal_tension.
El grado de relacin es de 0,97%. Los procedimientos y formulas se encuentran en el Excel anexo.
Dada la ecuacin:
De acuerdo a los valores dados, se genera diagrama de dispersin de acuerdo a la tabla:
T. mins (X)No dias (Y)X^2Y^2XY
10351001225350
2028400784560
3023900529690
40201600400800
50182500324900
60153600225900
70134900169910
Medias40222000522730
Modelos matemticos
La explicacin matemtica de los resultados se encuentra en el Excel anexo en la pestaa Proceso Artesanal.a-0,34643
b35,57
R = 0,9454Tiene un relativo grado de confiabilidad, teniendo en cuenta
El grado de relacin es de 0,94%. Al estar el coeficiente de determinacin cercano a 1 es confiable, adicional tiene una buena correlacin. Los procedimientos y formulas se encuentran en el Excel anexo.
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos variables.
El modelo explica el 94% de la informacin, de acuedo a anlisis de R2. La duracin del tiempo de fabricacin de la artesana es directamente proporcional a los das empelados.
(Clculo realizado en el Excel anexo. Pestaa Proceso Artesanal)
Estatura cm (X)Peso Kg (Y)X^2Y^2XY
12125146416253025
12322151294842706
10819116643612052
11824139245762832
11119123213612109
10918118813241962
11420129964002280
10315106092251545
11020121004002200
11521132254412415
Sumatorias1132203128490419723126
a0,4212
b-27,377
R20,810
(Nota: Detalle de operaciones y formulas en el Excel anexo, pestaa Estatura_peso)La ecuacin de la recta no es muy confiable, al estar el coeficiente de determinacin alejado del 1. El grado de confiabilidad es aceptable.
Peso y estatura estn directamente relacionados. La conclusin se da respecto al valor de r.
De acuerdo a las medias se realiza la operacin: )/113,2=23,3kg(Desarrollo de ejercicio en Excel anexo)MediasX cmY kgEstaturaPeso
113,220,313023,KG
APORTES INDIVIDUALES
Aportes individuales Carlos Andrs Sandoval
REGRESION Y CORRELACION SIMPLE
Identificar dos variables cuantitativas de la situacin estudiada que puedan estar relacionadas. Las variables identificadas en este punto fueron PESO segn la.
realizar el diagrama de dispersin de dichas variables y determinar el tipo de asociacin entre las variables.Los datos que tenemos para estas dos variables tenemos los siguientes datos:N pacientesx (edad)Y (peso)xyxy
102,6006,76
203,1009,61
303,1009,61
403,40011,56
503,90015,21
615,25,2127,04
719,49,4188,36
819,79,7194,09
928,917,8479,21
10211,923,84141,61
11312,537,59156,25
12314,242,69201,64
13315,345,99234,09
14416,56616272,25
15416,766,816278,89
16515,979,525252,81
17516,984,525285,61
18518,391,525334,89
19524,5122,525600,25
2072316149529
21819,7157,664388,09
221330,5396,5169930,25
2316457202562025
241645,9734,42562106,81
251754,9933,32893014,01
261755,2938,42893047,04
271758,6996,22893433,96
281764,31093,12894134,49
291853,8968,43242894,44
301960,81155,23613696,64
311964,31221,73614134,49
321965,21238,83614251,04
331967,91290,13614610,41
341978,51491,53616162,25
352052,710544002777,29
362060,512104003660,25
372065,613124004303,36
38216012604413600
392163,81339,84414070,44
402165,41373,44414277,16
41225411884842916
422267,91493,84844610,41
432352,61209,85292766,76
442352,91216,75292798,41
452356,81306,45293226,24
462360,21384,65293624,04
47236514955294225
482367,21545,65294515,84
492370,81628,45295012,64
50245613445763136
512456,91365,65763237,61
522458,21396,85763387,24
532461,61478,45763794,56
542468,91653,65764747,21
552558,91472,56253469,21
562560,815206253696,64
572580,92022,56256544,81
582657,31489,86763283,29
592663,21643,26763994,24
60267018206764900
612675,31957,86765670,09
62316018609613600
63317222329615184
643372,92405,710895314,41
653373,82435,410895446,44
663460204011563600
673472,92478,611565314,41
683578,92761,512256225,21
693672,92624,412965314,41
703767,22486,413694515,84
713785,83174,613697361,64
723978,53061,515216162,25
733979,53100,515216320,25
743985,93350,115217378,81
754057,9231616003352,41
764078,4313616006146,56
774245,81923,617642097,64
784385365518497225
794478,5345419366162,25
804485374019367225
814555247520253025
824758,22735,422093387,24
834858,82822,423043457,44
844887,24185,623047603,84
854965,93229,124014342,81
865062,3311525003881,29
875185433526017225
885187,54462,526017656,25
895245,82381,627042097,64
905265,73416,427044316,49
915378,64165,828096177,96
925460,33256,229163636,09
935460,63272,429163672,36
945467,23628,829164515,84
955485,84633,229167361,64
965565,8361930254329,64
975578,14295,530256099,61
985578,6432330256177,96
995667,23763,231364515,84
1005760,53448,532493660,25
1015878,64558,833646177,96
1025962,93711,134813956,41
1035965,73876,334814316,49
1046067,5405036004556,25
1056158,33556,337213398,89
1066272,5449538445256,25
1076458371240963364
1086557,6374442253317,76
1096857,83930,446243340,84
1106878530446246084
1117162,74451,750413931,29
1127345,23299,653292043,04
1137370511053294900
1147555,94192,556253124,81
1157560,8456056253696,64
1168165,25281,265614251,04
1178270574067244900
1188550,2426772252520,04
1198762,95472,375693956,41
1209470,26598,888364928,04
sumatoria40836718267090,5203031437809,28
El diagrama de dispersin para estas variables ser:
El objetivo del anlisis de regresin lineal es predecir los valores de la variable respuesta, en funcin de los valores de la variable independiente:Regresin simple es cuando solo hay una variable independiente y el modelo a ajustar es el siguiente:
Donde Y es la variable respuesta, X es la variable independiente, constante es la variacin en funcin de la variable independiente y es una constante.Ahora empezamos a hallar valores para con la siguiente formula:
Remplazamos valores en formula:
Operamos:
Operamos:
Ahora empezamos a hallar valores para con la siguiente formula:
Remplazamos valores en formula:
Operamos:
Ahora remplazamos en el modelo matemtico que nos ayudara a solucionar la variable respuesta:
Remplazamos valores:
Remplazamos valores de edad de mayor a menor:
Remplazamos valores de edad de mayor a menor:
Ahora hallaremos el porcentaje de explicacin del modelo y el grado de relacin de las dos variables con el coeficiente de correlacin de Pearson ( r )
Aportes Individuales Leymar Andrs Ardila
Regresin y Correlacin lineal Simple-Identificar dos variables cuantitativas de la situacin estudiada que puedan estar relacionadas.
Cuadro estadstico ac se recopila la informacin de determinada variable y se hace un anlisis probabilstico
En el anlisis probabilstico se muestra el promedio de visitas por edades donde X= edadesf 1= N visitas del ltimo trimestren= total de visitas
xf1F1h1H1
0550,031250,03125
16110,03750,06875
22130,01250,08125
36190,03750,11875
42210,01250,13125
54250,0250,15625
71260,006250,1625
81270,006250,16875
131280,006250,175
162300,01250,1875
174340,0250,2125
181350,006250,21875
198430,050,26875
205480,031250,3
214520,0250,325
223550,018750,34375
238630,050,39375
249720,056250,45
255770,031250,48125
266830,03750,51875
312850,01250,53125
332870,01250,54375
344910,0250,56875
351920,006250,575
361930,006250,58125
372950,01250,59375
3951000,031250,625
4031030,018750,64375
4231060,018750,6625
4311070,006250,66875
4421090,01250,68125
4511100,006250,6875
4721120,01250,7
4821140,01250,7125
4911150,006250,71875
5011160,006250,725
5131190,018750,74375
5231220,018750,7625
5311230,006250,76875
5441270,0250,79375
5531300,018750,8125
5621320,01250,825
5721340,01250,8375
5811350,006250,84375
5941390,0250,86875
6011400,006250,875
6221420,01250,8875
6411430,006250,89375
6521450,01250,90625
6821470,01250,91875
7111480,006250,925
7321500,01250,9375
7521520,01250,95
8121540,01250,9625
8211550,006250,96875
8521570,01250,98125
8721590,01250,99375
9411600,006251
TOTAL n=1601
- Realizar el diagrama de dispersin de dichas variables y determinar el tipo de asociacin entre las variables
Diagrama de dispersin y correlacin lineal
Aportes individuales John Fernando Balln
-Identificar dos variables cuantitativas de la situacin estudiada que puedan estar relacionadas.Se escogen como variables cuantitativas la edad y las visitas realizadas el ltimo trimestre. Saber de qu edad son las personas que ms frecuentan el hospital podra ser un dato para apoyar la mejora del servicio.- Realizar el diagrama de dispersin de dichas variables y determinar el tipo de asociacin entre las variables. Diagrama de dispersin, correlacin lineal.
- Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre la otra. Es confiable?Se procede por lo tanto a determinar la ecuacin de la recta que ms se ajusta, por el mtodo de mnimos cuadrados. Se tiene en resumen las siguientes tablas.
ElementosSumatoriasCuadrados
X408316670889
Y16226244
X^2203031
Y^2262
XY5548
n(X)120
Ya se tienen los valores, por lo que se pasa a trabajar en la ecuacin de la recta ajustada est dada por:
Se procede por mtodo de mnimos cuadrados:
Por lo tanto:
Y es confiable?... De acuerdo a , este acerca mucho mas a 0 que a 1, por lo que el grado de confiabilidad es muy bajo y se recomienda no utilizar el modelo de regresin estimado.- Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos variables.El afirma adems que el modelo explica un 0,050% de la informacin. El valor queda en 2,23% lo que indica un mnimo porcentaje de grado de relacin entre las variables. (Nota: Las frmulas matemticas para el desarrollo de los resultados se encuentran en el archivo de Excel adjunto)
Conclusin: El nmero de visitas indica que la muestra de poblacin con edad promedio que ms consultas realizo en el trimestre esta entre los 22 y 26 aos. Esto aunque no indica nada definitivo, podra ser determinante para que sean atendidos por aporte de los menores de edad y adultos mayores, recibiendo un servicio ms express. No es que se les dejara de atender como es debido, es solo que los casos ms graves y que requieren de ms tiempo para el primer diagnstico, se trataran como un flujo a parte para mejorar la atencin. Adicionalmente y teniendo en cuenta que son mayora, mejorar el servicio en tiempo le dara un plus de utilidad a estos usuarios por lo que aumentara los indicadores de servicio. Tambin se debe hacer el reporte con las EPS, al ser gente joven es probable que den buena acogida al sistema virtual para asignacin de citas. Esto conllevara a una reduccin de tiempo en tramitologa y a evitar que el hospital colapse en servicio por que las personas van en primera instancia al hospital por urgencias, si quiera por una gripa.
APORTES GRUPALES
Identificar una variable cuantitativa dependiente y varias variables independientes del estudio de investigacin.Se encuentra que las variables de la base dada son independientes. Sin embargo, una variable es dependiente de otra cuando existe una relacin de dependencia respecto a lo que se est comparando o la magnitud que se quiere hallar. Se escoge por lo tanto a la variable Hora (X) como independiente, y la variable resultante Demanda/Hora como dependiente. La idea es poder tener claridad respecto a las horas picos de atencin en el hospital.
- Realizar el diagrama de dispersin de dichas variables.Cuadro de clculo para mnimos cuadrados
Formato Hora (X)Valor (X)Demanda / Hora (Y)X^2Y^2XY
1:00:00 a. m.0,04166666730,0017361190,125
2:00:00 a. m.0,08333333340,00694444160,333333333
3:00:00 a. m.0,12510,01562510,125
4:00:00 a. m.0,16666666700,0277777800
5:00:00 a. m.0,20833333320,0434027840,416666667
6:00:00 a. m.0,2510,062510,25
7:00:00 a. m.0,29166666770,08506944492,041666667
8:00:00 a. m.0,33333333380,11111111642,666666667
9:00:00 a. m.0,37570,140625492,625
10:00:00 a. m.0,416666667110,173611111214,583333333
11:00:00 a. m.0,45833333390,21006944814,125
12:00:00 p. m.0,510,2510,5
1:00:00 p. m.0,54166666780,29340278644,333333333
2:00:00 p. m.0,58333333360,34027778363,5
3:00:00 p. m.0,625100,3906251006,25
4:00:00 p. m.0,66666666740,44444444162,666666667
5:00:00 p. m.0,70833333370,50173611494,958333333
6:00:00 p. m.0,7530,562592,25
7:00:00 p. m.0,79166666770,62673611495,541666667
8:00:00 p. m.0,83333333340,69444444163,333333333
9:00:00 p. m.0,87540,765625163,5
10:00:00 p. m.0,91666666730,8402777892,75
11:00:00 p. m.0,95833333360,91840278365,75
12:00:00 a. m.141164
Diagrama de dispersin
- calcular la recta de regresin y el coeficiente de correlacin para probar estadsticamente su relacin.
Recta de regresin de Y/X
Coincide con la de mnimosRecta de regresin:R= 0,0402
(Nota: Las frmulas de ecuacin para los valores mostrados se encuentran en el Excel adjunto, Pestaa Colabora_Disp)
PROPUESTA UNICA
La mayora de pacientes que acuden a las citas de acuerdo al diagrama de dispersin, tiende a acudir entre la 1pm y las 5pm, habiendo para esto un pico de asistencia hacia las 7pm. Tras esta validacin de datos, se propone reforzar personal en los triages de urgencia en esa franja horaria (1 de la tarde a 5 de la tarde), con el fin de mejorar y agilizar ms el servicio. Sin embargo se propondra que se realizara inicialmente a modo de pruebas piloto, donde se haga monitoreo constante de la cantidad de personal necesario para atender en estas horas y adems realizando un seguimiento propiamente a los usuarios del servicio de saludo.
Por otra parte la recta de regresin es de un 0,0402, considerndose como una correlacin positiva dbil. Esto quiere decir que las estimaciones no son muy confiables. Sin embargo si se puede notar a simple vista que estos son los horarios con mayor afectacin y que en efecto esta podra ser una medida a tomar en pos de la mejora del servicio.
Se relaciona a continuacin los link donde podrn encontrar los archivos de informe:https://www.dropbox.com/sh/aiucsujjgoh0uc9/AAADl4NCQIN3A67O2yg0hikAa?dl=0
SUGERENCIAS
Pese a que hubieron participaciones factibles en el grupo de trabajo colaborativo, hizo falta aprovechar el espacio dado por el curso para participacin grupal y aprovechar la atencin dada por el tutor por Skype por parte de los integrantes del grupo. No se vieron propuestas de solucin, se escogi la nica que estaba disponible y la cual es de la autora de John Balln.