Post on 20-Feb-2018
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 1/38
Año de la Diversifcación Productiva y del Fortalecimiento de laEducación”
UNIVERSIDAD PARI!U"AR DE !#I!"A$%
FA!U"AD DE &EDI!INA ' ES!UE"A PR%FESI%NA" DE&EDI!INA #U&ANA DEPARA&EN% A!AD(&I!% DE
!IEN!IAS )*SI!AS ASI+NAURA ESADISI!A &EDI!A
E&A
Re,resión Sim-le "ineal. !oefcientes de!orrelación y de Determinación. Re,resión
"ineal &/lti-le
D%!ENE0o !int1ya Santacru2 Renteria
!I!"%0o 3456 7II
A"U&N%S0
o !US%DI% !A)RE8%S9 &ar:a Ale;andrao F"%RES PAU!AR 9 Rocioo &END%<A IN%!%9;eni=er>3456544?5@o %RRES VASUE< 9 Este=anny >o $A&A+U!#I !#AVE<9 AiBo
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 2/38
INTRODUCCIÓN
Si saCemos ue eiste una relación entre una variaCledenominada de-endiente y otras denominadasinde-endientes9 -uede darse el -roClema de ue lade-endiente asuma m/lti-les valores -ara una comCinaciónde valores de las inde-endientes.
"a de-endencia a la ue 1acemos re=erencia es relacionalmatemtica y no necesariamente de causalidad. As:9 -araun mismo n/mero de unidades -roducidas9 -ueden eistirniveles de costo9 ue var:an em-resa a em-resa.
Si se da ese ti-o de relaciones9 se suele recurrir a losestudios de re,resión en los cuales se oCtiene una nuevarelación -ero de un ti-o es-ecial denominado =unción9 en la
cual la variaCle inde-endiente se asocia con un indicador detendencia central de la variaCle de-endiente. !aCe recordarue en tGrminos ,enerales9 una =unción es un ti-o derelación en la cual -ara cada valor de la variaCleinde-endiente le corres-onde uno y sólo un valor de lavariaCle de-endiente.
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 3/38
OBJETIVOS
Determinar una =unción matemtica sencilla ue
descriCa el com-ortamiento de una variaCle dados los
valores de otra u otras variaCles
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 4/38
REGRESIÓN SIMPLE LINEAL, COEFICIENTES Y DE DETERMINACIÓN, REGRESIÓN LINEAL
MÚLTIPLE
REGRESIÓN SIMPLE
"a Re,resión es una tGcnica ue se -ueden utili2ar -ara solucionar-roClemas comunes en los ne,ocios.
&uc1os estudios se Casan en la creencia de ue es -osiCle identifcar
y cuantifcar al,una Relación Funcional entre dos o ms variaCles9donde una variaCle de-ende de la otra variaCle.
Se -uede decir ue $ de-ende de H9 en donde $ y H son dos variaClescualuiera en un modelo de Re,resión Sim-le.
"Y es una función de X"
Y = f(X)
!omo $ de-ende de H9
$ es la variaCle de-endiente9 y
H es la variaCle inde-endiente.
En el &odelo de Re,resión es muy im-ortante identifcar cul es lavariaCle de-endiente y cul es la variaCle inde-endiente.
En el &odelo de Re,resión Sim-le se estaClece ue $ es una =unción
de sólo una variaCle inde-endiente9 ra2ón -or la cual se le denominatamCiGn Re,resión Divariada -orue sólo 1ay dos variaCles9 unade-endiente y otra inde-endiente y se re-resenta as:0
Y = f (X)
"Y está regresando por X"
"a variaCle de-endiente es la variaCle ue se desea e-licar9 -redecir. amCiGn se le llama RE+RESAND% ó VARIA)"E DE RESPUESA.
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 5/38
"a variaCle Inde-endiente H se le denomina VARIA)"E EHP"I!AIVA óRE+RES%R y se le utili2a -ara EHP"I!AR $.
ANÁLISIS ESTADÍSTICO: REGRESIÓN LINEALSIMPLE
En el estudio de la relación =uncional entre dos variaCles-oClacionales9 una variaCle H9 llamada inde-endiente9e-licativa o de -redicción y una variaCle $9 llamadade-endiente o variaCle res-uesta9 -resenta la si,uiente
notación0
Y = a + b X + e
Donde0
A: es el valor de la ordenada donde la l:nea de re,resión seinterce-ta con el e;e $.
B: es el coefciente de re,resión -oClacional >-endiente de lal:nea recta@
E: es el error
SUPOSICIONES DE LA REGRESIÓN LINEAL
5. "os valores de la variaCle inde-endiente H son f;os9medidos sin error.
3. "a variaCle $ es aleatoria
. Para cada valor de H9 eiste una distriCución normal devalores de $ >suC-oClaciones $@
J. "as variancias de las suC-oClaciones $ son todas i,uales.
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 6/38
6. odas las medias de las suC-oClaciones de $ estn soCre larecta.
K. "os valores de $ estn normalmente distriCuidos y sonestad:sticamente inde-endientes.
ESTIMACIÓN DE LA ECUACIÓN DE REGRESIÓN MUESTRAL
!onsiste en determinar los valores de LaL y LC L a -artir de lamuestra9 es decir9 encontrar los valores de a y C con los datosoCservados de la muestra. El mGtodo de estimación es el de Mínios
!uadrados9 mediante el cual se oCtiene0
"ue,o9 la ecuación de re,resión muestra estimada es0
ue se inter-reta como0
A: es el estimador de a
Es el valor estimado de la variaCle $ cuando la variaCle H M 4
B: es el estimador de C9 es el coefciente de re,resión
Est e-resado en las mismas unidades de $ -or cada unidad de H.Indica el n/mero de unidades en ue var:a $ cuando se -roduce uncamCio9 en una unidad9 en H >-endiente de la recta de re,resión@.
Un valor ne,ativo de C ser:a inter-retado como la ma,nitud deldecremento en $ -or cada unidad de aumento en H.
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 7/38
ANTECEDENTES DEL PROBLEMA
"os datos de la si,uiente taCla re-resentan las estaturas >H9 cm@ y los-esos >$9 B,@ de una muestra de 53 1omCres adultos. Para cadaestatura f;ada -reviamente se oCservó el -eso de una -ersona
seleccionada de entre el ,ru-o con dic1a estatura9 resultando0
X 563 5
Y 64 K
!on estos datos vamos a -lantear una ecuación de re,resión sim-leue nos -ermita -ronosticar los -esos conociendo las tallas.Utili2aremos a M 4.469 y contrastaremos nuestra 1i-ótesis con la-rueCa F
E#A$$%&&%:
• Re-resentación matemtica y ,rfca de los datos0
Representación Mate!tica
estatura
-esos Re,resión "ineal
I.!. -arala media
I. !.individual
datos y 3 y 3 y
yest.
Residual ". I. ". S. ". I. ". S.
5 563 64354J 3644 OK44
6K.J 'K.J
6.4O
6.O
JO.4
K6.6K
3 566 K5.63J436
O?3.
63.6
6.4 3.JO
6K.4
K5.O
64.46
K?.43
563 6J.6 35 3O4 ?3?J 6K.J '5. 6.4 6.O JO. K6.6
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 8/38
4J . O 4 K
J 566 6O.63J436
4K.
?53.6
6.4 '5.6
6K.4
K5.O
64.46
K?.43
6 56O K.63JKJ
J43.
K.6
K4.OO 3.O
6?.46
K.J?
65.?6
K.K?
K 563 6354J J?5 ?K?
6K.J 3.6O
6.4O
6.O
JO.4
K6.6K
O 56O K53JKJ O35 6OO
K4.OO 4.3
6?.46
K.J?
65.?6
K.K?
? 5K6 O33O336 65?J
55??4
KO.O5 J.3
K6.5O
O4.3J
6?.?6
OK.6O
5K3 KK3K3JJ J6K
54K3
K6.55 4.?
K3.K6
KO.6K
6K.3O
O.J
54 5O? O35K?J 65?J
53?5K
O?. 'K.
OJ.K6
?.
K.J6
??.63
55 5? ?JJ? O46K
56O3
?.3 4.K?
O?.45
??.KJ
O.5
.J
53 5O? ?35K?J KO3J
5J6K
O?. .45
OJ.K6
?.
K.J6
??.63
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 9/38
Representación Gr!"ca
#IPÓTESIS
'%: No 1ay relación entre el variaCle -eso y la variaCleestatura.
'A: #ay relación entre la variaCle -eso y la variaCle
estatura.
aCla de anlisis de varian2a
Fuente de +rados de
Variación liCertad
DeCido a
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 10/38
la re,resión 5
error 54
total 55
Se oCtiene un valor F M O.4? Q J.K9 con lo cual se rec1a2a la1i-ótesis nula y ace-tamos ue la variaCle estatura est relacionadacon la variaCle -eso con un 6 de confan2a.
• De acuerdo al desarrollo matemtico 1emos oCtenido los si,uientesclculos0
"o ue nos -ermite oCtener los coefcientes a y C.
"ue,o9
C M 533 5J4.KKO M 4.?KOK
a M K6.36 7 >4.?KOK@ >5K3.5KO@ M 'O6.JJK
INTERPRETACIÓN
• "a ecuación de re,resión estimada es0
!oefciente de correlación0 RM 4.O
!oefciente de determinación0 RTM4.?OK
El valor de C M 4.?KOK indica el incremento del -eso en Bilo,ramos9en -romedio9 -or cada cent:metro de aumento en la estatura de los1omCres adultos.
El valor de a9 no tiene inter-retación -rctica en el e;em-lo9 seinter-retar:a como el valor oCtenido9 en -romedio9 -ara el -eso $9cuando la estatura es 4.
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 11/38
Utili2ando la ecuación de re,resión -ara estimar o -redecir valores dela variaCle $0 Para una talla de 5?4 se oCtiene un -eso de ?4.O B,.
!uánto se espera ue pese (en proedio) una persona ueide *,- .
Sustituyendo el valor de interGs en la ecuación0
Se oCtiene0
CONCLUSIÓN
"a ecuación de Re,resión "ineal estimada -ara las variaClesestatura y -eso muestran9 de acuerdo a la -rueCa F9relación.
Esta relación se 1a estimado en un R M .O9 ue indica una=uerte relación -ositiva.
Adems si consideramos el coefciente de determinación RTM ?O. -odemos indicar ue el ?O. de las variacionesue ocurren en el -eso se e-licar:an -or las variaciones enla variaCle estatura.
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 12/38
COE$ICIENTE DE DETERMINACIÓN% COE$ICIENTE DE
CORRELACIÓNUna ve2 a;ustada la recta de re,resión a la nuCe de oCservaciones es
im-ortante dis-oner de una medida ue mida la Condad del a;uste
reali2ado y ue -ermita decidir si el a;uste lineal es sufciente o se
deCen Cuscar modelos alternativos. !omo medida de Condad del
a;uste se utili2a el coe/ciente de deterinación0 defnido como
si,ue0
>K.56@
% Cien
!omo scE scG, se verifca ue 4 R3 5.
El coefciente de determinación mide la -ro-orción de variaCilidadtotal de la variaCle de-endiente res-ecto a su media ue ese-licada -or el modelo de re,resión. Es usual e-resar esta medidaen tanto -or ciento9 multi-licndola -or cien.
Por otra -arte9 teniendo en cuenta ue i ' M 5 9 se oCtiene0
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 13/38
>K.5K@
Dadas dos variaCles aleatorias cualesuiera X e Y 9 una medida de larelación lineal ue 1ay entre amCas variaCles es el coe/ciente de
corre1ación defnido -or
>K.5O@
Donde re-resenta la desviación t:-ica de lavariaCle X >anlo,amente -ara @. Un Cuen estimador de este-armetro es el coe/ciente de corre1ación 1inea1 uestra1 (o
coe/ciente de corre1ación de 2earson)9 defnido -or0
>K.5?@
Por tanto9 r . Este coefciente es una Cuena medida de laCondad del a;uste de la recta de re,resión. Evidentemente9 eiste unaestrec1a relación entre r y 5 aunue estos estimadores -ro-orcionan
di=erentes inter-retaciones del modelo0
r es una medida de la relación lineal entre las variaCles X e Y.
5 mide el camCio -roducido en la variaCle Y al reali2arse un camCiode una unidad en la variaCle X.
De las defniciones anteriores se deduce ue0
Es im-ortante estudiar si r es si,nifcativo >distinto de cero@ ya ueello im-lica ue el modelo de re,resión lineal es si,nifcativo.Desa=ortunadamente la distriCución de r es com-licada -ero -aratamaños muestrales mayores ue 4 su desviación t:-ica es 5 /
, y -uede utili2arse la si,uiente re,la
En la inter-retación del coefciente de correlación se deCe tener en
cuenta ue0
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 14/38
W r M X5 indica una relación lineal eacta -ositiva >creciente@ one,ativa >decreciente@9
W r M 4 indica la no eistencia de relación lineal estocstica9 -ero noindica inde-endencia de las variaCles ya ue -uede eistir una
relación no lineal incluso eacta9
W valores intermedios de r >4 < r < 5 ó '5 < r < 4@ indican laeistencia de una relación lineal estocstica9 ms =uerte cuanto ms-róimo a Y5 >ó '5@ sea el valor der .
Para -oder inter-retar con mayor =acilidad el coefciente decorrelación muestral se e-onen varias nuCes de oCservaciones y ela;uste lineal oCtenido
Eiste una de-endencia =uncional lineal9 las oCservaciones estnsoCre la recta de re,resión. r M R3 M 59 recta de re,resión0 y M .
ependencia funciona1 1inea1
"a relación lineal entre las variaCles es muy -eueña y no -arece ueeista otro ti-o de relación entre ellas9 la nuCe de -untos indica uelas variaCles son Zcasi” inde-endientes.
r M 4[53, R3 M 4[4O, recta de re,resión0 y M K[5O Y 4[4?K x.
!ontraste de re,resión0 R M 4[K?O F 5,5? p ' valor M 4[J5?. Seace-ta la no in\uencia de la variaCle re,resora en Y.
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 15/38
%bser3aciones 4casi5 independientes
Eiste una de-endencia =uncional entre las oCservaciones -ero no deti-o lineal9 -or tanto la correlación es muy -eueña
r M 4[5, R3 M 4[56, recta de re,resión0 y M 3[6J ' 5[?? x.
!ontraste de re,resión0 R M [363 F 5,5? p'valor M 4[4??. Se ace-taue no eiste relación lineal con M 4[46. En Case a la Fi,ura K.K. Se
deCe de 1acer un a;uste del ti-o -araCólico Y M 4 Y 5 x Y 3 x 3.
E6iste una re1ación cuadrát
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 16/38
"a nuCe de datos se a;usta ra2onaClemente a una recta con-endiente -ositiva.
r M 4[KJ5, R3 M 4[J54, recta de re,resión0 y M '[ K Y '5[OJ x.
!ontraste de re,resión0 R M 53[633 F 5,5? p ' valor M 4[443. Serec1a2a la no in\uencia lineal de la variaCle x.
$e1ación estocástica1inea1
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 17/38
Eiste una =uerte de-endencia lineal ne,ativa entre las dos variaClesy la correlación es muy alta >-róima a 5@.
r M 4[3J, R3 M 4[?JK, recta de re,resión0 y M '3[63? ' 3[3KO x
!ontraste de re,resión0 R M 546[
5 F 5,5? p ' valor M 4[
444. Seace-ta la eistencia de una relación lineal.
7uerte re1ación estocástica1inea1
PREDI!!I]N EN RE+RESI]N "INEA" SI&P"E
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 18/38
!omo se comentó anteriormente 1ay dos oC;etivos Csicos en el
a;uste de un modelo de re,resión0
' !onocer la relación eistente entre la variaCle res-uesta y las
variaCles re,resoras. En el caso de la re,resión lineal sim-le se
estima la me;or recta de re,resión ue relaciona la
variaCle Y con la variaCle X y se cuantifca la im-ortancia de
dic1a relación -or medio del coefciente de correlación9 r .
' Utili2ar el modelo de re,resión a;ustado -ara Z-redecir” el
valor de la variaCle res-uesta Y cuando la variaCle re,resora
toma un valor determinado9 X M x t .
En esta sección se estudia este se,undo oC;etivo. Esto es9 estimada la
recta de re,resión9 cóo predecir e1 3a1or de & sabiendo ue 1a
3ariab1e regresora toa e1 3a1or ' = ( t . Ante esta -re,unta9 se
deCen distin,uir dos situaciones di=erentes0
Estiar la media de la distriCución condicionada de Y/X M x t 0 E
M mt
.Se uiere res-onder a -re,untas del ti-o0 )*c+!, es e, -ast.e/i. en ateria, in0.r!tic. /e ,as epresas 1+etienen +n.s in-res.s -,.2a,es /e 344 i,,.nesan+a,es567
2redecir el valor de la variaCle res-uesta en un individuo de la-oClación en estudio del ue se saCe ue X M t. Esto es9-redecir un valor de la variaCle condicionada $HMt
Se uiere res-onder a -re,untas del ti-o0 )La epresa MEGA tiene+n.s in-res.s an+a,es /e 344 i,,.nes% *c+!, ser! e, -ast. enateria, in0.r!tic. /e esta epresa567
Estiación de 1as edias condicionadas:
Una ve2 calculada la recta de re,resión de la variaCle Y res-ecto a X,
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 19/38
se uiere estiar el -armetro mt M E . Para ello9 comoestimador se utili2a el ue -ro-orciona la recta de re,resión9sustituyendo t -or x en la ecuación de la recta9
>K.5@
Este estimador verifca las si,uientes -ro-iedades0
5. Es centrado o inses,ado9 E M mt .
3. "a varian2a es0
>K.34@
. donde
>K.35@
J. nt se denomina n8ero eui3a1ente de obser3aciones -ara
estimar mt .
6. eniendo en cuenta ue en una muestra de tamaño n, lavarian2a de la media muestral es V ar M 3 /n, la inter-retaciónde nt es la si,uiente0
),a in0.ración 1+e pr.p.rci.na ,a +estra% /e taa8. n%/e /at.s 2i9ariantes i = *
n para estiar t es ,aisa 1+e pr.p.rci.nara +na +estra /e taa8. nt /e.2ser9aci.nes +ni9ariantes /e +na p.2,aciónc.n /istri2+ción i-+a, a ,a /e &;' = ( t67
K. De la e-resión de nt se deduce ue este valor ser mayorcuanto ms -róimo estG x t de . $ si x t M se verifca ue nt M n.
O. "a inversa de nt , h tt M 5 /nt se denomina 3a1or de in9uencia de 1a
obser3ación x t >muy utili2ado el nomCre en in,lGs 1e3erage) y se
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 20/38
ver ms adelante ue es una medida de la in\uencia de laoCservación >si este es uno de los datos muestrales@ en elclculo de la recta de re,resión.
?. "a distriCución del estimador t
es normal9
. En la -rctica el estad:stico anterior no se -uede utili2ar -aracalcular intervalos de confan2a de mt -orue es desconocido. Porello9 se sustituye -or su estimador R y Ca;o la 1i-ótesisde normalidad se oCtiene la si,uiente distriCución9
@
"a distriCución dada en >K .33@ -ermite calcular intervalos deconfan2a de mt con un nivel de confan2a , de la si,uiente =orma0
Al utili2ar el modelo de re,resión lineal -ara estimar una media
condicionada o -redecir una oCservación deCe de tenerse en cuentaue el mGtodo -ro-orciona resultados ace-taCles dentro del ran,o devalores muestrales de la X >interpo1ar@9 au: est ,aranti2adoue 5 nt n. Si x t es un -unto muy ale;ado de >a/n estando dentrode la nuCe de oCservaciones est muy ale;ado del centro de lamisma@ entonces nt 5 y la varian2a de t ser muy ,rande con lo uese oCtienen estimaciones con -oca -recisión >muc1a variaCilidad@. Elcaso o-uesto es ue x t M y9 -or tanto9 nt M n, a1ora la varian2a de t es 3 /n, la menor -osiCle.
Por otra -arte9 si se uiere -redecir =uera del ran,o de valoresmuestrales de X >e6trapo1ar@9 entonces x t ' -uede ser muy ,rande y9en consecuencia9 nt 49 lo ue 1ace ue la -recisión de la estimaciónde mt sea muy -eueña -or tener el estimador t una varian2a muy,rande y9 -or tanto9 oCtener resultados con muy -oca valide2.
Pre/icción /e +na .2ser9aciónSe uiere predecir el valor de la variaCle aleatoria Y/X M x t teniendo
en cuenta ue se 1a a;ustado una recta de re,resión. El -roClema esconce-tualmente di=erente del anterior9 ya ue en el a-artado
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 21/38
anterior se estima un -armetro >la media condicionada@ y a1ora seuiere -redecir el resultado de una variaCle aleatoria. El -redictor uese utili2a t se oCtiene como auel ue minimi2e el Error !uadrtico&edio de Predicción. Esto es9 t se oCtiene como el valor ue
minimi2a la si,uiente =unción
Al resolver este -roClema de minimi2ación se oCtiene como-redictor el resultado de sustituir el valor de x t en la recta dere,resión calculada9
Por tanto9 la -redicción de Y/X M x t es la misma ue la estimaciónde mt -ero su varian2a aumenta ya ue la variaCilidad deCida a lamuestra se incrementa con la variaCilidad -ro-ia de lavariaCle aleatoria ue se uiere -redecir . A1ora la varian2ade la -redicción es
Var> t ' yt@ M
Por la 1i-ótesis de normalidad y ra2onando como en el a-artadoanterior se oCtiene
Utili2ando esta distriCución se -uede calcular un “intervalo de predicción -ara y t 9 con un nivel de confan2a , de la si,uiente =orma
Por ser la var muc1o mayor ue la var , los intervalos de-redicción de y t son muc1o mayores ue los intervalos de confan2ade mt .
An!,isis /e +n cas. /e +n ./e,. /e re-resión ,inea,
sip,e
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 22/38
En esta sección se -resenta el desarrollo en detalle de unsu-uesto -rctico del modelo de re,resión lineal sim-le9 enlos clculos se utili2a toda la teor:a e-uesta en este ca-:tulo.
Eep1o ,;
ZSe desea estudiar la -osiCle relación entre los !astos enmaterial in"orm#tico9 en m/lti-los de cien mil euros9 de unaem-resa y s$s in!resos !lo%ales9 en millones de euros.Para ello se reco,e una muestra de datos anuales de ,astos ein,resos de K6 em-resas9 los datos muestrales son los de lataCla ad;unta. Estudiar la -osiCle eistencia de una relaciónlineal entre la variaCle res-uesta !asto en materialin"orm#tico y la variaCle re,resora in!reso !lo%al”.
X 0Z&n!r esos !lo%ales”
34 64 544 344 44 J44 644
Y “!ast os en mat erialin"or m#t.
36
5JK45J5OO..
56
363?5O63343K5JK
36
K5JK3J63?3JO..
6O
JK6JKK3O5KOKJ5K3
O6
54OO366OOKOJ?O.
5
J5443454O555?O
535
5545455?55O53653553355
Estadísticos básicos de las variaCles X e Y
Estiadores de 1os coe/cientes de 1a recta dere,resión son
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 23/38
Datos y recta a;ustada.
Residuos del modelo.
Se calculan las -redicciones de las oCservacionesmuestrales y los residuos, a -artir de los cuales se
oCtiene 1a 3arian<a residua1
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 24/38
nter3a1os de con/an<a a1 >?@ > M 4[46@ -ara los tres
-armetros del modelo.Para 3
Para 4,
Para5
,
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 25/38
ota: si se 1uCiese -lanteado el -roClema de =ormainversa y se uisiera calcular la recta de re,resión delin,reso res-ecto al ,asto 9 se oCtiene9
o des-e;ando9 -ara com-arar con la recta de re,resiónde Y soCre X,
Se com-rueCa ue las dos rectas de re,resión no coinciden>oCservar la Fi,ura K.55.@.
Fi,ura K.55. +rfca de las dos rectas de re,resión.
!ontrastes indi3idua1es >contrastes de la t @.
!ontraste !5, '4 0 5 M 4 =rente a '5 0 5 4.
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 26/38
Del p'valor -róimo a cero5 se concluye ue la variaClere,resora X in\uye linealmente en la variaCle de-endiente Y.
!ontraste !4, '4 0 4 M 4 =rente a '5 0 4 4.
ab1a A%CA !ontraste de regresión
!on los datos del -roClema se oCtiene la si,uiente taClaAN%VA
aCla AN%VA
F$entes Variación ($ma )$adrados Gr. li%ertad Varian2as
Por la recta O6.K43[
6 5 e
3
M O6.K43[
6Residual ?.6JJ[O K R
3 M 56[K
+loCal ?J.5JO[5 KJ Y3 M 5.5J[?
El contraste de la F es
se rec1a2a la no in\uencia de la recta de re,resión. Esteresultado es eactamente el mismo ue se oCtiene en elcontraste individual de la t relativo a 5. El motivo es ue seest estudiando un modelo de re,resión con una solare,resora y9 -or tanto9 el estudio de la in\uencia del modeloes euivalente al estudio de la in\uencia de la /nicare,resora. El si,nifcado de los contrastes individuales de
la t y del contraste con;unto de la F >contraste de re,resión@
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 27/38
sern di=erentes en modelos de re,resión con ms de unavariaCle e-licativa.
!ontraste de 1inea1idad
Dado ue -ara cada valor de X se tienen varios valoresde Y se -ueden calcular las medias muestrales condicionadas9lo ue -ermite descom-oner la suma de los residuos alcuadrado y oCtener la si,uiente taCla AN%VA
ab1a A%CA
F$entes Variación ($ma )$adrados Gr. li%ertad Varian2as
Por la recta O6.K43[6 5 e3 M O6.K43[6
scR>5@ 5J[O 6 R,53 M K3[J
scR>3@ ?.33[ 6? R,33 M 5J5[?
Residual ?.6JJ[O K R3 M 56[K
+loCal ?J.5JO[5 KJ Y3 M 5.5J[?
Se calcula el estad:stico del contraste de linealidad de la F
Se acepta claramente la 1i-ótesis de ue la =unción de
re,resión es lineal.!oe/ciente de deterinación D corre1ación 1inea1
sip1e
El coefciente de determinación es
El modelo de re,resión lineal constru:do e-lica el ?[
?6 devariaCilidad de la variaCle res-uesta.
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 28/38
El coefciente de correlación lineal muestral es9
Eiste una alta correlación -ositiva.
Estiación de 1a edia condicionada
ZSe uiere estimar el ,asto medio en material in=ormtico delas em-resas cuyos in,resos ,loCales son de 44 y ?44millones anuales9 res-ectivamente. !alcular intervalos deconfan2a al 4 -ara dic1as medias condicionadas.”
Para las em-resas con 44 millones de in,resos se oCtiene
Se calcula el n/mero de oCservaciones euivalentes
"a varian2a del estimador es
El intervalo de confan2a es
Para x M ?449 se oCtiene
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 29/38
!om-arando los intervalos de confan2a oCtenidos se
oCserva ue el relativo a x M ?44 tiene una lon,itud muc1omayor ue en el caso de x M 44. Esto es deCido a ue el-unto x M 44 est ms cerca de la media muestral x M3[35 ue el se,undo -unto x M ?44.
2redicción
ZPredecir el ,asto en material in=ormtico de la em-resa&E+A5 y &E+A3 cuyos in,resos ,loCales son de 44 y ?44millones9 res-ectivamente. !alcular intervalos de -redicciónal 4 -ara dic1as -redicciones”.
Para la em-resa &E+A59 con x M 44, la -redicción de,asto es
!on varian2a
El intervalo de -redicción es
Para la em-resa &E+A39 con x M ?449 se oCtiene la-redicción
El intervalo de -redicción es
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 30/38
En el cuadro ad;unto se com-aran las lon,itudes de los
intervalos de confan2a oCtenidos
"on,itud de los I.!. al 4 x M 44 x M ?44
Estimación de mt 6[5?4 5K[OO4
Predicción de y t [33O J3[JK
En la Fi,ura K.53. Se re-resenta la nuCe de -untos del-roClema estudiado9 la recta de re,resión estimada9 losintervalos de confan2a de las medias condicionadas al 4>los ms -róimos a la recta@ y los intervalos de -redicción al4.
Fi,ura K.53. Recta de re,resión
En 1a $egresión 1inea1 81tip1e
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 31/38
5. &odeli2amos la relación entre una variaCle de-endiente y dos o
ms variaCles inde-endientes mediante una =unción lineal9 una
=unción ue ser9 a1ora9 no una recta9 como suced:a con la Re,resión
lineal sim-le9 sino un -lano >si tenemos dos variaCles inde-endientes@
o un 1i-er-lano >si tenemos ms de dos variaCles inde-endientes@.
3. En la Re,resión lineal m/lti-le el -unto de -artida es el mismo ue
en la Re,resión lineal sim-le. Se -retende modeli2ar la relación entre
unas variaCles con la fnalidad /ltima de -oder -ronosticar una de
ellas0 la variaCle de-endiente9 a -artir del conocimientos de las otras0
las variaCles inde-endientes. En la Re,resión lineal m/lti-le se
introducen nuevas variaCles inde-endientes con la fnalidad de
reducir la dis-ersión de la -redicción9 con la fnalidad de disminuir el
residuo.
. El modelo matemtico es9 a1ora0
D=a*6*+a6+F+ad6d+b+eDonde a59 a39^9 ad y C son los coefcientes del modelo y donde es el
residuo9 ue9 como en la Re,resión lineal sim-le9 su-ondremos ue
si,ue una distriCución normal N >49 DE@.J. Aunue la Re,resión lineal m/lti-le es9 en Cuena -arte9 una
,enerali2ación de la Re,resión lineal sim-le9 tiene unas-articularidades ue conviene -recisar.
6. Una de sus -eculiaridades es la tendencia a llenar ecesivamente
el modelo. #ay la tendencia a ir introduciendo variaCles9 1inc1ando el
modelo y esto es muy -er;udicial. Para ue las cosas =uncionen lo
me;or -osiCle conviene traCa;ar con variaCles ue sean
inde-endientes entre ellas.
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 32/38
K. %Cservemos ue en el -unto anterior 1e usado la noción de
inde-endencia entre variaCles -ara re=erirme a las variaCles ue se
denominan inde-endientes en el modelo de re,resión. Recordemos
ue de esas variaCles tendremos9 en el =uturo9 valores concretos -ara
un individuo y a -artir de ellos trataremos de -ronosticar el valor de
una variaCle de-endiente ue desconoceremos su valor -ara ese
individuo.
O. Pueden oCservarse dos nociones de inde-endencia distintas9 -ues9
en lo ue estamos diciendo a1ora. Una cosa es la -osición de las
variaCles en el modelo de Re,resión y otra es el ue las variaCles
sean inde-endientes entre ellas9 ue si,nifca ue la correlación entre
ellas sea cero.
?. !uando no se cum-le esta relación de inde-endencia entre las
variaCles inde-endientes se -roduce un =enómeno de colinealidad.
Esto es -er;udicial -ara el modelo. El -er;uicio re-resenta ue las
estimaciones de los -armetros del modelo >los coefcientes@9 ue son
los elementos Csicos -ara la construcción de los -ronósticos de lavariaCle de-endiente9 tienen ms Error estndar. $ el Error estndar9
como Desviación estndar de una -redicción9 es uno de los
-rinci-ales criterios de calidad de una estimación.
. #ay distintos mecanismos -ara com-roCar si tenemos un eceso
de colinealidad. El est de )elsey9 _u1 y `elsc1 >Ver #erCario detGcnicas@ es uno de los ms usados -ara com-roCar si tenemos ese
eceso de linealidad. Ante un eceso de colinealidad conviene 1acer
una revisión y una nueva consideración de las variaCles
inde-endientes a usar en el modelo de Re,resión9 eliminando al,una
de ellas o 1aciendo una Anlisis de com-onentes -rinci-ales >Gcnica
multivalente ue veremos ms adelante@.
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 33/38
54. De 1ec1o9 -arece ló,ico9 en una Re,resión lineal m/lti-le9 -edirle
a las variaCles inde-endientes ue sean inde-endientes entre ellas.
Pensemos ue si no lo son9 si tienen un cierto ,rado de de-endencia9
es -orue de al,una =orma com-arten as-ectos entre ellas9 en cierta
=orma dicen cosas similares esas variaCles. Por lo tanto9 a la 1ora de
ser usadas -ara -redecir una variaCle de-endiente se -roduce un
=enómeno de redundancia0 estamos usando varias veces lo mismo
-ara -ronosticar al,o. $ esto se -a,a con ms im-recisión en las
estimaciones.
55. %tra -eculiaridad de la Re,resión lineal m/lti-le es la -osiCilidad
de construir el modelo -aso a -aso. Es el -rocedimiento denominado9
en in,lGs9 Ste-ise.
53. Al reali2ar una Re,resión lineal m/lti-le 1ay9 -ues9 tres
modalidades de estimación del modelo0
a. For2ando la entrada en el modelo de todas las variaCles ele,idas.
C. &ediante un Ste-ise 1acia delante. "a Re,resión entonces se
denomina Forard Ste-ise Re,resión.
c. &ediante un Ste-ise 1acia atrs. "a Re,resión entonces se
denomina )acBard Ste-ise Re,resión.
5. E-liuemos las dos variantes /ltimas9 -uesto ue la -rimera no
-recisa nin,una e-licación.
5J. El Ste-ise 1acia delante lo ue 1ace es9 -asó a -aso9 ir
introduciendo9 en el modelo de Re,resión lineal9 como dice su
nomCre0 -asó a -aso9 variaCles inde-endientes9 1asta com-letar el
me;or modelo -osiCle.
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 34/38
56. En -rimer lu,ar crea un modelo con una /nica variaCle
inde-endiente. En realidad9 -ues9 el -rimer -aso es crear una
Re,resión lineal sim-le. Pero lo 1ace eli,iendo entre todas las
variaCles inde-endientes la ue consi,ue un me;or modelo9 si es ue
lo consi,ue. En este -rimer -aso deCe eistir entre las variaCles
inde-endientes una variaCle ue ten,a una relación si,nifcativa con
la variaCle de-endiente. De lo contrario el -rocedimiento acaCar:a
au: y no tendr:amos modelo matemtico -ara relacionar esas
variaCles.
5K. En el se,undo -aso se -rueCa de introducir9 entre las variaCles
inde-endientes ue uedan9 cul es la ue consi,ue un modelo
me;or9 si es ue al,una lo consi,ue. Se trata de estaClecer unos
criterios de calidad m:nimos. "o ue se denomina un )riterio de
entrada. Si no se alcan2an nos uedamos con una Re,resión lineal
sim-le y se rec1a2an las otras variaCles.
5O. Si 1emos conse,uido introducir en el modelo una se,unda
variaCle inde-endiente se valora9 -roCando con todas las variaCles
inde-endientes ue uedan9 la -osiCilidad de introducir una tercera.
De nuevo se a-lican unos criterios de entrada ue si no se alcan2an
no se introduce nin,una variaCle ms.
5?. $ as: se va 1aciendo 1asta alcan2ar el me;or modelo. Es
im-ortante tener en cuenta ue en cualuiera de estos -asos 1ay la
-osiCilidad de etraer una variaCle ue anteriormente se 1aC:a
introducido. $ camCiar as: la dis-osición inicial. Por e;em-lo9su-on,amos ue en los -asos anteriores se 1aC:an introducido las
variaCles y 6 y9 al -roCar una nueva introducción9 al ensayar con9
-or e;em-lo9 O9 el -rocedimiento oCserva ue consi,ue me;ores
resultados sacando del modelo la variaCle ue 1aC:a sido la
-rimera ue 1aC:a introducido9 uedando9 entonces9 el modelo con
6 y O.
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 35/38
5. El Ste-ise 1acia atrs es lo mismo -ero a1ora -artiendo ue
1emos em-e2ado =or2ando la entrada de todas las variaCles dentro
del modelo y9 a continuación9 en el si,uiente -aso9 mirar de sacar una
de las variaCles inde-endientes0 una variaCle ue al sacarla
alteremos la calidad del modelo menos ue un valor umCral
estaClecido9 lo ue se denomina9 a1ora9 un )riterio de salida. Si es
as:9 si -odemos etraer sin -er;udicar -or encima de ese valor
-reestaClecido9 reducimos el modelo.
34. $ as:9 -aso a -aso9 -ero en sentido contrario9 vamos creando el
me;or modelo -osiCle9 la me;or ecuación -osiCle ue relacione una
variaCle de-endiente con varias variaCles inde-endientes.
35. "os criterios de entrada y de salida9 ue en muc1as ocasiones son
el mismo valor9 ,eneralmente vienen dados -or el valor de un
estad:stico9 -or el valor de la F de Fis1er. Puede verse en el #erCario
de tGcnicas9 en concreto9 la tGcnica Z!ontraste de 1i-ótesis de la
-endiente de Re,resión” ue valores de F -eueños im-lican Cuena
relación entre la variaCle de-endiente y la inde-endiente. $ valores
,randes im-lican mala relación. Pues el criterio de entrada ser ue
el valor de la F estG -or deCa;o de cierto valor y el de salida ue estG
-or encima de tamCiGn de cierto valor9 ue suele ser el mismo. En
otras ocasiones el criterio de entrada o de salida es un determinado
-'valor -ref;ado asociado al -armetro de la variaCle ue se decide si
entra o no en el modelo.
33. Dados unos datos muestrales de una serie de individuos dondeten,amos de ellos los valores tanto de la variaCle de-endiente como
de todas las variaCles inde-endientes9 cualuiera de los tres
-rocedimientos estima los coefcientes del modelo y el valor de la
Desviación estndar del residuob o sea9 de ese elemento ue
sumamos a cualuier -rocedimiento de Re,resión.
3. odos estos coefcientes deCe decidirse si son coefcientes
si,nifcativos9 valores faCles ue nos -ro-orcionan una modelo
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 36/38
asentado9 estaCle9 ue re\e;a una realidad no sólo muestral9 sino una
realidad -oClacional.
3J. Para ue todas estas estimaciones y estas si,nifcaciones
-ro-orcionadas9 mediante -'valores9 -or tGcnicas estad:stica9 sean
faCles es necesario ue se cum-lan al,unas condiciones ue a1ora
comentarG.
36. No olvidemos ue toda la llamada Estad:stica -aramGtrica se
construye con -rocedimientos cuyas decisiones y cuyas
construcciones se Casan en unas su-osiciones9 Castante ei,entes9
ue deCen cum-lirse.
3K. Por otro lado las su-osiciones ue a1ora comentarG son
condiciones com-artidas con la Re,resión lineal sim-le.
#aCitualmente la mayor -arte de so=tare estad:sticos ue reali2an
Re,resión lineal9 tanto la sim-le como la m/lti-le9 y9 en Gsta /ltima9
tanto los dos ti-os de Ste-ise como la ue =uer2a la entrada de
todas las variaCles inde-endientes9 sus in=erencias se Casan en estas
su-osiciones.
3O. Una de las com-roCaciones necesarias a 1acer en estos modelos
es ue realmente los residuos si,an la distriCución normal N >49 DE@.
Su-osición nuclear en la Estad:stica -aramGtrica. $ =undamental -ara
el Cuen =uncionamiento de la mayor -arte módulos de Re,resiónlineal en los distintos so=tare comerciales.
3?. Una de las tGcnicas -ara com-roCar esta normalidad es el est de
la ;i'cuadrado de Condad de a;uste a una distriCución. %tra muy
utili2ada es el est de _olmo,orov.
3. %tra com-roCación im-ortante es la #omo,eneidad de varian2as.
Esto si,nifca ue el residuo tiene una dis-ersión 1omo,Gnea9 i,ual9sean cuales sean los valores de las variaCles inde-endientes. #ay
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 37/38
diversas -rueCas ue se 1an desarrollado -ara com-roCar si se
cum-le o no esta condición. Una es el est de +les;er.
4. %tra com-roCación im-ortante es ue no 1aya autocorrelación
entre los valores en su orden de oCtención. ue sean valores
inde-endientes uno res-ecto a otro. El est de DurCin'`atson es el
a-ro-iado en estos casos. "a inde-endencia de los datos entre s: es
una su-osición tamCiGn del modelo de Re,resión lineal.
5. %tra consideración im-ortante a investi,ación en una Re,resión
es la in\uencia de cada -unto. No todo -unto tiene la misma
in\uencia. Es im-ortante ue no 1aya -untos ecesivamente
in\uyentes. ue las estimaciones de los -armetros del modelo
ueden demasiado en manos de esos -untos. Entre muc1os criterios
eistentes uno de los ms usados es el criterio de !ooB >Ver #erCario
de tGcnicas@ -ara la detección de in\uencia.
3. !uando al,una o varias de las condiciones necesarias no se
cum-len una de las o-ciones ms usuales es la Re,resión no
-aramGtrica. En este mCito los mGtodos ms usados se Casan en la
utili2ación de estimaciones de =unciones de densidad no
-aramGtricas.
. De 1ec1o9 los di=erentes -rocedimientos de Re,resión no
-aramGtrica9 tanto sim-le como m/lti-le9 se Casan en -rocedimientos
de construcción9 soCre el terreno9 -artiendo de la muestra9 donde
1aCr una enorme \eiCilidad ue vendr dada -orue la =unción ir
siem-re a remolue de la -osición de los valores muestrales ue
ten,amos.
7/24/2019 Estadistica Medica Trabajo (1)
http://slidepdf.com/reader/full/estadistica-medica-trabajo-1 38/38
J. PosiClemente el modelo de Re,resión no -aramGtrica ms
utili2ado es el Estimador de Nadaraya'`atson ue se -uede consultar
en la sección #erCario de tGcnicas.
6. Finalmente un criterio de calidad de una Re,resión lineal m/lti-le9
como sucede tamCiGn en la Re,resión lineal sim-le9 es el !oefciente
de determinación9 la R3 >Ver #erCario de tGcnicas@. Aunue el valor de
este coefciente es un n/mero ue va del 4 al 5 es =recuente
e-resarlo en tanto -or ciento. Es una =orma de e-resar el ,rado de
determinación de la variaCle de-endiente -or -arte de las
inde-endientes.
CONCLUSIONES