Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de...
Transcript of Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de...
![Page 1: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/1.jpg)
![Page 2: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/2.jpg)
Yo tambien soy una chica Calderon
Calderon
Riviere+
Harboure +
Aimar +
Forzani +
![Page 3: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/3.jpg)
Ahorrando dimensiones:Menos datos, misma informacion
Liliana Forzani
Facultad de Ingenierıa Quımica, UNL
Bura, Cook, Duarte, Garcıa A., Gieco, Llop, Pfeiffer, Rodriguez, Rothman, Smucler, Sued, Tolmasky, Tomassi
![Page 4: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/4.jpg)
![Page 5: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/5.jpg)
¿Objetivo?
Regresion y clasificacion supervisada
Interesa predecir o explicar una variable respuesta Y enfuncion de un conjunto de predictoresX = (X1,X2, . . . ,Xp).
Y = f(X1, . . . ,Xp).
La solucion generalmente es simple cuando p = 1 o p = 2
![Page 6: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/6.jpg)
¿Objetivo?
Regresion y clasificacion supervisada
Interesa predecir o explicar una variable respuesta Y enfuncion de un conjunto de predictoresX = (X1,X2, . . . ,Xp). Y = f(X1, . . . ,Xp).
La solucion generalmente es simple cuando p = 1 o p = 2
![Page 7: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/7.jpg)
La idea basica
Regresion: Estudio de la distribucion condicional de unavariable respuesta Y dada el vector de predictores X ∈ Rp.
Si p = 1, un grafico nos dice casi todo: grafiquemos los pares(X1, Y ) datos
-2 -1 0 1 2
05
1015
x
y
E(Y ∣X = x) = aebx. Estimamos a y b.-2 -1 0 1 2
05
1015
x
y
E(Y ∣X = x) = aebx. Observemos que x y b.x nos dan la mismainformacion
![Page 8: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/8.jpg)
La idea basica
Regresion: Estudio de la distribucion condicional de unavariable respuesta Y dada el vector de predictores X ∈ Rp.
Si p = 1, un grafico nos dice casi todo: grafiquemos los pares(X1, Y ) datos
-2 -1 0 1 2
05
1015
x
y
E(Y ∣X = x) = aebx. Estimamos a y b.-2 -1 0 1 2
05
1015
x
y
E(Y ∣X = x) = aebx. Observemos que x y b.x nos dan la mismainformacion
![Page 9: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/9.jpg)
La idea basica
Regresion: Estudio de la distribucion condicional de unavariable respuesta Y dada el vector de predictores X ∈ Rp.
Si p = 1, un grafico nos dice casi todo: grafiquemos los pares(X1, Y ) datos
-2 -1 0 1 2
05
1015
x
y
E(Y ∣X = x) = aebx. Estimamos a y b.-2 -1 0 1 2
05
1015
x
y
E(Y ∣X = x) = aebx. Observemos que x y b.x nos dan la mismainformacion
![Page 10: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/10.jpg)
La idea basica
Regresion: Estudio de la distribucion condicional de unavariable respuesta Y dada el vector de predictores X ∈ Rp.
Si p = 1, un grafico nos dice casi todo: grafiquemos los pares(X1, Y ) datos
-2 -1 0 1 2
05
1015
x
y
E(Y ∣X = x) = aebx. Estimamos a y b.
-2 -1 0 1 2
05
1015
x
y
E(Y ∣X = x) = aebx. Observemos que x y b.x nos dan la mismainformacion
![Page 11: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/11.jpg)
La idea basica
Regresion: Estudio de la distribucion condicional de unavariable respuesta Y dada el vector de predictores X ∈ Rp.
Si p = 1, un grafico nos dice casi todo: grafiquemos los pares(X1, Y ) datos
-2 -1 0 1 2
05
1015
x
y
E(Y ∣X = x) = aebx. Estimamos a y b.
-2 -1 0 1 2
05
1015
x
y
E(Y ∣X = x) = aebx. Observemos que x y b.x nos dan la mismainformacion
![Page 12: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/12.jpg)
¿Que sucede si tenemos mas predictores ?
Queremos estudiar Y ∣(X1,X2), i.e, Y ∶ R2 → R.
¿Graficosmarginales que nos dicen?
¿Como depende Y de (X1,X2)? lineal en X1 y√X2?
![Page 13: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/13.jpg)
¿Que sucede si tenemos mas predictores ?
Queremos estudiar Y ∣(X1,X2), i.e, Y ∶ R2 → R. ¿Graficosmarginales que nos dicen?
¿Como depende Y de (X1,X2)?
lineal en X1 y√X2?
![Page 14: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/14.jpg)
¿Que sucede si tenemos mas predictores ?
Queremos estudiar Y ∣(X1,X2), i.e, Y ∶ R2 → R. ¿Graficosmarginales que nos dicen?
¿Como depende Y de (X1,X2)? lineal en X1 y√X2?
![Page 15: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/15.jpg)
Regresion directa
Tenemos que mirar una funcion Y ∶ R2 → R, i.e. Y vsX = (X1,X2) conjuntamente rotando el grafico.
Y = f(aX1 + bX2).
![Page 16: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/16.jpg)
Regresion directa
Tenemos que mirar una funcion Y ∶ R2 → R, i.e. Y vsX = (X1,X2) conjuntamente rotando el grafico.
Y = f(aX1 + bX2).
![Page 17: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/17.jpg)
Regresion directa
Tenemos que mirar una funcion Y ∶ R2 → R, i.e. Y vsX = (X1,X2) conjuntamente rotando el grafico.
Y = f(aX1 + bX2).
![Page 18: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/18.jpg)
A partir de conocer a y b
10 20 30 40 50
23
45
67
a X_1 + b X_2
Y
Vuelvo al problema de p = 1 y modelo Y = f(aX1 + bX2), . . . .
En este caso:Y ∣(X1,X2) =d Y ∣
√3X1 +X2 =d Y ∣f(3X1 +X2) =d Y ∣f(αTX)
con αT = c(3,1).
![Page 19: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/19.jpg)
A partir de conocer a y b
10 20 30 40 50
23
45
67
a X_1 + b X_2
Y
Vuelvo al problema de p = 1 y modelo Y = f(aX1 + bX2), . . . .
En este caso:Y ∣(X1,X2) =d Y ∣
√3X1 +X2 =d Y ∣f(3X1 +X2) =d Y ∣f(αTX)
con αT = c(3,1).
![Page 20: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/20.jpg)
Ejemplo: caso p = 2
Como conclusion 3X1 +X2 no tiene la misma informacionque el par (X1,X2).
Sin embargo, 3X1 +X2 tiene la misma informacion que elpar (X1,X2) sobre Y
![Page 21: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/21.jpg)
Ejemplo: caso p = 2
Como conclusion 3X1 +X2 no tiene la misma informacionque el par (X1,X2).
Sin embargo, 3X1 +X2 tiene la misma informacion que elpar (X1,X2) sobre Y
![Page 22: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/22.jpg)
Que pasa cuando la cantidad de predictoresaumenta?
Difcil comprension de la relacion entre predictores yrespuesta
Que hacemos?Como antes: transformamos el problema en uno mas simple,encontramos α tal que αTX y X tengan la misma informacionsobre Y .
Como encontramos α?Estudiamos la funcion Rp → R. ¿Graficos? ¿Dios nos da α? Yluego sigo con el problema.
![Page 23: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/23.jpg)
Que pasa cuando la cantidad de predictoresaumenta?
Difcil comprension de la relacion entre predictores yrespuesta
Que hacemos?Como antes: transformamos el problema en uno mas simple,encontramos α tal que αTX y X tengan la misma informacionsobre Y .
Como encontramos α?Estudiamos la funcion Rp → R. ¿Graficos? ¿Dios nos da α? Yluego sigo con el problema.
![Page 24: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/24.jpg)
Solucion: Principal Components in Regression(2.010.000 resultados en google)
Si p es grande un paso preliminar a todo estudio es reducir X
La idea
Reemplazar X = (X1, . . . ,Xp) por k < p combinacioneslineales de Xi. Si k = 1 serıa reemplazar X por la variablea1X1 + ⋅ ⋅ ⋅ + apXp
Estudiar la regresion de Y en funcion de estascombinaciones lineales en lugar de Y en funcion de X
¿Como elige PCR estas combinaciones lineales?
![Page 25: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/25.jpg)
Solucion: Principal Components in Regression(2.010.000 resultados en google)
Si p es grande un paso preliminar a todo estudio es reducir X
La idea
Reemplazar X = (X1, . . . ,Xp) por k < p combinacioneslineales de Xi. Si k = 1 serıa reemplazar X por la variablea1X1 + ⋅ ⋅ ⋅ + apXp
Estudiar la regresion de Y en funcion de estascombinaciones lineales en lugar de Y en funcion de X
¿Como elige PCR estas combinaciones lineales?
![Page 26: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/26.jpg)
Solucion: Principal Components in Regression(2.010.000 resultados en google)
Si p es grande un paso preliminar a todo estudio es reducir X
La idea
Reemplazar X = (X1, . . . ,Xp) por k < p combinacioneslineales de Xi. Si k = 1 serıa reemplazar X por la variablea1X1 + ⋅ ⋅ ⋅ + apXp
Estudiar la regresion de Y en funcion de estascombinaciones lineales en lugar de Y en funcion de X
¿Como elige PCR estas combinaciones lineales?
![Page 27: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/27.jpg)
Solucion: Principal Components in Regression(2.010.000 resultados en google)
Si p es grande un paso preliminar a todo estudio es reducir X
La idea
Reemplazar X = (X1, . . . ,Xp) por k < p combinacioneslineales de Xi. Si k = 1 serıa reemplazar X por la variablea1X1 + ⋅ ⋅ ⋅ + apXp
Estudiar la regresion de Y en funcion de estascombinaciones lineales en lugar de Y en funcion de X
¿Como elige PCR estas combinaciones lineales?
![Page 28: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/28.jpg)
Como tomar una foto de una tetera
Es la foto que contiene la mayor cantidad de informacionposible
![Page 29: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/29.jpg)
Como tomar una foto de una tetera
Es la foto que contiene la mayor cantidad de informacionposible
![Page 30: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/30.jpg)
PCR
PCR of Y on X = (X1, . . . ,Xp)T
Tomar Cov (X)Encontrar los primeros k autovectores de Cov (X):α = (a1, . . . ,ak)Considerar αTX = (aT1 X, . . . ,aTkX)Estudiar Y en funcion de αTX o clasificar usando αTX.
![Page 31: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/31.jpg)
Algunas ventajas y racionalidad atras de PCR
Facil de entender: 2.010.000 resultados en google vs3.220.000 resultados para regresion lineal simple
Las combinaciones lineales de X son las que tienen mayorvariabilidadNo necesito modelar Y ∣X como paso previo
Si usamos los PC, en lugar de las variables originales losPC minimizan la varianza de los estimadores
PEROError = VARIANZA + SESGO2
La varianza esta conectada con la varianza de XSESGO es la conexion entre X e Y . Y los PCs NO tienenconexion con Y
![Page 32: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/32.jpg)
Algunas ventajas y racionalidad atras de PCR
Facil de entender: 2.010.000 resultados en google vs3.220.000 resultados para regresion lineal simple
Las combinaciones lineales de X son las que tienen mayorvariabilidadNo necesito modelar Y ∣X como paso previo
Si usamos los PC, en lugar de las variables originales losPC minimizan la varianza de los estimadores
PEROError = VARIANZA + SESGO2
La varianza esta conectada con la varianza de XSESGO es la conexion entre X e Y . Y los PCs NO tienenconexion con Y
![Page 33: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/33.jpg)
Algunas ventajas y racionalidad atras de PCR
Facil de entender: 2.010.000 resultados en google vs3.220.000 resultados para regresion lineal simple
Las combinaciones lineales de X son las que tienen mayorvariabilidadNo necesito modelar Y ∣X como paso previo
Si usamos los PC, en lugar de las variables originales losPC minimizan la varianza de los estimadores
PEROError = VARIANZA + SESGO2
La varianza esta conectada con la varianza de XSESGO es la conexion entre X e Y .
Y los PCs NO tienenconexion con Y
![Page 34: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/34.jpg)
Algunas ventajas y racionalidad atras de PCR
Facil de entender: 2.010.000 resultados en google vs3.220.000 resultados para regresion lineal simple
Las combinaciones lineales de X son las que tienen mayorvariabilidadNo necesito modelar Y ∣X como paso previo
Si usamos los PC, en lugar de las variables originales losPC minimizan la varianza de los estimadores
PEROError = VARIANZA + SESGO2
La varianza esta conectada con la varianza de XSESGO es la conexion entre X e Y . Y los PCs NO tienenconexion con Y
![Page 35: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/35.jpg)
Ejemplo de juguete
X = (X1,X2), Y = f(X1,X2) + εCalculo la primera PC y grafico Y vs PC1
Pareciera que no hay ninguna relacion. Grafico vs PC2.¿Porque?: en este ejemplo Y =X1 −X2 + ε,
PC1 teorica: X1 +X2 y PC2 teorica: X1 −X2.
PC1 ∶≈ 95% variabilidad PC2 ∶≈ 5% variabilidad
![Page 36: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/36.jpg)
Ejemplo de juguete
X = (X1,X2), Y = f(X1,X2) + εCalculo la primera PC y grafico Y vs PC1
Pareciera que no hay ninguna relacion. Grafico vs PC2.¿Porque?: en este ejemplo Y =X1 −X2 + ε,
PC1 teorica: X1 +X2 y PC2 teorica: X1 −X2.
PC1 ∶≈ 95% variabilidad PC2 ∶≈ 5% variabilidad
![Page 37: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/37.jpg)
Ejemplo de juguete
X = (X1,X2), Y = f(X1,X2) + εCalculo la primera PC y grafico Y vs PC1
Pareciera que no hay ninguna relacion. Grafico vs PC2.
¿Porque?:
en este ejemplo Y =X1 −X2 + ε,
PC1 teorica: X1 +X2 y PC2 teorica: X1 −X2.
PC1 ∶≈ 95% variabilidad PC2 ∶≈ 5% variabilidad
![Page 38: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/38.jpg)
Ejemplo de juguete
X = (X1,X2), Y = f(X1,X2) + εCalculo la primera PC y grafico Y vs PC1
Pareciera que no hay ninguna relacion. Grafico vs PC2.
¿Porque?: en este ejemplo Y =X1 −X2 + ε,
PC1 teorica: X1 +X2 y PC2 teorica: X1 −X2.
PC1 ∶≈ 95% variabilidad PC2 ∶≈ 5% variabilidad
![Page 39: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/39.jpg)
Ejemplo de juguete
X = (X1,X2), Y = f(X1,X2) + εCalculo la primera PC y grafico Y vs PC1
Pareciera que no hay ninguna relacion. Grafico vs PC2.
¿Porque?: en este ejemplo Y =X1 −X2 + ε,
PC1 teorica: X1 +X2 y PC2 teorica: X1 −X2.
PC1 ∶≈ 95% variabilidad PC2 ∶≈ 5% variabilidad
![Page 40: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/40.jpg)
¿Que paso con la tetera
Y, queriamos estudiar la tapa
![Page 41: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/41.jpg)
¿Que paso con la tetera
Y, queriamos estudiar la tapa
![Page 42: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/42.jpg)
Resumen
Mayor problema con el uso de PC es que no hay conexionentre PCs y Y .
Estan ordenados de acuerdo a su importancia conrespecto a X y no con respecto a Y .
Positivo: se calculan antes de modelar Y ∣X y si funcionanpueden servir de mucho (esperar que Y se mueva en lamisma direccion que los primeros k PCs).
![Page 43: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/43.jpg)
Resumen
Mayor problema con el uso de PC es que no hay conexionentre PCs y Y .
Estan ordenados de acuerdo a su importancia conrespecto a X y no con respecto a Y .
Positivo: se calculan antes de modelar Y ∣X y si funcionanpueden servir de mucho (esperar que Y se mueva en lamisma direccion que los primeros k PCs).
![Page 44: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/44.jpg)
Resumen
Mayor problema con el uso de PC es que no hay conexionentre PCs y Y .
Estan ordenados de acuerdo a su importancia conrespecto a X y no con respecto a Y .
Positivo: se calculan antes de modelar Y ∣X y si funcionanpueden servir de mucho (esperar que Y se mueva en lamisma direccion que los primeros k PCs).
![Page 45: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/45.jpg)
Reduccion suficiente de dimensiones
Definicion
Una reduccion R ∶ Rp → Rd, con d ≤ p es suficiente para laregresion de Y ∣X si satisface la siguiente condicion
Y ∣X ∼ Y ∣R(X)
¿Cual es la diferencia con R(X) via componentes principales?
![Page 46: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/46.jpg)
Reduccion suficiente de dimensiones
Definicion
Una reduccion R ∶ Rp → Rd, con d ≤ p es suficiente para laregresion de Y ∣X si satisface la siguiente condicion
Y ∣X ∼ Y ∣R(X)
¿Cual es la diferencia con R(X) via componentes principales?
![Page 47: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/47.jpg)
Reduccion suficiente de dimensiones
¿Como encontramos R(X)?
Respuesta: Enfoque de reduccion inversa
Objetivo: Y ∣X pero estudiaremos X∣YY ∣X⇒ Regresion de R en Rp, estudiar una funcionY ∶ Rp → R
X∣Y ⇒ p regresiones univariadas, R→ Rp,
X1∣YX2∣Y
⋮ Mas faciles de estudiar!Xp−1∣YXp∣Y
![Page 48: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/48.jpg)
Reduccion suficiente de dimensiones
¿Como encontramos R(X)?
Respuesta: Enfoque de reduccion inversa
Objetivo: Y ∣X pero estudiaremos X∣YY ∣X⇒ Regresion de R en Rp, estudiar una funcionY ∶ Rp → R
X∣Y ⇒ p regresiones univariadas, R→ Rp,
X1∣YX2∣Y
⋮ Mas faciles de estudiar!Xp−1∣YXp∣Y
![Page 49: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/49.jpg)
Reduccion suficiente de dimensiones
¿Como encontramos R(X)?
Respuesta: Enfoque de reduccion inversa
Objetivo: Y ∣X pero estudiaremos X∣YY ∣X⇒ Regresion de R en Rp, estudiar una funcionY ∶ Rp → R
X∣Y ⇒ p regresiones univariadas, R→ Rp,
X1∣YX2∣Y
⋮ Mas faciles de estudiar!Xp−1∣YXp∣Y
![Page 50: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/50.jpg)
¿Como encontramos R(X) cuando tenemos datos?
Metodos basados en modelos para la regresioninversa para X∣Y
Cook (2007)
Ventajas
Estimadores ML
Identificacion exhaustiva de R(X)
![Page 51: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/51.jpg)
¿Como encontramos R(X) cuando tenemos datos?
Metodos basados en modelos para la regresioninversa para X∣Y
Cook (2007)
Ventajas
Estimadores ML
Identificacion exhaustiva de R(X)
![Page 52: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/52.jpg)
PFC - Principal Fitted Component
Metodo PFC:
Xy ≐X∣(Y = y) ∼ N (µy,∆) (2)
R(X) = αTX es una reduccion suficiente minimal si
Sα = ∆−1spanµy − µ, y ∈ ΩY
¿En los datos? para el modelo (2) se encuentran losestimadores ML y R(X) = αTX, con
α = ∆−1spanµy − µ, y ∈ ΩY
Extension al caso ∆y (Metodo LAD)
![Page 53: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/53.jpg)
PFC - Principal Fitted Component
Metodo PFC:
Xy ≐X∣(Y = y) ∼ N (µy,∆) (2)
R(X) = αTX es una reduccion suficiente minimal si
Sα = ∆−1spanµy − µ, y ∈ ΩY
¿En los datos? para el modelo (2) se encuentran losestimadores ML y R(X) = αTX, con
α = ∆−1spanµy − µ, y ∈ ΩY
Extension al caso ∆y (Metodo LAD)
![Page 54: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/54.jpg)
PFC - Principal Fitted Component
Metodo PFC:
Xy ≐X∣(Y = y) ∼ N (µy,∆) (2)
R(X) = αTX es una reduccion suficiente minimal si
Sα = ∆−1spanµy − µ, y ∈ ΩY
¿En los datos? para el modelo (2) se encuentran losestimadores ML y R(X) = αTX, con
α = ∆−1spanµy − µ, y ∈ ΩY
Extension al caso ∆y (Metodo LAD)
![Page 55: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/55.jpg)
PFC - Principal Fitted Component
Metodo PFC:
Xy ≐X∣(Y = y) ∼ N (µy,∆) (2)
R(X) = αTX es una reduccion suficiente minimal si
Sα = ∆−1spanµy − µ, y ∈ ΩY
¿En los datos? para el modelo (2) se encuentran losestimadores ML y R(X) = αTX, con
α = ∆−1spanµy − µ, y ∈ ΩY
Extension al caso ∆y (Metodo LAD)
![Page 56: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/56.jpg)
Regresion inversa
Regresion inversa.¿Ventajas? p regresiones uni-dimensionales
Modelar X1∣Y , X2∣Y o (X1,X2)∣Y
Encontrar R tal que (X1,X2)∣(R(X1,X2)T , Y ) no dependade Y . Via PFC o LAD
![Page 57: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/57.jpg)
Regresion inversa
Regresion inversa.¿Ventajas? p regresiones uni-dimensionales
Modelar X1∣Y , X2∣Y o (X1,X2)∣Y
Encontrar R tal que (X1,X2)∣(R(X1,X2)T , Y ) no dependade Y . Via PFC o LAD
![Page 58: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/58.jpg)
Regresion inversa
Regresion inversa.¿Ventajas? p regresiones uni-dimensionales
Modelar X1∣Y , X2∣Y o (X1,X2)∣Y
Encontrar R tal que (X1,X2)∣(R(X1,X2)T , Y ) no dependade Y . Via PFC o LAD
![Page 59: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/59.jpg)
Solucion
5 10 15 20 25 30 35
23
45
67
Reduccion estimada via PFC
Y
Y de ahı modelamos Y en funcion de esta combinacion lineal.
![Page 60: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/60.jpg)
Primera PC en el ejemplo de juguete
Primera PC Primera PFC
-3 -2 -1 0 1 2 3
-2-1
01
PC1
Y
-0.5 0.0 0.5
-1.0
-0.5
0.0
0.5
1.0
1.5
SIR-1Y
Primera PC Segunda PC
![Page 61: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/61.jpg)
Primera PC en el ejemplo de juguete
Primera PC Primera PFC
-3 -2 -1 0 1 2 3
-2-1
01
PC1
Y
-0.5 0.0 0.5
-1.0
-0.5
0.0
0.5
1.0
1.5
SIR-1
Y
Primera PC Segunda PC
![Page 62: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/62.jpg)
Y discreta: discriminacion. Cancer de pulmon
Los datos de entrenamiento: X ∈ Rp en poblacionesdiferentes Y = 1, . . . ,H para n individuos.
X: 24 biomarcadores para cada uno de los 174 (individuos concancer) + 59 (individuos sin cancer)
¿Los biomarcadores dicen algo de la enfermedad?
![Page 63: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/63.jpg)
Y discreta: discriminacion. Cancer de pulmon
Los datos de entrenamiento: X ∈ Rp en poblacionesdiferentes Y = 1, . . . ,H para n individuos.
X: 24 biomarcadores para cada uno de los 174 (individuos concancer) + 59 (individuos sin cancer)¿Los biomarcadores dicen algo de la enfermedad?
![Page 64: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/64.jpg)
Graficos
0 1 2 3 4 5
-10
12
3
X2
X1
![Page 65: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/65.jpg)
Graficos
V17
2 3 4 5 6 7
23
45
67
23
45
67
V18
2 3 4 5 6 7 0 400 800 1200
0400
800
1200
V19
![Page 66: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/66.jpg)
Y discreta: discriminacion. Cancer de pulmon
Los datos de entrenamiento: X ∈ Rp en poblacionesdiferentes Y = 1, . . . ,H para n individuos.
X: 24 biomarcadores para cada uno de los 174 (individuos concancer) + 59 (individuos sin cancer)¿Los biomarcadores dicen algo de la enfermedad?
Objetivo: encontrar α such that αTX tenga la mismainformacion que X de Y (reduccion suficiente dedimensiones) y que ademas ayude visualmente.
Consideramos los predictores αTX en lugar de X
Hacemos graficos (para la visualizacion) y usamos estosnuevos predictores para predecir Y , cancer o no
![Page 67: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/67.jpg)
Y discreta: discriminacion. Cancer de pulmon
Los datos de entrenamiento: X ∈ Rp en poblacionesdiferentes Y = 1, . . . ,H para n individuos.
X: 24 biomarcadores para cada uno de los 174 (individuos concancer) + 59 (individuos sin cancer)¿Los biomarcadores dicen algo de la enfermedad?
Objetivo: encontrar α such that αTX tenga la mismainformacion que X de Y (reduccion suficiente dedimensiones) y que ademas ayude visualmente.Consideramos los predictores αTX en lugar de X
Hacemos graficos (para la visualizacion) y usamos estosnuevos predictores para predecir Y , cancer o no
![Page 68: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/68.jpg)
Y discreta: discriminacion. Cancer de pulmon
Los datos de entrenamiento: X ∈ Rp en poblacionesdiferentes Y = 1, . . . ,H para n individuos.
X: 24 biomarcadores para cada uno de los 174 (individuos concancer) + 59 (individuos sin cancer)¿Los biomarcadores dicen algo de la enfermedad?
Objetivo: encontrar α such that αTX tenga la mismainformacion que X de Y (reduccion suficiente dedimensiones) y que ademas ayude visualmente.Consideramos los predictores αTX en lugar de X
Hacemos graficos (para la visualizacion) y usamos estosnuevos predictores para predecir Y , cancer o no
![Page 69: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/69.jpg)
Cander de pulmon data - PC
4 6 8 10
-10
12
34
5
PC1
PC2
Porcentaje de bien clasificado: 75 %.
![Page 70: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/70.jpg)
Cander de pulmon data - PC
4 6 8 10
-10
12
34
5
PC1
PC2
Porcentaje de bien clasificado: 75 %.
![Page 71: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/71.jpg)
Cander de pulmon data - LAD
-3.5 -3.0 -2.5 -2.0 -1.5 -1.0
-6.0
-5.5
-5.0
-4.5
-4.0
LAD1
LAD2
Porcentaje de bien clasificado: 83 %.
![Page 72: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/72.jpg)
Cander de pulmon data - LAD
-3.5 -3.0 -2.5 -2.0 -1.5 -1.0
-6.0
-5.5
-5.0
-4.5
-4.0
LAD1
LAD2
Porcentaje de bien clasificado: 83 %.
![Page 73: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/73.jpg)
curva ROC para datos de cancer
PC, AUC=.8710 and LAD, AUC= 0.9628
![Page 74: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/74.jpg)
Limitaciones. Datos: Atletas de Autralia
Objetivo: investigar la relacion entre el ındice de masacorporal (Y) y varios predictores e identificar los factoresque estan asociados al sobrepeso
Variables predictoras: altura, peso, cant. de globulos rojos,cant. de globulos blancos, hemoglobina (X) y sexo (W )
n = 102
![Page 75: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/75.jpg)
Limitaciones: PFC y LAD es para predictorescontinuos
Solucion: trabajar con cada nivel de la variable nocontinua: y considerar
Reduccion suficiente: R((X,W )) = (αTX,W ) con α ∶ 5 × 1
Modelamos Y ∣(R(X),W )
![Page 76: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/76.jpg)
Limitaciones: PFC y LAD es para predictorescontinuos
Solucion: trabajar con cada nivel de la variable nocontinua: y considerar
Reduccion suficiente: R((X,W )) = (αTX,W ) con α ∶ 5 × 1
Modelamos Y ∣(R(X),W )
![Page 77: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/77.jpg)
Limitaciones: PFC y LAD es para predictorescontinuos
Solucion: trabajar con cada nivel de la variable nocontinua: y considerar
Reduccion suficiente: R((X,W )) = (αTX,W ) con α ∶ 5 × 1
Modelamos Y ∣(R(X),W )
![Page 78: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/78.jpg)
Datos: Atletas de Autralia - EFDR
Solucion via modelos inversos
Modelo de regresion inversa: fX,W ∣Y = fX∣W,Y ⋅ fW ∣Y
W ∣Y ∼ Bernoulli(py)X∣(Y,W ) ∼ N (µy,w,∆) conµy,w = µX + b1(y − µY ) + b2(w − µW )
![Page 79: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/79.jpg)
Datos: Atletas de Autralia - EFDR
Solucion via modelos inversos
Modelo de regresion inversa: fX,W ∣Y = fX∣W,Y ⋅ fW ∣YW ∣Y ∼ Bernoulli(py)
X∣(Y,W ) ∼ N (µy,w,∆) conµy,w = µX + b1(y − µY ) + b2(w − µW )
![Page 80: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/80.jpg)
Datos: Atletas de Autralia - EFDR
Solucion via modelos inversos
Modelo de regresion inversa: fX,W ∣Y = fX∣W,Y ⋅ fW ∣YW ∣Y ∼ Bernoulli(py)
X∣(Y,W ) ∼ N (µy,w,∆) conµy,w = µX + b1(y − µY ) + b2(w − µW )
![Page 81: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/81.jpg)
Datos: Atletas de Autralia - EFDR
Solucion via modelos inversos
Modelo de regresion inversa: fX,W ∣Y = fX∣W,Y ⋅ fW ∣YW ∣Y ∼ Bernoulli(py)X∣(Y,W ) ∼ N (µy,w,∆) conµy,w = µX + b1(y − µY ) + b2(w − µW )
![Page 82: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/82.jpg)
Datos: Atletas de Autralia - EFDR
Reduccion suficiente: R((X,W )) = αT (X,W ) con α ∶ 6× 1.
Regresion directa:
E(Y ∣X,W ) = E(Y ∣R(X,W )) = γ1+γ2R(X,W )+γ3R2(X,W )
![Page 83: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/83.jpg)
Datos: Atletas de Autralia - EFDR
Reduccion suficiente: R((X,W )) = αT (X,W ) con α ∶ 6× 1.
Regresion directa:
E(Y ∣X,W ) = E(Y ∣R(X,W )) = γ1+γ2R(X,W )+γ3R2(X,W )
![Page 84: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/84.jpg)
Datos: Atletas de Autralia - EFDR
Reduccion suficiente: R((X,W )) = αT (X,W ) con α ∶ 6× 1.
Regresion directa:
E(Y ∣X,W ) = E(Y ∣R(X,W )) = γ1+γ2R(X,W )+γ3R2(X,W )
![Page 85: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/85.jpg)
Nota sobre EFDR
Las reducciones no son mas necesariamente lineales en X
![Page 86: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/86.jpg)
Ejemplo: biomarcadores de cancer de pulmon
Descripcion de los datos:509 casos positivos (Y = 1) y 606 casos de control (Y = 0).47 biomarcadores altamente correlacionados.Mediciones sujetas a lımites de deteccion de las tecnicasanalticas.
![Page 87: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/87.jpg)
Ejemplo: biomarcadores de cancer de pulmon
Descripcion de los datos:509 casos positivos (Y = 1) y 606 casos de control (Y = 0).47 biomarcadores altamente correlacionados.Mediciones sujetas a lımites de deteccion de las tecnicasanalticas.
![Page 88: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/88.jpg)
dos biomarcadores vs Y
-3 -2 -1 0 1 2 3 4X-1
-4
-3
-2
-1
0
1
2
3
4
X-16
![Page 89: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/89.jpg)
Ejemplo: biomarcadores de cancer de pulmon
Descripcion de los datos:509 casos positivos (Y = 1) y 606 casos de control (Y = 0).47 biomarcadores altamente correlacionados.Mediciones sujetas a lmites de deteccion de las tecnicasanalticas.
Objetivos del analisis:Combinar biomarcadores en unas pocas nuevas variablesque faciliten el modelado y clasificacion.Identificar los biomarcadores realmente relacionados concancer de pulmon y remover el resto.
![Page 90: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/90.jpg)
Resultados usando las tecnicas para variablescontinuas
Resultados de prediccion (20-fold CV) Logıstica:
PREDICTORES ERROR DE PREDICCION
d = 1 d = 6 p = 47
Sin reduccionX .46MI-X (con imputacion) .45Con reduccion convencionalPFC .43LAD .48 .40
![Page 91: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/91.jpg)
¿Que pasa si tenemos en cuenta la presencia delımites de deteccion
Tener en cuenta la presencia de lımites de deteccion.Extension de los metodos para datos continuos
¿Ganamos algo?
![Page 92: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/92.jpg)
Ejemplo: biomarcadores de cancer de pulmon
Resultados de prediccion (20-fold CV) con Logıstica:
PREDICTORES ERROR DE PREDICCION
d = 1 d = 6 p = 47
Sin reduccionX .46MI-X (con imputacion) .45Con reduccion convencionalPFC .43LAD .48 .40Con reduccion adaptadacPFC .39cLAD .42 .35
![Page 93: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/93.jpg)
Ejemplo: biomarcadores de cancer de pulmon
False positive rate
True
pos
itive
rat
e
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
cLADMI−LADcPFCMI−PFC
![Page 94: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/94.jpg)
Identificacion de biomarcadores relevantes
En una reduccion convencional, todos los predictoresoriginales forman parte de cada una de las nuevasdirecciones.Cuando nos interesa explicar la relacion entre predictoresy respuesta, es util seleccionar variables relevantes.Importante: bajo el enfoque de suficiencia podemosseleccionar variables sin depender de un modelopredictivo (como LASSO y sus parientes), pero con mayorestabilidad que los metodos paso-a-paso.
![Page 95: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/95.jpg)
Identificacion de biomarcadores relevantes
Table: Marcadores seleccionados basado en maxima verosimilitudpenalizada. Los marcadores resaltados en rojo son los identificadosexperimentalmente (Shiels et al. 2013). Nuestra mayor contribucion
Marker case-control status (binary Y )cLAD LAD MI-LAD cPFC stepwise LR
X6CKINE CRP
CTACK CXCL11ITACCXCL9MIG
EGFR FGF2 GRO IL1RA MIP1B SEGFR
SVEGFR2 TARC TNFB VEGF
VEGFR2
![Page 96: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/96.jpg)
Ejemplo. Los famosos ındices sociales
Asignar una ayuda economica a hogares o individuos queviven en situacion de pobreza
Polıticas o Programas Focalizados(Ejemplos reales: CAS in Chile, Sisben en Colombia, SISFOHen Peru, Tekopora en Paraguay, SIERP en Honduras, PANES
en Uruguay, entre otros)
Aquı pobreza es pobreza monetaria
Un hogar j es pobre si su ingreso monetario Yj no alcanzapara cubrir las necesidades basicas, i.e. Yj ≤ LP donde LP esel ingreso que determina la lınea de pobreza.
![Page 97: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/97.jpg)
Ejemplo. Los famosos ındices sociales
Asignar una ayuda economica a hogares o individuos queviven en situacion de pobreza
Polıticas o Programas Focalizados(Ejemplos reales: CAS in Chile, Sisben en Colombia, SISFOHen Peru, Tekopora en Paraguay, SIERP en Honduras, PANES
en Uruguay, entre otros)
Aquı pobreza es pobreza monetaria
Un hogar j es pobre si su ingreso monetario Yj no alcanzapara cubrir las necesidades basicas, i.e. Yj ≤ LP donde LP esel ingreso que determina la lınea de pobreza.
![Page 98: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/98.jpg)
Ejemplo. Los famosos ındices sociales
Asignar una ayuda economica a hogares o individuos queviven en situacion de pobreza
Polıticas o Programas Focalizados(Ejemplos reales: CAS in Chile, Sisben en Colombia, SISFOHen Peru, Tekopora en Paraguay, SIERP en Honduras, PANES
en Uruguay, entre otros)
Aquı pobreza es pobreza monetaria
Un hogar j es pobre si su ingreso monetario Yj no alcanzapara cubrir las necesidades basicas, i.e. Yj ≤ LP donde LP esel ingreso que determina la lınea de pobreza.
![Page 99: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/99.jpg)
Solucion con Situacion Ideal
Conocemos el valor exacto de ingreso monetario de cadahogar Si Yj ≤ LP le asigno la ayuda prevista.
Pero...
Existen varios problemas en la captacion del ingreso comomedida creıble o fiable (reporting biases):
Incentivos a revelar el valor verdadero.Economıa informal u oculta (ej. pagos en especie(trueque),auto-provision).Estacionalidad (ej. changas, empleos rurales).
![Page 100: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/100.jpg)
Solucion con Situacion Ideal
Conocemos el valor exacto de ingreso monetario de cadahogar Si Yj ≤ LP le asigno la ayuda prevista.
Pero...
Existen varios problemas en la captacion del ingreso comomedida creıble o fiable (reporting biases):
Incentivos a revelar el valor verdadero.Economıa informal u oculta (ej. pagos en especie(trueque),auto-provision).Estacionalidad (ej. changas, empleos rurales).
![Page 101: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/101.jpg)
Solucion con Situacion Ideal
Conocemos el valor exacto de ingreso monetario de cadahogar Si Yj ≤ LP le asigno la ayuda prevista.
Pero...
Existen varios problemas en la captacion del ingreso comomedida creıble o fiable (reporting biases):
Incentivos a revelar el valor verdadero.Economıa informal u oculta (ej. pagos en especie(trueque),auto-provision).Estacionalidad (ej. changas, empleos rurales).
![Page 102: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/102.jpg)
¿Que hacer?
Construir un ındice (I ∈ R) como proxy de ingreso o riqueza
Si I ≤ LP ∗ asigno la ayuda (para un LP ∗ determinado)
![Page 103: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/103.jpg)
El como
Miramos otras variables del hogar, de observacion mas directay en general mas faciles de recolectar, que en conjunto sonproxy del bienestar economico del mismo. Ej:
Vivienda (materiales del techo, materiales del suelo, formade acceso al agua potable, etc.).Activos fısicos (tiene radio?, tiene TV?, tiene internet?tiene moto? tienen auto?)Otras socio-demograficas (cant. de miembros,escolaridad, situacion ocupacional, etc.)
Definicion del ındice (I)
Sean X1, . . . ,Xp diferentes variables que caracterizan al hogaren terminos economicos y sociales, se define por ındice deestatus socieconomico (ESE), a la combinacion lineal dedichas variables para un determinado vector de pesos fijos(a1, . . . , ap), i.e.
I = a1X1 + ⋅ ⋅ ⋅ + apXp
![Page 104: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/104.jpg)
El como
Miramos otras variables del hogar, de observacion mas directay en general mas faciles de recolectar, que en conjunto sonproxy del bienestar economico del mismo. Ej:
Vivienda (materiales del techo, materiales del suelo, formade acceso al agua potable, etc.).Activos fısicos (tiene radio?, tiene TV?, tiene internet?tiene moto? tienen auto?)Otras socio-demograficas (cant. de miembros,escolaridad, situacion ocupacional, etc.)
Definicion del ındice (I)
Sean X1, . . . ,Xp diferentes variables que caracterizan al hogaren terminos economicos y sociales, se define por ındice deestatus socieconomico (ESE), a la combinacion lineal dedichas variables para un determinado vector de pesos fijos(a1, . . . , ap), i.e.
I = a1X1 + ⋅ ⋅ ⋅ + apXp
![Page 105: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/105.jpg)
El como
Miramos otras variables del hogar, de observacion mas directay en general mas faciles de recolectar, que en conjunto sonproxy del bienestar economico del mismo. Ej:
Vivienda (materiales del techo, materiales del suelo, formade acceso al agua potable, etc.).Activos fısicos (tiene radio?, tiene TV?, tiene internet?tiene moto? tienen auto?)Otras socio-demograficas (cant. de miembros,escolaridad, situacion ocupacional, etc.)
Definicion del ındice (I)
Sean X1, . . . ,Xp diferentes variables que caracterizan al hogaren terminos economicos y sociales, se define por ındice deestatus socieconomico (ESE), a la combinacion lineal dedichas variables para un determinado vector de pesos fijos(a1, . . . , ap), i.e.
I = a1X1 + ⋅ ⋅ ⋅ + apXp
![Page 106: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/106.jpg)
Solucion con Situacion Casi Ideal
Un Ser omnisciente me dicta los verdaderos valores de lospesos: a∗1 , a
∗2 , . . . , a
∗p .
Para un cierto hogar j miro sus X ′s, i.e. si tiene auto,internet, TV, materiales del techo, de los pisos, etc.
Luego computo el ındicea∗1auto + a∗2internet + a∗3TV + a∗4techo + a∗5pisos + . . . y yapuedo clasificar.
Dura realidad: Con una muestra (denominada deentrenamiento) debo estimar (a1, . . . , ap) y que me de unbuen ındice para implementar de mejor manera elprograma focalizado (i.e. evitar falsos-positivos ofalsos-negativos)
![Page 107: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/107.jpg)
Solucion con Situacion Casi Ideal
Un Ser omnisciente me dicta los verdaderos valores de lospesos: a∗1 , a
∗2 , . . . , a
∗p .
Para un cierto hogar j miro sus X ′s, i.e. si tiene auto,internet, TV, materiales del techo, de los pisos, etc.
Luego computo el ındicea∗1auto + a∗2internet + a∗3TV + a∗4techo + a∗5pisos + . . . y yapuedo clasificar.
Dura realidad: Con una muestra (denominada deentrenamiento) debo estimar (a1, . . . , ap) y que me de unbuen ındice para implementar de mejor manera elprograma focalizado (i.e. evitar falsos-positivos ofalsos-negativos)
![Page 108: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/108.jpg)
Solucion con Situacion Casi Ideal
Un Ser omnisciente me dicta los verdaderos valores de lospesos: a∗1 , a
∗2 , . . . , a
∗p .
Para un cierto hogar j miro sus X ′s, i.e. si tiene auto,internet, TV, materiales del techo, de los pisos, etc.
Luego computo el ındicea∗1auto + a∗2internet + a∗3TV + a∗4techo + a∗5pisos + . . . y yapuedo clasificar.
Dura realidad: Con una muestra (denominada deentrenamiento) debo estimar (a1, . . . , ap) y que me de unbuen ındice para implementar de mejor manera elprograma focalizado (i.e. evitar falsos-positivos ofalsos-negativos)
![Page 109: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/109.jpg)
Solucion con Situacion Casi Ideal
Un Ser omnisciente me dicta los verdaderos valores de lospesos: a∗1 , a
∗2 , . . . , a
∗p .
Para un cierto hogar j miro sus X ′s, i.e. si tiene auto,internet, TV, materiales del techo, de los pisos, etc.
Luego computo el ındicea∗1auto + a∗2internet + a∗3TV + a∗4techo + a∗5pisos + . . . y yapuedo clasificar.
Dura realidad: Con una muestra (denominada deentrenamiento) debo estimar (a1, . . . , ap) y que me de unbuen ındice para implementar de mejor manera elprograma focalizado (i.e. evitar falsos-positivos ofalsos-negativos)
![Page 110: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/110.jpg)
Caracterısticas de las variables socio-economicas
Ejemplos:
pisos= 1 (tierra/ladrillos sueltos), 2 (cemento o ladrillo fijo), 3(mosaicos o baldosas), 4(madera/ceramica y alfombra).
techo= 1 (cana o paja), 2 (chapa de carton), 3 (chapa defibrocemento o de metal),...
agua= 1 (perforacion con bomba manual), 2 (perforacion conbomba a motor), 3( red publica).
bano= 1 (letrina), 2 (inodoro sin boton o cadena -balde), 3(inodoro boton/cadena/mochila).
TV-CPU-auto-moto= 1 (no tiene), 2 (si tiene).
escolaridad=: 1 (sin inst.), 2(primaria incompleta), 3 (primariacompleta), 4 (secundaria incomp.),..
![Page 111: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/111.jpg)
¿Como son estas variables?
Se llaman variables ordinales
![Page 112: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/112.jpg)
Solucion Real Convencional para conseguir un ındice
Componentes principales adaptado a que las variablesson ordinales, ej. Kolenikov & Angeles (2009)
¿Que ocurre si en la muestra de entrenamiento tenemosinformacion de la variable respuesta que buscamospredecir (e.j. ingreso o pobreza)? PCA no usa talinformacion!
![Page 113: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/113.jpg)
Solucion Real Convencional para conseguir un ındice
Componentes principales adaptado a que las variablesson ordinales, ej. Kolenikov & Angeles (2009)
¿Que ocurre si en la muestra de entrenamiento tenemosinformacion de la variable respuesta que buscamospredecir (e.j. ingreso o pobreza)? PCA no usa talinformacion!
![Page 114: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/114.jpg)
Problema Estadıstico
Usar los metodos de reduccion suficiente para variablescontinuas
Desarrollar un metodo de reduccion suficiente para Xordinales
![Page 115: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/115.jpg)
Problema Estadıstico
Usar los metodos de reduccion suficiente para variablescontinuas
Desarrollar un metodo de reduccion suficiente para Xordinales
![Page 116: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/116.jpg)
¿Como podemos extender el metodo a variablesordinales?
KARINA RDZ-NAVARRO Y RODRIGO A. ASÚN
4
constituyen los puntos de corte de la variable continua que dieron lugar a la distribución de frecuencias observada en la variable ordinal. De este modo, distintos valores de parámetros umbrales darán origen a distintas distribuciones de las variables ordinales efectivamente medidas, como se muestra en la Figura 1.
Figura 1. Relación entre la variable continua normal
subyacente y las variables observadas ordinales. De este modo, en lugar de centrarse en el cálculo de la correlación entre las variables observadas, las correlaciones policóricas permiten estimar la relación existente entre las variables continuas subyacentes, de modo que la estimación de la magnitud de la relación entre las variables no se vea afectada por el grado de asimetría introducido por la recodificación arbitraria de las variables que generan los parámetros umbrales. En consecuencia, actualmente se recomienda que toda vez que se esté en presencia de ítems ordinales, se empleen matrices de correlaciones policóricas para estimar la magnitud de la relación entre las variables. El interés de los científicos sociales no sólo se centra en el análisis de la relación entre variables observadas sino principalmente en el análisis de variables latentes. Como se mencionó previamente, las variables latentes son constructos que no tienen un correlato empírico directo, por lo que deben ser medidos a partir de múltiples indicadores o ítems que son manifestaciones empíricas de la variable latente. Así por ejemplo, en investigación por encuestas, se suelen medir variables latentes a través de escalas tipo Likert, es decir, de un conjunto preguntas simples con respuesta cerrada que se suponen miden el mismo constructo complejo, ante las cuales las personas manifiestan su grado de acuerdo seleccionando una respuesta dentro de una serie de categorías generalmente ordenadas en función de su intensidad (Likert, 1932). Se ha demostrado que el uso múltiples preguntas o ítems para la medición de constructos latentes contiene menos error de medida que intentar medir una variable latente con una sola pregunta, pues los errores de medida introducidos en el fraseo o la respuesta a cada uno de ellos tiende a compensarse con los errores en direcciones opuestas de los otros ítems (Likert, Roslow & Murphy, 1934), pero ello sólo es cierto si es que se puede obtener evidencia de que realmente se está midiendo el mismo constructo latente con el conjunto de
![Page 117: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/117.jpg)
RSD para Categorıas Ordinales
p variables aleatorias ordinales X = (X1,X2, . . . ,Xp)T , conXj ∈ 1,2, . . . ,Kj;
Respuesta Y ∈ R;
p variables latentes Z = (Z1, Z2, . . . , Zp)T ;
Conjunto de umbrales Θ = θ(j)0 , θ(j)1 , . . . , θ
(j)Kj, donde
−∞ = θ(j)0 < θ(j)1 < ⋅ ⋅ ⋅ < θ(j)Kj−1 < θ(j)Kj
= +∞, j = 1,2, . . . , p;
Las variables ordinales X y las variables latentes Z estanrelacionadas mediante:
Pr(Xj = k∣Y ) = Pr(θ(j)k−1 ≤ Zj < θ(j)k ∣Y );
Se asume Z∣Y ∼ N(βfY ,∆)Con la ayuda de la teorıa de normalidad encontramos lareduccion suficiente para las observadas X.
![Page 118: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/118.jpg)
RSD para Categorıas Ordinales
p variables aleatorias ordinales X = (X1,X2, . . . ,Xp)T , conXj ∈ 1,2, . . . ,Kj;
Respuesta Y ∈ R;
p variables latentes Z = (Z1, Z2, . . . , Zp)T ;
Conjunto de umbrales Θ = θ(j)0 , θ(j)1 , . . . , θ
(j)Kj, donde
−∞ = θ(j)0 < θ(j)1 < ⋅ ⋅ ⋅ < θ(j)Kj−1 < θ(j)Kj
= +∞, j = 1,2, . . . , p;
Las variables ordinales X y las variables latentes Z estanrelacionadas mediante:
Pr(Xj = k∣Y ) = Pr(θ(j)k−1 ≤ Zj < θ(j)k ∣Y );
Se asume Z∣Y ∼ N(βfY ,∆)Con la ayuda de la teorıa de normalidad encontramos lareduccion suficiente para las observadas X.
![Page 119: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/119.jpg)
RSD para Categorıas Ordinales
p variables aleatorias ordinales X = (X1,X2, . . . ,Xp)T , conXj ∈ 1,2, . . . ,Kj;
Respuesta Y ∈ R;
p variables latentes Z = (Z1, Z2, . . . , Zp)T ;
Conjunto de umbrales Θ = θ(j)0 , θ(j)1 , . . . , θ
(j)Kj, donde
−∞ = θ(j)0 < θ(j)1 < ⋅ ⋅ ⋅ < θ(j)Kj−1 < θ(j)Kj
= +∞, j = 1,2, . . . , p;
Las variables ordinales X y las variables latentes Z estanrelacionadas mediante:
Pr(Xj = k∣Y ) = Pr(θ(j)k−1 ≤ Zj < θ(j)k ∣Y );
Se asume Z∣Y ∼ N(βfY ,∆)Con la ayuda de la teorıa de normalidad encontramos lareduccion suficiente para las observadas X.
![Page 120: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/120.jpg)
RSD para Categorıas Ordinales
p variables aleatorias ordinales X = (X1,X2, . . . ,Xp)T , conXj ∈ 1,2, . . . ,Kj;
Respuesta Y ∈ R;
p variables latentes Z = (Z1, Z2, . . . , Zp)T ;
Conjunto de umbrales Θ = θ(j)0 , θ(j)1 , . . . , θ
(j)Kj, donde
−∞ = θ(j)0 < θ(j)1 < ⋅ ⋅ ⋅ < θ(j)Kj−1 < θ(j)Kj
= +∞, j = 1,2, . . . , p;
Las variables ordinales X y las variables latentes Z estanrelacionadas mediante:
Pr(Xj = k∣Y ) = Pr(θ(j)k−1 ≤ Zj < θ(j)k ∣Y );
Se asume Z∣Y ∼ N(βfY ,∆)Con la ayuda de la teorıa de normalidad encontramos lareduccion suficiente para las observadas X.
![Page 121: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/121.jpg)
RSD para Categorıas Ordinales
p variables aleatorias ordinales X = (X1,X2, . . . ,Xp)T , conXj ∈ 1,2, . . . ,Kj;
Respuesta Y ∈ R;
p variables latentes Z = (Z1, Z2, . . . , Zp)T ;
Conjunto de umbrales Θ = θ(j)0 , θ(j)1 , . . . , θ
(j)Kj, donde
−∞ = θ(j)0 < θ(j)1 < ⋅ ⋅ ⋅ < θ(j)Kj−1 < θ(j)Kj
= +∞, j = 1,2, . . . , p;
Las variables ordinales X y las variables latentes Z estanrelacionadas mediante:
Pr(Xj = k∣Y ) = Pr(θ(j)k−1 ≤ Zj < θ(j)k ∣Y );
Se asume Z∣Y ∼ N(βfY ,∆)Con la ayuda de la teorıa de normalidad encontramos lareduccion suficiente para las observadas X.
![Page 122: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/122.jpg)
RSD para Categorıas Ordinales
p variables aleatorias ordinales X = (X1,X2, . . . ,Xp)T , conXj ∈ 1,2, . . . ,Kj;
Respuesta Y ∈ R;
p variables latentes Z = (Z1, Z2, . . . , Zp)T ;
Conjunto de umbrales Θ = θ(j)0 , θ(j)1 , . . . , θ
(j)Kj, donde
−∞ = θ(j)0 < θ(j)1 < ⋅ ⋅ ⋅ < θ(j)Kj−1 < θ(j)Kj
= +∞, j = 1,2, . . . , p;
Las variables ordinales X y las variables latentes Z estanrelacionadas mediante:
Pr(Xj = k∣Y ) = Pr(θ(j)k−1 ≤ Zj < θ(j)k ∣Y );
Se asume Z∣Y ∼ N(βfY ,∆)
Con la ayuda de la teorıa de normalidad encontramos lareduccion suficiente para las observadas X.
![Page 123: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/123.jpg)
RSD para Categorıas Ordinales
p variables aleatorias ordinales X = (X1,X2, . . . ,Xp)T , conXj ∈ 1,2, . . . ,Kj;
Respuesta Y ∈ R;
p variables latentes Z = (Z1, Z2, . . . , Zp)T ;
Conjunto de umbrales Θ = θ(j)0 , θ(j)1 , . . . , θ
(j)Kj, donde
−∞ = θ(j)0 < θ(j)1 < ⋅ ⋅ ⋅ < θ(j)Kj−1 < θ(j)Kj
= +∞, j = 1,2, . . . , p;
Las variables ordinales X y las variables latentes Z estanrelacionadas mediante:
Pr(Xj = k∣Y ) = Pr(θ(j)k−1 ≤ Zj < θ(j)k ∣Y );
Se asume Z∣Y ∼ N(βfY ,∆)Con la ayuda de la teorıa de normalidad encontramos lareduccion suficiente para las observadas X.
![Page 124: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/124.jpg)
Aplicacion usando EPH-Argentina
EPH 3er. trimestre de 2013 (INDEC).
9 predictores ordinales.
Heterogeneidad regional Estimacion de diferentes Ipara 5 regiones (GBA, Pampeana, NOA, NEA yPatagonia).
2 tipos de respuesta (Y ): una continua (ingreso per capitadel hogar) y una dicotomica (pobreza).
Estimacion: EM + seleccion de variables .
Evaluacion: El metodo aquı propuesto PFCORD vs. 2variantes del PCA que contemplan predictorescategoricos: no lineal (NLPCA) y con polychoriccorrelations (PCAPOLY)
![Page 125: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/125.jpg)
Aplicacion usando EPH-Argentina
EPH 3er. trimestre de 2013 (INDEC).
9 predictores ordinales.
Heterogeneidad regional Estimacion de diferentes Ipara 5 regiones (GBA, Pampeana, NOA, NEA yPatagonia).
2 tipos de respuesta (Y ): una continua (ingreso per capitadel hogar) y una dicotomica (pobreza).
Estimacion: EM + seleccion de variables .
Evaluacion: El metodo aquı propuesto PFCORD vs. 2variantes del PCA que contemplan predictorescategoricos: no lineal (NLPCA) y con polychoriccorrelations (PCAPOLY)
![Page 126: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/126.jpg)
Aplicacion usando EPH-Argentina
EPH 3er. trimestre de 2013 (INDEC).
9 predictores ordinales.
Heterogeneidad regional Estimacion de diferentes Ipara 5 regiones (GBA, Pampeana, NOA, NEA yPatagonia).
2 tipos de respuesta (Y ): una continua (ingreso per capitadel hogar) y una dicotomica (pobreza).
Estimacion: EM + seleccion de variables .
Evaluacion: El metodo aquı propuesto PFCORD vs. 2variantes del PCA que contemplan predictorescategoricos: no lineal (NLPCA) y con polychoriccorrelations (PCAPOLY)
![Page 127: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/127.jpg)
Aplicacion usando EPH-Argentina
EPH 3er. trimestre de 2013 (INDEC).
9 predictores ordinales.
Heterogeneidad regional Estimacion de diferentes Ipara 5 regiones (GBA, Pampeana, NOA, NEA yPatagonia).
2 tipos de respuesta (Y ): una continua (ingreso per capitadel hogar) y una dicotomica (pobreza).
Estimacion: EM + seleccion de variables .
Evaluacion: El metodo aquı propuesto PFCORD vs. 2variantes del PCA que contemplan predictorescategoricos: no lineal (NLPCA) y con polychoriccorrelations (PCAPOLY)
![Page 128: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/128.jpg)
Aplicacion usando EPH-Argentina
EPH 3er. trimestre de 2013 (INDEC).
9 predictores ordinales.
Heterogeneidad regional Estimacion de diferentes Ipara 5 regiones (GBA, Pampeana, NOA, NEA yPatagonia).
2 tipos de respuesta (Y ): una continua (ingreso per capitadel hogar) y una dicotomica (pobreza).
Estimacion: EM + seleccion de variables .
Evaluacion: El metodo aquı propuesto PFCORD vs. 2variantes del PCA que contemplan predictorescategoricos: no lineal (NLPCA) y con polychoriccorrelations (PCAPOLY)
![Page 129: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/129.jpg)
Aplicacion usando EPH-Argentina
EPH 3er. trimestre de 2013 (INDEC).
9 predictores ordinales.
Heterogeneidad regional Estimacion de diferentes Ipara 5 regiones (GBA, Pampeana, NOA, NEA yPatagonia).
2 tipos de respuesta (Y ): una continua (ingreso per capitadel hogar) y una dicotomica (pobreza).
Estimacion: EM + seleccion de variables .
Evaluacion: El metodo aquı propuesto PFCORD vs. 2variantes del PCA que contemplan predictorescategoricos: no lineal (NLPCA) y con polychoriccorrelations (PCAPOLY)
![Page 130: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/130.jpg)
Performance del metodo
Table: 10-fold MSE para el ındice I
Prediction Errors -MSEResponse Method Buenos Aires Humid Pampas Northwest Northeast Patagonia
Per capita Income ORIG-I 7.22 4.69 4.68 3.32 13.14(continuous) (3.50) (0.88) (2.47) (0.93) (3.34)
PCAPOLY 7.60 5.10 5.07 3.68 14.7(2.45) (0.90) (1.77) (0.90) (4.01)
NLPCA 7.38 4.95 4.89 3.52 13.67(2.29) (0.61) (1.48) (0.65) (3.71)
PFCORD 7.26 4.73 4.71 3.30 13.20(2.75) (1.66) (2.75) (1.35) (3.34)
Poverty ORIG-I 0.202 0.162 0.274 0.287 0.129(discrete) (0.021) (0.008) (0.026) (0.036) (0.020)
PCAPOLY 0.229 0.204 0.366 0.390 0.132(0.028) (0.018) (0.023) (0.063) (0.025)
NLPCA 0.228 0.186 0.302 0.290 0.161(0.021) (0.019) (0.019) (0.018) (0.016)
PFCORD 0.208 0.167 0.279 0.287 0.129(0.015) (0.011) (0.028) (0.028) (0.022)
Note: standard deviations in parentheses. Database: EPH (2013)
![Page 131: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/131.jpg)
Performance del metodo
0.0 0.2 0.4 0.6 0.8 1.0
010
2030
SES_PCApoly
ipcf
^0.3
3
Data Model
0.0 0.2 0.4 0.6 0.8 1.0
05
1015
2025
3035
SES_PFCord
ipcf
^0.3
3
Data Model
Figure: Comparacion de Ajuste de modelo lineal (Ingreso ∼ I) PCA(izquierda) vs. PFCORD (derecha)
![Page 132: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/132.jpg)
Comparacion de los ponderadores (a) de I
1. La importancia relativa que tiene cada variable (i.e.predictores) es diferente
Table: Comparacion de ındices para predecir ingreso per capita en elhogar.
Variables Buenos AiresPFCORD PCAPOLY NLPCA
housing location 0 -0.1690 -0.0943housing quality -0.2455 -0.3768 -0.2199
sources of cooking fuel -0.4637 -0.3788 -0.2080overcrowding -0.7222 -0.2888 -0.1788
schooling -0.2860 -0.2275 -0.1474toilet drainage -0.1175 -0.3381 -0.2047
toilet facility 0 -0.4061 -0.2246toilet sharing 0 -0.2759 -0.1186
water location 0 -0.3918 -0.1790water source 0 -0.2023 -0.1033
working hours -0.3278 0 0
![Page 133: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/133.jpg)
Comparacion de los ponderadores (a) de I
1. La importancia relativa que tiene cada variable (i.e.predictores) es diferente
Table: Comparacion de ındices para predecir ingreso per capita en elhogar.
Variables Buenos AiresPFCORD PCAPOLY NLPCA
housing location 0 -0.1690 -0.0943housing quality -0.2455 -0.3768 -0.2199
sources of cooking fuel -0.4637 -0.3788 -0.2080overcrowding -0.7222 -0.2888 -0.1788
schooling -0.2860 -0.2275 -0.1474toilet drainage -0.1175 -0.3381 -0.2047
toilet facility 0 -0.4061 -0.2246toilet sharing 0 -0.2759 -0.1186
water location 0 -0.3918 -0.1790water source 0 -0.2023 -0.1033
working hours -0.3278 0 0
![Page 134: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/134.jpg)
Comparacion de los ponderadores (a) de I
1. La importancia relativa que tiene cada variable (i.e.predictores) es diferente
Table: Comparacion de ındices para predecir ingreso per capita en elhogar.
Variables Buenos AiresPFCORD PCAPOLY NLPCA
housing location 0 -0.1690 -0.0943housing quality -0.2455 -0.3768 -0.2199
sources of cooking fuel -0.4637 -0.3788 -0.2080overcrowding -0.7222 -0.2888 -0.1788
schooling -0.2860 -0.2275 -0.1474toilet drainage -0.1175 -0.3381 -0.2047
toilet facility 0 -0.4061 -0.2246toilet sharing 0 -0.2759 -0.1186
water location 0 -0.3918 -0.1790water source 0 -0.2023 -0.1033
working hours -0.3278 0 0
![Page 135: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/135.jpg)
Comparacion de los ponderadores (a) de I
1. La importancia relativa que tiene cada variable (i.e.predictores) es diferente
Table: Comparacion de ındices para predecir ingreso per capita en elhogar.
Variables Buenos AiresPFCORD PCAPOLY NLPCA
housing location 0 -0.1690 -0.0943housing quality -0.2455 -0.3768 -0.2199
sources of cooking fuel -0.4637 -0.3788 -0.2080overcrowding -0.7222 -0.2888 -0.1788
schooling -0.2860 -0.2275 -0.1474toilet drainage -0.1175 -0.3381 -0.2047
toilet facility 0 -0.4061 -0.2246toilet sharing 0 -0.2759 -0.1186
water location 0 -0.3918 -0.1790water source 0 -0.2023 -0.1033
working hours -0.3278 0 0
![Page 136: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/136.jpg)
Comparacion de los ponderadores (a) de I
2. Mientras que PCA da pesos muy similares para lasdiferentes regiones, el ındice PFCORD logra captar las
divergencias regionales
Ejemplo: PCA
Table: Indice PCAPOLY por regiones. Respuesta Ingreso per capita
Variables GBA Pampeana NOA NEA Patag.PCA PCA PCA PCA PCA
housing location -0.1690 -0.1903 -0.1068 -0.1809 -0.1437housing quality -0.3768 -0.3557 -0.3278 -0.3727 -0.3258
sources of cooking fuel -0.3788 -0.3609 -0.3287 -0.1648 -0.4026overcrowding -0.2888 -0.2351 -0.1991 -0.2025 -0.2207
schooling -0.2275 -0.2075 -0.2197 -0.1869 -0.1284toilet drainage -0.3381 -0.3519 -0.3623 -0.3572 -0.4122
toilet facility -0.4061 -0.4105 -0.4217 -0.4383 -0.4376toilet sharing -0.2759 -0.3176 -0.2579 -0.2921 -0.2937
water location -0.3918 -0.3933 -0.4202 -0.4227 -0.4169water source -0.2023 -0.2461 -0.3646 -0.3733 -0.1525
working hours 0 0 0 0 0
![Page 137: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/137.jpg)
Comparacion de los ponderadores (a) de I
2. Mientras que PCA da pesos muy similares para lasdiferentes regiones, el ındice PFCORD logra captar las
divergencias regionales
Ejemplo: PCA
Table: Indice PCAPOLY por regiones. Respuesta Ingreso per capita
Variables GBA Pampeana NOA NEA Patag.PCA PCA PCA PCA PCA
housing location -0.1690 -0.1903 -0.1068 -0.1809 -0.1437housing quality -0.3768 -0.3557 -0.3278 -0.3727 -0.3258
sources of cooking fuel -0.3788 -0.3609 -0.3287 -0.1648 -0.4026overcrowding -0.2888 -0.2351 -0.1991 -0.2025 -0.2207
schooling -0.2275 -0.2075 -0.2197 -0.1869 -0.1284toilet drainage -0.3381 -0.3519 -0.3623 -0.3572 -0.4122
toilet facility -0.4061 -0.4105 -0.4217 -0.4383 -0.4376toilet sharing -0.2759 -0.3176 -0.2579 -0.2921 -0.2937
water location -0.3918 -0.3933 -0.4202 -0.4227 -0.4169water source -0.2023 -0.2461 -0.3646 -0.3733 -0.1525
working hours 0 0 0 0 0
![Page 138: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/138.jpg)
Comparacion de los ponderadores (a) de I
2. Mientras que PCA da pesos muy similares para lasdiferentes regiones, el ındice PFCORD logra captar las
divergencias regionales
Ejemplo: PCA
Table: Indice PCAPOLY por regiones. Respuesta Ingreso per capita
Variables GBA Pampeana NOA NEA Patag.PCA PCA PCA PCA PCA
housing location -0.1690 -0.1903 -0.1068 -0.1809 -0.1437housing quality -0.3768 -0.3557 -0.3278 -0.3727 -0.3258
sources of cooking fuel -0.3788 -0.3609 -0.3287 -0.1648 -0.4026overcrowding -0.2888 -0.2351 -0.1991 -0.2025 -0.2207
schooling -0.2275 -0.2075 -0.2197 -0.1869 -0.1284toilet drainage -0.3381 -0.3519 -0.3623 -0.3572 -0.4122
toilet facility -0.4061 -0.4105 -0.4217 -0.4383 -0.4376toilet sharing -0.2759 -0.3176 -0.2579 -0.2921 -0.2937
water location -0.3918 -0.3933 -0.4202 -0.4227 -0.4169water source -0.2023 -0.2461 -0.3646 -0.3733 -0.1525
working hours 0 0 0 0 0
![Page 139: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/139.jpg)
Comparacion de los ponderadores (a) de I
Para nuestro metodo propuesto:
Table: Indice con PFCORD por regiones. Respuesta Ingreso percapita
Variables GBA Pampeana NOA NEA Patag.PFC PFC PFC PFC PFC
housing location 0 0 -0.1412 -0.1677 -0.1105housing quality -0.2455 -0.3077 -0.1195 -0.0858 -0.3341
sources of cooking fuel -0.4637 -0.3735 -0.1340 -0.0920 -0.1926overcrowding -0.7222 -0.8086 -0.8556 -0.8367 -0.7447
schooling -0.2860 -0.2703 -0.3556 -0.3364 -0.3807toilet drainage -0.1175 0 -0.1153 0 -0.1406
toilet facility 0 -0.1214 -0.0927 -0.0743 0toilet sharing 0 0 0 -0.2369 -0.1242
water location 0 0 -0.2119 -0.1058 0water source 0 0 -0.0787 -0.2423 0.1956
working hours -0.3278 -0.1555 -0.1279 -0.1054 -0.2570
![Page 140: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/140.jpg)
Comparacion de los ponderadores (a) de I
Para nuestro metodo propuesto:
Table: Indice con PFCORD por regiones. Respuesta Ingreso percapita
Variables GBA Pampeana NOA NEA Patag.PFC PFC PFC PFC PFC
housing location 0 0 -0.1412 -0.1677 -0.1105housing quality -0.2455 -0.3077 -0.1195 -0.0858 -0.3341
sources of cooking fuel -0.4637 -0.3735 -0.1340 -0.0920 -0.1926overcrowding -0.7222 -0.8086 -0.8556 -0.8367 -0.7447
schooling -0.2860 -0.2703 -0.3556 -0.3364 -0.3807toilet drainage -0.1175 0 -0.1153 0 -0.1406
toilet facility 0 -0.1214 -0.0927 -0.0743 0toilet sharing 0 0 0 -0.2369 -0.1242
water location 0 0 -0.2119 -0.1058 0water source 0 0 -0.0787 -0.2423 0.1956
working hours -0.3278 -0.1555 -0.1279 -0.1054 -0.2570
![Page 141: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/141.jpg)
Comparacion de los ponderadores (a) de I
3. Impacto de la variable respuesta
Table: PFCORD ordinal segun Variable respuesta.
Respuesta: Ingreso (pc) PobrezaGBA PAMPEANA GBA PAMPEANA
housing location 0 0 0 0housing quality -0.2455 -0.3077 -0.3940 -0.3561
sources of cooking fuel -0.4637 -0.3735 -0.4629 -0.3490overcrowding -0.7222 -0.8086 -0.6865 -0.7133
schooling -0.2860 -0.2703 0 0toilet drainage -0.1175 0 0 0
toilet facility 0 -0.1214 -0.2426 -0.3538toilet sharing 0 0 -0.1729 -0.1350
water location 0 0 -0.2231 -0.2612water source 0 0 0 0
working hours -0.3278 -0.1555 -0.2378 -0.1557
![Page 142: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/142.jpg)
Comparacion de los ponderadores (a) de I
3. Impacto de la variable respuesta
Table: PFCORD ordinal segun Variable respuesta.
Respuesta: Ingreso (pc) PobrezaGBA PAMPEANA GBA PAMPEANA
housing location 0 0 0 0housing quality -0.2455 -0.3077 -0.3940 -0.3561
sources of cooking fuel -0.4637 -0.3735 -0.4629 -0.3490overcrowding -0.7222 -0.8086 -0.6865 -0.7133
schooling -0.2860 -0.2703 0 0toilet drainage -0.1175 0 0 0
toilet facility 0 -0.1214 -0.2426 -0.3538toilet sharing 0 0 -0.1729 -0.1350
water location 0 0 -0.2231 -0.2612water source 0 0 0 0
working hours -0.3278 -0.1555 -0.2378 -0.1557
![Page 143: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/143.jpg)
Comparacion de los ponderadores (a) de I
3. Impacto de la variable respuesta
Table: PFCORD ordinal segun Variable respuesta.
Respuesta: Ingreso (pc) PobrezaGBA PAMPEANA GBA PAMPEANA
housing location 0 0 0 0housing quality -0.2455 -0.3077 -0.3940 -0.3561
sources of cooking fuel -0.4637 -0.3735 -0.4629 -0.3490overcrowding -0.7222 -0.8086 -0.6865 -0.7133
schooling -0.2860 -0.2703 0 0toilet drainage -0.1175 0 0 0
toilet facility 0 -0.1214 -0.2426 -0.3538toilet sharing 0 0 -0.1729 -0.1350
water location 0 0 -0.2231 -0.2612water source 0 0 0 0
working hours -0.3278 -0.1555 -0.2378 -0.1557
![Page 144: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/144.jpg)
Conclusiones
Creciente interes en el analisis cuantitativo de polıticas yprogramas sociales.
Indices de estatus socio-economico predominancia dePCA.
El enfoque de RSD permite usar la informacion de lavariable respuesta:
Mejor prediccion de la respuesta de interes.
Diferentes ponderaciones respecto de PCA.
Capta diferencias regionales.
Sensibilidad ante la variable respuesta que caracteriza elfenomeno social de interes.
![Page 145: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/145.jpg)
Extensiones
Adaptaciones a predictores de distinta naturaleza.
Descubrir asociaciones entre variables en grandes basesde datos.
Desarrollar metodos especialmente adaptados para redesbiologicas.
Regularizacion estructurada para seleccion eficiente devariables.
![Page 146: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/146.jpg)
Extensiones
Adaptaciones a predictores de distinta naturaleza. Con el
ejemplo de datos de cancer de pulmon vimos que seobtienen mejores resultados adaptando la metodologa dereduccin suficiente a la naturaleza de los predictores.
Podemos hacer lo mismo cuando tenemos mezclas devariables continuas, categoricas, ordinales, dicotomicas, ...
Descubrir asociaciones entre variables en grandes basesde datos.
Desarrollar metodos especialmente adaptados para redesbiologicas.
Regularizacion estructurada para seleccion eficiente devariables.
![Page 147: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/147.jpg)
Extensiones
Adaptaciones a predictores de distinta naturaleza.
Descubrir asociaciones entre variables en grandes basesde datos.
Desarrollar metodos especialmente adaptados para redesbiologicas.
Regularizacion estructurada para seleccion eficiente devariables.
![Page 148: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/148.jpg)
Extensiones
Adaptaciones a predictores de distinta naturaleza.
Descubrir asociaciones entre variables en grandes basesde datos.
Objetivo: detectar interacciones y relaciones no linealesusando diferentes medidas de dependencia estadısticapropuestas recientemente y/o modelandolo comoregresion multivariada
Desarrollar metodos especialmente adaptados para redesbiologicas.
Regularizacion estructurada para seleccion eficiente devariables.
![Page 149: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/149.jpg)
Extensiones
Adaptaciones a predictores de distinta naturaleza.
Descubrir asociaciones entre variables en grandes basesde datos.
Desarrollar metodos especialmente adaptados para redesbiologicas.
Regularizacion estructurada para seleccion eficiente devariables.
![Page 150: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/150.jpg)
Extensiones
Adaptaciones a predictores de distinta naturaleza.
Descubrir asociaciones entre variables en grandes basesde datos.
Desarrollar metodos especialmente adaptados para redesbiologicas. Funciones biologicas basicas (metabolicas,
regulatorias) se relacionan con pathways, no con genesaislados. Podemos usar conceptos de analisis armonicoen grafos y semigrupos para capturar la estructura de losdatos.
Regularizacion estructurada para seleccion eficiente devariables.
![Page 151: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/151.jpg)
Extensiones
Adaptaciones a predictores de distinta naturaleza.
Descubrir asociaciones entre variables en grandes basesde datos.
Desarrollar metodos especialmente adaptados para redesbiologicas.
Regularizacion estructurada para seleccion eficiente devariables.
![Page 152: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/152.jpg)
Extensiones
Adaptaciones a predictores de distinta naturaleza.
Descubrir asociaciones entre variables en grandes basesde datos.
Desarrollar metodos especialmente adaptados para redesbiologicas.
Regularizacion estructurada para seleccion eficiente devariables. grupos de variables que influyen de maneracoordinada sobre la respuesta.
![Page 153: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/153.jpg)
Extensiones
Adaptaciones a predictores de distinta naturaleza.
Descubrir asociaciones entre variables en grandes basesde datos.
Desarrollar metodos especialmente adaptados para redesbiologicas.
Regularizacion estructurada para seleccion eficiente devariables.
![Page 154: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/154.jpg)
Extensiones
Adaptaciones a predictores de distinta naturaleza.
Descubrir asociaciones entre variables en grandes basesde datos.
Desarrollar metodos especialmente adaptados para redesbiologicas.
Regularizacion estructurada para seleccion eficiente devariables.
![Page 155: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/155.jpg)
Extensiones
Adaptaciones a predictores de distinta naturaleza.
Descubrir asociaciones entre variables en grandes basesde datos.
Desarrollar metodos especialmente adaptados para redesbiologicas.
Regularizacion estructurada para seleccion eficiente devariables.. . .
![Page 156: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/156.jpg)
Teorıa
Usando modelos para la reduccion inversa encontramos R(X)que no pierda informacion que X tiene sobre Y
La teorıa se puede dividir en las siguientes contribuciones
Encontrar la RS teorica para las diferentes naturaleza delas variablesEncontrar estimadores los mas eficientes posiblesDar un error a las estimaciones (importantısimo)Probar que se puede substituir X por R(X) para predecirY ∣R(X) o para modelar Y ∣R(X).
Trabajo actual: p > n. Avances en PFC escencialmente yalgunos metodos de regresion directa. En la practica yteorıa: aun cuando no se consiguen buenos estimadoresde la reduccion suficiente, en prediccion (cuandorealmente incorporo informacion al hacer crecer p) tengobuenos resultados
![Page 157: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/157.jpg)
Teorıa
Usando modelos para la reduccion inversa encontramos R(X)que no pierda informacion que X tiene sobre Y
La teorıa se puede dividir en las siguientes contribuciones
Encontrar la RS teorica para las diferentes naturaleza delas variablesEncontrar estimadores los mas eficientes posiblesDar un error a las estimaciones (importantısimo)Probar que se puede substituir X por R(X) para predecirY ∣R(X) o para modelar Y ∣R(X).
Trabajo actual: p > n. Avances en PFC escencialmente yalgunos metodos de regresion directa. En la practica yteorıa: aun cuando no se consiguen buenos estimadoresde la reduccion suficiente, en prediccion (cuandorealmente incorporo informacion al hacer crecer p) tengobuenos resultados
![Page 158: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/158.jpg)
Teorıa
Usando modelos para la reduccion inversa encontramos R(X)que no pierda informacion que X tiene sobre Y
La teorıa se puede dividir en las siguientes contribuciones
Encontrar la RS teorica para las diferentes naturaleza delas variables
Encontrar estimadores los mas eficientes posiblesDar un error a las estimaciones (importantısimo)Probar que se puede substituir X por R(X) para predecirY ∣R(X) o para modelar Y ∣R(X).
Trabajo actual: p > n. Avances en PFC escencialmente yalgunos metodos de regresion directa. En la practica yteorıa: aun cuando no se consiguen buenos estimadoresde la reduccion suficiente, en prediccion (cuandorealmente incorporo informacion al hacer crecer p) tengobuenos resultados
![Page 159: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/159.jpg)
Teorıa
Usando modelos para la reduccion inversa encontramos R(X)que no pierda informacion que X tiene sobre Y
La teorıa se puede dividir en las siguientes contribuciones
Encontrar la RS teorica para las diferentes naturaleza delas variablesEncontrar estimadores los mas eficientes posibles
Dar un error a las estimaciones (importantısimo)Probar que se puede substituir X por R(X) para predecirY ∣R(X) o para modelar Y ∣R(X).
Trabajo actual: p > n. Avances en PFC escencialmente yalgunos metodos de regresion directa. En la practica yteorıa: aun cuando no se consiguen buenos estimadoresde la reduccion suficiente, en prediccion (cuandorealmente incorporo informacion al hacer crecer p) tengobuenos resultados
![Page 160: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/160.jpg)
Teorıa
Usando modelos para la reduccion inversa encontramos R(X)que no pierda informacion que X tiene sobre Y
La teorıa se puede dividir en las siguientes contribuciones
Encontrar la RS teorica para las diferentes naturaleza delas variablesEncontrar estimadores los mas eficientes posiblesDar un error a las estimaciones (importantısimo)
Probar que se puede substituir X por R(X) para predecirY ∣R(X) o para modelar Y ∣R(X).
Trabajo actual: p > n. Avances en PFC escencialmente yalgunos metodos de regresion directa. En la practica yteorıa: aun cuando no se consiguen buenos estimadoresde la reduccion suficiente, en prediccion (cuandorealmente incorporo informacion al hacer crecer p) tengobuenos resultados
![Page 161: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/161.jpg)
Teorıa
Usando modelos para la reduccion inversa encontramos R(X)que no pierda informacion que X tiene sobre Y
La teorıa se puede dividir en las siguientes contribuciones
Encontrar la RS teorica para las diferentes naturaleza delas variablesEncontrar estimadores los mas eficientes posiblesDar un error a las estimaciones (importantısimo)Probar que se puede substituir X por R(X) para predecirY ∣R(X) o para modelar Y ∣R(X).
Trabajo actual: p > n. Avances en PFC escencialmente yalgunos metodos de regresion directa. En la practica yteorıa: aun cuando no se consiguen buenos estimadoresde la reduccion suficiente, en prediccion (cuandorealmente incorporo informacion al hacer crecer p) tengobuenos resultados
![Page 162: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/162.jpg)
Teorıa
Usando modelos para la reduccion inversa encontramos R(X)que no pierda informacion que X tiene sobre Y
La teorıa se puede dividir en las siguientes contribuciones
Encontrar la RS teorica para las diferentes naturaleza delas variablesEncontrar estimadores los mas eficientes posiblesDar un error a las estimaciones (importantısimo)Probar que se puede substituir X por R(X) para predecirY ∣R(X) o para modelar Y ∣R(X).
Trabajo actual: p > n. Avances en PFC escencialmente yalgunos metodos de regresion directa. En la practica yteorıa: aun cuando no se consiguen buenos estimadoresde la reduccion suficiente, en prediccion (cuandorealmente incorporo informacion al hacer crecer p) tengobuenos resultados
![Page 163: Yo tambien soy una chica Calder´ on´ · 2020. 4. 5. · Que pasa cuando la cantidad de predictores´ aumenta? Difcil comprension de la relaci´ on entre predictores y´ respuesta](https://reader036.fdocuments.mx/reader036/viewer/2022071413/610b15b2e11ade7f4d076dfe/html5/thumbnails/163.jpg)
GRACIAS!