Practica Dirigida Nº 106

5
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD CIENCIAS ECONOMICAS Dr. Víctor Pérez Suárez 1 2006 PROFESOR: Dr. VICTOR PEREZ SUAREZ Practica dirigida Nº 06 El objetivo de ésta práctica es realizar las estimaciones con modelos que tienen como variable dependiente una variable cualitativa. Nos basaremos en el ejemplo 19.1 del texto “Análisis Econométrico” de E. Greene. La evaluación del modelo de elección binaria consiste en analizar si una nueva metodología didáctica resulta eficaz en la enseñanza de la economía. Se tiene una muestra de 32 alumnos, con las siguientes datos para las variables. Donde la variable MEJORA es la dependiente: MEJORA Variable binaria que indica si el alumno mejoró o no su rendimiento. Variable endógena observada. CM Promedio de las calificaciones anteriores al proceso de aprendizaje del alumno. NP Nota del alumno en un examen previo al periodo de aprendizaje. PSI Variable binaria que indica si en el periodo de aprendizaje, el alumno estudió con el nuevo método didáctico. Se trata de estimar la probabilidad de que los calificativos de un alumno mejoraron, por lo tanto eso indicará que habrán mejorado su rendimiento académico (notas), luego de un período de aprendizaje, durante el cual se implementó una nueva metodología de enseñanza. La base de datos que contiene la información básica se llama Grene191. Existen varios modelos para determinar la probabilidad de los calificativos de los alumnos. Dichos métodos son: 1. Probabilidad lineal (MPL) 2. Función logística(LOGIT) 3. Función probabilística(PROBIT) Para el Método de Probabilidad Lineal(MPL),se tiene la siguiente función lineal: i i i i j i E PSI NP CM MEJORA 3 2 0 (1) Al estimar el modelo (1) se puede apreciar: que existen probabilidades mayores que 1 y menores que 0. Que no existe normalidad de los residuos. Que el valor del “r cuadrado” no es significativo y que existe heteroscedasticidad en el modelo, por que la varianza residual depende de la esperanza condicional de la variable dependiente. Para el método logístico(LOGIT) ) ( 1 ) 1 ( Pr x Y ob x x Distribución Acumulada Logística 2 1 ) 1 ( ) ( ) ( ) ( x x x d x d x Función de densidad

description

Practica

Transcript of Practica Dirigida Nº 106

Page 1: Practica Dirigida Nº 106

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD CIENCIAS ECONOMICAS

Dr. Víctor Pérez Suárez 1 2006

PROFESOR: Dr. VICTOR PEREZ SUAREZ

Practica dirigida Nº 06 El objetivo de ésta práctica es realizar las estimaciones con modelos que tienen como variable

dependiente una variable cualitativa. Nos basaremos en el ejemplo 19.1 del texto “Análisis

Econométrico” de E. Greene.

La evaluación del modelo de elección binaria consiste en analizar si una nueva metodología

didáctica resulta eficaz en la enseñanza de la economía. Se tiene una muestra de 32 alumnos, con

las siguientes datos para las variables. Donde la variable MEJORA es la dependiente:

MEJORA Variable binaria que indica si el alumno mejoró o no su

rendimiento. Variable endógena observada.

CM Promedio de las calificaciones anteriores al proceso de aprendizaje del alumno.

NP Nota del alumno en un examen previo al periodo de aprendizaje.

PSI Variable binaria que indica si en el periodo de aprendizaje, el alumno estudió con

el nuevo método didáctico.

Se trata de estimar la probabilidad de que los calificativos de un alumno mejoraron, por lo tanto eso

indicará que habrán mejorado su rendimiento académico (notas), luego de un período de aprendizaje, durante el cual se implementó una nueva metodología de enseñanza.

La base de datos que contiene la información básica se llama Grene191.

Existen varios modelos para determinar la probabilidad de los calificativos de los alumnos. Dichos

métodos son:

1. Probabilidad lineal (MPL) 2. Función logística(LOGIT)

3. Función probabilística(PROBIT)

Para el Método de Probabilidad Lineal(MPL),se tiene la siguiente función lineal:

iiiiji EPSINPCMMEJORA 320 (1)

Al estimar el modelo (1) se puede apreciar: que existen probabilidades mayores que 1 y menores

que 0. Que no existe normalidad de los residuos. Que el valor del “r cuadrado” no es significativo y que existe heteroscedasticidad en el modelo, por que la varianza residual depende de la esperanza

condicional de la variable dependiente.

Para el método logístico(LOGIT)

)(1

)1(Pr xYobx

x

Distribución Acumulada Logística

2

1

)1()(

)()(

x

x

xd

xdx

Función de densidad

Admin
Highlight
Admin
Highlight
Admin
Highlight
Admin
Highlight
Admin
Highlight
Page 2: Practica Dirigida Nº 106

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD CIENCIAS ECONOMICAS

Dr. Víctor Pérez Suárez 2 2006

)(log@)( xisticcx En Eviews. Calculo de la función acumulada

)(log@)(' xisticdx En Eviews. Calculo de la función de densidad

Para el método probabilístico

)()()1(Pr

'

xdttYob

x

Función Acumulativa de Probabilidad.

2

2

2

1)('

t

x

Función de densidad.

)(@)( xcnormx En Eviews. Calculo de la función acumulada.

)(@)(' xdnormx En Eviews. Calculo de la función de densidad.

Los modelos de elección binaria(LOGIT, PROBIT), excepto el Modelo de Probabilidad

Lineal(MPL), se estiman utilizando el método de máxima verosimilitud,

Pasos a seguir:

1. Calculemos: los valores medios de las variables independientes. Mean

Variable Dep=0 Dep=1 All

C 1.000000 1.000000 1.000000

CM 2.951905 3.432727 3.117188

NP 21.09524 23.54545 21.93750

PSI

0.285714 0.727273 0.437500

Page 3: Practica Dirigida Nº 106

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD CIENCIAS ECONOMICAS

Dr. Víctor Pérez Suárez 3 2006

2. Se resuelve la regresión utilizando el método de máxima verosimilitud. Para el caso LOGIT:

Dependent Variable: MEJORA

Method: ML - Binary Logit

Date: 10/25/01 Time: 15:01

Sample: 1 32

Included observations: 32

Convergence achieved after 5 iterations

Covariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C -13.02135 4.931317 -2.640541 0.0083

CM 2.826113 1.262940 2.237726 0.0252

NP 0.095158 0.141554 0.672235 0.5014

PSI 2.378688 1.064563 2.234426 0.0255

Mean dependent var 0.343750 S.D. dependent var 0.482559

S.E. of regression 0.384716 Akaike info criterion 1.055602

Sum squared resid 4.144171 Schwarz criterion 1.238819

Log likelihood -12.88963 Hannan-Quinn criter. 1.116333

Restr. log likelihood -20.59173 Avg. log likelihood -0.402801

LR statistic (3 df) 15.40419 McFadden R-squared 0.374038

Probability(LR stat) 0.001502

Obs with Dep=0 21 Total obs 32

Obs with Dep=1 11

Para el caso PROBIT: Dependent Variable: MEJORA Method: ML - Binary Probit Date: 10/25/01 Time: 15:05 Sample: 1 32 Included observations: 32 Convergence achieved after 5 iterations Covariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C -7.452320 2.542472 -2.931131 0.0034 CM 1.625810 0.693882 2.343063 0.0191 NP 0.051729 0.083890 0.616626 0.5375 PSI 1.426332 0.595038 2.397045 0.0165

Mean dependent var 0.343750 S.D. dependent var 0.482559 S.E. of regression 0.386128 Akaike info criterion 1.051175 Sum squared resid 4.174660 Schwarz criterion 1.234392 Log likelihood -12.81880 Hannan-Quinn criter. 1.111907 Restr. log likelihood -20.59173 Avg. log likelihood -0.400588 LR statistic (3 df) 15.54585 McFadden R-squared 0.377478 Probability(LR stat) 0.001405

Obs with Dep=0 21 Total obs 32 Obs with Dep=1 11

Page 4: Practica Dirigida Nº 106

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD CIENCIAS ECONOMICAS

Dr. Víctor Pérez Suárez 4 2006

3. Se genera un vector que contenga los valores medios de las variables. Para el PROBIT, en el archivo GREEN191P:

625540.04375.0*)4(9375.21*)3(117188.3*)2()1()( ccccx

Para el LOGIT, en el Archivo GREEN191L:

083626.14375.0*)4(9375.21*)3(117188.3*)2()1()( ccccx

4. Se calcula el factor de escala. Dicho valor es el valor de la variable dependiente cuando se

utiliza el vector de las medias en la función de densidad. Para el PROBIT: Para el LOGIT:

328.0)(@)(' xdnormx 189.0)(log@)(' xisticdx

5. Calculamos el valor de la probabilidad acumulada en las funciones acumulativas. Para el PROBIT: Para el LOGIT:

265808.0)(@)( xcnormx 252821.0)(log@)( xisticcx

6. Generemos un factor de escala que sea variable, para ello mantenemos a la variable CM,

utilizando el valor promedio para la variable NP, para la probabilidad condicional de MEJORA=1, dado PSI=0 y para la probabilidad condicional de MEJORA=1, dado PSI=1.

7. Se calcula PSI1 y PSI0, de la manera siguiente:

PSI1=c(1)+c(2)CM+0.052(21.938)+1.4263 PSI0=c(1)+c(2)CM+0.052(21.938)

8. Se halla la función FDA para PSI1 Y PSI0 FDAPSI1=@cnorm(PSI1) y FDAPSI0=@cnorm(PSI0

9. Luego , se grafica las dos funciones acumulativas FDAPSI1 y FDAPSI0 El efecto marginal del nuevo método didáctico es la diferencia entre éstas dos funciones.

Esto muestra que la probabilidad de que la nota de un estudiante mejore tras seguir un curso

con la nueva metodología, es mucho mayor en alumnos con alta calificación media que en

alumnos con baja calificación media(CM). Si la calificación media del estudiante es la media muestral de esta variable, es decir 3.117, la probabilidad de que mejore su nota

aumentará si ha llevado el nuevo método didáctico.

Page 5: Practica Dirigida Nº 106

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD CIENCIAS ECONOMICAS

Dr. Víctor Pérez Suárez 5 2006

Grafico de las funciones FDAPSI1 y FDAPSI0 en la ordenada y CM en la abscisa.

10. Para la interpretación del esquema de regresión de los modelos estimados por el método de máxima verosimilitud se debe considerar lo siguiente:

10.1 Utilizar la prueba de Wald para determinar si las variable son significativas.

10.2 Similar a la prueba F que se realiza con el método de los mínimos cuadrados. Se genera un estadístico Ji-Cuadrado con 3 grados de libertad. Este estadístico se forma

con la verosimilitud logarítmica restringida y la verosimilitud logarítmica no

restringida. Donde se realiza una prueba conjunta de que los coeficientes de las variables CM, NP, PSI son todos cero.

10.3 Similar al R cuadrado del método de los Mínimos Cuadrados, se analiza el indicador

MacFadden.