Manual Stata Basico
date post
16-Oct-2015Category
Documents
view
253download
8
Embed Size (px)
Transcript of Manual Stata Basico
StataBasico
Aplicado a la Investigacion Economica
Juan Carlos Abanto Orihuela
25 de enero de 2013
2Stata BasicoAplicado a la Investigacion Economica
www.giddea.com
administracion@giddea.com
Indice general
Indice general 3
1. Introduccion al Stata 51.1. Iniciando Stata . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2. Tipos de Archivos en Stata . . . . . . . . . . . . . . . . . . . . . 61.3. Estructura Basica de Stata . . . . . . . . . . . . . . . . . . . . . 61.4. Principales Comandos de Trabajo y Analisis . . . . . . . . . . . 7
1.4.1. Las Bitacoras . . . . . . . . . . . . . . . . . . . . . . . . 71.4.2. La Base de Datos . . . . . . . . . . . . . . . . . . . . . . 71.4.3. Append, Merge, Collapse . . . . . . . . . . . . . . . . . . 9
2. Manejo de Datos 152.1. Cargando los Datos en Stata . . . . . . . . . . . . . . . . . . . . 152.2. Etiquetas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.3. Comando IF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.4. Comando SUMMARIZE . . . . . . . . . . . . . . . . . . . . . . 182.5. Comando SPLIT . . . . . . . . . . . . . . . . . . . . . . . . . . 182.6. Creando Variables . . . . . . . . . . . . . . . . . . . . . . . . . . 192.7. KEEP y DROP . . . . . . . . . . . . . . . . . . . . . . . . . . . 222.8. Reestructurando los Datos . . . . . . . . . . . . . . . . . . . . . 242.9. Muestreos Probabilsticos . . . . . . . . . . . . . . . . . . . . . . 262.10. Generacion de Numeros Aleatorios . . . . . . . . . . . . . . . . 262.11. Percentiles, Cuartiles, Deciles . . . . . . . . . . . . . . . . . . . 27
3. Analisis Grafico con Stata 313.1. Visualizando Algunos Comandos . . . . . . . . . . . . . . . . . 313.2. TWOWAY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.3. TWOWAY y SCATTERPLOT . . . . . . . . . . . . . . . . . . 383.4. Combinando TWOWAY Y SCATTERPLOT . . . . . . . . . . . 40
3.4.1. Filtro de Graficos . . . . . . . . . . . . . . . . . . . . . . 403.4.2. Union de Graficos . . . . . . . . . . . . . . . . . . . . . . 40
3.5. Opciones para Edicion de Graficos . . . . . . . . . . . . . . . . . 433.6. Trabajando con Esquemas y Graficos Adicionales . . . . . . . . 47
3
4 INDICE GENERAL
3.6.1. Esquemas . . . . . . . . . . . . . . . . . . . . . . . . . . 473.6.2. Graficos de Barras Verticales . . . . . . . . . . . . . . . . 493.6.3. Graficos de Barras Horizontales . . . . . . . . . . . . . . 493.6.4. Graficos de Cajas . . . . . . . . . . . . . . . . . . . . . . 503.6.5. Graficos de Pastel . . . . . . . . . . . . . . . . . . . . . . 51
4. Analisis de Regresion Lineal 554.1. Regresion Lineal . . . . . . . . . . . . . . . . . . . . . . . . . . 554.2. Diagnostico de los Resultados . . . . . . . . . . . . . . . . . . . 59
4.2.1. Efecto Influencia . . . . . . . . . . . . . . . . . . . . . . 594.3. Normalidad del Residuo . . . . . . . . . . . . . . . . . . . . . . 624.4. Homocedasticidad del Residuo . . . . . . . . . . . . . . . . . . . 634.5. Multicolinealidad . . . . . . . . . . . . . . . . . . . . . . . . . . 644.6. Linealidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644.7. Especificacion del modelo . . . . . . . . . . . . . . . . . . . . . 654.8. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5. Variables Categoricas 695.1. Estimacion con Variables Categoricas . . . . . . . . . . . . . . . 695.2. El Comando Xi . . . . . . . . . . . . . . . . . . . . . . . . . . . 705.3. Pruebas de Hipotesis . . . . . . . . . . . . . . . . . . . . . . . . 725.4. Creacion de Variables Dummys . . . . . . . . . . . . . . . . . . 755.5. Bucles y Programas . . . . . . . . . . . . . . . . . . . . . . . . . 75
Bibliografa 79
Stata BasicoAplicado a la Investigacion Economica
www.giddea.com
administracion@giddea.com
Sesion 1Introduccion al Stata
1.1. Iniciando Stata
Stata es una poderosa herramienta en aplicaciones economicas. Puede ayu-darnos a analizar facil y eficientemente, series de tiempo, paneles, y data deseccion cruzada. Nos dara las herramientas que necesitamos para organizar ymanejar un gran tamano de data, obteniendo resultados de analisis estadsti-cos.
En esta sesion introduciremos las nociones basicas del software, para pos-teriormente realizar un analisis estadstico y familiarizarnos con el manejo ymodificacion de la base de datos.
Veamos como se presenta Stata al iniciarse. (ver Figura 1.1)
Figura 1.1: Pantalla de Inicio
5
6 1. Introduccion al Stata
Los comandos de stata estan implementados en el menu el cual esta organizadopor topicos. As nosotros podemos trabajar interactivamente y de manera muysimple, sin embargo sigue siendo util el uso de comandos para realizar el analisisdado que da pie al manejo de programas, o estructuras de programacion. (verFigura 1.2)
Figura 1.2: Barra de Comandos
1.2. Tipos de Archivos en Stata
En STATA, distinguimos 3 tipos de archivos importantes:
Archivo de extension dta, para la generacion de base de datos, en ella sealmacenara informacion de las variables con su respectiva extension.
Archivo de extension log, smcl, para la generacion de bitacoras, en ella seguardaran los resultados de manera ordenada, sin tener que pasarlos a ninguntipo de archivo de texto.
Archivo de extension do, que es un archivo de ejecucion, donde se elaborael programa.
Archivo de extension gph, para la generacion de graficos almacenados enla carpeta de trabajo
1.3. Estructura Basica de Stata
Siempre que trabajemos en STATA, es recomendable que mantengamoscierta estructura. (ver Figura 1.3)
Stata BasicoAplicado a la Investigacion Economica
www.giddea.com
administracion@giddea.com
1.4. Principales Comandos de Trabajo y Analisis 7
Figura 1.3: Estructura Basica
1.4. Principales Comandos de Trabajo y Anali-
sis
Ahora veamos los principales comandos de trabajo, los cuales haran quelos futuros analisis econometricos sean simples de realizar.
1.4.1. Las Bitacoras
En estos objetos se guardara la informacion tal y cual aparecen en la ven-tana Result, aunque tambien podramos indicarle al programa que deseamossolo guardar los comandos y no los resultados.
log using clase1.logo tambien
cmdlog using clase1.log
1.4.2. La Base de Datos
El uso de la base de datos es vital para nuestro analisis, a continuacionpresentamos los comandos que nos ensenara a trabajar con esta.
use auto.dta
Stata BasicoAplicado a la Investigacion Economica
www.giddea.com
administracion@giddea.com
8 1. Introduccion al Stata
use auto.dta if foreign==1
use auto.dta in 1/10
use make mpg using auto.dta
save auto01.dta
Repasemos lo que hemos aprendido:Ya sabemos como limpiar la memoria de Stata, tambien sabemos como ampliaresta memoria para trabajar con data de gran capacidad. Sabemos como fijarel path de trabajo, como crear una rutina y como cargar la base de datos anuestro espacio de trabajo. Ahora vamos a trabajar con la base de datos paraempezar nuestro analisis.
use auto01.dta
browse
replace mpg=20 if mpg==19
save, replace
list make
list make price
describe
codebook
summarize mpg weight
summarize mpg weight if foreign
summarize price if mpg=21.3
summarize price, detail
tabulate mpg
table mpg
table rep78, contents(n mpg)
table rep78, contents(n mpg mean mpg sd mpg median mpg)
table rep78, c(n mpg mean mpg sd mpg median mpg) format(%9.2f)
sort mpg
gsort mpg
gsort -mpg
sort foreign
by foreign: summarize price
Stata BasicoAplicado a la Investigacion Economica
www.giddea.com
administracion@giddea.com
1.4. Principales Comandos de Trabajo y Analisis 9
count
count if foreign==0
count if foreign==1
by foreign: count
generate orden=_n
rename orden num_obs
by foreign: egen prom_mill=mean(mpg)
drop num_obs
keep make price mpg prom_mill
1.4.3. Append, Merge, Collapse
El comando append y merge nos ayudara a unir bases de datos integrando-las en una sola. Append, pegara hacia abajo o verticalmente y Merge, pegarahacia el costado o de forma horizontal.
clear
use base1, clear
list
use base2, clear
list
use base3, clear
list
use base4, clear
list
Vamos a empezar observando cada una de las bases de datos que tenemos,veamos la figura1.4 Empecemos nuestra tarea en Stata, podemos observar que
Figura 1.4: Bases de Datos
Stata BasicoAplicado a la Investigacion Economica
www.giddea.com
administracion@giddea.com
10 1. Introduccion al Stata
la base de datos Base1 tiene los mismos campos (columnas) que la base dedatos Base2, pero diferentes filas, seria util, unir ambas bases.
Abramos entonces, la base de datos Base1 y peguemosla con la base dedatos Base2, una union vertical.
use base1.dta, clear
list
append using base2
list
save base12.dta, replace
list
Hagamos lo mismo con las bases de datos Base3 y Base4 y observemos losresultados:
use base3.dta, clear
list
append using base4
list
save base34.dta, replace
list
Por que la variable la variable sexo se anadio 2 veces como columna?porque no se unio en una sola columna?
use base3.dta, clear
list
rename Sexo sexo
list
save base03.dta, replace
use base03.dta, clear
list
append using base4
list
save base034.dta, replace
Ahora si resulto bien la union vertical. Veamos la