Post on 29-Jun-2015
description
“ANÁLISIS DISCRIMINANTE SPSS”
“ANÁLISIS DISCRIMINANTE SPSS”
Estudio de Caso: Mundo
UNIVERSIDAD GALILEO
FACULTAD DE CIENCIA, TECNOLOGÍA E INDUSTRIA
DOCTORADO EN ADMINISTRACIÓN CON
ESPECIALIDAD EN FINANZAS
ARQ. ALVARO COUTIÑO G Carnet 1300-4393
“ANÁLISIS DISCRIMINANTE SPSS”
1
INTRODUCCIÓN ............................................................................................................ 2
1. Información caso de estudio ..................................................................................... 2
OBSERVACIONES IMPORTANTES PARA ANALISIS DISCRIMINANTE. ............ 3
2. Ejercicio Análisis discriminante: MUNDO .............................................................. 3
3. Resultados del análisis discriminante: ...................................................................... 4
3.1. Resumen del procesamiento para el análisis de casos ........................................... 4
3.2. Estadísticos de grupo ............................................................................................. 4
RESÚMENES LAS FUNCIONES CANÓNICAS DISCRIMINANTES ....................... 5
3.3. Autovalores ............................................................................................................ 5
3.4. Lambda de Wilks ................................................................................................... 6
3.5. Coeficientes estandarizados de las funciones determinantes canónicas. ............... 6
3.6. Matriz de estructura ............................................................................................... 7
3.7. Funciones en los centroides de los grupos ............................................................ 7
ESTADÍSTICOS DE CLASIFICACIÓN: ....................................................................... 8
3.8. Resumen del proceso de clasificación ................................................................... 8
3.9. Probabilidades previas para los grupos ................................................................. 8
3.10. Coeficientes de la función clasificación: ........................................................... 8
3.10.1. Funciones lineales discriminantes de Fisher .................................................. 9
3.11. Estadísticos por casos ........................................................................................ 7
3.12. Mapa territorial: ................................................................................................. 8
3.13. Resultado de la clasificación .............................................................................. 9
4. RESPUESTAS CUESTIONARIO ......................................................................... 10
4.1. INCISO 1: ............................................................................................................ 10
4.2. INCISO 2: ............................................................................................................ 10
4.3. INCISO 3 ............................................................................................................. 10
5. CONCLUSIONES .................................................................................................. 12
6. ANEXOS ................................................................................................................ 12
Resultados alfa cronbach ................................................................................................ 12
7. BIBLIOGRAFÍA .................................................................................................... 21
“ANÁLISIS DISCRIMINANTE SPSS”
2
INTRODUCCIÓN
El análisis discriminante permite estudiar las diferencias entre dos o más grupos de
individuos definidos a priori, con respecto a varias variables simultáneamente. Por lo
tanto, tiene como objetivo analizar la relación entre una variable dependiente categórica
con g modalidades, que se corresponden con los grupos analizados, y un conjunto de
variables independientes x1 , x2 … xp, métricas o cuantitativas, a partir de una serie de
funciones discriminantes, que son combinaciones lineales de las variables
independientes que mejor discriminan o separan los grupos, y cuya expresión es la
siguiente:
1. Información caso de estudio
Por término medio las personas de los países de zonas templadas consumen más
calorías por día que las de los trópicos y una proporción mayor de la población de las
zonas templadas viven en núcleos urbanos. Un investigador desea combinar esta
información en una función para discriminar entre grupos de países. Considera además
que el tamaño de la población y la información económica también pueden ser
importantes. Utilice el archivo MUNDO el cuál contienen indicadores económicos,
demográficos, sanitarios y de otros tipos para diversos países del mundo.
Las variables independientes a considerar son:
Consumo diario de calorías (calorías),
El logaritmo del pib (log_pib),
La población urbana (urbana) y
El logaritmo de la población (log_pob).
Como variable de agrupación usamos:
El clima (clima) con valores entre 5 y 8.
1. Escribir las funciones de clasificación para clima:
a. Tropical,
b. Mediterráneo,
c. Templado.
2. Cuantos casos fueron eliminados del análisis?
3. Que porcentaje de la varianza explica la primera función canónica
discriminante?
“ANÁLISIS DISCRIMINANTE SPSS”
3
4. Clasificar a Brasil, Burundi, Costa Rica, Italia en el grupo de país que
corresponde según el clima.
5. El grupo en el que estaban realmente estos tres países es el correcto según el
análisis?.
OBSERVACIONES IMPORTANTES PARA ANALISIS DISCRIMINANTE.
1. Tomar en cuenta los valores de la variable de agrupación. (clima 5 y 8)
2. En el Análisis solicitar la Introducción de variables independientes juntas. (no
utilizar la inclusión por pasos porque interesa ver todas las variables
independientes).
2. Ejercicio Análisis discriminante: MUNDO
El siguiente análisis de caso, está basado en las técnicas de análisis discriminante de
datos (SPSS), el cual está dividido en 5 incisos, acompañadas de los análisis
respectivos, referencias conceptuales, respuestas, conclusiones.
Por último, en ANEXOS se realizaron análisis de fiabilidad y discriminantes con el
objetivo de comprobar si eliminando las variables que influyen menos en la
clasificación e incluyendo países que están muy correlacionados entre sí, como los
países centroamericanos, cuál sería el comportamiento y el resultado del discriminante y
así poder compararlo con el análisis inicial.
Como primer paso,
Cargue en SPSS el archivo de nombre MUNDO, (archivo → abrir → datos) este
contiene indicadores económicos, demográficos, sanitarios y de otros tipos para
diversos países del mundo.
Siguiente paso, cargar las variables independientes siguientes:
Consumo diario de calorías (calorías),
El logaritmo del pib (log_pib),
La población urbana (urbana) y
El logaritmo de la población (log_pob).
A continuación la viable de agrupación:
El clima (clima) con valores entre 5 y 8.
“ANÁLISIS DISCRIMINANTE SPSS”
4
3. Resultados del análisis discriminante:
DISCRIMINANTE
3.1. Resumen del procesamiento para el análisis de casos
Resumen del procesamiento para el análisis de casos
Casos no ponderados N Porcentaje
Válidos 56 51.4
Excluidos
Códigos de grupo para perdidos o fuera de rango 18 16.5
Perdida al menos una variable discriminante 24 22.0
Perdidos o fuera de rango ambos, el código de grupo y al
menos una de las variables discriminantes. 11 10.1
Total excluidos 53 48.6
Casos Totales 109 100.0
Interpretación:
Se puede observar que la cantidad de casos válidos fueron el 51.4% y no validos
48.6%.
3.2. Estadísticos de grupo
Estadísticos de grupo
Clima predominante N válido (según lista)
No ponderados Ponderados
tropical
Ingesta diaria de calorías 28 28.000
Log(10) de PIB_CAP 28 28.000
Habitantes en ciudades (%) 28 28.000
Log(10) de POBLAC 28 28.000
mediterráneo
Ingesta diaria de calorías 6 6.000
Log(10) de PIB_CAP 6 6.000
Habitantes en ciudades (%) 6 6.000
Log(10) de POBLAC 6 6.000
templado
Ingesta diaria de calorías 22 22.000
Log(10) de PIB_CAP 22 22.000
Habitantes en ciudades (%) 22 22.000
Log(10) de POBLAC 22 22.000
Total
Ingesta diaria de calorías 56 56.000
Log(10) de PIB_CAP 56 56.000
Habitantes en ciudades (%) 56 56.000
Log(10) de POBLAC 56 56.000
Interpretación:
“ANÁLISIS DISCRIMINANTE SPSS”
5
ANÁLISIS 1
RESÚMENES LAS FUNCIONES CANÓNICAS DISCRIMINANTES
3.3. Autovalores1
Autovalores
Función Autovalor % de varianza % acumulado Correlación canónica2
1 .885a 95.9 95.9 .685
2 .038a 4.1 100.0 .192
a. Se han empleado las 2 primeras funciones discriminantes canónicas en el análisis.
Interpretación:
Se observa que la primera función discriminante explica casi toda la variabilidad
del modelo (95.9%) lo que concuerda con el hecho de que la Lambda de Wilkis
indica que sólo es significativa con la primera función discriminantes.
Se observa además, que los valores de correlación canónica decrecen
0.685>0.192 = la primera función discrimina más que la segunda. Por lo tanto,
su correlación canónica es (0.685) lo que indica que discrimina aceptablemente.
Se observa que la correlación canónica está correlacionada (.685) con la variable
dependiente. Por lo tanto mide una correlación entre la función que se encontró
y los valores que puede tomar la variable dependiente. En consecuencia, si lo
que tratamos es de explicar una correlación entre una variable y otra, mientras
más alto este valor mejor. (max.1), Esto nos dice que si tenemos una buena
correlación entonces esa función si explica bien la otra.
Con los autovalores se observa también que los valores de la correlación
canónica decrecen .885 > .038. En donde la primera función explicaría un total
del 95.9% de la variabilidad total, mientras que la segunda explica el restante
4.1%.
En Resumen:
La primera función es la que otorgará la clasificación. Mientras que la segunda
aporta información y según el Lambda de Wilkes es significativa.
1 Autovalores: Mide las desviaciones de las puntuaciones discriminantes entre grupos respecto a las
desviaciones dentro de los grupos. En consecuencia, es la parte de la variabilidad total de la nube de
puntos proyectada sobre el conjunto de todas las funciones atribuible a la función. Por lo tanto, si su valor
es grande, la función discriminará mucho. 2 Correlación canónica: Mide la correlación entre la función discriminante y la variable dependiente (0,
1). Por lo tanto, si su valor es grande (próximo a 1) la dispersión será debida a las diferencias entre grupos
y en consecuencia la función discriminará mucho.
“ANÁLISIS DISCRIMINANTE SPSS”
6
3.4. Lambda de Wilks3
Lambda de Wilks
Contraste de las funciones Lambda de Wilks Chi-cuadrado gl Sig.
1 a la 2 .511 34.565 8 .000
2 .963 1.931 3 .587
Interpretación
La Lambda de Wilks mientras más pequeña es mejor o sea que discrimina más.
Se observa que sólo es significativa la primera función discriminante (0.000) ya
que es menor a 0.05. Por lo tanto, la función que se calculó si discrimina la
variable dependiente. En consecuencia, el (Sig) es un criterio importante para
saber si el modelo contiene variables discriminadoras.
3.5. Coeficientes estandarizados de las funciones determinantes canónicas.
Coeficientes estandarizados de las funciones discriminantes canónicas
Función
1 2
Ingesta diaria de calorías 1.107 -.459
Log(10) de PIB_CAP .005 .548
Habitantes en ciudades (%) -.196 -.145
Log(10) de POBLAC .160 1.014
Interpretación:
Se observan los coeficientes estandarizados de las funciones discriminantes
canónicas, en donde en la función (1) la ingesta de caloría (1.107) es la que más
discrimina y en la función (2) es Log (10) de POBLAC (1.014)
respectivamente.
Son las variables que más permiten separar a los grupos. Por lo tanto, la variable
con el coeficiente mayor, es la que tiene más importancia en el momento de
tomar una decisión de a cuál grupo se dirige.
En consecuencia, en este caso son en la primera función las variables de Ingesta
diaria de calorías y en la segunda función Log (10) de POBLAC.
3 Lambda de Wilks: Se obtiene de la razón entre el determinante de la matriz de varianzas y covarianzas
dentro de grupos y el determinante de la matriz de varianzas y covarianzas total.
“ANÁLISIS DISCRIMINANTE SPSS”
7
3.6. Matriz de estructura4
Matriz de estructura
Función
1 2
Ingesta diaria de calorías .972* -.175
Log(10) de PIB_CAP .753* -.164
Habitantes en ciudades (%) .488* -.207
Log(10) de POBLAC .103 .966*
Correlaciones intra-grupo combinadas entre las variables discriminantes y las funciones
discriminantes canónicas tipificadas
Variables ordenadas por el tamaño de la correlación con la función.
*. Mayor correlación absoluta entre cada variable y cualquier función discriminante.
Interpretación:
Se observa que todas las variables (salvo cuarta) tienen la mayor correlación con
la primera función discriminante. Por lo tanto, la ingesta de caloría tiene una
correlación con la función alta (.972*), y Log (10) de PIB_CAP (.753*) y ates
en ciudades (%) con (.488*) respectivamente
Se observa que en la segunda función discriminante, la mayor correlación es
Log (10) de POBLAC con (.966*)
3.7. Funciones en los centroides de los grupos5
Funciones en los centroides de los grupos
Clima predominante Función
1 2
tropical -.888 -.046
mediterráneo .293 .546
templado 1.050 -.091
Funciones discriminantes canónicas no tipificadas evaluadas en las medias de los grupos
Interpretación:
Se puede observar que las medias entre los grupos son diferentes o poca
parecidas. Por lo tanto la discriminación es aceptable y concuerda con la opinión
del análisis Lambda de Wilkis.
4 Matriz de estructura: Son las correlaciones entre las variables y la función discriminante
5 Funciones en los centroides de los grupos: Nos da una idea de cómo las funciones discriminan grupos.
Por lo tanto, si las medias de los grupos en cada función son muy parecidas la función no discrimina
grupos.
“ANÁLISIS DISCRIMINANTE SPSS”
8
Además, se observa valores más distintos en la primera función. Por lo tanto,
discrimina mejor. No obstante, se aprecia que existe poca diferencia entre los
valores tropical y templado (-.046 y -.091 respectivamente) lo que nos indica
que se observa un menor poder discriminatorio.
ESTADÍSTICOS DE CLASIFICACIÓN:
3.8. Resumen del proceso de clasificación
Resumen del proceso de clasificación
Procesados 109
Excluidos Código de grupo perdido o fuera de rango 0
Perdida al menos una variable discriminante 35
Usados en los resultados 74
Interpretación:
3.9. Probabilidades previas para los grupos
Probabilidades previas para los grupos
Clima predominante Previas Casos utilizados en el análisis
No ponderados Ponderados
tropical .333 28 28.000
mediterráneo .333 6 6.000
templado .333 22 22.000
Total 1.000 56 56.000
Interpretación:
3.10. Coeficientes de la función clasificación:
Coeficientes de la función de clasificación
Clima predominante
tropical mediterráneo templado
Ingesta diaria de calorías .004 .006 .008
Log(10) de PIB_CAP 15.681 16.247 15.654
Habitantes en ciudades (%) -.204 -.218 -.220
Log(10) de POBLAC 11.311 12.510 11.712
(Constante) -47.445 -60.071 -62.083
Funciones discriminantes lineales de Fisher
Interpretación:
“ANÁLISIS DISCRIMINANTE SPSS”
9
3.10.1. Funciones lineales discriminantes de Fisher
Funciones lineales discriminantes de Fisher
Tropical Y=-47.445+.004*Ingesta diaria calorías+15,682*Log(10)de PIB_CAP-2.04*Habitantes
en ciudades (%)+11.311*Log(10) de POBLAC
Mediterráneo Y=--60.071+.006*Ingesta diaria calorías+16.247*Log(10)de PIB_CAP-2.18*Habitantes
en ciudades (%)+12.510*Log(10) de POBLAC
Templado Y=-62.083+.008*Ingesta diaria calorías+15,654*Log(10)de PIB_CAP-2.20*Habitantes
en ciudades (%)+11.712*Log(10) de POBLAC
Interpretación:
Estos coeficientes se utilizarán para clasificar en el futuro a los países según el
clima a donde pertenecen, previo cálculo su puntuación en cada uno de los
grupos usando las funciones discriminantes con estos coeficientes Fisher. Por lo
tanto, cada país se clasificará en el grupo que haya alcanzado la puntuación más
elevada.
En la tabla siguiente de estadísticos de caso se observan el grupo real (Grupo al cual
pertenece antes de realizar el análisis) y el pronosticado (Grupo que se pronostica al
que pertenece). En consecuencia, cuando el grupo real en que cae el país y el
pronosticado en grupo no coinciden, hay un error de clasificación en el país.
Como podemos observar en la tabla de análisis por caso únicamente Costa Rica fue
clasificada con la función de clasificación en el grupo al cual pertenecía originalmente.
Por el contrario, Brasil, Burundi y Italia fueron clasificados erróneamente.
“ANÁLISIS DISCRIMINANTE SPSS”
10
Estadísticos por caso:
Interpretación
“ANÁLISIS DISCRIMINANTE SPSS”
Coeficientes de la función de clasificación
tropical
mediterráne
o templado tropical
mediterráne
o templado tropical
mediterráne
o templado tropical
mediterráne
o templado tropical
mediterráne
o templado
Ingesta diaria de
calorías.004 .006 .008 2751.00 2751.00 2751.00 1932.00 1932.00 1932.00 2808.00 2808.00 2808.00 3504.00 3504.00 3504.00
Log(10) de
PIB_CAP15.681 16.247 15.654
3.37 3.37 3.372.320 2.320 2.320 3.310 3.310 3.310 4.240 4.240 4.240
Habitantes en
ciudades (%)-.204 -.218 -.220 75.00 75.00 75.00 5.00 5.00 5.00 47.00 47.00 47.00 69.00 69.00 69.00
Log(10) de
POBLAC11.311 12.510 11.712
5.19 5.19 5.193.780 3.780 3.780 3.520 3.520 3.520 4.760 4.760 4.760
(Constante)-47.445 -60.071 -62.083 1 1 1 1 1 1 1 1 1 1 1 1
58.45 59.52 58.34 37.46 35.22 33.83 44.54 44.08 44.49 71.10 74.02 74.64
burundi costarica italia
17 20 27 61Coeficientes de la función de clasificación
Clima predominante
Funciones discriminantes lineales de Fisher
brasil
Interpretación:
3.11. Estadísticos por casos
Fisher Grupo real Grupo pronosticado
17 Brasil 59.52 Mediterráneo (6) 5 6**
20 Burundi 37.46 Tropical (5) 8 5**
27 Costa Rica 44.54 Tropical (5) 5 5
61 Italia 74.64 Templado (8) 6 8**
Interpretación: 5 = tropical
6 = mediterráneo
8 = templado
Interpretación
Brasil (17) pertenecía antes del análisis al grupo real de Tropical (5), después del análisis pasó al grupo pronosticado Mediterráneo (6**), pero resultó
mal pronosticado según el análisis, por lo que se procedió a realizar el análisis según Fisher y el análisis confirmó la pertenencia al grupo Mediterráneo
(6).
Burundi (20) pertenecía antes del análisis al grupo real de Templado 8), después del análisis pasó al grupo pronosticado Tropical (5**), pero resultó mal
pronosticado según el análisis, por lo que se procedió a realizar el análisis según Fisher y el análisis confirmó la pertenencia al grupo Tropical (5)
Costa Rica (27) pertenecía antes del análisis al grupo real de Tropical (5), después del análisis se confirmó en el grupo pronosticado Tropical (5), por lo
que se procedió a realizar el análisis según Fisher y el análisis reconfirmó la pertenencia al grupo Tropical (5)
Italia (61) pertenecía antes del análisis al grupo real de Mediterráneo (6), después del análisis pasó al grupo pronosticado Templado (8**), pero resultó
mal pronosticado según el análisis, por lo que se procedió a realizar el análisis según Fisher y el análisis confirmó la pertenencia al grupo Templado (8)
“ANÁLISIS DISCRIMINANTE SPSS”
3.12. Mapa territorial:
Mapa territorial (Asumiendo que todas las funciones excepto las dos primeras son = 0)
Discriminante canónica
Función 2
-8.0 -6.0 -4.0 -2.0 .0 2.0 4.0 6.0 8.0
+---------+---------+---------+---------+---------+---------+---------+---------+
8.0 + 12 224 +
I 12 244 I
I 12 24 I
I 12 224 I
I 12 244 I
I 12 224 I
6.0 + + + 12 + + + + 244 +
I 12 24 I
I 12 224 I
I 12 244 I
I 12 224 I
I 12 244 I
4.0 + + + 12 + + 24 + +
I 12 224 I
I 12 244 I
I 12 224 I
I 12 244 I
I 12 24 I
2.0 + + + + 12 + +224 + + +
I 12 244 I
I 12 224 I
I 12 244 I
I 12 * 24 I
I 12 224 I
.0 + + + + * 12 24* + + + +
I 1224 I
I 144 I
I 14 I
I 14 I
I 14 I
-2.0 + + + + 14 + + + +
I 14 I
I 14 I
I 14 I
I 14 I
I 14 I
-4.0 + + + + 14 + + + +
I 14 I
I 14 I
I 14 I
I 14 I
I 14 I
-6.0 + + + + 14 + + + +
I 14 I
I 14 I
I 14 I
I 14 I
I 14 I
-8.0 + 14 +
+---------+---------+---------+---------+---------+---------+---------+---------+
-8.0 -6.0 -4.0 -2.0 .0 2.0 4.0 6.0 8.0
Función discriminante canónica 1
Brasil (X = .059, Y = 1.361) = 2 Mediterráneo
Burundi (X = -1.806, Y = -.531) = 1 Tropical
Costa Rica (X = 0.26, Y = -1.178) = 4 Templado
Italia (X = 1.927, Y = .757) = 4 Templado
“ANÁLISIS DISCRIMINANTE SPSS”
9
Símbolos usados en el mapa territorial Símbol Grupo Etiqu
1 5 tropical
2 6 mediterráneo
4 8 templado
* Indica un centroide de grupo
Interpretación:
El mapa territorial que se observa representa los valores en las funciones
discriminantes canónicas, en abscisas se sitúan los valores de la función 1 y en
ordenadas las puntuaciones en la función 2.
Las regiones están determinadas por los símbolos 1, 2, 3 y 4. Por lo tanto,
corresponde a los climas donde se agrupan los países según su clima, (Tropical,
mediterráneo o templado)
Clasificación según mapa territorial
Países Abscisas F1
= X
Ordenadas F2
= Y
Coordenadas
cartesianos
Región
Real
Pronosticada Territorial Fisher
17 Brasil 0.059 1.361 (0.059,1.361) 5 Trop 6** Med. 6 Med 6 Med
20 Burundi -1.806 -0.531 (-1.806,-0.531) 8 Temp. 5** Trop 5 Trop. 5 Trop.
27 Costa Rica 0.26 -1.178 (0.26,-1.178) 5 Trop. 5 Trop. 8 Temp. 5Trop.
61 Italia 1.927 0.757 (1.927, 0.757) 6 Med. 8** Temp. 8 Temp. 8Temp
Interpretación:
Se puede observar que el pronóstico es similar al realizado con los coeficientes de la
clasificación de Fisher, con 1 excepción en la clasificación de Costa Rica que según el
mapa territorial la ubica en la región Templada y Fisher la ubica en la región Tropical
3.13. Resultado de la clasificación
Resultados de la clasificacióna
Clima predominante Grupo de pertenencia pronosticado Total
tropical mediterráneo templado
Original
Recuento
tropical 23 4 1 28
mediterráneo 2 2 2 6
templado 4 2 16 22
Casos desagrupados 8 4 6 18
%
tropical 82.1 14.3 3.6 100.0
mediterráneo 33.3 33.3 33.3 100.0
templado 18.2 9.1 72.7 100.0
Casos desagrupados 44.4 22.2 33.3 100.0
a. Clasificados correctamente el 73.2% de los casos agrupados originales.
Interpretación:
Se observa que el porcentaje de aciertos es 73.2%, lo que indica que el modelo
es correcto.
“ANÁLISIS DISCRIMINANTE SPSS”
10
4. RESPUESTAS CUESTIONARIO
4.1. INCISO 1:
Escribir las funciones de clasificación para clima: tropical, mediterráneo,
templado.
Conclusiones:
Las Funciones lineales discriminantes de Fisher para el clima tropical,
mediterráneo y templado son las siguientes
4.2. INCISO 2:
Cuantos casos fueron eliminados del análisis:
Conclusiones:
Fueron excluidos 53 casos, lo que representa un 48.6% de casos totales.
4.3. INCISO 3
Qué porcentaje de la varianza explica la primera función canónica discriminante:
Conclusiones:
La primera función discriminante explica el 95.9%
“ANÁLISIS DISCRIMINANTE SPSS”
11
INCISO 4
Clasificar a Brasil, Burundi, Costa Rica, Italia en el grupo de país que
corresponde según el clima.
Conclusiones:
En resumen:
Según el clima estos países se clasifican de la siguiente manera:
Grupo real:
Brasil (17) Grupo real / Tropical (5)
Burundi (20) Grupo real / Templado (8)
Costa rica (27) Grupo real / Tropical (5)
Italia (61) Grupo real / Mediterráneo (6)
INCISO 5
El grupo en el que estaban realmente estos tres países es el correcto según el
análisis?.
Conclusiones
Brasil estaba en Grupo real = 5 tropical y pronosticado está mal pronosticado en
6** Mediterráneo
Burundi estaba en real = 8 Templado y pronosticado está mal pronosticado en
5** Tropical
Costa rica estaba en real = 5 Tropical y pronosticado está bien pronosticado 5
Tropical
Italia estaba en real = 6 Mediterráneo y pronosticado está mal pronosticado en
8** Templado
En resumen:
Según el análisis realizado con los coeficientes de la función clasificación.
Brasil (59.52) está según Fisher está en 6 Mediterráneo
Burundi (37.46) está según Fisher está en 5 Tropical
Costa rica (44.54) está según Fisher está en 5 Tropical
Italia (74.64) está según Fisher está en 8 Templado
“ANÁLISIS DISCRIMINANTE SPSS”
12
5. CONCLUSIONES
Se pudo confirmar la importancia y utilidad del análisis discriminante y como es
aplicable a muy diversas áreas del conocimiento. En este estudio de caso, nos
ayudó a distinguir con una mayor precisión la pertenencia de los países
estudiados a diferentes grupos según su clima y en base a variables
independientes y variable dependiente de agrupación.
En consecuencia, el análisis discriminante sirvió para encontrar la combinación
lineal de las variables independientes que mejor nos permitieron discriminar a
los grupos estudiados, y una vez encontrada esta combinación se utilizó para
realizar una reclasificación de a los países analizados según el grupo climático
que pertenecen.
6. ANEXOS
ANEXO 1: EVALUACIÓN ANÁLISIS FIDELIDAD Y ANÁLISIS
DISCRIMINANTE
En el siguiente análisis del mismo caso MUNDO, se procederá a realizar un
análisis de fiabilidad, con el objetivo de optimizar el % de la clasificación
mediante el estudio de las variables que más aporten al modelo discriminante y
eliminar a las que menos aporten al modelo discriminante, para proceder a
eliminar la que menos impacten en el modelo y proceder a evaluar y comparar
los resultados de la clasificación
Resultados alfa cronbach
Analisis fiabilidad
Escala: Todas las variables
Resumen del procesamiento de los casos
Resumen del procesamiento de los casos
N %
Casos
Válidos 74 67.9
Excluidosa 35 32.1
Total 109 100.0
a. Eliminación por lista basada en todas las variables del procedimiento.
Estadísticos de fiabilidad
Estadísticos de fiabilidad
Alfa de Cronbach N de elementos
.080 4
“ANÁLISIS DISCRIMINANTE SPSS”
13
Estadísticos total-elemento
Media de la
escala si se
elimina el
elemento
Varianza de la
escala si se
elimina el
elemento
Correlación
elemento-total
corregida
Alfa de Cronbach
si se elimina el
elemento
Ingesta diaria de calorías 62.2269 653.530 .703 .053
Log(10) de PIB_CAP 2800.8433 336341.716 .857 .087
Habitantes en ciudades (%) 2749.5242 316811.864 .692 .003
Log(10) de POBLAC 2799.9647 336969.184 .047 .090
Eliminando la variable Log(10) de POBLAC para elevar a 0.090 el alfa cronbach
Analisis de fiabilidad
Escala todas las variables
Resumen del procesamiento de los casos
N %
Casos
Válidos 74 67.9
Excluidosa 35 32.1
Total 109 100.0
a. Eliminación por lista basada en todas las variables del procedimiento.
Estadísticos de fiabilidad
Alfa de Cronbach N de elementos
.090 3
Estadísticos total-elemento
Media de la
escala si se
elimina el
elemento
Varianza de la
escala si se
elimina el
elemento
Correlación
elemento-total
corregida
Alfa de Cronbach
si se elimina el
elemento
Ingesta diaria de calorías 58.0052 656.770 .700 .081
Log(10) de PIB_CAP 2796.6216 336307.060 .857 .116
Habitantes en ciudades (%) 2745.3025 316773.789 .693 .004
“ANÁLISIS DISCRIMINANTE SPSS”
14
Se volvió a realizar el análisis discriminante eliminando a la variable Log (10) de
POBLAC para verificar si mejora el resultado de la clasificación
Resumen del procesamiento para el análisis de casos
Casos no ponderados N Porcentaje
Válidos 56 51.4
Excluidos
Códigos de grupo para perdidos o fuera de
rango
18 16.5
Perdida al menos una variable discriminante 24 22.0
Perdidos o fuera de rango ambos, el código de
grupo y al menos una de las variables
discriminantes.
11 10.1
Total excluidos 53 48.6
Casos Totales 109 100.0
Estadísticos de grupo
Clima predominante N válido (según lista)
No ponderados Ponderados
tropical
Ingesta diaria de calorías 28 28.000
Log(10) de PIB_CAP 28 28.000
Habitantes en ciudades (%) 28 28.000
mediterráneo
Ingesta diaria de calorías 6 6.000
Log(10) de PIB_CAP 6 6.000
Habitantes en ciudades (%) 6 6.000
templado
Ingesta diaria de calorías 22 22.000
Log(10) de PIB_CAP 22 22.000
Habitantes en ciudades (%) 22 22.000
Total
Ingesta diaria de calorías 56 56.000
Log(10) de PIB_CAP 56 56.000
Habitantes en ciudades (%) 56 56.000
ANÁLISIS 1
RESUMEN DE LAS FUNCIONES CANÓNICAS DISCRIMINANTES
Autovalores
Función Autovalor % de
varianza
% acumulado Correlación
canónica
1 .865a 99.9 99.9 .681
2 .001a .1 100.0 .031
Se han empleado las 2 primeras funciones discriminantes canónicas
en el análisis.
“ANÁLISIS DISCRIMINANTE SPSS”
15
Lambda de Wilks
Contraste de las
funciones
Lambda de
Wilks
Chi-cuadrado gl Sig.
1 a la 2 .536 32.448 6 .000
2 .999 .051 2 .975
Coeficientes estandarizados de las
funciones discriminantes canónicas
Función
1 2
Ingesta diaria de calorías 1.171 -.226
Log(10) de PIB_CAP -.064 -.687
Habitantes en ciudades
(%)
-.207 1.509
Matriz de estructura
Función
1 2
Ingesta diaria de calorías .983* .163
Log(10) de PIB_CAP .762* .304
Habitantes en ciudades (%) .495 .825*
Correlaciones intra-grupo combinadas entre las variables discriminantes y las funciones discriminantes
canónicas tipificadas
Variables ordenadas por el tamaño de la correlación con la función.
*. Mayor correlación absoluta entre cada variable y cualquier función discriminante.
Funciones en los centroides de los grupos
Clima predominante Función
1 2
tropical -.871 .008
mediterráneo .207 -.088
templado 1.052 .013
Funciones discriminantes canónicas no tipificadas evaluadas en las medias de los grupos
“ANÁLISIS DISCRIMINANTE SPSS”
16
ESTADÍSTICOS DE CLASIFICACIÓN
Resumen del proceso de clasificación
Procesados 109
Excluidos Código de grupo perdido o fuera de rango 0
Perdida al menos una variable discriminante 35
Usados en los resultados 74
Probabilidades previas para los grupos
Clima predominante Previas Casos utilizados en el análisis
No ponderados Ponderados
tropical .333 28 28.000
mediterráneo .333 6 6.000
templado .333 22 22.000
Total 1.000 56 56.000
Coeficientes de la función de clasificación
Clima predominante
tropical mediterráneo templado
Ingesta diaria de calorías .009 .012 .014
Log(10) de PIB_CAP 10.285 10.279 10.066
Habitantes en ciudades (%) -.224 -.240 -.241
(Constante) -21.892 -28.812 -34.685
“ANÁLISIS DISCRIMINANTE SPSS”
17
Mapa territorial
Mapa territorial
(Asumiendo que todas las funciones excepto las dos primeras son = 0)
Discriminante canónica
Función 2
-8.0 -6.0 -4.0 -2.0 .0 2.0 4.0 6.0 8.0
+---------+---------+---------+---------+---------+---------+---------+---------+
8.0 + 14 +
I 14 I
I 14 I
I 14 I
I 14 I
I 14 I
6.0 + + + + 14 + + + +
I 14 I
I 14 I
I 14 I
I 14 I
I 14 I
4.0 + + + + 124 + + + +
I 124 I
I 124 I
I 124 I
I 124 I
I 12 24 I
2.0 + + + + 12 24 + + + +
I 12 24 I
I 12 24 I
I 12 24 I
I 12 24 I
I 12 24 I
.0 + + + + * 12+* 24* + + + +
I 12 24 I
I 12 24 I
I 12 24 I
I 12 24 I
I 12 24 I
-2.0 + + + + 12+ 24 + + + +
I 12 24 I
I 12 24 I
I 12 24 I
I 12 24 I
I 12 24 I
-4.0 + + + + 12 + 24 + + + +
I 12 24 I
I 12 24 I
I 12 24 I
I 12 24 I
I 12 24 I
-6.0 + + + + 12 + 24 + + + +
I 12 24 I
I 12 24 I
I 12 24 I
I 12 24 I
I 12 24 I
-8.0 + 12 24 +
+---------+---------+---------+---------+---------+---------+---------+---------+
-8.0 -6.0 -4.0 -2.0 .0 2.0 4.0 6.0 8.0
Función discriminante canónica 1
Símbolos usados en el mapa territorial
Símbol Grupo Etiqu
1 5 tropical
2 6 mediterráneo
4 8 templado
* Indica un centroide de grupo
Clasificación según mapa territorial
Países Abscisas F1
= X
Ordenadas F2
= Y
Coordenadas
cartesianos
Región
Real
Pronosticada Territorial Fisher
35 Guatemala -1.047 -.016 (-1.047,-0.016) 5 Trop 5 Trop. 5Trop 5 Trop
49 Salvador -1.285 -.399 (-1.285,-0.399) 5 Trop 5 Trop. 5Trop 5 Trop
51 Honduras -1.234 0.44 (-1.234,0.44) 5 Trop 5 Trop. 5Trop 5 Trop
74 Nicaragua -1.283 1.468 (-1.283, 1.468) 5 Trop 5 Trop. 5Trop 5 Trop
81 Panamá -.566 .025 (-0.566, 0.025) 5 Trop 5 Trop. 5Trop 5 Trop
Interpretación:
Se puede observar que el pronóstico es similar al realizado con los coeficientes de la
clasificación de Fisher, que según el mapa territorial los ubica en la región Tropical y Fisher los
ubica también en la región Tropical
Brasil (X = -.184, Y = 1.306) = 2 Mediterráneo
Burundi (X = -1.166, Y = -1.423) = 1 Tropical
Costa Rica (X = 0.218, Y = -.407) = 2 Mediterráneo
Italia (X = 1.798, Y = -.491) = 4 Templado Guatemala (X = -1.047, Y = -0.016) = 5
Tropical
Salvador (X = -1.285, Y = -0.399) = 5 Tropical
Nicaragua (X = -1.283, Y =1.468) = 5 Tropical
Honduras (X = -1.234, Y = 0.044) = 5 Tropical
Panamá (X = -0.0566, Y = 0.025) = 5 Tropical
“ANÁLISIS DISCRIMINANTE SPSS”
18
Estadísticos por casos
“ANÁLISIS DISCRIMINANTE SPSS”
Coeficientes de la función clasificación
Brasil 17 Burundi 20 Costa Rica 27 Italia 61 Guatemala 49 Salvador 35 Honduras 51 Nicaragua 74 Panamá 81
tropica
l
mediter
ráneo
templa
do
tropica
l
mediter
ráneo
templa
do
tropica
l
mediter
ráneo
templa
do
tropica
l
mediter
ráneo
templa
do
tropica
l
mediter
ráneo
templa
do
tropica
l
mediter
ráneo
templa
do
tropica
l
mediter
ráneo
templa
do
tropica
l
mediter
ráneo
templa
do
tropica
l
mediter
ráneo
templa
do
tropica
l
mediter
ráneo
templa
do
Ingesta diaria de
calorías .009 .012 .014 2751 2751 2751 1932 1932 1932 2808 2808 2808 3504 3504 3504 2235 2235 2235 2327 2327 2327 2247 2247 2247 2265 2265 2265 2539 2539 2539
Log(10) de
PIB_CAP 10.285 10.279 10.066 3.37 3.37 3.37 2.32 2.32 2.32 3.31 3.31 3.31 4.24 4.24 4.24 3.13 3.13 3.13 3.03 3.03 3.03 3.01 3.01 3.01 2.65 2.65 2.65 3.38 3.38 3.38
Habitantes en
ciudades (%) -.224 -.240 -.241 75 75 75 5 5 5 47 47 47 69 69 69 39 39 39 44 44 44 44 44 44 60 60 60 53 53 53
(Constante) ##### ##### ##### 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
20.37 20.40 19.85 18.00 16.69 14.61 26.54 27.16 26.78 37.34 39.68 40.63 21.39 20.45 18.84 20.06 19.31 17.92 19.14 18.16 16.60 12.01 10.84 9.38 23.52 23.26 22.26
Coeficientes de la función de
clasificación
Clima predominante
Funciones discriminantes lineales de
Fisher
Interpretación:
Se puede observar que todos los países del área pertenecen al mismo grupo real y grupo pronosticado Tropical (5) con excepción de Costa Rica que pertenece al
grupo real (5) pero en el análisis lo considera m pronosticado (6**) y al realizar el análisis Fisher lo confirma en mediterraneo (6)
Si se compara el modelo inicial con el modelo modificado (el cual se eliminó la variable Log (10) POBLAC para obtener una % de clasificación mejor: Modelo
modificado 75% > 73.2 modelo sin modificar o inicial). Se puede observar que se obtienen los mismos datos y clasificaciones grupales para los países estudiados con
excepción de Costa Rica el cual en el primer modelo sin modificar estaba en el grupo real Tropical (5) y se mantenía en el grupo pronosticado Tropical (5). Sin
embargo en el modelo modificado se ubicada en el grupo real (5) y se pronostica en el grupo mediterráneo (6)
Fisher Grupo real Grupo pronosticado
17 Brasil 20.39 Mediterráneo (6) 5 6**
20 Burundi 17.99 Tropical (5) 8 5**
27 Costa Rica 27.16 Mediterráneo (6) 5 6*
61 Italia 40.62 Templado (8) 6 8**
PAÍSES ÁREA CENTROAMERICANA
49 Guatemala 21.39 Tropical (5) 5 5
35 Salvador 20.05 Tropical (5) 5 5
51 Honduras 19.14 Tropical (5) 5 5
74 Nicaragua 12.01 Tropical (5) 5 5
81 Panama 23.52 Tropical (5) 5 5
“ANÁLISIS DISCRIMINANTE SPSS”
Resultados de la clasificacióna
Clima predominante Grupo de pertenencia pronosticado Total
tropical mediterráneo templado
Original
Recuento
tropical 23 4 1 28
mediterráneo 2 2 2 6
templado 4 1 17 22
Casos desagrupados 8 3 7 18
%
tropical 82.1 14.3 3.6 100.0
mediterráneo 33.3 33.3 33.3 100.0
templado 18.2 4.5 77.3 100.0
Casos desagrupados 44.4 16.7 38.9 100.0
a. Clasificados correctamente el 75.0% de los casos agrupados originales.
Conclusiones:
Se observa que el porcentaje de aciertos clasificados correctamente para el
modelo eliminando la variable Log (10) POBLAC es del 75.0 %, en
comparación con el modelo donde se incluía la variable Log (10) POBLAC en
el cual el cómo resultados de clasificados correctamente era de 73.2%. lo que
indica que el modelo es correcto y que el proceso de eliminación de la variable
escogida en el análisis de fiabilidad es aceptable y justifica el uso, ya que el los
clasificados correctamente son mayores 75% > 73.2% del modelo 2 con el
modelo 1 respectivamente.
“ANÁLISIS DISCRIMINANTE SPSS”
21
7. BIBLIOGRAFÍA
(Mayo de 2014). Recuperado el Mayo de 2014, de
http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departamento/mat
eriales/analisis_datosyMultivariable/23discr_SPSS.pdf
(Mayo de 2014). Recuperado el Mayo de 2014, de
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/AMult/tema6am.pdf
(Mayo de 2014). Recuperado el Mayo de 2014, de
http://www.youtube.com/watch?v=DCez9jrmohw
(Mayo de 2014). Recuperado el Mayo de 2014, de
http://www.aulafacil.com/spss-avanzado/curso/Lecc-10.htm
(Mayo de 2014). Recuperado el Mayo de 2014, de
http://www.google.com.gt/url?sa=t&rct=j&q=&esrc=s&source=web&cd=5&ve
d=0CEEQFjAE&url=http%3A%2F%2Frevistes.ub.edu%2Findex.php%2FREIR
E%2Farticle%2Fdownload%2F6210%2F8164&ei=vQSAU9CdE-
HgsAS5hIHABA&usg=AFQjCNF4Xun7reWYMm2oSu1UiAFp5DVmUA
(Mayo de 2014). Recuperado el Mayo de 2014, de
http://www.uam.es/personal_pdi/ciencias/ajustel/docencia/ad/AD10_11_Discri
minante.pdf
(Mayo de 2014). Recuperado el Mayo de 2014, de
http://www.uam.es/personal_pdi/ciencias/ajustel/docencia/ad/SPSS_discriminan
te.pdf
(Mayo de 2014). Recuperado el Mayo de 2014, de
http://www.fuenterrebollo.com/Economicas/ECONOMETRIA/SEGMENTACI
ON/DISCRIMINANTE/analisis-discriminante.pdf
(Mayo de 2014). Recuperado el Mayo de 2014, de
ftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/20.0/e
s/client/Manuals/IBM_SPSS_Statistics_Base.pdf
(Mayo de 2014). Recuperado el Mayo de 2014, de
http://www.sibiup.up.ac.pa/otrosenlaces/tecnociencias/Vol.%207%281%29/Tec
nociencia%20Articulo%201%207%281%29%2005.pdf
Banco Central de Costa Rica. (Mayo de 2014). Google. Recuperado el Mayo de
2014, de
“ANÁLISIS DISCRIMINANTE SPSS”
22
http://www.bccr.fi.cr/investigacioneseconomicas/sistemafinanciero/La_tecnica_
analisis_discriminante,_aplicacion_area_bancaria.pdf
Garnica, E., zález, P. M., & Días de Pascual, A. (Mayo de 2014). oogle.
Recuperado el Mayo de 2014, de
http://iies.faces.ula.ve/Revista/Articulos/Revista_06/Pdf/Rev6GarnicaO.pdf
IBM SPSS Statistics Base 20. (Mayo de 2014). Google. Recuperado el Mayo de
2014, de
ftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/20.0/e
s/client/Manuals/IBM_SPSS_Statistics_Base.pdf
Manzano Aldás, J. (Mayo de 2014). Google. Recuperado el Mayo de 2014, de
http://wwwyyy.files.wordpress.com/2013/03/anc3a1lisis-discriminante.pdf
Mures Quintana, J. M., García Vallejo, A., & Vallejo Pascual, E. M. (Mayo de
2014). Google. Recuperado el Mayo de 2014, de
file:///C:/Users/DELL/Downloads/DialnetAplicacionDelAnalisisDiscriminanteY
RegresionLogist-1281700%20(1).pdf
(Mayo de 2014). Recuperado el Mayo de 2014, de
http://www.uam.es/personal_pdi/ciencias/ajustel/docencia/ad/AD10_11_Discri
minante.pdf
(Mayo de 2014). Recuperado el Mayo de 2014, de
http://www.uam.es/personal_pdi/ciencias/ajustel/docencia/ad/SPSS_discriminan
te.pdf
(Mayo de 2014). Recuperado el Mayo de 2014, de
http://www.fuenterrebollo.com/Economicas/ECONOMETRIA/SEGMENTACI
ON/DISCRIMINANTE/analisis-discriminante.pdf
(Mayo de 2014). Recuperado el Mayo de 2014, de
ftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/20.0/e
s/client/Manuals/IBM_SPSS_Statistics_Base.pdf
Pérez López, C. (2004). Técnicas de Análisis Multivariante de Datos. Madrid:
PEARSON EDUCACIÓN, S. A.