Unidad 12 - Analisis e Interpretacion de Datos en La Tesis
-
Upload
miki-jaksic -
Category
Documents
-
view
57 -
download
5
description
Transcript of Unidad 12 - Analisis e Interpretacion de Datos en La Tesis
![Page 1: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/1.jpg)
ANÁLISIS DE DATOS
Elaborado por:
Dr. Alfonso Ramón Chung Pinzás
En convenio con:
![Page 2: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/2.jpg)
ANÁLISIS DE DATOS
• Es el estudio de los datos obtenidos a
fin de dar respuesta al problema
planteado.
• Asimismo importante para aceptar o
rechazar la hipótesis planteada.
![Page 3: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/3.jpg)
ANÁLISIS DE DATOS
• Si bien el tema es muy amplio, se
darán indicaciones generales y se
señalarán los textos de consulta
![Page 4: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/4.jpg)
OBJETIVOS DEL ANÁLISIS DE DATOS
• Los autores coinciden en los siguientes
objetivos
![Page 5: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/5.jpg)
OBJETIVOS DEL ANÁLISIS DE DATOS
• Hallar que hay en los datos
• Conocer que tanto varían los datos
• Conocer como están distribuidos los datos
• Conocer que relación existe entre los
datos
• Hacer estimaciones y predicciones
• Describir las diferencias entre grupos y
variables
• Demostrar causalidad
![Page 6: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/6.jpg)
ESCALAS DE MEDICIÓN
• Escala Nominal
• Escala Ordinal
• Escala de Intervalo
• Escala Proporción o
Razón
• Por el valor concreto
![Page 7: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/7.jpg)
ESCALA NOMINAL
• Es la más simple de todas las escalas
• No hace mayor análisis, ni establece
relaciones etc.
• Separa a los datos en clases las cuales
son mutuamente excluyentes.
• Por ejemplo: fumadores y no fumadores,
operarios y operarias etc.
![Page 8: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/8.jpg)
ESCALA ORDINAL
• Es un nivel superior a la nominal.
• Ordinal=Orden, es decir ordena los datos
según un determinado criterio.
• El criterio puede ser de mayor a menor o a
la inversa.
• Es decir según su posición.
• Ejemplo: Muy fumador, medianamente
fumador, poco fumador, no fumador
![Page 9: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/9.jpg)
ESCALA DE INTERVALO
• Permiten también ordenar los datos, pero
adicionalmente se pueden comparar las
distancias entre dos de ellos.
• Estas distancias de preferencia son iguales.
• No considera el cero, es decir la ausencia de la
variable.
• No se pueden establecer proporciones ya que
su función es ordenar, nombrar y mostrar la
igualdad en la magnitud
• Ejemplo: la diferencia entre 25°C y 26°c es la
misma que 45°C y 46°C
![Page 10: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/10.jpg)
ESCALA DE PROPORCIÓN
• Permite realizar las operaciones
anteriores con la escala de intervalo.
• Además permite operaciones adicionales
como la división.
• Considera el cero como ausencia de
variable.
• Ejemplo: el peso de A es 100 kg. Por lo
tanto es el doble de B que pesa 50 kg., el
ingreso del ingeniero de planta es 2000
soles/mes
![Page 11: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/11.jpg)
POR EL VALOR CONCRETO
• A diferencia de los anteriores, es recoger
los valores de cada individuo de la
muestra o población sin agruparlos.
• Es conveniente recoger los datos de esta
forma al inicio para luego poder
transformarlo a una de las escalas
anteriormente indicadas
![Page 12: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/12.jpg)
DETERMINACIÓN DE ESCALAS
• La escala se determina según el
estudio a realizar.
• Lo recomendable es tomar
mediciones con una escala superior
para luego poder transformar a una
inferior si es el caso.
• Sin embargo, no se puede
transformar de una inferior a una
superior.
![Page 13: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/13.jpg)
TRANSFORMACIONES
ESCALA
Por el valor concreto
Proporcional
De intervalo
Ordinal
Nominal
TRANSFORMACIONES
![Page 14: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/14.jpg)
TRANSFORMACIONES
ESCALA
Por el valor concreto
Proporcional
De intervalo
Ordinal
Nominal
TRANSFORMACIONES
EN ESTE SENTIDO
NO SE PUEDEN
REALIZAR
![Page 15: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/15.jpg)
PROCEDIMIENTO PARA EL ANÁLISIS DE
DATOS
• Primeramente revisar y depurar los datos
• Luego se describen las características de las
variables de la muestra o población.
• A continuación se realizan las pruebas
adecuadas para la verificación o negación de
las hipótesis respectivas.
• En la sección de resultados van solamente los
hallazgos de la investigación.
• En la sección discusión, se discuten, comentan
etc.
![Page 16: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/16.jpg)
DISTRIBUCIÓN DE FRECUENCIAS
• Es un procedimiento muy útil para el
ordenamiento de los datos.
• Consta de las siguientes partes:
• Frecuencia absoluta (Fa): número de
veces que se repiten las observaciones en
una determinada categoría
• Frecuencia relativa (Fr): Es la Fa entre el
número de individuos.
![Page 17: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/17.jpg)
DISTRIBUCIÓN DE FRECUENCIAS
• Porcentaje (P): Es el tanto porciento de
la Fa con respecto al total de las
observaciones.
• Fa acumulada: Es la cantidad acumulada
de Fa
• Fr acumulada: Es el acumulado de Fr
• Porcentaje Acumulado: Es la
acumulación de los porcentajes P
![Page 18: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/18.jpg)
TIPOS DE ANÁLISIS
• Descriptivo: son aquellos procedimientos
que caracterizan, analizan y describen las
características de los datos estudiados de
una muestra o población.
• Inferencial: son aquellos procedimientos
que a partir de los datos de la muestra,
hacen estimaciones o inducciones hacia la
población.
![Page 19: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/19.jpg)
ANÁLISIS DESCRIPTIVO
• El análisis descriptivo se clasifica en:
Medidas de tendencia central, de
dispersión y otros.
![Page 20: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/20.jpg)
MEDIDAS DE TENDENCIA CENTRAL
• Estas medidas
muestran el valor
alrededor del cual se
sitúan el resto de
variables.
• Las medidas de
tendencia central más
usadas son: media
aritmética, mediana y
moda.
![Page 21: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/21.jpg)
MEDIA ARITMÉTICA
• Determina el promedio de las
observaciones y se calcula de la
siguiente forma:
• Xi: Es la observación i
• n: Es el total de observaciones
![Page 22: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/22.jpg)
LA MEDIANA
• Es aquel valor que divide a la distribución
de datos en dos parte iguales (es decir
50% a 50%).
• También se le conoce como percentil 50.
• Para su determinación, se ordenan los
datos de menor a mayor y si la cantidad
es impar se toma el valor central.
• Cuando la cantidad es par, se toman los
dos valores centrales y de divide entre 2
![Page 23: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/23.jpg)
LA MODA
• Es el valor que más se repite en una
distribución.
• Cuando hay un solo valor que se repite,
se dice que es una distribución unimodal.
• Cuando hay más de uno por ejemplo dos
o tres, se dice bimodal, trimodal etc.
![Page 24: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/24.jpg)
MEDIDAS DE DISPERSIÓN O VARIABILIDAD
• Son aquellas que indican las
variaciones o dispersiones de los
datos obtenidos.
• Por lo tanto permiten conocer la
distribución de una variable.
• Las medidas usadas son: Rango o
amplitud, varianza, desviación
estándar o típica y coeficiente de
variación.
![Page 25: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/25.jpg)
RANGO O AMPLITUD
• Es la diferencia entre el máximo y
mínimo valor de la distribución, es
decir la distancia entre los extremos.
• Esta medida ofrece problemas porque
pueden existir valores atípicos.
• Además no realiza mayor análisis.
![Page 26: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/26.jpg)
VARIANZA
• Indica la distancia de cada observación
con respecto a la media. Los valores
extremos afectan esta medida
• Se calcula con la siguiente formula:
![Page 27: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/27.jpg)
DESVIACIÓN ESTÁNDAR
• Expresa también la variabilidad de los
datos, pero en las unidades originales.
• Cuanto más pequeño sea el valor el grupo
será más homogéneo y cuanto más
grande más heterogéneo.
• Se calcula mediante la raíz cuadrada
positiva de la varianza.
• Al igual que en el caso anterior, se ve
afectada por valores extremos
![Page 28: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/28.jpg)
COEFICIENTE DE VARIACIÓN
• Expresa el porcentaje de la desviación
estándar con respecto a la media.
• Se calcula con la siguiente fórmula:
![Page 29: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/29.jpg)
OTRAS MEDIDAS DE DESCRIPCIÓN
• Otras medidas de descripción que
también son muy utilizadas son: medidas
de posición y de forma.
![Page 30: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/30.jpg)
MEDIDAS DE POSICIÓN
• Cuartiles: dividen a la distribución en
tres partes, Q1 deja debajo a una
cuarta parte y el resto encima, Q2 deja
la mitad por debajo y por encima, Q3
deja debajo las 3 cuartas partes y
encima una cuarta parte.
• Deciles y centiles, dividen en diez y
cien partes respectivamente.
![Page 31: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/31.jpg)
MEDIDAS DE POSICIÓN
• Percentiles: Es el valor que deja
encima y debajo un porcentaje de
observaciones definidas, por ejemplo
el percentil 50 deja la mitad tanto por
arriba como por debajo, el percentil 30
deja 30% por debajo y 70% por
encima
![Page 32: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/32.jpg)
MEDIDAS DE FORMA
• Son aquellas que proporcionan la forma
en que se distribuyen los datos.
• Estas medidas buscan verificar si la forma
de distribución se asemeja a la
distribución normal o curva de Gauss.
• Las medidas usadas son: Asimetria y
Kurtosis (o Curtosis)
![Page 33: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/33.jpg)
COEFICIENTE DE ASIMETRIA
• Mide la falta de simetría con respecto a la
curva normal.
• Cuando el valor es cero es simétrica a la
curva normal, un valor negativo indica
sesgo a la izquierda y un valor positivo a
la derecha.
![Page 34: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/34.jpg)
COEFICIENTE DE ASIMETRIA
• Las formulas de calculo son:
CA= (promedio-moda) / desv. std.
CA= 3 x (promedio-mediana) / desv. std
CA= (Q3 – 2Q2 + Q1) / (Q3 – Q1)
![Page 35: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/35.jpg)
CARACTERÍSTICAS DE LA CURVA
NORMAL
![Page 36: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/36.jpg)
KURTOSIS
• También conocida como Curtosis
• Verifica si la forma es estrecha y alta o
ancha y plana con respecto a la curva
normal.
• En el primer caso se dice que es
Leptocúrtica (kurtosis >3) y en el segundo
caso Platicúrtica (kurtosis <3) , cuando la
curva se asemeja a la normal de dice que
es Mesocúrtica (kurtosis=3)
![Page 37: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/37.jpg)
KURTOSIS
• La Kurtosis se calcula en función al
momento 4 (m4) y momento 2 (m2).
• Su formula es: Kurtosis= m4 / m22
• Para mayor información sobre el calculo
de los momentos consultar el libro:
“Estadística general con énfasis en
muestreo” de José Calzada Benza
![Page 38: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/38.jpg)
ANÁLISIS INFERENCIAL
• Se aplica cuando se utiliza una muestra
en vez de estudiar a la población.
• Esto se debe a que muchas veces la
población es muy grande y sería costoso
estudiarla.
• El análisis inferencial permite caracterizar
a la población y también comprobar las
hipótesis de la investigación, todo esto
mediante los resultados de la muestra.
![Page 39: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/39.jpg)
ERROR ESTANDAR
• Si bien una muestra proporciona
información sobre la población, esta
información esta sujeta a error.
• El error estándar dime la variabilidad entre
las medias de las diferentes muestras.
• Este cálculo se puede hacer considerando
la desviación estándar o el porcentaje
![Page 40: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/40.jpg)
ERROR ESTANDAR
• Las formulas de calculo son:
![Page 41: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/41.jpg)
INTERVALO DE CONFIANZA
• Calcula el rango en el cual se ubicará la media
de la población.
• Esta calculo esta asociado a una probabilidad.
• Generalmente la probabilidad más utilizada es
95% cuyo valor Z=1,96
• Por lo tanto el intervalo de confianza indica que
con una probabilidad de 95% la media estará
entre el intervalo de confianza
![Page 42: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/42.jpg)
INTERVALO DE CONFIANZA
• Fórmulas de cálculo:
![Page 43: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/43.jpg)
HIPÓTESIS ESTADÍSTICAS
• Son suposiciones que se hacen sobre los
parámetros de las poblaciones
• Se distinguen dos tipos: Hipótesis Nula
(H0) e Hipótesis Alternativa (H1 o HA) .
• H0 indica que no hay diferencias entre los
resultados encontrados y si las hubieran,
se deben al azar.
• H1 indica que si hay diferencias y se
acepta cuando se rechaza H0
![Page 44: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/44.jpg)
HIPÓTESIS ESTADÍSTICAS
• H0 : u=u0 , u1=u2
• H0 : σ=σ0, σ1=σ2
• H1 : u≠u0 , u1≠u2 , lo que implica que
pueden ser mayor o menor.
• H1 : σ ≠ σ0, σ1 ≠ σ2 lo que implica que
pueden ser mayor o menor.
![Page 45: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/45.jpg)
ERRORES
![Page 46: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/46.jpg)
PRUEBAS DE HIPÓTESIS
• Cuando se tiene una hipótesis alternativa
la prueba es de una cola, cuando se
tienen dos hipótesis alternativas se dice
que es de dos colas
• Las pruebas pueden ser paramétricas o
no paramétricas.
• Las paramétricas son más confiables pero
suponen que la muestra sigue una
distribución normal
![Page 47: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/47.jpg)
PRUEBAS DE HIPÓTESIS
• Si se analiza la relación entre dos
variables se llama bivariable y si es de
más se dice multivariable.
• Si hay mediciones en momentos
diferentes, se dice que son medidas
apareadas, en caso contrario datos
independientes.
![Page 48: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/48.jpg)
PRUEBAS PARAMÉTRICAS
(BIVARIABLE)
• Prueba t de Student
• Análisis de varianza unidireccional
(ANOVA oneway)
• Análisis de varianza factorial (ANOVA)
• Análisis de Covarianza
• Coeficiente de correlación de Pearson
![Page 49: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/49.jpg)
PRUEBAS NO PARAMÉTRICAS
• Prueba del Chi Cuadrado
• U de Mann-Withney
• Rangos de Wilcoxon
• La prueba de McNemar
• Anova de Krustal Wallis
• Coeficiente de correlación por rangos
ordenados de Spearman y Kendall
• Q de Cochram
![Page 50: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/50.jpg)
CONSULTAS
• Icart, M., et al. (2000). Elaboración y
Presentación de un Proyecto de
Investigación y una Tesina. Barcelona:
Universidad de Barcelona.
![Page 51: Unidad 12 - Analisis e Interpretacion de Datos en La Tesis](https://reader031.fdocuments.mx/reader031/viewer/2022012319/577c85701a28abe054bd2acb/html5/thumbnails/51.jpg)
Muchas gracias!