Post on 14-Sep-2015
description
ASIGNATURA DE FORMACIN BSICA
Anlisis de Datos Estadstica Descriptiva Estadstica
Inferencial Pruebas de Hiptesis Pruebas Paramtricas y No
Paramtricas - SPSS
SIC 335
Metodologa de Investigacin I
1. Utilizar tecnicas de estadi stica descriptiva para la presentacion e
interpretacio n de datos cuantitativos.
2. Diferenciar entre pruebas parame tricas y no parame tricas.
3. Conocer la lo gica del test de hipo tesis y errores alfa y beta.
4. Decidir la seleccio n de metodos estadisticos apropiados para distintos
contraste de hipo tesis.
5. Utilizar estadi stica inferencial para analizar distintos tipos de datos e
hipo tesis estadi sticas.
OBJETIVOS
Desarrollar capacidades para que el estudiante pueda comprender y utilizar
con propiedad metodos estadisticos para el analisis e interpretacio n de datos cuantitativos, a la vez de tomar decisiones en base a los resultados de
dichos ana lisis.
Objetivos asociados al Perfil de Egreso
1. INTRODUCCION AL ANALISIS DE DATOS
2. ESTADISTICA DESCRIPTIVA
3. ESTADISTICA INFERENCIAL (Analisis Paramtrico)
4. ESTADISTICA INFERENCIAL (Analisis No Paramtrico)
UNIDADES DEL CURSO
EVALUACION
ACTIVIDAD EVALUATIVA PONDERACION
4 Controles y/o Trabajos 15%
2 Pruebas de Ctedra
(07 de Mayo y 11 de Junio)
50%
Examen 35%
La asignatura considera eximicin del examen en el caso que la nota de
presentacion sea igual o superior a 6.0.
La nota de presentacion a examen corresponde al promedio ponderado de
todas las evaluaciones anteriores al examen.
CONTENIDOS
Estadstica descriptiva e inferencial.
Tipos de variables, nivel de medicin de las variables
Niveles de anlisis univariado, bivariado y multivariado.
Hiptesis estadsticas, test de hiptesis y toma de decisiones.
Estadstico de contraste y nivel de significancia estadstica.
Principios generales de la construccin de bases de datos para anlisis
y codificacin.
Sesin N1
Introduccin al Anlisis de Datos
Metodologa y Estadstica
Estadstica Descriptiva
Estadstica Inferencial
Contraste de Hiptesis
La Estadstica
La estadstica descriptiva, se dedica a la descripcin,
visualizacin y resumen de datos originados a partir de los
fenmenos de estudio. Los datos pueden ser resumidos numrica
o grficamente.
La estadstica inferencial, se dedica a la generacin de los
modelos, inferencias y predicciones asociadas a los fenmenos en
cuestin teniendo en cuenta la aleatoriedad de las observaciones.
Para comprender la estadstica como herramienta primero debemos tener claridad respecto del concepto de VARIABLE
Definicin de Variable
Para Kerlinger y Lee, una variable es un smbolo al que se le asignan valores o nmeros
Segn Hugh Coolican, una variable es cualquier cosa que vare.
Esta variabilidad puede registrarse mediante una observacin.
Existen diferentes niveles de dificultad para medir distintas variables, segn sea el tipo.
Al trabajar con variables psicosociales debemos especificarlas con mucha precisin, en parte, porque queremos ser precisos al medir sus cambios y tambin, porque deseamos comunicarnos con otros acerca de nuestros hallazgos.
Trabajo en Grupo
Intente escribir su propia definicin de:
INTELIGENCIA
ACTITUD
PARTICIPACION ESTUDIANTIL
D ejemplos de personas que posean estas caractersticas en diferentes niveles de posesin del atributo
Constructos Hipotticos
Todos manejamos conceptos psicosociales desde nuestra niez.
Creamos nuestras propias conceptualizaciones conforme
avanzamos en nuestro proceso de socializacin.
De all que nos resulte fcil apreciar caractersticas como la
inteligencia la simpata la ansiedad, etc.
La tendencia a tratar un concepto abstracto como si tuviera
existencia independiente se conoce como REIFICACION
Constructos Hipotticos
Algunos psiclogos (especialmente conductistas), argumentaron que
los eventos observables son todo lo que debemos de preocuparnos.
Otros psiclogos argumentaran que hay ms. Que la actitud hacia
una persona es ms que la suma de las afirmaciones y acciones
hacia el objeto de la actitud.
Ningn fsico ha visto directamente un tomo o un quark. Esto no es
fsicamente posible. Lo que hacen es asumir que los tomos y los
quark existen y entonces agotan toda la evidencia fsica que se
explica mediante ellos.
Los quarks son constructos hipotticos, y sobrevivirn como parte de
una Teora general en tanto la cantidad que expliquen sea bastante
mayor a la que contradigan
Concepto de Variable y Clasificacin
Podemos entender que una variable es una propiedad que puede variar y cuya variacin es
susceptible de medirse u observarse.
Las variables se pueden clasificar en categricas y continuas.
Las variables categricas clasifican a los sujetos distribuyndolos en grupos, de acuerdo a
algn atributo previamente establecido, por ejemplo, el idioma, la ocupacin, etc. Este tipo
de variables se subdividen a su vez en dos:
a) variables dicotmicas que poseen dos categoras
b) variables policotmicas que establecen tres o mas categoras
Son variables continuas cuando se miden atributos que toman un nmero infinito de
valores, como por ejemplo, el peso, la talla, la estatura, etc.
Concepto de Variable y Clasificacin
Las variables tambin pueden clasificarse como:
Variable independiente: Es la variable que antecede a una variable dependiente, la que se
presenta como causa y condicin de la variable dependiente, es decir, son las condiciones
manipuladas por el investigador a fin de producir ciertos efectos.
Variable dependiente: Es la variable que se presenta como consecuencia de una variable
antecedente. Es decir, que es el efecto producido por la variable que se considera
independiente, la cual es manejada por el investigador.
Variable interviniente o alterna: Es la variable que aparece interponindose entre la
variable independiente y la variable dependiente y en el momento de relacionar las variables
interviene en forma notoria.
Operacionalizacin de Variables
Es un proceso que se inicia con la definicin de las variables en funcin de factores
estrictamente medibles a los que se les llama indicadores.
El proceso obliga a realizar una definicin conceptual de la variables para romper el
concepto difuso que ella engloba y as darle sentido concreto dentro de la investigacin , luego
en funcin de ello se procese a realizar la definicin operacional de la misma para
identificar los indicadores que permitirn realizar su medicin de forma emprica y
cuantitativa, al igual que cualitativamente llegado el caso.
DEFINICIN CONCEPTUAL: Constituye una abstraccin articulada en palabras para
facilitar su comprensin y su adecuacin a los requerimientos prcticos de la investigacin.
DEFINICIN OPERACIONAL: Est constituida por una serie de procedimientos o
indicaciones para realizar la medicin (observacin) de una variable definida
conceptualmente.
Definicin Conceptual
Es la definicin abstracta y formal de la variable. Semejante a una definicin de diccionario.
Deriva de la Teora existente, por lo tanto, al formularla se debe dar cuenta de la fuente involucrada
Ejemplo:
Cultura Organizacional: se refiere a las presunciones y creencias bsicas que comparten los miembros de una organizacin respecto al comportamiento y conductas que en ellas se establecen como adecuadas (Shein, 1995)
Definicin Operacional
En la bsqueda de objetividad los cientficos tratan de volver
operacionales sus variable.
Es la serie de actividades requeridas para medir el concepto.
Algo as como un juego de instrucciones.
Ejemplos:
En la Fsica el concepto de Presin se define operacionalmente
como la masa por unidad de rea.
Memoria a Corto Plazo: lista ms larga de dgitos que el
participante recuerde a la perfeccin
Para compartir significados
Para asegurar que las variables puedan ser evaluadas en la realidad emprica
Para confrontar la investigacin con otras similares
Para evaluar mejor los resultados de la investigacin, al haber sido contextualizadas las variables.
Por qu es importante definir las variables conceptual y operacionalmente?
Trabajo en Grupo
Suponga que desea poner a prueba las siguientes hiptesis de trabajo:
1. Los nios castigados en forma fsica son ms agresivos
2. El deterioro de la memoria es resultado del estrs en el trabajo
3. El clima universitario est determinado por la calidad de las relaciones entre el alumnado con el profesorado
Identifique las variables para cada una de las hiptesis y construya la definicin conceptual y operacional para cada una de ellas.
FORMULACION DE HIPOTESIS
Las hiptesis son el punto de enlace entre la teora y la observacin. Su importancia radica en que dan rumbo a la investigacin al sugerir los pasos y procedimientos siguientes en el proceso investigativo
Cuando la hiptesis de investigacin ha sido bien elaborada, y en ella se observa claramente la relacin o vnculo entre dos o mas variables, es factible que el investigador pueda:
1. Elaborar el objetivo, o conjunto de objetivos que desea alcanzar en el desarrollo de la
investigacin
2. Seleccionar el tipo de diseo de investigacin factible con el problema planteado.
3. Seleccionar el mtodo, los instrumentos y las tcnicas de investigacin acordes con el
problema que se desea resolver, y
4. Seleccionar los recursos, tanto humanos como materiales, que se emplearn para llevar
a cabo la investigacin planteada.
FORMULACION DE HIPOTESIS
Una hiptesis puede estar basada simplemente en una sospecha, en los resultados de otros estudios y la esperanza de que una relacin entre una o mas variables se den en el estudio en cuestin.
O pueden estar basadas en un cuerpo de teoras que, por un proceso de deduccin lgica, lleva a la prediccin de que, si estn presentes ciertas condiciones, se darn determinados resultados.
La elaboracin de una buena hiptesis tiene como punto de partida el conocimiento del rea en la que se desea hacer la investigacin, sin este conocimiento previo se corre el riesgo de recorrer caminos ya transitados y trabajar en temas ya tratados que carecen de inters para la ciencia.
"Es una expresin conjetural de la relacin que existe entre dos o ms variables. Siempre aparece en forma de oracin aseverativa y relaciona de manera general o especfica, una variable con otra
Kerlinger (1985)
FORMULACION DE HIPOTESIS
Requisitos para la formulacin de Hiptesis:
Es una afirmacin que expresa la relacin entre 2 o ms variables
Debe formularse en trminos claros, es decir, emplear palabras precisas
que no den lugar a mltiples interpretaciones. La claridad con que se formulen es fundamental, debido a que constituyen una gua para la investigacin.
Debe tener un referente emprico, ello hace que pueda ser
comprobable. Una hiptesis sin referente emprico se transforma en un juicio de valor al no poder ser comprobable, verificable, carece de validez para la ciencia.
Las afirmaciones formalizadas en las hiptesis deben ser validadas mediante la observacin emprica y sometidas a procedimientos de comprobacin formales y
universalmente convenidos.
Estas pruebas de las diferencias o relaciones entre las variables se realizan
utilizando como herramienta la Estadstica Inferencial
Las pruebas de hiptesis pueden ser:
1. De Laboratorio
2. De Campo
Qu evitar en una hiptesis?
1.- No incluya Teora:
No decimos Las personas recordarn ms porque Slo afirmamos lo que esperamos que suceda.
2.- Los efectos se definen con precisin:
No decimos La memoria mejorar. sino que definimos de manera exacta cmo se medir el mejoramiento, las personas recordarn de manera significativa ms reactivos..
Las hiptesis pueden clasificarse en:
1. De Diferencia de Relacin
2. Direccional Bidireccional (1 o 2 colas)
Hiptesis de Diferencia vs Relacin Se refiere a la forma de relacionar las variables de manera tal que se define el
diseo a utilizar en la investigacin:
EJEMPLOS
Las mujeres poseen mayor capacidad emptica que los hombres
A mayor cantidad de horas de trabajo semanal, mayores niveles de stress
laboral
Los alumnos de 2do. y 3er. ao se involucran ms en actividades
extraprogramticas que los de 1ero o los de 4to y 5to.
Cuando los estudiantes asisten poco a clases, tienen bajas calificaciones
Mientras ms avanzada es la edad de las personas, mayor deterioro de la
memoria demostrarn
Existen diferencias en los niveles de autoestima entre los nios de
colegios particulares respecto de los nios de colegios municipales
Las mujeres poseen mayor capacidad emptica que los hombres Diferencia
A mayor cantidad de horas de trabajo semanal, mayores niveles de stress
laboral Correlacin
Los alumnos de 2do. y 3er. ao se involucran ms en actividades
extraprogramticas que los de 1ero o los de 4to y 5to. Diferencia
Cuando los estudiantes asisten poco a clases, tienen bajas calificaciones Correlacin
Mientras ms avanzada es la edad de las personas, mayor deterioro de la
memoria demostrarn Correlacin
Existen diferencias en los niveles de autoestima entre los nios de
colegios particulares respecto de los nios de colegios municipales Diferencia
Hiptesis de Diferencia vs Relacin Se refiere a la forma de relacionar las variables de manera tal que se define el
diseo a utilizar en la investigacin:
EJEMPLOS
Hiptesis Direccionales o Bidireccionales Se refiere a la direccin en la que se predice el efecto de la interaccin entre las variables. Tambin se les llama hiptesis de una cola o de dos colas
EJEMPLOS
Los alumnos de 2do. y 3er. ao se involucran ms en
actividades extraprogramticas que los de 1ero o los de 4to
y 5to.
Existen diferencias en los niveles de autoestima entre los
nios de colegios particulares respecto de los nios de
colegios municipales
Cuando los estudiantes asisten poco a clases, tienen bajas
calificaciones
Mientras ms avanzada es la edad de las personas, mayor
deterioro de la memoria demostrarn
Los alumnos de 2do. y 3er. ao se involucran ms en
actividades extraprogramticas que los de 1ero o los de 4to
y 5to.
Una cola
Existen diferencias en los niveles de autoestima entre los
nios de colegios particulares respecto de los nios de
colegios municipales
Dos colas
Cuando los estudiantes asisten poco a clases, tienen bajas
calificaciones Una cola
Mientras ms avanzada es la edad de las personas, mayor
deterioro de la memoria demostrarn Una cola
Hiptesis Direccionales o Bidireccionales Se refiere a la direccin en la que se predice el efecto de la interaccin entre las variables. Tambin se les llama hiptesis de una cola o de dos colas
EJEMPLOS
HIPOTESIS Relacin colas
Las mujeres son ms fumadoras que los hombres
Los estudiantes muestran diferencias en el grado de stress
ante las pruebas de estadstica respecto de las de ingls
Los profesores muestran diferencias en el modo de
evaluar a los alumnos segn el favoritismo que sientan por
cada uno de ellos
Los administrativos de las carreras de las Ciencias
Sociales son ms amables que los de Ciencias Jurdicas
Si a las personas se les formulan preguntas embarazosas,
es ms probable que desven la mirada.
El puntaje obtenido por los estudiantes en la PSU est
relacionado con el rendimiento acadmico que exhibirn
en su primer ao de universidad.
TRABAJO
HIPOTESIS Relacin colas
Las mujeres son ms fumadoras que los hombres Diferencia 1 cola
Los estudiantes muestran diferencias en el grado de stress
ante las pruebas de estadstica respecto de las de ingls Diferencia 2 colas
Los profesores muestran diferencias en el modo de
evaluar a los alumnos segn el favoritismo que sientan por
cada uno de ellos
Diferencia 2 colas
Los administrativos de las carreras de las Ciencias
Sociales son ms amables que los de Ciencias Jurdicas Diferencia 1 cola
Si a las personas se les formulan preguntas embarazosas,
es ms probable que desven la mirada. Correlacin 1 cola
El puntaje obtenido por los estudiantes en la PSU est
relacionado con el rendimiento acadmico que exhibirn
en su primer ao de universidad.
Correlacin 2 colas
TRABAJO GRUPAL
Cuando es exitosa una Prueba de Hiptesis?
Esta decisin se basa completamente en una PRUEBA DE SIGNIFICACION, la cual estima la probabilidad de que la hiptesis nula sea verdadera
Si la Prueba de Hiptesis falla, del mismo modo aceptamos la hiptesis nula como informacin importante o evaluamos en forma crtica el diseo del proyecto buscando sus debilidades.
Control de Lectura N1
Mtodos de Investigacin y Estadstica en Psicologa
Coolican, Hugh
Capitulo 1 Psicologa e Investigacin
Pags 3 - 22
CONTENIDOS
Estadisticos de tendencia central, dispersion y posicion. -
Distribucio n de datos, asimetri a y curtosis.
Tablas de frecuencias.
Presentacio n de resultados: Numerica, tablas y graficos.
UNIDAD 2
Estadstica Descriptiva
Estadstica Descriptiva
Escalas de Medicin
Medidas de Tendencia Central
Medidas de Dispersin
Grficos
Escalas de Medicin
En la estadstica descriptiva y con el fin de realizar pruebas de
significancia, las variables se clasifican de la siguiente manera de
acuerdo con su nivel de medida:
1. Nominal (tambin categrica o discreta)
2. Ordinal
3. Intervalo o intervalar
4. De razn o racional
Escala Nominal El nivel nominal de medicin, de la palabra latina nomn (nombre)
describe variables de naturaleza categrica que difieren en calidad ms
que en cantidad. Ante las observaciones que se realizan de la realidad, es
posible asignar cada una de ellas exclusivamente a una categora o grupo.
Esta escala comprende variables categricas que se identifican por
atributos o cualidades. Las variables de este tipo nombran e identifican
distintas categoras sin seguir un orden. El concepto nominal sugiere su
uso que es etiquetar o nombrar. El uso de un nmero es para identificar. Un nmero no tiene mayor valor que otro.
Escala Ordinal
El nivel ordinal describe las variables a lo largo de un continuo sobre el que
se pueden ordenar los valores. En este caso las variables no slo se
asignan a grupos sino que adems pueden establecerse relaciones de
mayor que, menor que o igual que, entre los elementos.
Las variables de este tipo adems de nombrar se considera el asignar un
orden a los datos. Esto implica que un nmero de mayor cantidad tiene un
ms alto grado de atributo medido en comparacin con un nmero menor, pero las diferencias entre rangos pueden no ser iguales.
Escala Intervalar El nivel de intervalo procede del latn interval lun (espacio entre
dos paredes).
Este nivel integra las variables que pueden establecer intervalos
iguales entre sus valores.
Las variables del nivel de intervalos permiten determinar la
diferencia entre puntos a lo largo del mismo continuo. Las
operaciones posibles son todas las de escalas anteriores, ms
la suma y la resta.
En este tipo de medida, los nmeros asignados a los objetos
tienen todas las caractersticas de las medidas ordinales, y
adems las diferencias entre medidas representan intervalos
equivalentes.
En estas variables el punto cero de la escala es arbitrario y
se pueden usar valores negativos, no significa ausencia de valor
y existe una unidad de igualdad entre los valores.
Las medidas de tendencia central pueden representarse
mediante la moda, la mediana al promedio aritmtico. El promedio proporciona ms informacin.
Escala De Razn
El nivel de razn, cuya denominacin procede del latn ratio (clculo),
integra aquellas variables con intervalos iguales pueden situar un cero
absoluto. Estas variables nombran orden, presentan intervalos iguales y
el cero significa ausencia de la caracterstica. El cero absoluto supone
identificar una posicin de ausencia total del rasgo o fenmeno.
La presencia de un cero absoluto permite utilizar operaciones
matemticas ms complejas a las otras escalas. Hasta ahora se poda
asignar, establecer la igualdad (nominal), mayor o menor que (ordinal),
sumar y restar (intervalo) a las que se aade multiplicar, dividir, etc.
Medidas de Tendencia Central
Moda
Mediana
Media
La Moda
La moda se refiere al dato ms repetido, el valor de la variable con
mayor frecuencia absoluta.
En cierto sentido la definicin matemtica corresponde con la locucin
"estar de moda", esto es, ser lo que ms se lleva.
Su clculo es extremadamente sencillo, pues slo necesita un recuento.
Por ejemplo, el nmero de personas en distintos vehculos en una
carretera: 5-7-4-6-9-5-6-1-5-3-7. El nmero que ms se repite es 5,
entonces la moda es 5.
Hablaremos de una distribucin bimodal de los datos, cuando
encontremos dos modas, es decir, dos datos que tengan la misma
frecuencia absoluta mxima. Cuando en una distribucin de datos se
encuentran tres o ms modas, entonces es multimodal. Por ltimo, si
todas las variables tienen la misma frecuencia diremos que no hay moda.
La Mediana
En el mbito de la estadstica, la mediana, representa el
valor de la variable de posicin central en un conjunto
de datos ordenados.
De acuerdo con esta definicin el conjunto de datos
menores o iguales que la mediana representarn el 50%
de los datos, y los que sean mayores que la mediana
representarn el otro 50% del total de datos de la muestra.
La Media
En matemticas y estadstica una media o promedio es
una medida de tendencia central que segn la Real
Academia Espaola (2001) [] resulta al efectuar una serie determinada de operaciones con un conjunto de
nmeros y que, en determinadas condiciones, puede representar por s solo a todo el conjunto
Propiedades de La Media
La suma de las desviaciones de todas las puntuaciones de una
distribucin respecto a la media de la misma es igual a cero.
Si a todos los valores de la variable se les suma un mismo nmero,
la media aritmtica queda aumentada en dicho nmero.
Si todos los valores de la variable se multiplican por un mismo nmero la media aritmtica queda multiplicada por dicho nmero.
Desventajas de La Media
Es sensible a los valores extremos.
No es recomendable emplearla en distribuciones muy asimtricas.
Si se emplean variables discretas o cuasi-cualitativas, la media
aritmtica puede no pertenecer al conjunto de valores de la variable.
Tablas de Frecuencias
La distribucin de frecuencias o tabla de frecuencias es una
ordenacin en forma de tabla de los datos estadsticos,
asignando a cada dato su frecuencia correspondiente.
Tablas de Frecuencias
Supongamos que le entregan su primera nota en Estadstica y que obtuvo
una calificacin de 86.
Qu tan bueno fue ese resultado respecto de sus compaeros? Cuntos obtuvieron 86? Hubo muchas calificaciones mas altas? Cuntas fueron mas bajas?
Calificaciones
95 57 76 93 86 80 89
76 76 63 74 94 96 77
65 79 60 56 72 82 70
67 79 71 77 52 76 68
72 88 84 70 83 93 76
82 96 87 69 89 77 81
87 65 77 72 56 78 78
58 54 82 82 66 73 79
86 81 63 46 62 99 93
82 92 75 76 90 74 67
Distribucin de Frecuencias
Las calificaciones de la
tabla anterior han sido
dispuestas en la presente
distribucin de frecuencias
Una distribucin de
frecuencias presenta los
valores de los datos y la
frecuencia con que se
presentan.
Al ser mostrados en una
tabla, los valores de los
datos se presentan en
orden y por lo general el
valor del dato mas bajo
aparece en la parte inferior
de la tabla
Calif f Calif f Calif f Calif f
99 1 85 0 71 1 57 1
98 0 84 1 70 2 56 2
97 0 83 1 69 1 55 0
96 2 82 5 68 1 54 1
95 1 81 2 67 2 53 0
94 1 80 1 66 1 52 1
93 3 79 3 65 2 51 0
92 1 78 2 64 1 50 0
91 0 77 4 63 2 49 0
90 1 76 6 62 1 48 0
89 2 75 1 61 0 47 0
88 1 74 2 60 1 46 1
87 2 73 1 59 0
86 2 72 3 58 1
Datos Agrupados
Amplitud = 2 Amplitud = 19
Intervalo f Intervalo f Intervalo f
98-99 1 70-71 3 95-113 4
96-97 2 68-69 2 76-94 38
94-95 2 66-67 3 57-75 23
92-93 4 64-65 2 38-56 5
90-91 1 62-63 3
88-89 3 60-61 1 Cuando se dispone de muchos datos con un rango muy amplio, la
enumeracin de los casos individuales
produce muchos valores cuya
frecuencia es cero (nula) y resulta
difcil visualizar la forma de la
distribucin.
86-87 4 58-59 1
84-85 1 56-57 3
82-83 6 54-55 1
80-81 3 52-53 1
78-79 5 50-51 0 En estos casos, los datos se agrupan en intervalos de clase y se presentan como
una distribucin de datos agrupados
76-77 10 48-49 0
74-75 3 46-47 1
72-73 4
Construccin de una distribucin de frecuencias
Pasos para la elaboracin de una distribucin de frecuencias
de datos agrupados
1. Se busca el valor mximo de la variable y el valor mnimo. Con estos datos
se determina el rango.
2. Se divide el rango en la cantidad de intervalos que se desea tener,
obtenindose as la amplitud o tamao de cada intervalo.
3. Comenzando por el mnimo valor de la variable, que ser el extremo inferior
del primer intervalo, se suma a este valor la amplitud para obtener el extremo
superior y as sucesivamente.
4. Contar los datos en bruto contenidos en los intervalos de clase
correspondientes
5. Sumar las cuentas de cada intervalo para obtener la frecuencia del intervalo.
Construccin de una distribucin de frecuencias
Construccin de una distribucin de frecuencias
Construccin de una distribucin de frecuencias
Construccin de una distribucin de frecuencias
Construccin de una distribucin de frecuencias
Intervalo Lmites Reales Conteo f
95-99 94,5 - 99,5 4
90-94 89,5 94,5 6
85-89 84,5 89,5 7
80-84 79,5 - 84,5 10
75-79 74,5 - 79,5 16
70-74 69,5 - 74,5 9
65-69 64,5 - 69,5 7
60-64 59,5 - 64,5 4
55-59 54,5 - 59,5 4
50-54 49,5 - 54,5 2
45-49 44,5 - 49,5 1
Tablas de Frecuencias Frecuencia absoluta
La frecuencia absoluta es el nmero de veces que aparece un determinado
valor en un estudio estadstico.
Se representa por f
Frecuencia relativa
Indica la proporcin del nmero total de datos que aparecen en cada intervalo
Se calcula dividiendo el n de casos del intervalo por el total de la muestra.
La suma de las frecuencias relativas es igual a 1.
Frecuencia acumulada
Indica el numero de datos que estn por debajo del lmite real superior de
cada intervalo
La frecuencia acumulada es la suma de las frecuencias absolutas de
todos los valores inferiores o iguales al valor considerado.
Porcentaje Acumulado
Indica el porcentaje de datos que estn por debajo del lmite real superior de
cada intervalo.
Desarrolle una Tabla de Frecuencia
de seis intervalos de clase
Prueba de Ctedra N1
Materia de Clases
BIBLIOGRAFIA Mtodos de Investigacin y Estadstica en Psicologa
Coolican, Hugh
Capitulo 13 Estadstica Descriptiva (Pags 239 270)
Ejercicios de Tablas en SPSS
Medidas de Dispersin
Rango
Rango Semi-intercuartil
Desviacin Media
Desviacin Estndar
Varianza
Rango
La tendencia central de un conjunto de datos es una buena forma de
describir sus caractersticas, pero sin conocer su DISTRIBUCION o
DISPERSION un promedio puede ser muy engaoso
La manera ms sencilla de medir la variacin entre un conjunto de
valores es utilizar lo que se denomina RANGO
El promedio de la figura (a) puede ser el mismo que la figura (b), pero la
distribucin puede ser muy diferente.
El RANGO es simplemente la distancia entre los valores mximo y
mnimo en un conjunto de datos
Rango
VENTAJAS
Fcil de calcular
Incluye valores extremos
DESVENTAJAS
Se distorsiona con valores extremos
No es representativo de ninguna carcterstica de la distribucin de
valores entre los extremos. Ej: No nos dice si los valores estan
agrupados o no alrededor de la media
Desviacin Semi Intercuartil Nace a partir de una desventaja del Rango. Es una medicin del
agrupamiento central de los valores.
Se concentra en la distancia entre los dos valores que cortan el 25% de
la puntuacin ms alta y ms baja. Estos dos valores se conocen como
los percentiles 25 y 75, o bien, el primer y tercer cuartil (Q1 y Q3)
La desviacin semi Intercuartil es la mitad de la distancia entre estos dos valores
Desviacin Semi Intercuartil
PROCEDIMIENTO
Encuentre el Q1 y Q3
Reste Q1 de Q3
Divida el resultado por dos (2)
VENTAJAS
Es representativo del agrupamiento central de valores
Es muy sencillo de calcular
DESVENTAJAS
No considera valores extremos
Es inexacto cuando existen intervalos largos de clase
La Desviacin Media
El VALOR DE DESVIACION es la diferencia entre cualquier valor
particular y la Media. Es una medicin de qu tan lejos se desva ese
valor de la media. En trminos formales:
Desviacin Estndar y Varianza Otra manera de salir del problema de que la suma de las desviaciones
sea cero es calcular el cuadrado de cada desviacion (d2)
Lo anterior tambien har desaparecer los valores negativos pero si
tomamos la media de esos valores obtendremos un numero bastante
grande y que no es representativo del conjunto de desviaciones. Este
valor se le conoce como la VARIANZA
La Desviacin Estndar se calcula a partir de la raz cuadrada de la
Varianza, esto para regresarnos al nivel original en el que estn expresadas las desviaciones
REPRESENTACION GRAFICA
Histograma
Grafico de Barras
Polgono de Frecuencia
Ojiva
El Histograma
Un histograma muestra columnas del mismo ancho las cuales
representan los intervalos de clase de una distribucin
Cada una de estas barras se representa por un punto medio al centro
de cada columna
La altura de las columnas representa el numero de valores (n) que se encuentran en ese intervalo
El Grfico de Barras
As como el histograma muestra una variable contnua, una
grfica de barras muestra una variable categrica, la cual
normalmente se coloca en el eje horizontal (x)
De lo anterior se deriva que las columnas se grafican de forma
separada, a pesar de que en muchas ocasiones no se muestran as
Polgono de Frecuencias
Si tomamos como referencia un histograma, enfocndonos
exclusivamente en los puntos centrales de las partes alta de
todas las columnas ontendremos lo que se conoce como
Polgono de Frecuencia al unir todos estos puntos.
Esto es muy til cuando se muestra la comparacin del progreso en dos o ms condiciones de estudio
La Ojiva La Ojiva se obtiene al delinear una distribucin de frecuencias
acumuladas. Los puntos muestran el nmero de casos que estn
acumulados por debajo del intervalo de clase correspondiente.
Tambin se puede construir una ojiva a partir de los porcentajes
acumulados de una Tabla de Frecuencias
La forma de una Ojiva sera similar a una S siempre que su correspondiente histograma fuera normal
LA DISTRIBUCION NORMAL
Fundamento y Descripcin
Si tomamos una muestra aleatoria lo suficientemente grande de
individuos de una poblacin y medimos cualidades fsicas como la
altura, peso, IMC, etc, obtendremos una distribucin parecida a la
siguiente figura:
La curva que resulta de este tipo de mediciones se aproxima de modo
cercano a una curva matemtica muy bien conocida desarrollada por
Gauss denominada comnmente CURVA DE DISTRIBUCION NORMAL
Distribucin Normal
La grfica de su funcin de densidad tiene una forma acampanada y es
simtrica respecto de un determinado parmetro estadstico.
Esta curva se conoce como campana de Gauss y es el grfico de
una funcin gaussiana.
La importancia de esta distribucin radica en que
permite modelar numerosos fenmenos naturales, sociales y psicolgicos.
Mientras que los mecanismos que subyacen a gran parte de este tipo de
fenmenos son desconocidos, por la enorme cantidad de variables
incontrolables que en ellos intervienen, el uso del modelo normal puede
justificarse asumiendo que cada observacin se obtiene como la suma de
unas pocas causas independientes.
Propiedades de la Curva Normal
1. Es simtrica respecto al punto medio del eje horizontal
2. El punto por el que es simtrica es el mismo punto en que caen la Moda (Mo),
la Mediana (Md) y la Media ();
3. Las asntotas (final de las colas) de la curva nunca tocan el eje horizontal
4. Se sabe qu rea se encuentra bajo la curva entre el punto central (Media) y el
punto en el que cae una desviacin estndar. De esta forma podemos calcular
cualquier rea dentro de la curva
En el intervalo [ - , + ] se encuentra comprendida, aproximadamente, el
68,26% de la distribucin;
En el intervalo [ - 2, + 2] se encuentra, aproximadamente, el 95,44% de
la distribucin;
En el intervalo [ -3, + 3] se encuentra comprendida, aproximadamente, el
99,74% de la distribucin.
Area bajo la curva normal
Estandarizacin de variables aleatorias normales
Como consecuencia de la Propiedad 1; es posible relacionar todas
las variables aleatorias normales con la distribucin normal
estndar.
La transformacin de una distribucin X (, ) en una N (0, 1) se llama normalizacin, estandarizacin o tipificacin de la variable X.
xxZ
Puntaje Z y Curva Normal
Un puntaje Z lo que hace es decirnos a cuntas unidades de
desviacin estndar del promedio est un puntaje determinado, o
sea, no contamos en cantidad de puntos, sino en cantidades de
desviaciones estndar. Para utilizar el puntaje Z requerimos que la
distribucin sea normal y conocer el promedio y la desviacin estndar
de los puntajes.
xxZ
Ejercicio 1
Suponemos que Jos, un estudiante de psicologa, obtuvo en su primer
ao de universidad un rendimiento promedio de 5,5
Si su generacin de ingreso obtuvo un rendimiento promedio de 5,2 con
una desviacin tpica de 0,4 cul es el valor z del rendimiento del
estudiante?
Sus compaeros Ricardo y Natalia obtuvieron 4,8 y 5,1 respectivamente
Qu valores de z les corresponde a ambos?
Ejercicio 2
Juan es estudiante de Psicologa de la UDLA, en la asignatura de Metodologa I
aprob con un promedio de 5,8
Su prima Anglica, tambin estudiante de Psicologa, obtuvo un 6,1 en la misma
asignatura, pero ella estudiaba en la UCEN
Si histricamente el promedio de la UDLA en ese ramo es de un 4,8 con una DS de
1,2 y en la UCEN es de un 4,3 con una DS de 0,8
1. A cul de los dos le fue mejor?
2. Qu porcentaje de compaeros de Juan obtuvieron un promedio inferior a l?
3. Qu porcentaje de compaeros obtuvo un promedio superior a Anglica?
Ejercicio 3
En una distribucin de puntajes C.I. que ha sido estandarizada con
media de 100 y desviacin estndar de 15
1. Qu puntuacin Z obtendra una persona con calificacin C.I. de
110?
2. A partir de qu puntaje CI se espera acumular el 75% de personas
con puntaje ms alto?
3. Qu porcentaje de personas se esperara que califiquen con menos
de 90 C.I.?
Ejercicio 4
Un grupo de 60 profesores son sometidos a contestar un instrumento
que mide Burnout en una escala de 1 a 100 puntos. Dicho instrumento
se encuentra estandarizado para la poblacin chilena, por lo tanto se
sabe que la media poblacional es de 60,0 puntos y la DS es de 10,5
El profesor Morales obtuvo un puntaje bruto de 65 puntos
1. Cul sera el valor de su puntaje normalizado?
2. Cuntos profesores habrn obtenido un puntaje menor al profesor
Morales?
3. Cuntos un puntaje mayor?
4. Que porcentaje se encuentra entre 55 y 62 puntos?
5. Si se desea dividir la muestra en 3 grupos de Alto, Medio y Bajo
puntaje CI Cules seran los puntajes de corte?
Ejercicio 5
Un grupo de 120 estudiantes son sometidos a contestar un instrumento
que mide satisfaccin usuaria con los servicios de la UDLA. Para ello se
utiliza un instrumento estandarizado que utiliza una escala de 1 a 100
puntos el cual se encuentra estandarizado para la poblacin objetivo con
media 65,0 puntos y una S de 12,5
1. Cuntos estudiantes se esperara que obtengan un puntaje menor
a los 50 puntos?
2. Cuntos estudiantes obtendran entre 52 y 67 puntos?
3. Si se desea dividir la muestra en 3 grupos de Alto, Medio y Bajo
puntaje y para ello decide utilizar terciles, Cules seran los
puntajes de corte?
Ejercicio 5
Un grupo de 120 estudiantes son sometidos a contestar un instrumento
que mide satisfaccin usuaria con los servicios de la UDLA. Para ello se
utiliza un instrumento estandarizado que utiliza una escala de 1 a 100
puntos el cual se encuentra estandarizado para la poblacin objetivo con
media 65,0 puntos y una S de 12,5
1. Cuntos estudiantes se esperara que obtengan un puntaje mayor a
los 45 puntos?
2. Cuntos estudiantes obtendran entre 66 y 69 puntos?
3. Si se desea dividir la muestra en 2 grupos (Alto y Bajo puntaje)
Cual seria el punto de corte?
Control Curva Normal (12 pts)
Un grupo de 500 profesores son sometidos a contestar un instrumento
que mide stress laboral. Para ello se utiliza un instrumento que utiliza
una escala de 1 a 50 puntos el cual se encuentra estandarizado para la
poblacin chilena con media de 27,0 puntos y una S de 5,2
1. Si un profesor obtuviese un puntaje de 22 puntos qu cantidad de
profesores obtendran un puntaje mayor?
2. Qu puntaje de stress acumulara al 25% de profesores con puntaje
ms bajo?
3. Si se desea dividir la muestra en 3 grupos iguales de Alto, Medio y
Bajo puntaje y para ello decide utilizar terciles, Cules seran los
puntajes de corte?
4. Considerando los parmetros anteriores (media, desviacin y puntos
de corte) Si una muestra de 100 profesores de la UDLA obtuviesen
un promedio de 30 pts Qu podra usted afirmar respecto a los
profesores de esta universidad? estn estresados o no?
Fundamente
Ejercicio de Prueba de Significacin Simple
Suponga que se descubre un grupo de nios criados en una comunidad donde la escolarizacin se ha conducido como parte de la vida diaria. La lectura no se ha enseado en lecciones, sino que se ha integrado a las actividades normales. Un visitador educativo est impresionado y quiere comparar estos nios con la media nacional
Imagine que aplicamos una prueba de lectura estandarizada a nivel nacional, con una media de 40 pts. y DS de 10 pts.
Al revisar los resultados constatamos que los nios han obtenido un promedio de 61 puntos.
Existen diferencias significativas entre el desempeo de los nios respecto de la poblacin?
Ejercicio de Prueba de Significacin Simple
Un grupo de integrantes de un CEP est preocupado por la nula participacin estudiantil que percibe entre sus compaeros. Para establecer una medida mas objetiva de su percepcin decide aplicar un instrumento estandarizado que mide la participacin en una escala de 1 a 10 (con una media de 4,0 y desviacin estndar de 0,8) a una muestra al azar de 50 estudiantes (10 estudiantes por nivel) obteniendo un promedio de 3,2 pts
Podra concluirse que sus compaeros efectivamente demuestran bajo nivel de participacin comparados frente al parmetro de la poblacin? Demuestre con un alfa de 0,01
Zonas de Aceptacin y Rechazo de la Ho
En la curva de distribucin se debe definir un rea que determine
probabilidades asociadas a distintos eventos posibles, los cuales, como
ya sabemos, pueden diferir en cuanto a su nivel de probabilidad de
ocurrencia.
Depender del nivel de significacin definido el punto de corte que
delimitar ambas zonas.
Tambin influir el tipo de hiptesis formulada, en cuanto a la
direccionalidad planteada.
Acepto Ho
Rechazo Ho
Rechazo Ho
Existen diferencias significativas entre el desempeo de los nios respecto de la poblacin
Acepto Ho
Rechazo Ho
95,105,0 critZ
Rechazo Ho
Existen diferencias significativas entre el desempeo de los nios respecto de la poblacin
1,2obsZ
Existen diversos niveles en los cuales los investigadores rechazan la hiptesis nula. Para ello, se calcula la probabilidad de que las diferencias en los resultados ocurran
por azar.
Los investigadores llaman a una diferencia significativa y rechazan la hiptesis nula de no diferencia cuando su probabilidad de ser verdadera cae por debajo de 0,05. Esto se conoce como Nivel de Significacin al 5%
Los niveles ms utilizados son:
5% (0.05)
1% (0.01)
Niveles de Significacin
PRINCIPIO FUNDAMENTAL
Nocin de rechazar la Hiptesis Nula (Ho) en un nivel de significacin especfico)
En la prctica, el nivel de p 0.05 es el estndar
En resumen:
Si un resultado es significativo (p 0.05), se rechaza la Ho
Si NO es significativo (p > 0.05), se acepta la Ho
Niveles de Significacin
Pruebas de 1 cola y 2 colas
Suponiendo que la adivinadora se equivoc en todas las predicciones Sera una adivinadora sin futuro? O Es un resultado interesante? (p=0.001)
Si nuestra prueba es de 1 cola y los resultados van en la direccin contraria, no podemos rechazar la Ho, aunque su p sea inferior a 0.05
Con la prueba de 2 colas podemos rechazar Ho en cualquiera que sea la direccin que tomen los resultados, siempre que su p
Acepto Ho
Rechazo Ho
Rechazo Ho
Si Ho es BIDIRECCIONAL (2 colas)
.
Acepto Ho Rechazo Ho Acepto Ho Rechazo Ho
Si Ho es UNIDIRECCIONAL (1 cola)
1.65
Z obs= 2.1
.
Acepto Ho Rechazo Ho
El desempeo de los nios ser mayor al de la poblacin
Por qu no hacer siempre pruebas de 2
colas?
La hiptesis de 1 cola es por lo general una prediccin especfica
de una teora
La significacin con predicciones de 2 colas son ms difciles de
alcanzar
- 1.96 1.96 1.65
Ejercicio
Cul es el valor crtico de Z cuyas puntuaciones Z obtenidas tendran
que sobrepasarse si los resultados debieran considerarse significativos
bajo los siguientes niveles de Alfa?
Dos colas 10% 2% 1%
Una cola 2.5% 1% 0.01%
Respuesta
Dos colas 10% 2% 1%
Z crtico 1.65 2.33 2.58
Una cola 2.5% 1% 0.01%
Z crtico 1.96 2.33 3.51
Cul es el valor crtico de Z cuyas puntuaciones Z obtenidas tendran
que sobrepasarse si los resultados debieran considerarse significativos
bajo los siguientes niveles de Alfa?
Error Tipo I y Error Tipo II
Al aceptar o rechazar la Hiptesis Nula a un nivel de significacin (comunmente p>0.05) podemos estar en lo correcto o equivocados. Nunca podemos estar seguros de que un efecto aparente no es una casualidad.
Si un investigador demanda apoyo para su hiptesis de su investigacin con un resultado significativo, cuando en realidad las variaciones en los mismos se deben a variables aleatorias, se dice que cometi un ERROR TIPO UNO (I)
Si el diseo de investigacin ha sido defectuoso y el muestreo deficiente, los investigadores pueden fracasar en obtener significancia, a pesar de que el efecto que intentan demostrar en realidad existe. En este caso se dice que han cometido un ERROR TIPO DOS (II)
Tipos de Error
La Hiptesis Nula se estima:
(investigador)
La Hiptesis Nula en realidad es
Aceptada Rechazada
Verdadera 1 - Error Tipo I
(Alfa)
Falsa Error Tipo II
(Beta) 1 -
Teora Bsica de Probabilidad
Porqu estudiar probabilidad?
El objetivo es mostrar los medios mediante los cuales los
investigadores deciden que es improbable que la
diferencia o asociacin entre las variables sea el
resultado de meras coincidencias
Tipos de Probabilidad
1. Probabilidad Lgica
2. Probabilidad Emprica
3. Probabilidad Subjetiva
La probabilidad subjetiva se refiere al sentimiento de
posibilidad que uno tiene acerca de ciertos eventos
Valor de Probabilidad
AFIRMACIONES Valor
Llover el Mircoles de la prxima semana
Tomar desayuno el primer da del mes entrante
Su profesor de psicologa social estornudar en la siguiente
clase
Le darn a usted un milln de pesos el prximo ao
El Sol saldr maana por la maana
Alguien chocar con usted ms tarde
Si se lanza una moneda al aire con entusiasmo caer
mostrando sello
Dos lanzamientos de una moneda con entusiasmo caern, en
las dos oportunidades sello
Probabilidad Lgica
Consiste en calcular la probabilidad con base a principios
lgicos.
Frmula de la probabilidad lgica
nmero de formas en que el resultado deseado puede ocurrir
p =
nmero total de resultados posibles
Si se lanza una moneda al aire con
entusiasmo caer mostrando sello 50 % = 0.5
Dos lanzamientos de una moneda caern
o cara o sello + = 1.0
Regla 1 de Probabilidad (la regla o)
La probabilidad del evento A del evento B es igual a p (A) + p (B)
La probabilidad de que caiga cara (0,5) sumada a la probabilidad que caiga sello (0,5) es 1
Si se lanza una moneda al aire con
entusiasmo caer mostrando sello 50 % = 0.5
Dos lanzamientos de una moneda con
entusiasmo caern, en las dos oportunidades
sello 25 % = 0.25
Regla 2 de Probabilidad (la regla y)
La probabilidad del evento A y del evento B es igual a p (A) x p (B)
La probabilidad de obtener dos sellos en dos lanzadas independientes es igual a la probabilidad del evento sello en el 1er lanzamiento y de otro sello en el 2do.
Ejemplo
1er lanzamiento 2do lanzamiento
Sello Sello
Sello Cara
Cara Sello
Cara Cara
Existen 4 eventos posibles.
Luego, la probabilidad de obtener 2 sellos en dos lanzamientos independientes es de , lo que es igual a 0,25
Ejercicios Ejercicio 1
En la sala hay 20 alumnos, y el profesor debe elegir a uno de ellos para
explicar lo que lleva entendido hasta ahora.
Cul es la probabilidad que lo elija a usted?
Qu tan probable es que elija a alguien ms?
Ejercicio 2
Pensando en el mismo curso de 20 alumnos.
Cul es la probabilidad de que usted apruebe la asignatura?
Cul sera la probabilidad de que los 20 alumnos del curso aprueben?
Soluciones Ejercicio 1
En la sala hay 20 alumnos, y el profesor debe elegir a uno de ellos para
explicar lo que lleva entendido hasta ahora.
La probabilidad de ser elegido es de 1 en 20. O sea, 1/20 = 0,05
Que escoja alguien ms es de 19/19, lo que da como resultado 1,00
Ejercicio 2
Pensando en el mismo curso de 20 alumnos.
La probabilidad de aprobar es de lo que es igual a 0,5
La probabilidad de que todos aprueben es de: 0,000000953674
Probabilidad Emprica
En eventos de la vida real es cuestionable efectuar clculos lgicos, pues existen demasiadas variables por explicar. En estas circunstancias los expertos se basan
en datos que ya se tienen disponibles. El proceso consiste en mirar hacia atrs.
Frmula de la probabilidad emprica
nmero de alumnos aprobados por ao
p =
nmero total de alumnos que se han inscrito en todos los aos
Ejercicio en Clase
Utilice la probabilidad emprica para 2 lanzamientos de una moneda.
Efecte 2 lanzamientos durante 50 veces y registre la cantidad de eventos:
a) Cara y Cara
b) Cara y Sello
c) Sello y Cara
d) Sello y Sello