Metodología de la Investigación - Tiza y Pc...4 Nivel hipotético-conceptual Plantear una...

Post on 15-Aug-2020

0 views 0 download

Transcript of Metodología de la Investigación - Tiza y Pc...4 Nivel hipotético-conceptual Plantear una...

1

Conceptos Básicos de Estadística

Metodología de la Investigación

2

Población y muestra

Población o universo es el conjunto de todas las unidades de interés o de análisis en donde los resultados del estudio deberán extrapolarse(hacer inferencia).

Normalmente es demasiado grande para poder abarcarlo.El estudio de toda la población se denomina censo

Muestra es un subconjunto al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones)

Debería ser “representativo”Esta formado por miembros “seleccionados”de la población (individuos, unidades experimentales o de observación).Fracción de muestreo: es la proporción de la población que está siendo muestreada (n/N)

N

n

3

Consiste en extrapolar las conclusiones extraídas de una muestra sobre la población

La población ideal que se pretende estudiar se denomina población objetivo, de referencia o de interés o universo.

No es fácil estudiarla por completo. Aproximamos mediante muestras que den idealmente la misma probabilidad a cada individuo de ser elegido.Tampoco es fácil elegir muestras de la población objetivo:Las conclusiones se deben aplicar a la población de la cual se extrajo la muestra

El grupo que en realidad podemos estudiar (por ej. los que tienen teléfono) se denomina población de referencia.

Inferencia estadística

4

Nivel hipotético-conceptual

Plantear una hipótesis sobre una población

Ejemplo: La terapia de aceptación y compromiso (ACT) ha sido utilizada

en el ámbito clínico para el tratamiento de un gran número de problemas, como los trastornos afectivos o psicóticos o el dolor crónico. Se sospecha que esta terapia podría ayudar a los deportistas en la identificación y el control de los eventos privados

Efectuar una predicción asociada a dicha hipótesis: los deportistas sometidos a dicha terapia tendrán un mejor rendimiento en competición

Pasos en una investigación

5

Nivel técnico-metodológico

Decidir qué datos tomar (diseño)Qué individuos pertenecerán al estudio (muestra)Criterios de inclusión y exclusión; cantidadQué datos tomar de los mismos (variables)

Tomar los datos (muestreo) o efectuar el experimento

Nivel estadístico-analítico

Describir (resumir) los datos obtenidosEstadísticos, tablas de frecuencias, gráficos

Efectuar inferencia sobre la poblaciónEstimación de parámetrosPruebas de hipótesis estadísticas

Pasos en una investigación (2)

6

Tipos de estudios según cómo se recopilan los datos

Estudios observacionales o mensurativos:El proceso que se observa no está siendo controlado. Observación pasiva. Los datos existen antes de que el investigador decidaestudiarlos.

Estudios experimentales o manipulativos:El investigador asigna activamente un tratamiento a los individuos a fin de observar la respuesta. Los datos son generados por el investigador.

7

Tipos de estudios según cómo se recopilan los datos

Estudios ObservacionalesNo se puede establecer una relación causa-efecto. El efecto puede ser accidental o consecuencia de otra/s variable/s no contempladas en el análisisUnidad de observación o individuoEl azar interviene en la obtención de los individuos

Estudios ExperimentalesLas diferencias que se observen en la respuesta son asignables al tratamiento aplicado y no a otro factorEl azar interviene en la asignación de los tratamientos

8

¿Dónde interviene el azar?

En los estudios observacionales: en la selección de las unidades de observación (muestreo)

En los estudios experimentales: en la asignación de los tratamientos a las unidades experimentales

9

Técnicas de muestreo

La representatividad de una muestra depende del procedimiento seguido para la selección de las unidades muestrales

Muestreos probabilísticosTodos los individuos tienen una probabilidad conocida de ser elegidos para formar parte de la muestra, asegurando la representatividad de la muestra elegidaPuede utilizarse estadística inferencial con ellos.

Muestreos no probabilísticosNo se conoce la probabilidad de selección del individuo.Son muestreos que pueden esconder sesgos.No se pueden extrapolar los resultados a la población.

Una buena parte de los estudios en psicología usa esta técnica

10

Muestreos no probabilísticos

Muestreo de voluntariosMuestreo por convenienciaMuestreo por cuotas

No se puede evaluar “Precisión” en términos probabilísticos,

No obliga a tener una base o “Marco” para la selección

No garantiza “representatividad” y se corre el riesgo de que se termine en un estudio de casos

11

Muestreos probabilísticos

Muestreo aleatorio simpleMuestreo sistemáticoMuestreo estratificadoMuestreo por conglomeradosMuestreo multietápicoMuestreo Proporcional a Tamaño

Elimina sesgos de selección y caprichos humanos,Permite emplear la inferencia estadística para proyectar y

analizar los resultados,Permite cuantificar la incertidumbre, el riesgo y la validez que

podemos poner en los resultados

12

Estadística descriptiva

La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de variables.

13

Definiciones

Unidad experimental o de observación o individuo: es la menor unidad de la cual se obtiene una observaciónindependiente

Variable: es una característica de interés que es medida en cada uno de los individuos

Observación o dato: es el valor particular que toma la variable en cada individuo

14

Nominales

Ordinales

De Intervalo

De razón

Tipos de variables según la escala de medición

15

CualitativasSi sus valores (modalidades) no se pueden asociar naturalmente a un número (no se pueden hacer operaciones algebraicas con ellos)

Sexo, Nivel socioeconómico, Nacionalidad, Patología (Sí/No), presencia o no de cierta patología

Cuantitativas o NuméricasSi sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos)

Discretas: Si toma valores enterosCantidad de suicidios por año, Número de hijos

Continuas: Si entre dos valores, son posibles infinitos valores intermedios.

Altura, puntaje en un test, expresión de neuroceptores, edad

Tipos de variables

16

Las variables también se pueden clasificar en:

Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alunmos de una clase).

Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).

Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).

17

Resumir la información

Tablas de frecuenciasGráficosEstadísticos

18

Tabla de FrecuenciaEjemplo: Encuesta a los empleados de una empresa con respecto al nivelde satisfacción laboral

VariablesCualitativas o categóricasCuantitativas• discretas• continuas

Empleado Sexo Edad Categoría Ingreso Satisfacción remuneración

Satisfacción posibilidades

progreso

Satisfacción ambiente

laboral1 F 47 9 656 5 9 62 F 39 11 562 1 9 73 F 62 5 1393 2 3 64 F 57 11 672 1 9 35 F 26 5 831 2 4 56 F 53 8 1020 2 2 27 F 58 13 1612 7 8 48 M 43 2 1220 3 8 49 M 28 12 596 7 8 9

10 M 28 10 1175 8 7 711 M 57 5 1109 2 6 912 M 58 9 1356 3 8 613 M 23 3 1203 3 9 214 M 47 8 720 7 5 115 M 31 12 546 7 1 716 M 59 8 1403 8 3 717 M 63 7 1303 9 7 818 M 30 2 1233 7 4 919 F 58 13 1943 10 6 820 F 48 12 595 4 9 521 F 37 10 827 5 9 422 M 45 1 952 8 2 723 M 48 13 675 7 7 1024 M 39 13 849 2 2 625 M 50 13 2097 6 3 6

Variable discreta, continua, dependienteVariable cualitativa ordinal

Variable cuntitativaordinal

Variable cualitativa, nominal

Variable cuantitativa ordinal

19

Tablas de frecuencias

La distribución de una variable indica los posibles valores que esta puede tomar y cuan a menudo ocurren (frecuencia)muestra el patrón de variabilidad de la misma.

Sexo Cantidad %Hombres 18 72%Mujeres 7 28%

Total 25 100%

Satisfacción Cantidad %1-2 1 4%3-4 8 32%5-6 9 36%7-8 4 16%

9-10 3 12%Total 25 100%

20

Gráficos

Pueden servir como sustituto a las tablas

Constituyen una poderosa herramienta para el análisis de los datos, siendo en ocasiones el medio más efectivo no sólo para describir y resumir la información, sino también para analizarla.

Deben servir para representar la realidad

21

Gráficos: Variables cualitativas

Categoría Frec.abs. %No sabe leer ni escribir 69 7,8Sin estudios 246 27,9Estudios primarios incompletos 262 29,7Estudios primarios completos 129 14,6Estudios secundarios incompletos 85 9,7Estudios secundarios completos 57 6,5Estudios universitarios medios 24 2,7Estudios universitarios superiores 9 1,0Total 881 100

Gráfico circular

22

Gráfico de barras o columnas

23

Gráficos: Variables cuantitativas

La distribución de una variable indica los posibles valores que esta puede tomar y cuan a menudo ocurren (frecuencia)muestra el patrón de variabilidad de la misma.A los datos alejados del resto se los denomina atípicos o outliers.

Distribución de frecuencias Histograma simple

0

2

4

6

8

10

12

180 220 260 300 340 380 420 460

colesterol (mg/ml)

Can

t. de

pac

ient

es

Clase Frecuencia180-220 1220-260 9260-300 8300-340 2340-380 2380-420 3

25

24

¿Cómo debe ser un buen gráfico?

La calidad de un gráfico estadístico consiste en comunicar ideas complejas con precisión, claridad y eficiencia

Debe tener algunas características:

Inducir a pensar en el contenido más que en la apariencia Que no distorsione la información proporcionada por los datos Que presente mucha información (números) en poco espacio Que favorezca la comparación de diferentes grupos de datos o de relaciones entre los mismos

25

Guía para gráficos

debe ser autoexplicativo:título apropiado, ejes rotulados, unidades de medida, tamaño de la muestra, etcel número de intervalos no debe ser ni muy grande ni muy pequeño comenzar en cero el eje de las ordenadas (vertical)la frecuencia debe ser proporcional al área (es proporcional a la altura sólo si los intervalos tienen el mismo ancho)Para fines comparativos es mejor usar frecuencias relativas o porcentajes.

26

Estadísticos

Tendencia centralIndican valores con respecto a los que los datos parecen agruparse.

Media, mediana y modaDispersión

Indican la mayor o menor concentración de los datos con respecto a las medidas de tendencia central.

Varianza, Desviación estándar, coeficiente de variación, rango intercuartílico

PosiciónDividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.

Cuartiles, deciles, percentiles

27

Estadísticos de tendencia centralSon medidas que buscan posiciones (valores) con respecto a los cuales los datos muestran tendencia a agruparse.

Media Es la media aritmética (promedio) de los valores de una variable. Suma de los valores dividido por el tamaño muestral.

Media de 2,2,3,7 es (2+2+3+7)/4=3,5Conveniente cuando los datos se concentran simétricamente con respecto a ese valor. Muy sensible a valores extremos.Centro de gravedad de los datos

Mediana Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos

Mediana de 1,2,4,5,6,6,8 es 5Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos.

Ejemplo: Mediana de 1,2,4,5,6,6,800 es 5. La media es 117,7

Moda Es el/los valor/es donde la distribución de frecuencia alcanza un máximo, relativo o absoluto. Sin no hay moda: amodal 1,2,3,4,5,6

28

Medidas de dispersiónEstudian la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos.

Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las siguientes:

1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo.

2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

3.- Desviación típica: Se calcula como raíz cuadrada de la varianza.

4.- Coeficiente de variación de Pearson: se calcula como cociente entre la desviación típica y la media.

29

Cuartiles: Dividen a la muestra en 4 grupos con la misma cantidad de datos.

Q1 = Deja por debajo el 25% de los datosQ2 = Deja por debajo el 50% de los datos = medianaQ3 = Deja por debajo el 75% de los datos

Deciles: Dividen a la muestra en 10 grupos con la misma cantidad de datos

El D1 deja por debajo al 10% de las observaciones. Por encima queda el 90%

Percentiles: Dividen a la muestra en 100 grupos con la misma cantidad de datos

La mediana es el percentil 50El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%

Estadísticos de posición