U.D.9 LA MUESTRA

19
U.D.9 LA MUESTRA

description

U.D.9 LA MUESTRA. 1.- Introducción. Análisis de los datos: Descriptivo: describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. - PowerPoint PPT Presentation

Transcript of U.D.9 LA MUESTRA

Page 1: U.D.9 LA MUESTRA

U.D.9 LA MUESTRA

Page 2: U.D.9 LA MUESTRA

1.- Introducción

Análisis de los datos:

a) Descriptivo: describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.

b) Inferencial: apoyándose en probabilidad y a partir de datos sobre una muestra, efectúa estimaciones, decisiones y generalizaciones sobre un conjunto mayor de datos.

Page 3: U.D.9 LA MUESTRA

2.- Conceptos y Elementos del Muestreo

• Población/Universo: conjunto de elementos de los que se desea obtener información.– ELEMENTOS: empresas, familias, personas,…

• Muestra: subconjunto extraído de la población para examinarlos e inferir resultados a la población

• Muestreo: procedimiento que permite seleccionar la muestra. Fases:– Definir la Población objeto de estudio– Determinar el Marco Muestral: enumeración exhaustiva de todas la unidades

de la población– Seleccionar el método de muestreo– Determinación del tamaño muestral– Obtener la muestra

Page 4: U.D.9 LA MUESTRA

• Parámetro Poblacional: característica que se desea estudiar de la población. Se estima a partir de los datos obtenidos de la muestra. Ese valor se denomina Estimador Muestral

• Error Muestral: error cometido por estudiar la muestra y no la población entera. A mayor muestra menor será el error.

• Intervalo de confianza: conjunto de valores entre los que previsiblemente se encuentra el parámetro a estimar.

• Nivel de confianza: probabilidad de que el parámetro se encuentre en el intervalo de confianza

El error muestral es, habitualmente, 2 veces la desviación típica del estimador. Así el nivel de confianza es del 95,5%

Si el error se considera 3 veces la desviación típica del estimador, el nivel de confianza es del 99,7%

Page 5: U.D.9 LA MUESTRA

3.- Método de Muestreo

• Probabilístico– M. aleatorio simple– M. aleatorio sistemático– M. estratificado– M. por ruta aleatoria– M. por conglomerados

• No probabilístico– M. de conveniencia– M. de juicios– M. por cuotas– M. bola de nieve

Page 6: U.D.9 LA MUESTRA

3.1.- PROBABILISTICO

• Cada elemento de la población tiene una probabilidad conocida de ser elegido.

• Las muestras se seleccionan al azar• Se puede conocer el error y nivel de confianza

de las estimaciones• Los resultados se pueden generalizar• Más caro, lento y complicado que los

probabilísticos

Page 7: U.D.9 LA MUESTRA

a) M. ALEATORIO SIMPLE IRRESTRICTO

• Todos los elementos de la población tienen la misma probabilidad de ser elegidos.

• Procedimiento:– Enumerar los elementos de 1 a N– Elegir n unidades de la muestra mediante una

tabla de números aleatorios.• Recomendada para encuestas de pequeña

escala

Page 8: U.D.9 LA MUESTRA

Para instalar una máquina expendedora de productos de bollería en un centro educativo situado en la ciudad de Granada, una empresa decide realizar una encuesta

a los alumnos.

Tamaño de la población Tamaño de la muestra Proceso N= 450 (nº de alumnos) n= 60 Se signa un nº a cada alumno

Se selecciona 60 nº aleatorio de entre los 450. Ejemplo: 3, 17, 25, 42,… La muestra estará constituida por los alumnos a los que se le ha asignado el 3, 17, 25, 42,…

Page 9: U.D.9 LA MUESTRA

b) M. ALEATORIO SISTEMÁTICO• Selecciona un primer elemento al azar y el resto quedan determinados por

éste. • Procedimiento:

– Se ordenan los elementos de 1 a N– Se calcula el intervalo de selección “k”≤ N/n– Se elige un nº aleatorio entre 1 y k. se le denomina arranque aleatorio,

a.– Los elementos de la muestra serán: a, a+k, a+2k…

• Para poblaciones grandes, se usa mucho en investigaciones comerciales

Tamaño de la población

Tamaño de la muestra

Razón de la muestra

Intervalo de selección

Arranque aleatorio, a

Muestra sistemática

N= 3.000 n= 300 N/n= 3.000/300=10

K=10 1≤a≤k a= 7

7, 17, 27, 37,..

Page 10: U.D.9 LA MUESTRA

c) M. ALEATORIO ESTRATIFICADO

• La población de N individuos se divide en L estratos que son homogéneos entre sí y heterogéneos entre ellos. De cada estrato se elige una muestra de manera aleatoria o por asignación. (ni)

– A. igual: reparto a iguales de la muestra entre los estratos: ni=n/L– A. Proporcional: reparto de la muestra entre los estrato de forma

proporcional al tamaño de los estratos. ni= (Ni*n)/N

• Permite estimaciones más precisas. La variable de estratificación debe relacionarse con la investigación.

Page 11: U.D.9 LA MUESTRA

Una editorial se plantea realizar un estudio para conocer las características preferidas por los alumnos en cuanto al formato de sus textos.

N:4.000 estudiantesVariable de estratificación: nivel educativoEstratos (L): 3

- ESO- Bachillerato- Ciclos Formativos

Tamaño de los estratos

Tamaño de la muestra

Reparto de la muestra entre los estratos Intervalo de selección

N₁= nº de alumnos ESO: 1.800 N₂= nº de alumnos de bachillerato: 1.300 N₃= nº de alumnos de ciclos: 900 Se verifica: N=N₁+N₂+N₃

n=720 Afijación simple ni=720/3= 240 n₁+n₂+n₃= 240

Afijación proporcional n₁= (1800*720)/4.000= 324 n₂=(1.300*720)/4.000= 243 n₃= (900*720)/4.000= 162

Page 12: U.D.9 LA MUESTRA

d) M. POR RUTAS• Se le dan normas a los encuestadores sobre la ruta que debe seguirse en la

selección de la muestra. Es el entrevistador, al azar, el que elige.

e) M. POR CONGLOMERADOS• Las unidades muestrales son grupos formado a su vez por unidades muestrales ( ej: edificios). De ellos se obtiene mediante m.a.s otro grupo (ej: vivienda 4º B) y de este otro. Es un procedimiento polietápico (más de 1 etapa).

Encuesta a los hogares de una ciudadTamaño de la población: N=5000 hogaresTamaño de la muestra n= 200 hogaresConglomerado: edificio ( 20 viviendas por término medio)Número de conglomerados 200/20=10Eligiendo 10 edificios y entrevistando a las 200 familias residentes en ellos, se tendría la muestra de hogares.

población muestra Unidad muestralHogares de Murcia

Estratificación por distritos

Selección por ruta: Plaza Calle a la derecha Edificios Impares Pisos pares Letra A, C, D

Se realiza una encuesta a hogares para analizar los usuarios de Internet en la ciudad de Murcia

Page 13: U.D.9 LA MUESTRA

3.2.-NO PROBABILÍSTICO

• La selección depende del investigador o entrevistador de campo, es subjetiva

• No se apoya en probabilidad, y por tanto, no es posible calcular el error cometido ni el nivel de confianza.

• Costes y dificultad del diseño son más reducidos.

Page 14: U.D.9 LA MUESTRA

a) M. DE CONVENIENCIA: elegir las unidades que mejor se adapten a las conveniencias del investigador. Ej: proximidad

b) M. DE JUICIOS: la elección se deja en manos de expertos que sustituyen el azar

población muestra TamañoMujeres de un barrio de Palencia

Mujeres mayores de 40 años de dicho barrio

20 mujeresLa selección se basa en los objetivos del investigador, en función del establecimiento que se desea instalarLas 20 mujeres seleccionadas corresponderían a familiares y amigas

Se desea realizar una encuesta piloto para instalar un establecimiento de peluquer ía de señoras en un barrio de la ciudad de Palencia.

población muestra Unidad muestral

Empresas de Extremadura

Empresas con infraestructura informática

Expresa experta en informática

Se desea realizar una encuesta a empresas de la comunidad de Extremadura, para conocer sus necesidades en cuanto a programas informáticos

Page 15: U.D.9 LA MUESTRA

c) M. POR CUOTAS: fijar criterios que deben cumplir los individuos para ser parte de la muestra

d) M. DE BOLA DE NIEVE: las unidades muestrales se incluyen por sugerencia de las unidades ya elegidas

población muestra estrato Unidad muestralPersonas mayores de 18

Estratificado por nivel de estudios

Estudios primarios.Estudios secundarios.Estudios universitariosSin estudios

Criterio del entrevistador

Encuesta de opinión sobre los líderes políticos según el nivel de estudios de los encuestados

Page 16: U.D.9 LA MUESTRA

4.- D.T.M- Tamaño de la Población (N). Puede ser finita o infinita- Nivel de confianza (Zα =k) : indica la probabilidad de que los resultados de nuestra investigación sean ciertos:. Un 95,5 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 4,5%. Los valores de k más utilizados y sus niveles de confianza son:

Los valores se obtienen de la tabla de la distribución normal estándar N(0;1)

- Error muestral (d)deseado, en tanto por uno: es la diferencia que puede haber entre el resultado que obtenemos preguntando a una muestra de la población y el que obtendríamos si preguntáramos al total de ella. Ejemplo 1: si los resultados de una encuesta dicen que 100 personas comprarían un producto y tenemos un error muestral del 5% comprarán entre 95 y 105 personas

- Varianza poblacional (S² ). Se estima a través de una muestra piloto u otra encuesta

- P : proporción de individuos que presentan la característica en estudio. El valor: q= 1-p Si no se tiene datos del valorde p, se estima que es 0,5 (50%) , que maximiza el tamaño muestral.

Nivel de confianza

75% 80% 85% 90% 95% 97,5% 99%

Valor k 1,15 1,28 1,44 1,65 1,96 2,24 2,58

Page 17: U.D.9 LA MUESTRA

POBLACIÓN FINITA( ≤ 100.000)

ESTIMAR PROPORCIÓN

ESTIMAR MEDIA

POBLACIÓN INFINITA

ESTIMAR PROPORCIÓN

ESTIMAR MEDIA

PARáMETROS A ESTIMAR:- MEDIAS (µ)- PROPORCIÓN (p)

Page 18: U.D.9 LA MUESTRA

ESTIMACIÓN DE MEDIAS

Se desea conocer el número de hogares que hay que considerar de una población de 500 hogares para conocer el consumo

medio en bebidas alcohólicas. El error máximo admitido es de 3 euros y el nivel de confianza del 95,5%. Se ha estimado por

encuestas similares que la varianza muestral es de 30 euros.

Page 19: U.D.9 LA MUESTRA

ESTIMAR PROPORCIONES

¿A cuántas personas tendríamos que estudiar para conocer la prevalencia de diabetes?Confianza = 95%; Precisión = 3%: Proporción esperada = asumamos que puede ser próxima al 5%; si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor p = 0,5 (50%) que maximiza el tamaño muestral:

¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para conocer la prevalencia de diabetes?