Post on 30-Jun-2015
description
METODOS ESTADISTICOS PARA LA
INVESTIGACION.
Po
rce
nta
je
40
30
20
10
0
Hábito de estudio
AltoIntermedioBajo
PARTE I
Dr. CLETO DE LA TORRE DUEÑAS
cletounsaac@gmail.com
2011
1RA EDICION
Hecho el Depósito Legal en la Biblioteca Nacional del Perú REGISTRO Nº : 2009-09684
Todos los derechos reservados.
Prohibida la reproducción total o parcial de este libro en forma idéntica o
modificada por cualquier medio mecánico o electrónico, incluyendo fotocopia,
grabación o cualquier sistema de almacenamiento y recuperación de
información no autorizada por el autor.
Impreso en Perú.
CAPITULO I
INVESTIGACION CIENTIFICA.
1.1 INVESTIGACIÓN CIENTÍFICA
La investigación científica, se puede entender como un conjunto de actividades
que realizamos para obtener conocimientos nuevos, sobre problemas nuevos
que afectan la realidad, pero que sean nuevos, respecto a la ciencia, es decir,
respecto al conjunto de conocimientos ya provisionalmente establecidos y
sistematizados por la humanidad, conocimientos nuevos que, como aportes, se
sumarán a la Ciencia.
¿Qué es investigar?
Investigar viene del latín investigare.
Es la forma más adecuada de aproximarse al conocimiento de la verdad
mediante verdades parciales.
Desarrollar actividades con el objetivo de registrar, indagar o descubrir
la verdad.
En términos generales, es agregar algo nuevo a los conocimientos
humanos.
Es un proceso que, mediante la aplicación del método científico, procura
obtener información relevante y fidedigna. De entender, verificar,
corregir o aplicar el conocimiento
1.2 PROBLEMA DE INVESTIGACIÓN
Es un hecho, fenómeno o situación que incita a la reflexión o al estudio y es
importante puesto que permite conocer la situación que se va a estudiar
mostrando sus principales rasgos.
CRITERIOS BASICOS PARA IDENTIFICAR PROBLEMAS.
De manera general se considera que hay un problema cuando lo que
DEBERÍA SER, difiere de lo que ES.
El DEBERÍA SER, es el marco referencial, el patrón comparativo, el
ideal, el modelo, el paradigma.
Lo que ES, representa la realidad, es la práctica.
DEBERÍA SER diferente a ES, entonces existe Problema
ESQUEMA DEL PROBLEMA DE INVESTIGACION.
Para la presentación del POI, es necesario considerar cuatro momentos: el
diagnóstico, el pronóstico, el control del pronóstico y la formulación de la
pregunta o preguntas o la redacción de un texto a manera de pregunta.
El diagnóstico es la descripción de los síntomas o problemas.
El pronóstico es la serie consecuencias de los problemas.
El control del pronóstico es la serie de acciones para superar las
consecuencias de los problemas.
Formulación del problema
ELEMENTOS DE DEL TITULO DE UN PROBLEMA
Especificidad Situación
problemática
Unidad de
estudio
Espacio Tiempo
Situación problemática
Responde a la pregunta ¿Qué investigar?
Por ejemplo: Rendimiento académico, gestión educativa, desempeño
profesional,..
La especificidad
Es el aspecto o los aspectos concretos que se quiere investigar acerca
del hecho o situación problemática.
Por ejemplo: causas, consecuencias, características, importancia,
influencia, tendencia, modalidades, incidencia, prevalencia, implicancias,
estructura, función, nivel, relación, evolución, etc.
Unidades de estudio.
Son aquella en las se ponen de manifiesto los hechos o situaciones
problemáticas y constituyen, desde el punto de vista estadístico, la
población o muestra a la que se refiere la investigación. Son: Personas,
grupos sociales, seres, acontecimientos, instituciones, objetos,
procesos.
Espacio
Esta referido al lugar en el que ocurre el hecho o situación problemática.
Puede ser geográfico o administrativo. ¿Dónde?; Perú, Ciudad del
Cusco, Zona Franca, Aceros Arequipa, etc.
Tiempo
Está referido al momento en que ocurre el hecho o situación
problemática. ¿Cuándo?.
1.3 FORMULACION DE OBJETIVOS
Son los propósitos o fines que se pretenden lograr al realizar la
investigación.
Los objetivos son de dos tipos:
El objetivo general (singular)
Los objetivos específicos (plural)
Los objetivos deben ser verificables
Al definir los objetivos, debemos pensar inmediatamente en la manera
de verificar si éstos se han cumplido o no (pensar en métodos o
herramientas para ello)
Lo anterior nos permitirá ir dibujando el perfil metodológico de nuestra
investigación
Los objetivos se convierten así en la carta de navegación de la
investigación a realizar
Los objetivos deben ser precisos y no muy ambiciosos: deben ser
acordes con los recursos disponibles (tiempo) y ello delimitará el nivel de
detalle esperable.
Elementos a tomar en cuenta para redactar un objetivo
Sujeto : Beneficiario de la propuesta.
Contenido: Expresa el cambio requerido y
Acción : Conjunto de actividades que se desarrollan.
Ejemplo 1: Reforzar la capacidad de gestión en los centros de educación inicial
del país para la atención de los dominios del aprendizaje de los niños de 4 y 5
años de edad.
Acción : Reforzar la capacidad de gestión en los centros de
educación inicial del país.
Contenido: La atención de los dominios del aprendizaje.
Sujeto : Niños de 4 a 5 años de edad
1.4 JUSTIFICACION Y DELIMITACION DE LA INVESTIGACIÓN
Criterios de justificación.
Originalidad
Relevancia
Interés
Factibilidad
Criterios para delimitar
Espacial - Geográfica
Cronológica
1.5 MARCO TEORICO
En el marco teórico se integra con las teorías, enfoque teóricos, estudios y
antecedentes en general que se refieran al problema de investigación.
Para elaborar el marco teórico es necesario detectar, obtener y consultar la
literatura y otros documentos pertinentes para el problema de investigación,
así como extraer y recopilar de ellos la información de interés.
La revisión de la literatura puede iniciarse manualmente o
acudiendo a un banco de datos al que se tenga acceso por
computadora.
La construcción del marco teórico depende de lo que
encontremos en la revisión de la literatura:
Marco Teórico: Fundamentación teórica dentro de la cual se
enmarca la investigación
Marco Conceptual: Definición de conceptos relevantes utilizados en
el estudio
Marco Normativo: Normas, leyes referentes al estudio
¿Qué funciones cumple el marco teórico?
Sirve de guía al Investigador
Provee un marco para la interpretación de resultados
1.6 HIPOTESIS DE INVESTIGACION
Afirmaciones o suposiciones que hace el investigador respecto al
problema de investigación.
Es una suposición que permite establecer relaciones entre hechos. El
valor de una hipótesis reside en su capacidad de establecer esas
relaciones entre los hechos y de esa manera, explicarnos por qué se
produce el fenómeno de estudio.
¿Qué Funciones cumple?
Direccionar el problema objeto de investigación
Identificar variables objeto de análisis
Orientar el uso de métodos y técnicas de obtención de información
Elementos estructurales de la hipótesis
1. Las unidades de análisis, que puedan ser los individuos, grupos,
viviendas, instituciones, etc.
2. Variables, las características o propiedades cualitativas o
cuantitativas que presentan las unidades de análisis.
3. Los elementos lógicos, son los que relacionan las unidades de
análisis con las variables y estas entre sí.
Requisitos para estructurar las hipótesis
Las hipótesis deben referirse sólo a un ámbito determinado de la
realidad social. Las hipótesis en las ciencias sociales sólo pueden
someterse a prueba en un universo y contexto bien definidos.
Los conceptos de las hipótesis deben ser claros y precisos. En las
hipótesis, los conceptos son las variables y las unidades de
análisis.
Los conceptos de las hipótesis deben contar con realidades o
referencias empíricas observables (verificables).
El planteamiento de las hipótesis deben prever las técnicas para
probarlas. Se deben formular hipótesis que están relacionadas
con técnicas disponibles para su verificación.
1.7 NIVELES DE INVESTIGACIÓN.
El nivel de una investigación viene dado por el grado de profundidad y alcance
que se pretende con la misma
INVESTIGACIÓN DESCRIPTIVA
Orientada al descubrimiento de las propiedades particulares del hecho o
situación problemática y también a la determinación de la frecuencia con que
ocurre el hecho o situación problemática.
Responde a las preguntas ¿Cómo son? ¿Cuántos son? ¿Dónde están? Se
refiere a las características cualidades internas y externas, propiedades y
rasgos de la población de estudio
Ejemplo 2:
Nivel de conocimiento de las estrategias cognitivas por los profesores, de la
población de la ciudad de Cusco, 2011.
INVESTIGACIÓN EXPLICATIVA
Orientada al descubrimiento de las causas o consecuencias o
condicionantes de la situación problemática
Está dirigida a responder a las causas de los eventos físicos o sociales y
su interés se centra en explicar por qué y en qué condiciones ocurre un
fenómeno, o por qué dos o más variables se relacionan.
¿Por qué? La finalidad es determinar por qué un hecho o fenómeno de
la realidad tiene tales y cuales características.
Ejemplo 3:
Principales causas de la deserción escolar en la región andina del Perú, 2010.
INVESTIGACIÓN COMPARATIVA
Orientada al estudio de las semejanzas o diferencias de un hecho o situación
problemática en dos circunstancias diferentes.
Ejemplo 4:
Nivel de aplicación de metodologías de enseñanza por los profesores de las
instituciones educativas A y B de Cusco, 2010.
INVESTIGACIÓN RELACIONAL
Orientada al descubrimiento de la influencia de un hecho o situación
problemática en otro hecho o situación problemática.
Ejemplo 5:
Influencia de la internet en la lectura de los estudiantes de secundaria de la
Ciudad del Cusco, 2011.
INVESTIGACIÓN CORRELACIONAL
Orientada a descubrir la covariación o correspondencia entre los valores de dos
hechos o situaciones problemáticas.
Ejemplo 6:
Correlación entre hábitos de estudio y aprendizaje en los estudiantes de la
Universidad de Nacional San Antonio Abad del Cusco, 2011.
INVESTIGACIÓN EXPERIMENTAL
Orientada a descubrir la validez de un hecho para la modificación de una
situación problemática.
¿Qué cambios y modificaciones se han producido? ¿Qué mejoras se
han logrado?.
Ejemplo 7:
Evaluación del efecto del uso de tres tipos de materiales didácticos en el
rendimiento académico, en las I.E de la ciudad de Cusco, 2011.
1.8 TIPOS DE INVESTIGACION
Los Tipos de investigación se determinan mediante la aplicación de distintos
criterios, a continuación se refieren algunos de ellos.
INVESTIGACION BASICA. Solo busca aplicar y profundizar el conocimiento
científico existente acerca de la realidad.
INVESTIGACION APLICADA. Se investiga para transformar, modificar o
producir cambios en un determinado sector de la realidad.
INVESTIGACION SUSTANTIVA. Se orienta a resolver problemas facticos, su
propósito es dar respuesta objetiva a interrogantes que se plantea en un
determinado fragmento de la realidad y del conocimiento con el objeto de
contribuir en la estructuración de las teorías científicas.
INVESTIGACION TECNOLOGICA. Se relaciona esencial, objetiva y
metodológicamente con el nivel experimental, se busca cambios mediante la
aplicación de nuevos sistemas.
1.9 DISEÑOS DE INVESTIGACION.
Conjunto de estrategias procedimentales y metodológicas definidas
y elaboradas para el desarrollo del proceso de investigación.
El diseño de investigación puede ser pensado como la estructura
de la Investigación.
El investigador debe seleccionar un diseño de investigación. Esto
se refiere a la manera práctica y precisa que el investigador adopta
para cumplir con los objetivos de su estudio, ya que el diseño de
investigación indica los pasos a seguir para alcanzar dichos
objetivos. Es necesario por tanto que previo a la selección del
diseño de investigación se tengan claros los objetivos de la
investigación.
Las maneras de cómo conseguir respuesta a las interrogantes o
hipótesis planteadas dependen de la investigación. Por esto,
existen diferentes tipos de diseños de investigación, de los cuales
debe elegirse uno o varios para llevar a cabo una investigación
particular (Hernández, Fernández y Baptista, 2000; Castillo, 2005).
La precisión, la profundidad así como también el éxito de los
resultados de la investigación dependen de la elección adecuada
del diseño de investigación. He aquí un esquema donde se
resumen los diferentes tipos de investigación según Hernández,
Fernández y Baptista (2000).
Diseños experimentales
Son aquellos en los que se cumple que:
Los grupos a ser investigados han sido asignados al azar, por
procedimientos aleatorios y los grupos resultantes son equivalentes, de
tal manera que se tiene un grupo control equivalente a los grupos
experimentales.
Diseños cuasi-experimentales.
Entendemos por diseños cuasi-experimentales cuando se cumplen las
siguientes condiciones:
Los grupos sobre los que se lleva a cabo la investigación no han
podido establecerse como equivalentes en las características
fundamentales. Los grupos no han sido asignados al azar, sino
que han sido establecidos por algún otro procedimiento de
muestreo.
Como dice Hernández et al.“En los diseños cuasi-experimentales
los sujetos no son asignados al azar a los grupos no
emparejados; sino que dichos grupos ya estaban formados antes
del experimento, son grupos intacto (la razón por la que surgen y
la manera como se formaron fueron independientes o aparte del
experimento.”
También algunos autores denominan CUASI-EXPERIMENTAL,
cuando el investigador aplica un tratamiento a un solo grupo de
sujetos, sin grupo de control, observándolo antes y después de
aplicar el tratamiento.
Diseños no-experimentales.
Se establece que un diseño no-experimental es: “la que se realiza sin
manipular deliberadamente variables. Es decir, se trata de investigación donde
no hacemos variar intencionadamente las variables independientes. Lo que
hacemos en la investigación no experimental es observar fenómenos tal y
como se dan en su contexto natural, para después analizarlos.” (Hernández,
184)
La diferencia con los diseños experimentales y cuasi- experimentales se ve con
claridad, porque en estos dos siempre hay algún tipo de intervención del
investigador, que manipula las variables independientes para averiguar su
influencia en las variables dependientes.
Método transversal: Es el diseño de investigación que recolecta datos de un
solo momento y en un tiempo único. El propósito de este método es describir
variables y analizar su incidencia e interrelación en un momento dado.
Diseños transversales descriptivos: son aquellos que tienen como objetivo
indagar la incidencia y los valores en que se manifiesta una o más variables.
Diseños transversales correlacionales: Se encargan de describir relaciones
entre dos o más variables en un momento determinado.
Diseños transversales explicativos: Son aquellos en los cuales las
causas y efectos ya ocurrieron en la realidad (estaban dados y manifestados)
y el investigador los observa y explica.
Diseños longitudinales: Son aquellos que analizan cambios a través del
tiempo (en variables o sus relaciones), dentro de alguna población en general.
1.10 VARIABLES
A las características objeto de estudio en la población se les llama variables, ya
que pueden variar de un individuo a otro y se representara por letras
mayúsculas: X, Y, Z,. . ., debemos distinguir los distintos tipos de variables que
hay, lo cual nos va a permitir utilizar las herramientas estadísticas apropiadas.
TIPOS DE VARIABLES.
Las variables estadísticas pueden ser de dos tipos:
Variables cualitativas o atributos: describen cualidades y no toman
valores numéricos, estas a su vez pueden ser:
Nominales.- Las cualidades no presentan ningún orden. Ejemplo Sexo
del estudiante (Femenino, Masculino), Procedencia, I.E.
Ordinales.- Este tipo de variables presentan orden Ejemplo: Grado de
estudios (Analfabeto, primaria, secundaria, superior), Nivel de
conocimiento de Docentes.
Variables cuantitativas: toman valores numéricos. A su vez pueden ser:
Discretas.- Solo toman un número finito o infinito numerable de valores
distintos (generalmente números naturales o enteros). Ejemplos:
número de estudiantes por secciones, número de profesores, número
de aulas, etc.
Continuas.- Toman valores en un intervalo. Generalmente
corresponden a medir magnitudes continuas. Ejemplo, Rendimiento
académico, altura, ingreso del docente, etc.
Una característica esencial de este tipo de variables es que sus valores nunca
son observables con exactitud, sino que dependen (las observaciones) de la
precisión del instrumento de medida.
Ejemplo 7
Un especialista estudia, el nivel de introversión en niños menores de 4 años en
las instituciones educativas de la ciudad de Cusco. Defina los conceptos
previos para este estudio.
Solución:
Población: Niños menores de 4 años de las I.E de la ciudad de Cusco.
Muestra: Niños de 3 años de las I.E de la ciudad de Cusco.
Variable: Nivel de Introversión.
Tipo de variable: Cuantitativa
Unidad de estudio: Niño menor de 4 años.
1.11 ESCALAS DE MEDICION
Se llama medición al proceso de atribuir números a las características.
Tenemos las siguientes escalas de medición: nominales, ordinales,
cuantitativas de intervalo y cuantitativas de razón.
Escala nominal: la clave de estas escalas de medida es que sólo informan
de la igualdad o desigualdad de los individuos en una característica, pero
no de posibles ordenaciones, puesto que la característica a la que se
refieren no se tiene en mayor o menor medida, sino que simplemente
adopta formas cualitativamente distintas. Los números solo sirven para
distinguir valores o categorías diferentes de la variable.
Esta escala se emplea para variables cualitativas nominales.
Ejemplo 8: El sexo 1=Masculino y 2=Femenino esto simplemente es un
proceso de codificación pero no significa que la mujer sea mayor que el
hombre, ni el doble, ni que existe sexo intermedio.
Escala Ordinal: Los números además de servir para distinguir reflejan un
orden existente sobre los valores de la variable.
Se obtiene clasificando objetos o arreglándolos en un orden con respecto
a alguna variable común. La pregunta es simplemente, si el objeto tiene
más o menos de esta variable que algún otro objeto.
Esta escala se emplea para variables cualitativas ordinales.
Ejemplo 9: Nivel de conocimientos de estrategias cognitivas por parte de
los docentes. Excelente=5, bueno =4, regular =3 y malo = 2.” es cierto la
relación de orden 2<3<4<5.
Escala de Intervalo: La ubicación del punto origen no es fija, puesto que
0 no denota la ausencia del atributo. Aquí los números para clasificar los
objetos representan también incrementos iguales del atributo que se esta
midiendo. Esto significa que los números pueden ser comparados. La
diferencia en 1 y 2 es la misma que entre 2 y 3, pero es solo la mitad de
la diferencia entre 2 y 4.
Las temperaturas Fahrenheit y Centígrados son medidas que tiene
diferentes escalas de intervalo y diferentes puntos de 0.
Escala de Razón: Medida numéricas en las cuales cero es un valor fijo
en cualquier escala y la diferencia entre valores es diferente
Además de la distancia de orden e intervalo, se añade un origen absoluto
de forma que no solo cabe hallar distancias (ya en la escala de intervalo),
si no también múltiplos exactos. En este caso, el valor representado por 4
tiene doble cantidad medida que él representado por un 2.
Ejemplo 10: Edad del profesor expresada en años.
40 años y 20 años son edades distintas y 40 años es superior a 20
años
Entre 40 y 20 hay una diferencia de 20, la misma que entre 50 y 30.
El 0 tiene sentido. Una persona con 0 años, realmente no tiene edad
todavía no ha nacido.
En el siguiente cuadro se muestra un resumen de las características de
las escalas de medición.
Resumen de escalas de medición
Tipo Información
deducible
Transform.
admisibles
Significa
orden
Significa
distancia
Significa
Origen Ejemplos
Nominal
Relaciones
“igual que” o
“distinto que”
Aplicaciones
inyectivas
No No No Procedencia
del Profesor,
tipo de
metodologia
Ordinal
Relaciones
“mayor que”
o “igual que”
Funciones
crecientes
Si No No Grado de
planificación,
Nivel de
utilización de
materiales
educativos.
Intervalo
Igualdad o
desigualdad
de
diferencias
A + b.x
(b 0)
Si Si No
Temperatura,
inteligencia
Razón
Igualdad o
desigualdad
de razones
B .x
(b 0)
Si Si Si Rendimiento
académico,
Número de
estudiantes.
ESCALAS PARA LA MEDICION DE ACTITUDES
La escala de clasificación por categorías es la que usan ampliamente los
investigadores de ciencias de la salud y sociales.
Escala de clasificación por categorías:
Existen cuatro categorías a partir de las cuales los entrevistados pueden
elegir para señalar su nivel general de satisfacción.
- Muy satisfecho (+2)
- Satisfecho (+1 )
- Algo satisfecho (0)
- No del todo satisfecho (-1)
Escala De Comparación:
Es una versión de la escala de categorías, califica a estas categorías
como: “excelente”, “muy bueno”, “bueno”, “regular” y “deficiente”,
eliminando de esta forma la comparación implícita. El problema con tal
escala es que el punto de referencia es poco claro y diferentes
entrevistados pueden usar diferentes puntos de referencia o estándares.
Escala de Likert:
La escala de Likert requiere que un entrevistado indique un grado de
acuerdo o desacuerdo con respecto a una variedad de afirmaciones
(reactivos) relacionadas con el objeto de las actitudes.
Es un tipo de instrumento de medición o de recolección de datos que
disponemos en la investigación social.
Es una escala para medir las actitudes.
Consiste en un conjunto de ítems bajo la forma de afirmaciones o juicios
ante los cuales se solicita la reacción (favorable o desfavorable, positiva
o negativa) de los individuos.
Alternativas o puntos en la escala de Likert
Asignación
Numérica
I
Asignación
Numérica
II
Alternativa
A
Alternativa
B
Alternativa
C
Alternativa
D
2 5 Muy de
acuerdo
Totalmente
de acuerdo
Definitivamen
te sí
Completame
nte
verdadero
1 4 De acuerdo De acuerdo Probablemen
te sí
Verdadero
0 3 Ni de
acuerdo, ni
en
desacuerdo
Neutral o
indiferente
Indeciso Ni falso, ni
verdadero
-1 2 En
desacuerdo
En
desacuerdo
Probablemen
te no
Falso
-2 1 Muy en
desacuerdo
Totalmente
en
desacuerdo
Definitivamen
te no
Completame
nte falso
Para obtener las puntuaciones de la escala de Likert, se suman los valores
obtenidos respecto de cada items. El puntaje mínimo resulta de la
multiplicación del número de ítems por 1. Una puntuación alta está dada por el
número de ítems o afirmaciones multiplicado por 5.
PM--------------------I----------------------I----------------------I------------------
PA
Donde: PM: Puntaje mínimo y PA: Puntaje Máximo.
Ejemplo 11: Ha encontrado en la institución educativa el apoyo y las
facilidades necesarias para que usted desarrolle de modo óptimo su trabajo.
( ) Definitivamente sí
( ) Probablemente sí
( ) Indeciso
( ) Probablemente no
( ) Definitivamente no
Ejemplo 12: El Director de la UGEL se preocupa por el bienestar del recurso
humano.
Categorías de Respuesta Frecuencia Porcentaje Asignación de
puntajes
Totalmente de acuerdo (5) 2 4.4% 2(5)
De acuerdo (4) 4 9% 4(4)
Indeciso (3) 7 15.6% 7(3)
En desacuerdo (2) 9 20% 9(2)
Totalmente en desacuerdo (1) 23 51% 23(1)
n=45 100% Total=88
Para interpretar el puntaje se ubica en los tramos de la escala de likert.
Totalmente
En desacuerdo
(1)
En
desacuerdo
(2)
Indeciso
(3)
De acuerdo
(4)
Totalmente de
Acuerdo (5)
45*1=45 45*2=90 45*3=135 45*4=180 45*5=225
La puntuación 88 se aproxima a 90, por lo tanto se ubica en la parte que indica
en desacuerdo.
1.12 TIPOS DE VARIABLES UTILIZADAS EN LA INVESTIGACION
CIENTIFICA.
Variable independiente
Es aquella que juega un rol determinante, causal o de influencia en
otra u otras variables, supone cierta autonomía con relación a las
demás variables, pero es necesario, señalar que las variables
independientes en determinados problemas, pueden cambiar, según
sea la posición que ocupen en el enunciado, debido a que la realidad
está en movimiento y que todos los hechos están concatenados.
Este tipo de variable se encuentra en las siguientes investigaciones:
1. Explicativa,
2. Relacional
3. Experimental ( en la experimental se le conoce como estímulo)
Variable dependiente
Es aquella que juega un rol de consecuencia, al ser determinada,
originada o influida por la variable independiente. Esto significa que
no pueden existir variables dependientes sin las independientes.
Considerando el tiempo, las independientes son más antiguas que
las dependientes. Se encuentran en las siguientes investigaciones:
1. Explicativa
2. Relacional
3. Experimental (La variable dependiente en una investigación
experimental se le conoce como respuesta)
Ejemplo 13:
En el problema influencia del uso de mapas mentales en el rendimiento
académico de los estudiantes de las I.E de la región de Cusco, 2011.
Variable independiente: Rendimiento Académico
Variable dependiente: Uso de mapas mentales
Variable Intermedia
Es aquella que juega un rol de factor condicionante, pues su
presencia entre la variable independiente y variable dependiente
hace que sin tener el carácter de factor causal o determinante,
modifique le resultado más complejas y de mayor profundidad.
Ejemplo 14:
En el estudio de formación académica y rol de la experiencia en el
desempeño profesional, Quillabamba. 2011.
Variable independiente: formación académica.
Variable Dependiente: Desempeño profesional
Variable Intermedia : Experiencia
Variable interviniente
Es aquella que en ciertas medida juega un rol pasivo en el problema,
pues permite medir las características, atributos, estructuras,
incidencia, elementos o aspectos que se son inherentes.
La variable interviniente, la encontramos en investigaciones:
1. Descriptiva
2. Comparativa.
Ejemplo 15:
En el problema: Niveles de desnutrición de los estudiantes de las
instituciones educativas de la ciudad de Sicuani, 2011.
Variable interviniente : Nivel de desnutrición.
Variables Asociadas
Son aquellas que no guardan mayor nivel de dependencia, no hay
relación causal entre ellas y considerando el criterio tiempo vienen a
ser más o menos contemporáneas, pues para que aparezca el
problema surgen de manera simultánea.
Este tipo de variables, se encuentra en la investigación descriptiva
multivariable, se trata de dos o más variables intervinientes, por lo
que nunca van acompañadas de algún otro tipo de variables.
Ejemplo 16:
En el problema: Rasgos sociales y culturales de los profesores de la
ciudad de Cusco , 2011.
Las variables asociadas son rasgos sociales y rasgos culturales
Variables Interdependientes
Son aquellas que indistintamente pueden ser consideradas como
causa o como consecuencia una de otra. Corresponden a la
investigación correlacional.
Ejemplo 17:
En el problema: Correlación entre tipo de alimentación y obesidad
de los estudiantes de la ciudad de Cusco, 2010.
Las variables interdependientes, son tipo de alimentación y obesidad
Resumen del tipo de variables según tipo de investigación.
Descriptiva
Interviniente
Asociada
Comparativa
Interviniente
Explicativa
Independiente(s)
Dependiente(s)
Relacional
Independiente
Dependiente
Correlacional
Interdependiente
Interdependiente
Experimental
Estimulo (Factor)
Respuesta
Observaciones:
1. Las variables según su naturaleza se clasifican en cuantitativas y
cualitativas.
2. Las variables según su relación casual se clasifican en:
independiente, dependiente, interviniente.
En el área de las ciencias de la salud, se tiene los siguientes tipos de
investigación biomédica.
1.13 RECOPILACIÓN DE DATOS.
Dentro de un proceso de investigación una de las actividades que se realizan
es la recopilación de datos, la cual es el acopio de información y se incluye
desde elaborar fichas bibliográficas hasta la aplicación de cuestionarios con el
empleo de técnicas de muestreo.
Para Hernández et.al. (2006) un instrumento de medición es un recurso que
utiliza el investigador para registrar información o datos sobre las variables que
tiene en mente.
La construcción de instrumento consiste en generar un número suficiente de
ítems para medir todas las variables con todas sus dimensiones.
La recopilación de datos, se puede realizar mediante:
Investigación documental
Investigación de campo
La investigación documental. Consiste en el estudio de documentos
escritos sobre un objeto determinado, es decir son todos aquellos
documentos registrados en diferentes dispositivos físicos a los que
podemos tener acceso en forma directa o indirecta para su consulta y se
puede clasificar en:
1.- Documental bibliográfica 4.- Documental audiográfica
2.- Documental hemerográfica 5.- Documental videográfica
3.- Documental escrita 6.- Documental iconográfica
La investigación de campo. Consiste en obtener información directa
mediante diferentes actividades por contacto directo con el hecho que se
quiere investigar así como las personas relacionadas y se puede
realizar:
a) Por observación directa
b) Por interrogación
La observación. Es el procedimiento empírico básico, el cual consiste
en realizar la percepción intencionada de una actividad determinada
mediante la experimentación la cual consiste en la obtención de datos
cuantitativos por medio de la medición del fenómeno que se este
observando. Para realizar la observación se utilizan diversos
instrumentos auxiliares los cuales son:
1.- La ficha de campo 3.- La entrevista
2.- Estudio de Actividades 4.- La encuesta
La Entrevista. Es una de las técnicas más comunes y es considerada
como la relación directa entre el investigador y el objeto de estudio a
través de individuos o grupos con el fin de obtener testimonios reales.
a) Entrevistas formales
b) Entrevistas informales
La Encuesta. Consiste en recopilar información sobre una parte de la
población.
La información recopilada puede emplearse para un análisis cuantitativo
con el fin de identificar las magnitudes del problema.
El Cuestionario. Es un eficaz auxiliar en la observación científica que
contiene aspectos del fenómeno esenciales, las cuales son preguntas
formuladas por escrito y no es necesaria la presencia del investigador.
- Cuestionarios por correo
- Cuestionario administrado por el entrevistado
- Cuestionario administrado por el entrevistador
La Cedula. Tiene carácter de anónimo, donde el encuestador es quien
llena la cedula de entrevista, además de que es posible aclara la
información sobre las preguntas y es utilizada cuando una persona tiene
un bajo nivel cultural.
1.14 VALIDACIÓN DEL INSTRUMENTO
La validación de los instrumentos se realiza con el fin de conseguir una mayor
objetividad al seleccionar los ítems en los respectivos cuestionarios.
VALIDEZ DE CONTENIDO
El proceso de validación de contenido es eminentemente lógico, si bien pueden
utilizarse jueces expertos en el tema para valorar la congruencia entre los
diversos items y los diversos objetivos.
Existen procedimientos cuantitativos diversos para que cada experto valore el
grado en que un ítem sirve para evaluar el objetivo al que corresponde. El
procedimiento cuantitativo más sencillo sería el siguiente:
Especificar los diversos objetivos (v.gr. áreas diferentes de contenidos)
que se Pretenden evaluar.
Elaborar varios ítems para cada objetivo.
Seleccionar una muestra de expertos en el contenido del test.
Pedirles que, según su opinión, asignen cada ítem al objetivo que
pretende medir.
Seleccionar los ítems en los que los expertos manifiestan mayor acuerdo
en sus clasificaciones.
CRITERIO DE EXPERTOS
Método 1:
HOJA DE PREGUNTAS PARA LA VALIDACIÓN
PREGUNTAS ESCALA DE VALORACION
1. ¿Considera usted que los ítems del instrumento
miden lo que se pretende medir?
1 2 3 4 5
2. ¿Considera usted que la cantidad de ítems
registrados en esta versión son suficientes para
tener una comprensión de la materia de estudio?
1 2 3 4 5
3, ¿Considera usted que los ítems contenidos
en este instrumento, son una muestra representativa del
universo materia del estudio?
1 2 3 4 5
4. ¿Considera usted que si aplicamos en reiteradas
oportunidades este instrumento a muestras similares,
obtendríamos también datos similares?
1 2 3 4 5
5. ¿Considera usted que los conceptos utilizados en
este instrumento, son todos y cada uno de ellos, propios
de las variables del estudio?
1 2 3 4 5
6. ¿Considera usted que todos y cada uno de los ítems
contenidos en este instrumento tienen los mismos
objetivos?
1 2 3 4 5
7. ¿Considera usted que el lenguaje utilizado en
el presente instrumento es claro, sencillo y no da lugar
a diversas interpretaciones?
1 2 3 4 5
8. ¿Considera usted que la estructura del presente
instrumento es adecuada al tipo de usuario a quien se
dirige el instrumento?
1 2 3 4 5
9. ¿Estima usted que las escalas de medición
utilizadas son pertinentes a los objetos materia de
estudio?
1 2 3 4 5
10. ¿Que aspectos habría que modificar, que aspectos tendrían que incrementarse o que aspectos
habría que suprimirse?
……………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………
……………………………………………………………………………………………………
PROCEDIMIENTO
El método DPP mide la adecuación de los instrumentos, para medir la variable
de interés, en función a la valoración de los expertos.
Ejemplo 18.
En el presente estudio la valoración de los expertos es:
Item
EXPERTOS
1 2 3 4 Promedio
1 5 4 5 5 4.75
2 5 5 5 5 5
3 5 4 5 4 4.5
4 5 5 4 4 4.5
5 5 5 5 5 5
6 5 5 5 5 5
7 4 5 3 4 4
8 4 4 5 4 4.25
9 4 4 5 5 4.5
2. Con los promedios hallados, se determina la distancia de punto múltiple
(DPP), mediante la siguiente ecuación:
2 2 2
1 1 2 2 9 9................DPP = (X Y ) +(X Y ) + (X Y )
Donde:
Xi = Valor máximo en la escala para el ítem i.
Yi = El promedio del ítem i.
2 2 25 4.75 5 5 ................ 5 4.5 1.541DPP = ( ) +( ) + ( )
Determinar la distancia máxima (Dmax) del valor obtenido respecto al punto de
referencia Cero (0), con la ecuación:
2 2 2
1 2(1)(1)...................(1)Max nDx x x
Donde:
Xi = Valor máximo en la escala concedido para el ítem i.
1 = Valor mínimo de la escala para cada ítem.
2 2 2(5 1) (5 1) ...................(5 1) 12MaxD
La Dmax hallada fue de 12
La Dmax se divide entre el valor máximo de la escala, lo que nos da un valor
de 12/5=2.4
5. Con el valor hallado anteriormente (apartado 4) se construye una nueva
escala valorativa a partir de cero, hasta llegar a Dmax. Dividiéndose en
intervalos Iguales entre si, llamándose con las letras A, B, C, D, y E.
Siendo:
Escala
Valoración Valoración de
Expertos
0-
2.4
A = Adecuación Total DPP=1.541
2.4-
4.8
B = Adecuación en gran
medida
4.8-
7.2
C = Adecuación
Promedio
7.2-
9.6
D = Escasa Adecuación
9.6-
12
E = inadecuación
6. El punto DPP debe caer en las zonas A o B; en caso contrario, la encuesta
requiere reestructuración y/o modificación, luego de las cuales se somete
nuevamente a juicio de expertos. El valor hallado del DPP fue de 1.541
cayendo en la zona A, lo que indica la Adecuación del instrumento y que
puede ser aplicado.
Método 2
Cuadro 1. Formato para validar instrumentos a incluir en el instrumento de
validación.
ÍTEM Criterios a evaluar observaciones
( si debe
eliminarse o
modificarse un
favor indique)
Claridad
En la
redacció
n
Coherencia
interna
Inducción
a la
respuesta
(sesgo)
Lenguaje
Adecuado
Con el nivel
Del
informante
Mide lo
que
pretend
e medir
Si No Si No Si No Si No Si No
1
..
n
Aspectos generales Si No *************
El instrumento contiene instrucciones claras y precisas
para responder el cuestionario
Los ítems permiten el logro del objetivo de la investigación
Los ítems están distribuidos en forma lógica y secuencial
El número de ítems es suficiente para recoger la
información. En caso de ser negativa su respuesta, sugiera
los ítems a añadir
Validez
Aplicable ( ) No aplicable ( )
Validado por:
Firma:
1.5.10 CONFIABILIDAD del INSTRUMENTO
Antes de iniciar el trabajo de campo, es imprescindible probar el cuestionario
sobre un pequeño grupo de población. Esta prueba piloto ha de garantizar las
mismas condiciones de realización que el trabajo de campo real. Se
recomienda un pequeño grupo de sujetos que no pertenezcan a la muestra
seleccionada pero sí a la población o un grupo con características similares a la
de la muestra del estudio, aproximadamente entre 14 y 30 personas. De esta
manera se estimará la confiabilidad del cuestionario.
La confiabilidad responde a la pregunta ¿con cuánta exactitud los ítems,
reactivos o tareas representan al universo de donde fueron seleccionados?. El
término confiabilidad “…designa la exactitud con que un conjunto de puntajes
de pruebas miden lo que tendrían que medir” (Ebel, 1977, citado por Fuentes,
op. cit., p. 103).
Entre los métodos para estimar la confiabilidad, se tienen:
Método Test-Retest: una forma de estimar la confiabilidad de un test o
cuestionario es administrarlo dos veces al mismo grupo y correlacionar las
puntuaciones obtenidas.
El coeficiente que se obtiene recibe el nombre de coeficiente de estabilidad
porque denota la coherencia de las puntuaciones en el tiempo
Para un desarrollo adecuado y sean confiables deben variar entre 0,80 y 0,95
(Popham, 1980, citado por Fuentes, op. cit.).
Se usa la correlación por el método de los puntajes directos (Correlación r de
Pearson):
2 22 2*
i i i i
xy
i i i i
n x y x yr
n x x n y y
Donde:
xyr : es el coeficiente de correlación
n: número de sujetos
X: valores de X (1ª aplicación)
Y: valores de Y (2ª aplicación)
Método común de división por mitades o Hemitest: este método computa el
coeficiente de correlación entre los puntajes de las dos mitades del test o
cuestionario aplicado. Esto supone que las dos test mitades son paralelos,
tienen igual longitud y varianza entre sí. Se estima a través del coeficiente de
confiabilidad de Spearman-Brown:
Se establece la correlación entre los dos puntajes de las dos mitades del test a
través del método de los puntajes directos, Correlación r de Pearson:
1 2 1 2
122 22 2
1 1 2 2*
n x x x xr
n x x n x x
Estimación del test completo (Spearman-Brown) con la fórmula:
12
12
2
1tt
rr
r
Se interpreta la prueba de hemitest como coeficiente de consistencia
interna, ya que una sola prueba contiene las dos formas equivalentes y su
énfasis lo pone en las puntuaciones de los sujetos, no en los ítemes.
El método de división por mitades de Rulon: utiliza la división del test en
mitades, pero su método no supone necesariamente varianzas iguales en los
sub-tests. coeficiente de consistencia interna.
2
21 d
tt
t
sr
s
Donde:
ttr : coeficiente de confiabilidad
2
ds : varianza de la diferencia entre las puntuaciones de las mitades
2
ts : varianza de las puntuaciones del test total
El método de división por mitades de Guttman: también se denomina
coeficiente de consistencia interna. Su fórmula es:
2 2
22 1 a b
tt
t
s sr
s
Donde:
ttr : coeficiente de confiabilidad
2
as : varianza de las puntuaciones de los ítemes pares
2
bs : varianza de las puntuaciones de los ítemes impares
2
ts :varianza de las puntuaciones del test total
ALFA DE CRONBACH
Para evaluar la confiabilidad o la homogeneidad de las preguntas o ítems es
común emplear el coeficiente alfa de Cronbach cuando se trata de alternativas
de respuestas policotómicas, como las escalas tipo Likert; la cual puede tomar
valores entre 0 y 1, donde: 0 significa confiabilidad nula y 1 representa
confiabilidad total. El coeficiente α de Cronbach puede ser calculado por medio
de la varianza de los ítems y la varianza del puntaje total (Hernández Sampieri
et al, 2003). Para calcular el coeficiente de confiabilidad se usó el
”COEFICIENTE ALFA DE CROMBACH ( )” Córdova (2009), cuya ecuación
es:
donde:
: coeficiente de confiabilidad de la prueba o cuestionario
número de ítems del instrumento
: Varianza total del instrumento.
: Sumatoria de las varianzas de los ítems.
Método de Kuder-Richarson 21: permite obtener la confiabilidad a partir de
los datos obtenidos en una sola aplicación del test. La suposición básica es
considerar que todos los ítemes presentan igual varianza. Coeficiente de
consistencia interna.
21 21
1 t
M n MnKR
n ns
Donde:
n: número total de ítems
M: media aritmética de las puntuaciones obtenidas por los individuos
2
ts : varianza de las puntuaciones totales
Para la interpretación de la confiabilidad se utiliza el siguiente cuadro:
TABLA DE CATEGORÍAS
ESCALA CATEGORÍA
Confiabilidad muy alta
Confiabilidad alta
Confiabilidad aceptable
Confiabilidad moderada
Confiabilidad baja
Confiabilidad muy baja
Confiabilidad despreciable
Ejemplo 19.
Determine la confiabilidad, utilizando alfa de cronbach, para la siguiente
información
Encuestados
Preguntas (Ítems) Puntos
1 2 3 4 5 6 7 8 9 10
1 0 0 0 1 1 1 0 0 0 0 3
2 0 1 1 1 2 1 1 1 2 2 12
3 0 1 0 2 1 1 0 0 0 0 5
4 0 0 0 1 1 0 0 1 0 0 3
5 0 0 1 1 1 1 2 1 0 0 7
6 0 0 0 1 1 1 0 1 0 0 4
7 0 0 0 2 1 2 2 1 0 2 10
8 0 0 0 0 0 1 0 0 0 0 1
9 1 0 0 1 1 0 0 0 0 0 3
10 0 1 0 2 2 2 0 2 2 2 13
11 0 0 1 1 1 1 0 1 2 2 9
12 0 1 0 1 2 2 0 2 0 1 9
13 0 0 0 1 2 2 0 0 0 0 5
14 1 0 0 2 2 0 0 1 0 0 6
15 1 1 0 0 0 0 1 0 0 3
Total 3 5 3 17 18 15 5 12 6 9 93
0.17 0.24 0.17 0.42 0.45 0.57 0.53 0.46 0.69 0.83
varianza del instrumento
Varianza de cada pregunta
El índice de confiabilidad es alto de conformidad con la tabla de categorías.
BAREMACIÓN DEL INSTRUMENTO, UTILIZANDO ESCALA DE LIKERT.
Para medir la variable de estudio se aplico una encuesta utilizando la escala de
likert, la misma que presenta en cada ítems cinco alternativas, a partir de las
cuales los entrevistados pueden elegir, con la finalidad de señalar su nivel de
acuerdo.
- Alternativa a (5)
- Alternativa b (4)
- Alternativa c (3)
- alternativa d (2)
-alternativa e (1)
Para obtener las puntuaciones de la variable de estudio, se suman los valores
obtenidos respecto de cada ítem. El puntaje mínimo (PM) resulta de la
multiplicación del número de ítems (x) por 1. Una puntuación alta (PA) está
dada por el número de ítems o afirmaciones multiplicado por 5.
PM--------------------I----------------------I----------------------I------------------PA
Para facilitar la interpretar las puntuaciones de la variable de estudio se
transforman a una escala cualitativa, según el siguiente criterio.
Puntaje Obtenido Categoría
1.5Puntaje x Deficiente
1.5 2.5x Puntaje x Malo
2.5 3.5x Puntaje x Regular
3.5 4.5x Puntaje x Bueno
4.5Puntaje x Muy bueno
5.11 MATRIZ DE CONSISTENCIA.
Esta referido a la estructura del proyecto de Investigación desarrollado y que para fines didácticos se presenta en el siguiente
esquema:
TITULO:………
PROBLEMA OBJETIVO HIPOTESIS VARIABLES
General
¿…………………….?
Formulación de problemas
específicos.
1. ¿………………….?
2. ¿………………
3. ¿…………………?
General
……………
Objetivo específico
..
..
…
General
………….
Formulación de hipótesis
operativas.
…
…..
…..
Variable
independiente
……………
Variable Dependiente
…………….
…………..
TIPO DE ESTUDIO POBLACIÓN Y
MUESTRA
RECOLECCIÓN DE DATOS PRUEBAS ESTADISTICAS
Nivel de investigación….
Tipo de investigación………….
Diseño de investigación………
Población….
Muestra…………
Guía de observación
Cuestionario encuestas
Entrevistas
VARIABLES DIMENSIONES INDICADORES Ubicación de ítems
1
2
1
2
…….
………….
………..
MODELO DE TESIS
TÍTULO DE LA TESIS:
CAPITULO I: PROBLEMA DE INVESTIGACIÓN
PLANTEAMIENTO DEL PROBLEMA
FORMULACIÓN DEL PROBLEMA DE INVESTIGACIÓN
OBJETIVOS
JUSTIFICACIÓN
ORIGINALIDAD:
PERTINENCIA:
RELEVANCIA:
OPORTUNIDAD:
FACTIBILIDAD:
IMPORTANCIA
LIMITACIÓN
ÁREA DE ESTUDIO
DELIMITACIÓN
DELIMITACIÓN ESPACIAL
DELIMITACIÓN TEMPORAL
CAPITULO II: MARCO TEÓRICO
ANTECEDENTES DE ESTUDIO
MARCO CONCEPTUAL
MARCO NORMATIVO
MARCO TEÓRICO
CONCEPTUALIZACIÓN EN TÉRMINOS
HIPÓTESIS DE INVESTIGACION.
CAPITULO III: DISEÑO METODOLÓGICO
NIVEL DE INVESTIGACIÓN
TIPO DE NVESTIGACION.
DISEÑO DE INVESTIGACIÓN
POBLACIÓN Y MUESTRA
VARIABLES
OPERACIONALIZACIÓN DE VARIABLES
TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS
CLETO DE LA TORRE DUEÑAS 41
TÉCNICAS DE ANÁLISIS DE DATOS.
CAPITULO IV: PRESENTACION DE RESULTADOS
CONCLUSIONES
RECOMENDACIONES
BIBLIOGRAFIA
ANEXOS
EJERCICIOS PROPUESTOS.
1. Influencia del uso de materiales didácticos en el rendimiento académico de los
estudiantes de la ciudad de Cusco. Especifique.
a. La(s) variable(s) de estudio y el tipo de variable.
b. La escala de medición a emplear.
c. Nivel de investigación.
d. Tipo de investigación
e. Diseño de investigación
2. Se realizo el estudio de la calidad de vida y servicio educativo de los profesores
de las I.E de la UGEL Cusco. Especifique
a. Proponer un titulo para esta investigación.
b. La(s) variable(s) de estudio y el tipo de variable.
c. La escala de medición a emplear.
d. Nivel, tipo y diseño de investigación.
3. Se hizo una encuesta a una muestra representativa de profesores de la UGEL
La Convención sobre el nivel de acuerdo con la carrera pública magisterial
propuesta por el gobierno.
Carrera publica magisterial. Frecuencia
Totalmente de acuerdo 15
De acuerdo 40
Indeciso 25
En desacuerdo 10
Totalmente en desacuerdo 6
En base a la información, realice el análisis correspondiente.
42 ESTADISTICA
4. Clasificar cada una de las siguientes variables :
a. Rendimiento Académico (Bajo, Medio, Alto).
b. Sexo.
c. Edad.
d. Nivel educativo (primario secundario, superior).
e. Años de estudios completados.
f. Tipo de enseñanza (privada o pública).
g. Estrato social (bajo, medio o alto).
h. Numero Telefónico
i. Numero de DNI de un profesor.
j. Método de enseñanza.
k. Nivel de congruencia entre la sumilla y el silabo.
5. Se aplico un test para medir la competitividad del magisterio a una muestra
piloto de 5 profesores, obteniendo los siguientes resultados.
Profesor Ítems
1 2 3 4 5 6
1 1 0 1 0 0 0
2 0 0 1 1 0 1
3 1 0 0 1 1 1
4 1 0 1 1 0 0
5 0 0 1 0 1 1
Determine la confiabilidad y validez del instrumento.
CLETO DE LA TORRE DUEÑAS 43
CAPITULO II
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
2.1 ESTADISTICA.
La Estadística es la ciencia que se ocupa de los métodos y procedimientos de
colección, clasificación, organización, análisis, síntesis e interpretación de datos;
siendo su característica que la distingue, la de hacer generalizaciones o inferencias en
base a una muestra.
Se define la estadística como:
Una ciencia que se ocupa de la recolección, organización, procesamiento y
análisis de la información.
Una ciencia que permite tomar de decisiones
Herramienta de la investigación científica.
En términos generales la estadística aborda dos tipos de problemas:
♦ Resumir, describir y explorar datos.
♦ Utilizar datos de una muestra para inferir la naturaleza del conjunto del cual se
selecciono la muestra.
DIVISION DE LA ESTADISTICA
La estadística se divide en dos partes íntimamente relacionadas:
Estadística Descriptiva: Esta es la parte de la estadística que se dedica a la
organización, síntesis y descripción de conjuntos de datos.
Esta es importante, ya que antes de que la mente humana pueda interpretar
(hacer inferencias) un conjunto de datos, especialmente cuando estos son
demasiados, es necesario resumirlos o representarlos de manera clara,
simplificada o reducida.
44 ESTADISTICA
Estadística Inferencial: Esta rama de la estadística trata el problema de inferir la
naturaleza de un conjunto de datos a partir de una muestra de dichos datos.
El problema general de la Estadística
Figura 2.1: Relación entre población y muestra.
CONCEPTOS BASICOS
Población. Es cualquier conjunto de datos, objetivo de nuestro interés, sobre los
cuales interesa observar una o más características. Esta puede ser finita o infinita.
El tamaño de la población es el número de individuos que esta tiene.
Muestra. Una muestra es un conjunto de individuos de la población que refleja las
características de ésta lo mejor posible. Si las características quedan bien
reflejadas, se dice que la muestra es representativa. El tamaño de una muestra es
el número de individuos que tiene, lo denotamos por n.
Unidad de estudio. Es cada elemento que va a ser estudiado, normalmente se
trate de individuos, pero no tiene por qué ser así.
Data. Es cualquier medida resultado de haber observado una variable en una
unidad de alguna población.
Parámetro. Es una propiedad descriptiva de una población. Ejemplo media y
varianza poblacional
Estadístico. Es una propiedad descriptiva de una muestra. Ejemplo media y
varianza muestral.
Variable. Cualquier característica de Interés en el estudio.
Variable cualitativa: Ordinal y Nominal
Variable cuantitativa: Discreta y continua.
Por otra parte, el reporte de las variables medidas requiere de los siguientes
conceptos:
Población Muestra Inferencias
Que tan reales
es.
CLETO DE LA TORRE DUEÑAS 45
2.2 ORGANIZACIÓN DE DATOS
La presentación de datos a través de tablas estadísticas es una actividad importante
dentro de los sistemas de información, estas se fortalecen significativamente cuando se
la acompañan con gráficos descriptivos ilustrativos. En el contexto de los sistemas de
información, en más de una oportunidad se encontrara que un buen grafico resume y
expresa mucho más que párrafos completos de comentarios e interpretaciones
literales.
Resumir los datos es un procedimiento útil para conseguirlo y puede hacerse mediante
tablas, gráficos o valores numéricos. A lo largo de este tema veremos las principales
técnicas numéricas y gráficas que nos permiten describir una característica de interés
observada en una población, poniendo en relieve sus rasgos más importantes.
2.3 TABLA DE FRECUENCIAS.
Un primer resumen de la información contenida en un conjunto de datos
observado se obtiene al organiza los datos, en una tabla de frecuencias. En ésta
se recogen los distintos valores (números o categorías) que toma la variable junto
con sus correspondientes frecuencias de aparición.
TABLA DE FRECUENCIAS PARA VARIABLES CUALITATIVAS
Si en una muestra de n elementos, se observa k categorías diferentes C1, C2,…,
Ck de una variable cualitativa X.
Para resumir la información, previamente definimos algunos conceptos:
La frecuencia absoluta de un valor Ci es el número de veces que dicho valor
aparece en la muestra. Se representa por fi y cumple
1 2
1
......k
ki
i
f f f f n
La frecuencia relativa de un valor Ci es el cociente de la frecuencia absoluta (fi)
entre el tamaño de la muestra (n), se representa por hi
ii
fh
n , se cumple 1
1k
i
i
h
46 ESTADISTICA
La frecuencia absoluta acumulada del valor i-ésimo es la suma de las
frecuencias absolutas hasta dicho valor, se denota por Fi
1 2 ...... iiF f f f
La frecuencia relativa acumulada del valor i-ésimo es la suma de las
frecuencias relativas hasta dicho valor, se denota por Fi
1 2 ...... iiH h h h ,
ii
FH
n
La tabla de frecuencias tiene la siguiente estructura:
Categoría de X fi hi pi Fi Hi
C1 f1 h1 p1 F1 H1
C2 f2 h2 pi F2 H2
…. … … … … …
Ck fk hk pk Fk=n Hk=1
Total n 1.00 100
GRAFICAS PARA VARIABLES CUALITATIVAS.
Las representaciones gráficas prácticamente están orientadas de acuerdo con las
necesidades del investigador o estadístico, de todas formas se tienen algunas
normas de trabajo y representación, que tienen por objeto facilitar la lectura de los
datos e información que se maneja estadísticamente.
La calidad de un gráfico estadístico consiste en comunicar ideas complejas con
precisión, claridad y eficiencia, de tal manera que:
• Induzca a pensar en el contenido más que en la apariencia
• No distorsione la información proporcionada por los datos
• Presente mucha información (números) en poco espacio
CLETO DE LA TORRE DUEÑAS 47
• Favorezca la comparación de diferentes grupos de datos o de relaciones entre
los mismos (por ejemplo una secuencia temporal)
La finalidad de los gráficos estadísticos es:
– Organizar los datos.
– Observar patrones.
– Observar agrupamientos.
– Observar relaciones.
– Comparar distribuciones.
– Visualizar rápidamente la distribución de los datos.
– Visualizar, obtener y comparar medidas estadísticas.
La tabla de frecuencias para variables cualitativas, se puede representar
utilizando los siguientes gráficos.
Diagrama de barras o rectangulos
Es la representación gráfica usual para variables cualitativas.
Para el caso de variables cualitativas se construye dibujando sobre la categoría
correspondiente un rectángulo con altura igual a la frecuencia (absoluta o
relativa). También es válido para variables cuantitativas discretas, considerando
en el eje de abscisas los valores de la variable en orden creciente en lugar de las
categorías, sobre cada valor levantamos una barra de altura igual a la frecuencia
(absoluta o relativa).
Este grafico es recomendable, cuando la variable de estudio tiene muchas
categorías.
Diagrama de Pareto.
Se ordenan las categorías de mayor a menor importancia y se dibujan los
rectángulos correspondientes.
Este grafico se recomienda para jerarquizar los factores considerados en el
estudio.
48 ESTADISTICA
Diagrama de sectores.
Es el más usual en variables cualitativas. Se representan mediante círculos.
A cada valor de la variable se le asocia el sector circular proporcional a su
frecuencia.
Para hallar el ángulo usamos la siguiente proporción: al tener una circunferencia
360º, el cociente entre la frecuencia absoluta (o relativa) total y la frecuencia
absoluta (o relativa) que queramos representar será igual al cociente entre los
360º de la circunferencia y el ángulo a determinar, así:
360º 1 360º
i i
n
f h
Donde es el ángulo a determinar.
Este grafico es recomendable, cuando la variable tiene pocas categorías.
Pictogramas.
Expresan con dibujos alusivos al tema de estudio las frecuencias de las
modalidades de la variable. La escala de los dibujos debe ser tal que el área de
cada uno de ellos sea proporcional a la frecuencia de la modalidad que
representa.
TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS
DISCRETAS
Una vez obtenida una muestra de cualquier población y observados los valores
que toma la variable en los individuos de la muestra, estos valores se suelen
ordenar. Si la variable es cuantitativa la ordenación será de menor a mayor.
CLETO DE LA TORRE DUEÑAS 49
Dada una variable X, consideramos una muestra de tamaño n que toma k valores
distintos, x1, . . . , xk (x1 < x2 < . . . < xk).
La organización es en forma similar al caso cualitativo.
Valores de X fi hi pi Fi Hi
x1 f1 h1 p1 F1 H1
x2 f2 h2 pi F2 H2
…. … … … … …
xk fk hk pk Fk=n Hk=1
Total n 1.00 100
La grafica para representar esta información es Bastones.
Existe otros gráficos, tales como:
Diagrama de cajas(box-plot)
Presentación visual que describe al mismo tiempo varias características
importantes de un conjunto de datos, tales como el centro, la dispersión, el
alejamiento de la simetría, y la identificación de valores extremos (puntos
atípicos), es decir, de valores que se alejan de una manera poco usual del resto
de los datos. Presenta los tres cuartiles, (y los valores mínimos y máximos)
alineados sobre una caja vertical u horizontalmente. El procedimiento Para el
diagrama de cajas y bigotes es:
1. Dibujar un segmento con extremos en los valores menor y mayor que aparecen
en la muestra paralelo a uno de los ejes.
2. Dibujamos una caja con extremos en el primer y tercer cuartil y marcamos en
ella la mediana.
3. Se hallan los límites interiores (Q1 – 1.5 IQR y Q3 + 1.5 IQR) y los límites
exteriores (Q1 – 3 IQR y Q3 + 3 IQR).
Donde Qi : Cuartiles que seran desarrollados más adelante.
4. Se unen, con unos segmentos (bigotes), Q1 y Q3 con los valores adyacentes de
la muestra.
50 ESTADISTICA
5. Por último se indican los valores atípicos
Tallos y Hojas (stem & leaf)
Procedimiento semigráfico para el que se preparan los datos resumiéndolos en
dos o tres cifras (expresándolos en las unidades adecuadas). A continuación se
disponen en una tabla de dos columnas del siguiente modo:
1. Si los datos son de dos dígitos, a la izquierda (en el tallo) aparece la cifra de las
decenas, a la derecha separada por una línea aparecen las hojas y se escriben
ordenadas y todas seguidas.
2. Si hay tres dígitos el tallo está formado por los dos primeros. Las hojas son las
unidades.
TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS CONTINUAS
A veces se hace necesario trabajar con datos agrupados. Definimos entonces
como clase a cada uno de los intervalos en que se agrupan los datos. Las
frecuencias harán ahora referencia al número de datos que hay en cada intervalo.
Para construir distribución de frecuencias por intervalos, se tiene los siguientes
pasos:
Elegir un número de intervalos de clase (K)
Puede utilizar la regla de Sturges, 1 3.3log( )k n
Donde k: Número de intervalos.
n: Número de datos.
Determinar el rango.
max minR x x
Determinar la amplitud de las clases.
/A R k
CLETO DE LA TORRE DUEÑAS 51
Determinación de los intervalos iI :
1 min min 1 1, ,I x x A LI LS
2 min min 2 2, 2 ,I x A x A LI LS
min min( 1) , ,k k kI x k A x kA LI LS
Determinación de las marcas de clase.
2
i ii
LI LSm
Donde LI : Limite inferior
LS : Limite superior.
Realizar la clasificación y el conteo de datos en cada clase construida.
Ii mi fi hi hi pi Fi Hi
I1 m1 f1 h1 h1 p1 F1 H1
I2 m2 f2 h2 h2 pi F2 H2
…. … … … … … … …
Ik mk fk hk hk pk Fk=n Hk=1
Total n 1.00 1.00 100
Cuando las variables son continuas, utilizamos como diagramas diferenciales los
histogramas y los polígonos de frecuencias.
52 ESTADISTICA
Histograma de frecuencias
Un histograma es la representación más frecuente con datos agrupados, se
construye a partir de la tabla estadística, representando sobre cada intervalo, un
rectángulo que tiene a este segmento como base. El criterio para calcular la altura
de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias
absolutas (o relativas) de cada intervalo y el área de los mismos.
Polígono de frecuencias
El polígono se construye fácilmente si tenemos representado previamente el
histograma, ya que consiste en unir mediante líneas rectas los puntos del
histograma que corresponden a las marcas de clase. Para representar el polígono
de frecuencias en el primer y último intervalo, suponemos que adyacentes a ellos
existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una
línea recta los puntos del histograma que corresponden a sus marcas de clase.
Curva de frecuencias.
Resulta de suavizar el polígono de frecuencias, en sus puntos angulosos.
Ojivas
Es una poligonal construida uniendo los puntos cuyas abscisas son los límites
superiores de clases y las ordenadas son las frecuencias absolutas acumuladas
CLETO DE LA TORRE DUEÑAS 53
Resumen de gráficos.
Variable Tipo Gráfico
Cualitativa Nominal Sectores circulares,
barras, pictogramas,
pareto.
Ordinal
Cuantitativa Discreta Bastones, barras, box
plots, tallos y hojas
Continua Histogramas, polígonos
de frecuencia, Ojivas,
Grafico de cajas, Box-
plots, tallos y hojas.
54 ESTADISTICA
EJERCICIOS DESARROLLADOS
1. En una encuesta de opinión, respecto a las preferencias del método de
enseñanza: Clásico(A), Nuevo enfoque (B), Ambos métodos(C), 30 docentes
dieron las siguientes respuestas:
A, B, B, B, C, B, B, B, A, A, B, B, C, A, B, C, B, A, A, B, B, B, C, C, B, B, C, C, C, B
Construir la distribución de frecuencias y represente la información mediante un
grafico.
Solución.
Método fi hi pi
Clásico 6 0.2 20
Nuevo Enfoque 16 0.5333 53.33
Ambos métodos 8 0.2667 26.67
Total n=30 1.00 100.00
Barchart for Metodo
0
4
8
12
16
frequency
{[}
{\}
{]}
{ }̂
{_}
{`}
Ambos metodos Clasico Nuevo enfoque
CLETO DE LA TORRE DUEÑAS 55
Category
Ambos metodos
Clasico
Nuevo enfoque
Pie Chart of C1
2. En un estudio realizado de los hábitos estudio de los estudiantes de I.E de la
ciudad de Cusco, se obtuvo los siguientes resultados que se muestra en el
cuadro siguiente.
96 38,4
83 33,2
71 28,4
250 100,0
Hábito de estudio
Bajo
Intermedio
Alto
Total
Frecuencia Porcentaje
Representa la información mediante dos gráficos adecuados.
Porc
enta
je
40
30
20
10
0
Hábito de estudio
AltoIntermedioBajo
56 ESTADISTICA
3. El Director de una institución educativa desea analizar el número de tardanzas
presentadas por los estudiantes. Para ello, se toma una muestra aleatoria de
50 estudiantes obtenido los siguientes datos de tardanzas:
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
En base a la información:
a) ¿Cuál es la población objeto de estudio?
b) ¿Qué variable estamos estudiando?
c) ¿Qué tipo de variable es?
d) Construir la tabla de frecuencias?
Solución:
a) La población objeto de estudio es el total de estudiantes de la I.E.
b) La variable (x) que estamos estudiando es el número de tardanzas
c) El tipo de variable es discreta ya que el número de tardanzas solo puede
tomar determinados valores enteros
d) Para construir la tabla de frecuencias tenemos que analizar el número de
tardanzas de los estudiantes. Podemos ver que el número de tardanzas, toma
los valores existentes entre 0 y 6 hijos:
Xi fi Fi hi Hi
0 2 2 0.04 0.04
1 4 6 0.08 0.12
2 21 27 0.42 0.54
3 15 42 0.30 0.84
4 6 48 0.12 0.96
5 1 49 0.02 0.98
6 1 50 0.024 1
n = 50 1
4. En la UGEL de la región Cusco, se realizo un estudio sobre el conocimiento de
estrategias cognitivas. Los resultados se muestran a continuación.
CLETO DE LA TORRE DUEÑAS 57
Conocimiento
26 63.4
8 19.5
7 17.1
41 100.0
Deficiente
Regular
Bueno
Total
Frecuencia Porcentaje
Represente la información mediante un grafico.
Solución:
Porc
entaj
e
60,0%
40,0%
20,0%
0,0%
Conocimiento
BuenoRegularDeficiente
5. Por encargo del nutricionista, se debe dar la siguiente cantidad de calorías a un
grupo de 50 estudiantes de una institución educativa.
3255 2123 3525 2123 3453
1895 2740 4525 3215 2593
2155 3255 2460 1985 3530
2456 3772 4220 2971 4685
1525 3847 3005 2224 2646
4450 2793 1965 2327 4525
4243 4124 4595 2643 3797
3024 3214 4509 3727 4134
4244 4955 3925 2220 2335
1255 4675 4580 3437 2702
58 ESTADISTICA
a) Organice la información en una tabla de frecuencias.
b) Represente la información utilizando: Histograma de frecuencias porcentuales
acumuladas y Ojiva.
c) Trace el histograma y polígono de frecuencias porcentuales.
Solución.
a) Construiremos la tabla de frecuencias.
Número de clases.
Usando la relación de sturges se tiene:
1 3.3log( ) 1 3.3log(50) 6,6 7k n
Determinar la amplitud de los intervalos
max min 4955 1255 3700R x x
Determinar el tamaño del intervalo de clases (A),
3700
A 528,577
R
k
Clase Intervalo mi fi hi pi Pi
1 [1255,0 - 1783,57 ) 1519,29 1 0,0400 4% 4%
2 [1783,57 - 2312,14 ) 2047,86 8 0,1600 16% 20%
3 [2312,14 - 2840,71 ) 2576,43 10 0,2000 20% 40%
4 [2840,71 - 3369,29 ) 3105,0 7 0,1400 14% 54%
5 [3369,29 - 3897,86) 3633,57 8 0,1600 16% 70%
6 [3897,86 - 4426,43) 4162,14 6 0,1200 12% 82%
7 [4426,43 - 4955 ) 4690,71 9 0,1800 18% 1OO%
Total 50 1 100%
CLETO DE LA TORRE DUEÑAS 59
b) La grafica muestra el histograma de frecuencias porcentuales acumuladas y la
ojiva
c) En el grafico se muestra, el polígono de frecuencias.
Fre
cu
en
cia
Po
rce
ntu
al A
cu
mu
lad
aHistograma
0 1 2 3 4 5(X 1000,0)
Calorias
0
20
40
60
80
100
Ojiva
Histograma
Fre
cu
en
cia
Po
rce
ntu
al A
cu
mu
lad
aHistograma
0 1 2 3 4 5(X 1000,0)
Calorias
0
20
40
60
80
100
Ojiva
Histograma
Fre
cu
en
cia
Po
rce
ntu
al
Histograma
0 1 2 3 4 5(X 1000,0)
Calorias
0
4
8
12
16
20
Polígono de
frecuencias
Fre
cu
en
cia
Po
rce
ntu
al
Histograma
0 1 2 3 4 5(X 1000,0)
Calorias
0
4
8
12
16
20
Polígono de
frecuencias
60 ESTADISTICA
6. Un investigador recopila información del peso de 50 profesores. Los datos
obtenidos fueron los siguientes.
65 63 65 63 69 67 53 58 60 61
64 65 64 72 68 66 55 57 60 62
64 65 64 71 68 66 56 59 61 62
63 65 63 70 67 66 57 59 61 62
64 64 63 69 67 66 58 60 61 62
a. Construya la tabla de distribución de frecuencias
b. Represente la información obtenida, mediante un grafico.
Solución.
a. Para construir una tabla de frecuencia se tiene los siguientes pasos.
Elegir el número de clases.
Usando la relación de sturges se tiene:
1 3.3log( ) 1 3.3log(50) 7k n
Determinar la amplitud de los intervalos
max min 72 53 19R x x
Determinar el tamaño del intervalo de clases (A),
19A 2,7
7
R
k
Consideramos A=3
Establecimiento de los límites y construcción de la tabla:
LI - LS fi mi Fi hi= fi/n pi Hi
[52 – 55) 2 53.5 2 0.04 4 0,04
[55 – 58) 5 56.5 7 0.1 10 0,14
[58 – 61) 9 59.5 16 0.18 18 0,32
[61 – 64) 15 62.5 31 0.3 30 0,62
[64 – 67) 12 65.5 43 0.24 24 0,86
[67 – 70) 5 68.5 48 0.1 10 0,96
[70 – 73) 2 71.5 50 0.04 4 1,0000
TOTAL n=50 1 100
CLETO DE LA TORRE DUEÑAS 61
b. Histograma de frecuencias relativas.
Histogram
52 56 60 64 68 72 76
Peso
0
5
10
15
20
25
30
perc
enta
ge
62 ESTADISTICA
EJERCICIOS PROPUESTOS.
1. Un investigador realiza una investigación con la finalidad de comparar la
eficiencia de los siguientes métodos de comprensión lectora:
A: Enseñanza directa.
B: Enseñanza recíproca.
C: Combinación de los métodos de enseñanza directa y enseñanza recíproca.
Si se aplico cada método en forma independiente en tres secciones diferentes
de 50 alumnos cada uno, obteniéndose, que 30 alumnos con el método de
enseñanza directa, 20 con método de enseñanza reciproca y 35 con la
combinación de estos métodos presenta una buena comprensión lectora. En
base a estos resultados cual es su conclusión del estudio.
2. Se aplico una encuesta a directores de I.E con la finalidad de evaluar la
influencia de los programas de capacitación de docentes fomentados por el
Estado en la calidad de servicio educativo. Los resultados son los siguientes:
I.E X Y I.E X Y I.E X Y
1 R R 8 MB MB 15 R R
2 M M 9 R R 16 R M
3 M R 10 R M 17 M R
4 R M 11 M M 18 M M
5 B B 12 M R 19 M M
6 M M 13 R R 20 B B
7 R R 14 MB B 21 B R
Donde
X: Programas de capacitación.
Y: Calidad del servicio educativo.
M: Mala, R: Regular, B: Buena, MB: Muy buena.
Cuál es su conclusión del estudio
3. Se ha medido la comprensión lectora de una muestra de 50 profesores de la
UGEL A, Los resultados son los siguientes: 30, 35, 34, 38, 40, 42, 43, 43,
CLETO DE LA TORRE DUEÑAS 63
44,44,45,45,46,46,46, 47, 48, 50, 55, 56, 58, 59, 60, 63, 65, 66, 67, 67, 68, 70,
72, 74, 75, 77,78,78,78,78, 78, 79, 79, 79, 80,82, 82, 83, 88, 90, 96,99
a) Organiza y representa adecuadamente la información.
b) Redacte sus conclusiones del estudio.
4. Los siguientes datos corresponden a una muestra de 30 estudiantes de un
centro educativo de la ciudad de Cusco, en los cuales se midieron tres
características: Peso en libras (X), Número de tardanzas en el año escolar (Y) y
Estrato socioeconómico (Z)
X Y Z
138 3 MEDIO
164 5 MEDIO
150 1 ALTO
132 4 BAJO
144 3 MEDIO
125 2 MEDIO
149 0 BAJO
157 1 BAJO
146 5 MEDIO
158 3 ALTO
140 4 BAJO
147 2 MEDIO
136 2 MEDIO
148 4 ALTO
152 5 BAJO
149 4 MEDIO
168 4 MEDIO
126 0 MEDIO
138 1 ALTO
176 2 BAJO
163 2 MEDIO
119 3 MEDIO
154 5 BAJO
165 2 BAJO
64 ESTADISTICA
146 3 BAJO
173 4 MEDIO
142 1 BAJO
147 1 ALTO
135 2 MEDIO
153 2 MEDIO
I. Identifique los siguientes conceptos:
a) Población.
b) Muestra.
c) Unidad de análisis.
d) Variables o características de interés
e) Clasifique las variables definidas anteriormente
II. Construya una tabla de frecuencias para presentar el estrato socioeconómico de
los estudiantes con su correspondiente título y anéxele un gráfico adecuado.
III. Construya una tabla de frecuencias para presentar el número de tardanzas al año
de los estudiantes con su correspondiente título y anéxele un gráfico adecuado.
IV. Construya una tabla de frecuencias de 5 intervalos para presentar el peso de los
estudiantes con su correspondiente título y anéxele un gráfico adecuado.
V. De las tablas construidas anteriormente responda las siguientes consultas:
a) ¿Qué porcentaje de estudiantes corresponde al estrato socioeconómico bajo?
b) ¿Cuantos estudiantes realizan, presentaron a lo más dos tardanzas al año?
c) ¿Qué porcentaje de estudiantes no presento tardanzas en el año?
d) ¿Cuántos estudiantes tienen un peso a lo más de 167?
e) ¿Qué porcentaje de estudiantes tiene un peso mayor a 127 y menor o igual a
159?
f) ¿Cuántos estudiantes tienen un peso mayor a 159?
5. Una encuesta realizada en un grupo de profesores sobre el uso de los distintos
tipos de estrategias metodológicas, dio los siguientes resultados
A D B A D D A C D
B A B A C A A D D
D A D C A C C D A
CLETO DE LA TORRE DUEÑAS 65
B A D B A B C C A
D C A D A B A B A
Confeccionar una tabla de frecuencias que recoja esta información y elabora dos
tipos de gráficos distintos a partir de ella. ¿Qué porcentaje de profesores utiliza
cada estrategia?
6. Los datos siguientes representan el número de gestiones realizadas en
instituciones públicas o privadas de 52 Directores de igual número de centros
educativos en el año 2009:
0 2 0 1 3 4 0 2 1 3 0 2 2 1 0 5 2 6 1 2 1 4 1 1 0 1 1
2 0 5 2 0 4 3 2 4 3 2 1 6 2 3 3 5 1 3 6 1 3 4 5 0 2 3
a) Identifique los siguientes conceptos:
i) Población analizada.
ii) Elementos de la población.
iii) Característica en estudio.
iv) Tipo de dato analizado.
b) Construya una tabla de frecuencias completa para estos datos y escríbale un
título.
c) Trazar una grafica adecuada.
d) Con la tabla construida en c) entregue la siguiente información al Director de la
UGEL:
i) ¿ Cuántos Directores , realizaron a lo más 3 gestiones?.
ii) ¿Qué porcentaje de Directores, realizo exactamente 5 gestiones?.
7. Se ha realizado una encuesta a 30 familias en la que se les pregunta el nº de
integrantes. Las respuestas obtenidas han sido las siguientes:
1, 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
1. Calcule la distribución de frecuencias de la variable obteniendo las frecuencias
absolutas, relativas y sus correspondientes acumuladas.
2. ¿Qué proporción de familias está compuesta por tres o menos personas?
3. Dibuje el diagrama de barras de frecuencias.
8. Se le aplico una prueba de inteligencia a los estudiantes de un centro educativo,
obteniendo los siguientes datos.
66 ESTADISTICA
87 105 88 103 114 125 108 107 118 114 129 100 106 113 105 111 94
115 89 82 141 92 132 112 97 135 101 104 130 99 114 91 145 95
101 115 104 87 108 115 103 132 110 113 102 109 124 98 140 107 93
108 122 117 114 141 116 108 102 101 118 138 99 105 112 94 96 132
118 123 108 131 127 100 91
a) Agrupe los datos en y confeccione una tabla de frecuencias
b) Trace las graficas adecuadas.
9. Represente gráficamente la siguiente información
2 4.0
18 36.0
30 60.0
50 100.0
Comprensión Literal
Malo
Regular
Bueno
Total
Frecuencia Porcentaje
CLETO DE LA TORRE DUEÑAS 67
CAPITULO III
MEDIDAS DESCRIPTIVAS DE UNA DISTRIBUCIÓN DE DATOS.
3.1 INTRODUCCION.
Las técnicas estudiadas anteriormente permiten una descripción visual de la
distribución de una variable. En muchos casos, el resumen puede hacerse
eficazmente de una forma más sencilla y precisa, utilizando valores numéricos que
den idea de la ubicación o del centro de los datos (medidas de posición). Usando
cantidades que informen de la concentración de las observaciones alrededor de
dicho centro (medidas de dispersión) y mediante números que reflejen la forma
(asimetría y apuntamiento) de la distribución (medidas de forma). La conjunción de
técnicas numéricas y gráficas permite una buena descripción de la variable.
Los estadísticos resúmenes tratan de reflejar numéricamente distintos aspectos de
la variable en estudio. Podemos distinguir 4 aspectos o características principales
que pueden resumirse en una distribución. (Ver cuadro siguiente)
68 ESTADISTICA
Medidas
descriptivas
Centralización
Media Nos dan un centro de
la distribución de
frecuencias
Mediana
Moda
Posición
Percentiles Son valores de la
distribución que
dividen en partes
iguales
Cuartiles
Deciles
Dispersión
Varianza Las medidas de
dispersión cuantifican
la separación, la
dispersión, la
variabilidad de los
valores de la
distribución respecto al
valor central
Desviación típica
Coeficiente de variación
Rango
Recorrido Intercuartilico
Forma
Coeficiente de Asimetría Comparan la forma
que tiene la
representación gráfica
Coeficiente de Apuntamiento
o Curtosis
3.2 MEDIDAS DE TENDENCIA CENTRAL
Los promedios o medidas de tendencia central son valores representativos de un
conjunto de datos. Pretenden resumir todos los datos en un único valor. Las
medidas de tendencia central son fundamentales ya que permiten localizar
cuantitativamente la zona central o de mayor acumulación de información de un
conjunto de datos correspondientes a una variable, obtenidos de una muestra
seleccionada de una población específica o de un conjunto de resultados del
espacio muestral de un experimento aleatorio.
Definimos tres medidas de tendencia central más importantes: media, mediana y
moda.
CLETO DE LA TORRE DUEÑAS 69
Media ( x )
Media para datos sin agrupar:
Dado un conjunto de observaciones x1, . . . , xn, la media se representa mediante
x , se obtiene mediante:
1 2 1.....
n
i
n i
xx x x
xn n
Media para datos agrupados
Consideremos el caso en que tenemos una distribución de frecuencia para
variables cuantitativas discretas, en este caso la media es:
1 1 2 2
1
.....k
kk
i i
i
f x f x f xx x h
n
Si los datos están agrupados por intervalos, para hallar la media tomamos la
marca de las clases,
1 1 2 2
1
.....k k
i
k
i
i
f m f m f mx h m
n
La media se mide en las mismas unidades que la variable, y tiene el
inconveniente de verse muy afectada por la presencia de datos que sean
extremadamente grandes o pequeños (datos atípicos).
Mediana (Me)
Se calcula para variables cuantitativas; es el valor de la serie de datos que se
sitúa justamente en el centro de la muestra una vez se ha ordenado ésta,
corresponde a un 50% de valores son inferiores y otro 50% son superiores.
70 ESTADISTICA
Mediana para datos sin agrupar
La mediana es el valor del dato central y depende del tamaño de la muestra.
1
2
nMe x
, para n impar
12 2
2
n nx x
Me , Si n es par.
Mediana para datos agrupados
Cuando trabajamos con variables agrupadas por intervalos es imposible
determinar con precisión los valores que toman los datos, ya que esa información
se ha perdido en privilegio del agrupamiento intervalo. Por lo tanto, en este caso,
debemos buscar otro método para determinar el valor de la mediana.
110.52
ii
i i
nF
HMe LI A LI A
f h
La mediana sólo tiene en cuenta la posición de los valores en la muestra y por lo
tanto tiene mejor comportamiento que la media cuando hay observaciones
anómalas.
Moda (Mo)
Es el valor con mayor frecuencia. Si hay más de una moda, la variable se dice
multimodal y puede calcularse para cualquier tipo de variable (Cuantitativas o
cualitativas).
Si los datos están agrupados hablamos de clase modal y será aquella para la que
la frecuencia absoluta sea mayor.
11
1 2 1 1
i i
i i i i
f fMo LI A LI A
f f f f
CLETO DE LA TORRE DUEÑAS 71
Donde:
1 1i if f
2 1i if f
¿Cómo elegir entre las medidas de tendencia central?- En general, la media es
la medida de tendencia central más útil y más empleada. El uso de la media es el
más apropiado cuando y la distribución de los datos es unimodal y
aproximadamente simétrica. Cuando valores extremos distorsionan la distribución
de los datos, el uso de la mediana es más apropiado pues se ve menos afectada,
pero en la práctica esta medida de tendencia central no se utiliza demasiado. Si se
trata de una variable ordinal, o sólo necesitas una descripción rápida y aproximada
de la tendencia central, puedes utilizar la moda, que también es útil cuando la
distribución está distorsionada por valores extremos o la distribución es bimodal.
3.3 CLASES DE DISTRIBUCIONES
Distribución Simétrica: Se presenta si todas las observaciones están concentradas
en un solo valor de la variable, en este caso la media, mediana y moda coincidirían
en el mismo.
x Me Mo
Distribución asimétrica sesgada a la izquierda
Unimodal Bimodal MultimodalUnimodal Bimodal Multimodal
72 ESTADISTICA
Supongamos ahora que las observaciones de la parte izquierda se alejan del valor
central más que las observaciones de la parte derecha, generando una distribución
asimétrica hacia la izquierda; en este caso como la media es la suma de los valores
de las observaciones dividido por la cantidad total de observaciones, su valor se
correrá a la izquierda también y por el mismo motivo, la media será menor que la
mediana y ambas menor que la moda, es decir:
x Me Mo
Distribución asimétrica sesgada a la derecha.
En este caso la media, es mayor que la mediana y que la moda.
Mo Me x
.
3.4 MEDIDAS DE POSICIÓN.
Cuartiles
Dividen la muestra, ordenada de menor a mayor, en 4 partes iguales, y se
denotan por Qi , i=1,2,3
1
.
4k
i i
k
i nF
Q LI Af
CLETO DE LA TORRE DUEÑAS 73
- Q1, primer cuartil, al menos el 25% de los datos son menores o iguales que él
y al menos el 75% de los datos son mayores o iguales que él.
- Q2, segundo cuartil, es la mediana, Q2 = Me.
- Q3, tercer cuartil, al menos el 75% de los datos son menores o iguales que él
y al menos el 25% de los datos son mayores o iguales que él.
Percentiles
Dividen la muestra ordenada en 100 partes iguales.
1
.
100k
i i
k
i nF
P LI Af
El i-ésimo percentil, Pi (1 99i ) es un valor tal que al menos el i% de los datos
son menores o iguales que él y al menos el (100-i) % de los datos son mayores o
iguales que él.
A partir de las definiciones de los cuartiles y percentiles, es claro que Q1 = P25, Q2
= P50 =Me y que Q3 = P75.
Deciles
Dividen el conjunto de datos en 10 partes iguales y se denota con Di , i=1,…9
1
.
10k
i i
k
i nF
D LI Af
3.5 MEDIDAS DE DISPERSIÓN
Mientras los estadísticos de tendencia central nos indican los valores alrededor de
los cuales se sitúan un grupo de observaciones, los estadísticos de variabilidad o
dispersión muestran si los valores de las observaciones están próximos entre sí o
74 ESTADISTICA
están muy separados. Dos conjuntos de datos pueden tener la misma localización
central y no obstante, ser muy distintos si uno se halla más disperso que el otro.
La dispersión es el grado en que los datos numéricos tienden a extenderse
alrededor de un valor medio. La dispersión de la distribución suministra
información complementaria que permite juzgar la confiabilidad de nuestra medida
de tendencia central. Si los datos están ampliamente dispersos, la localización
central será menos representativa de los datos en su conjunto de lo que sería en
el caso de datos que se acumulasen más alrededor de la media. Además, si no
conviene tener una amplia dispersión de valores respecto al centro o si esa
dispersión implica un riesgo inaceptable, deberemos ser capaces de reconocerlo
y no escoger las distribuciones que presentan la máxima dispersión.
Las medidas más importantes son: Varianza, desviación típica, coeficiente de
variación muestral, rango y rango semiintercuartilico. Las mismas que se
desarrolla a continuación:
Varianza.
Sólo tienen sentido para variables cuantitativas y se define:
2 2
2 21 1
n n
i i
i i
x x x
S xn n , Para datos no tabulados.
2 2
2 21 1
n n
i i i i
i i
x x f f x
S xn n , Para datos tabulados de variable
discreta
2 2
2 21 1
n n
i i i i
i i
m x f f m
S xn n
, Para datos tabulados por intervalos,
para variables continuas.
Observaciones sobre la varianza:
CLETO DE LA TORRE DUEÑAS 75
Las unidades de la varianza son los cuadrados de las unidades de los datos y
en muchas ocasiones no son fáciles de interpretar.
Puede sufrir un cambio desproporcionado por la existencia de valores extremos
en el conjunto.
Si la muestra es pequeño, se recomienda utilizar en el denominador de la
ecuación de la varianza n-1 en reemplazo de n.
Desviación típica (S)
Es la raíz cuadrada positiva de la varianza
2s s
La desviación típica poblacional suele denotarse por .
Observaciones sobre la desviación típica:
Nos permite determinar con mayor grado de precisión dónde se sitúan los
valores de una distribución de frecuencia en relación con la media.
Las unidades de la desviación típica se expresan en las mismas unidades de los
datos.
Puede sufrir un cambio desproporcionado por la existencia de valores extremos
en el conjunto.
Variables tipificadas
Los distintos conjuntos de datos están asociados por lo general a diferentes
medias, ya sea porque son de naturaleza diferente (escalas de medidas
diferentes). Con el propósito de reducir los datos a un mismo punto de referencia
y a una escala común, se realiza entre ellos una transformación llamada
tipificación.
Se conoce por tipificación de una variable “x” a efectuar el cambio de origen y de
escala de la variable:
x x para muestras
s
x-z para población
z
76 ESTADISTICA
Esta nueva variable (z), carece de unidades de medida y permite comparar dos o
más cantidades que en un principio no son comparables porque aluden a
conceptos diferentes. También es aplicable a casos en que se quieran comparar
individuos semejantes de poblaciones diferentes.
Ejemplo 1: Un estudiante obtuvo 84 puntos en el examen final de matemáticas,
en el que la nota media fue 76, y la desviación típica 10. En el examen final de
física obtuvo 90 puntos, siendo la media 82 y la desviación típica 16. ¿En qué
examen sobresalió más?.
Examen de matemática Examen de física
x = 76
s = 10
x = 84
z = 8,010
7684
x = 82
s = 16
x = 90
z = 5,016
8290
Sobresalió más en matemáticas.
Coeficiente de variación Muestral de Pearson
Las medidas de dispersión anteriores dependen de las unidades de medida, el
coeficiente de variación es, en cambio, una medida de dispersión relativa y
adimensional.
*100%| |
SCV
X
CV es apropiado en poblaciones donde los datos son positivos.
Si 0<CV<15%, los datos provienen de una población homogénea
Si CV>15%, los datos provienen de una población heterogénea.
El coeficiente de variación es útil, en razón de su carácter adimensional, para
comparar muestras con medias desiguales, donde las unidades de medida de las
CLETO DE LA TORRE DUEÑAS 77
observaciones son diferentes. También para decidir cual muestra es más
homogénea o menos variable
Recorrido o rango
Es la diferencia entre el mayor y menor valor de una muestra.
max minR x x
Rango semiintercuartílico y amplitud intercuartil
El rango semiintercuartílico es la mitad de la diferencia entre el tercer y primer
cuartil, Q = (Q3 – Q1)/2.
La amplitud intercuartil es el doble del valor anterior,
2Q = IQR = (Q3 – Q1).
¿Cómo elegir entre las medidas de dispersión?- La medida de dispersión más
útil es la desviación típica. Sólo debes usar el rango cuando dispones de pocas
medidas o cuando todo lo que necesitas conocer es la dispersión general de las
medidas. Utiliza el coeficiente de variación cuando quieras tener una idea de la
variabilidad relativa de dos o más variables cuyas medias son muy diferentes en
magnitud. Esto se ve facilitado por su carácter adimensional, es decir, no depende
de las unidades en que se mida la media
3.6 MEDIDAS DE FORMA
Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda y
Hacen referencia a la forma de la distribución, simétrica, asimetría a la derecha o
a la izquierda. En general la mejor manera de verlo es por la representación
gráfica, pero si no la tenemos existen coeficientes que nos indican la forma de la
distribución. Los más utilizados son:
Coeficiente de asimetría de Pearson,
El coeficiente de asimetría de una variable mide el grado de asimetría de la
distribución de sus datos en torno a su media, es adimensional y se define como
sigue:
78 ESTADISTICA
op
x MA
S
Este coeficiente puede ser:
0pA , entonces la media igual que la moda, distribución simétrica
0pA , entonces la media mayor que la moda, asimetría a la derecha positiva
0pA , entonces la media menor que la moda, asimetría a la izquierda
negativa.
Curtosis
El Coeficiente de Curtosis mide el grado de concentración que presentan los
valores alrededor de la zona central de la distribución.
La curtosis hace referencia al mayor o menor apuntamiento que tiene una
distribución de frecuencias respecto a una distribución Normal, por lo tanto sólo se
estudia en comparación con la campana de Gauss, se determina mediante:
75 25
90 10
0.5P P
KP P
Se definen 3 tipos de distribuciones según su grado de curtosis:
0K , la curva es igual que la normal, se llama Mesocúrtica
0K , la curva es más puntiaguda que la normal se llama Leptocúrtica
0K , la curva es más aplastada que la normal, se llama Platicúrtica
CLETO DE LA TORRE DUEÑAS 79
80 ESTADISTICA
EJERCICIOS DESARROLLADOS
1. La siguiente tabla muestra los coeficientes de inteligencia de 480 niños.
C.I 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126
fi 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2
Calcule:
a) El C.I. medio de los niños.
b) Su desviación típica.
c) Si una madre afirma que exactamente la mitad de los niños del colegio tienen un
C.I. superior al de su hijo, ¿qué C.I. tiene el niño?
d) Supongamos que se quieren hacer estudios sobre el proceso de aprendizaje de
los niños con mayor C.I., pero que el psicólogo solo puede atender al 15% de los
niños del centro. ¿Qué C.I. deberá tener un niño como mínimo para ser
considerado dentro de ese grupo de elegidos?
e) Se van a preparar unas clases de apoyo, para un 25% de los niños del centro,
precisamente para aquellos que tengan menor C.I. ¿Hasta que niños de qué C.I.
deberemos considerar en estas clases?
Solución:
La variable de estudio es el cociente intelectual (X)
xi fi fixi fixi2 Fi Hi
70 4 280 19600 4 0.0083
74 9 666 49284 13 0.0271
78 16 1248 97344 29 0.0604
82 28 2296 188272 57 0.1188
86 45 3870 332820 102 0.2125
90 66 5940 534600 168 0.35
94 85 7990 751060 253 0.5271
98 72 7056 691488 325 0.6771
102 54 5508 561816 379 0.7896
106 38 4028 426968 417 0.8688
110 27 2970 326700 444 0.925
114 18 2052 233928 462 0.9625
CLETO DE LA TORRE DUEÑAS 81
118 11 1298 153164 473 0.9854
122 5 610 74420 478 0.9958
126 2 252 31752 480 1
1470 n=480 46064 4473216
a) Media
1 21 2 ..... 46064
95.96480
kkf x f x f x
xn
b) Varianza y desviación.
2 2
22 21 1 447321695.96 110.88
480
n n
i i i i
i i
x x f f x
S xn n
110.88 10.52s
c) Mediana.
n=480 ( Par)
480 4801 1
240 2412 2 2 2 94 9494
2 2 2 2
n nx x x x
x xMe
d) Percentil 85
85 106P
e) Percentil 25
25 90P
2. Un centro educativo particular requiere los servicios de un Profesor. De los
expedientes presentados, se han seleccionado 2 candidatos: A y B, los cuales
reúnen los requisitos mínimos requeridos. Para decidir cual de los 2 se va a
contratar, los miembros del Jurado deciden tomar 7 pruebas a cada uno de ellos.
Los resultados se dan a continuación:
82 ESTADISTICA
Candidato Prueba
1 2 3 4 5 6 7
A 57 55 54 52 62 55 59
B 80 40 62 72 46 80 40
a) Halle e interprete la media, mediana y moda de los dos candidatos.
b) Estadísticamente ¿Cuál de los candidatos debe ser contratado? Fundamente su
respuesta.
Solución:
XA XB XA2 xB
2
57 80 3249 6400
55 40 3025 1600
54 62 2916 3844
52 72 2704 5184
62 46 3844 2116
55 80 3025 6400
59 40 3481 1600
394 420 22244 27144
a) Estadísticos de A.
1 2 1..... 39456.28
7
n
i
n iA
xx x x
xn n
1
2
A nMe x
, para n impar n=7
1 7 1 4
2 2
55A nMe x x x
55AMo
CLETO DE LA TORRE DUEÑAS 83
Estadísticos de B.
1 2 1..... 42060
7
n
i
n iB
xx x x
xn n
1
2
B nMe x
, para n impar n=7
1 7 1 4
2 2
62B nMe x x x
1 40BMo
2 80BMo
b) Calcular la varianza
2 2
2 2 21 1 22244(56.28) 10.27
7
n n
i i
i iA A
x x x
S xn n
10.27
0.05756.28| |
A
A
SCV
X
2 2
2 2 21 1 2714460 277.7
7
n n
i i
i iB B
x x x
S xn n
277.70.277
60| |B
B
SCV
X
La información se ilustra en el grafico siguiente.
84 ESTADISTICA
Postulante
Pu
nta
je
BA
80
70
60
50
40
Boxplot of Puntaje vs Postulante
3. En un examen de matemáticas los 30 alumnos de una clase han obtenido las
puntuaciones recogidas en la siguiente tabla:
Calificaciones Alumnos
[0, 1> 2
[1, 2> 2
[2, 3> 3
[3, 4> 6
[4, 5> 7
[5, 6> 1
[6, 7> 1
[7, 8> 1
[8, 9> 1
a) Halla la media, varianza, la desviación típica y coeficiente de variación.
b) Mediana
c) Moda.
CLETO DE LA TORRE DUEÑAS 85
Solución:
I fi mi mifi mi2fi Fi
[0, 1> 2 0.5 1 0.5 2
[1, 2> 2 1.5 3 4.5 4
[2, 3> 3 2.5 7.5 18.75 7
[3, 4> 6 3.5 21 73.5 13
[4, 5> 7 4.5 31.5 141.75 20
[5, 6> 1 5.5 5.5 30.25 21
[6, 7> 1 6.5 6.5 42.25 22
[7, 8> 1 7.5 7.5 56.25 23
8, 9 1 8.5 8.5 72.25 24
Total 24 40.5 92 440
a) Media, varianza, desviación y coeficiente de variación.
Media.
923.83
24
i if m
xn
Varianza.
2
2 2 4403.83 3.66
24
i im f
S xn
Desviación.
3.66 1.91s
Coeficiente de Variación.
1.910.498
3.83| |
SCV
X
86 ESTADISTICA
Mediana
12 73 *1 3.833
6Me
Moda
1
1 2
Mo Li A
1 7 6 1
2 7 1 6
14 *1 4.14
1 6Mo
4. En una institución educativa, se ha medido el nivel de depresión que presentan
los adolescentes en una escala de 0- 20, obteniendo los siguientes resultado.
Nivel de
depresión
Nro de
adolescentes.
[ 0-5 > 10
[ 5-10 > 15
[ 10-13 > 25
[13-18 > 8
[ 18-20 2
a) Calcule la media, varianza y la desviación.
b) Determine la mediana y la moda
c) Determine e interprete Q1, Q3, P10 y P90
d) Coeficiente de curtosis y de asimetría.
CLETO DE LA TORRE DUEÑAS 87
Solución:
I fi. Fi mi mifi mi2fi
[ 0-5 > 10 10 2.5 25 62.5
[ 5-10 > 15 25 7.5 112.5 843.75
[ 10-13 > 25 50 11.5 287.5 3306.25
[13-18 > 8 58 15.5 124 1922
[ 18-20 2 60 19 38 722
60 56 587 6856.5
a) Media y varianza
Media.
5879.78
60
i if m
xn
Varianza.
2
2 2 26856.59.78 18.63
60
i im f
S xn
Desviación.
18.63 4.31s
b) Mediana y moda
Mediana
12
k
K
nF
Me Li Af
Determinamos
6030
2 2
n
88 ESTADISTICA
1 30 252 10 3 10.625
k
K
nF
Me Li Af
Moda
1
1 2
Mo Li A
1 25 15 10
2 25 8 17
1
1 2
1010 3 11.11
10 17Mo Li A
c) Determine e interprete Q1, Q3, P10 y P90
Para obtener los cuarteles se tiene la relación.
1
.
4k
i
K
i nF
Q Li Af
Cuartil 1
1
1
1.15 104 5 5 6.67
15
k
K
nF
Q Li Af
El 25% de los adolescentes presentan niveles de depresión menores a 6.67
CLETO DE LA TORRE DUEÑAS 89
Cuartil 3
1
3
3.45 254 10 3 12.4
25
k
K
nF
Q Li Af
El nivel de depresión máximo del 75% de los adolescentes es de 12.4.
Para obtener los percentiles se tiene la relación.
1
.
100k
i
K
i nF
P Li Af
Percentil 10
1
10
10.
6 0100 0 5 310
k
K
nF
P Li Af
El 10% de los adolescentes tienen niveles de depresión entre 0 a 3
Percentil 90
1
90
90.
54 50100 13 5 15.58
k
K
nF
P Li Af
d) Coeficiente de Asimetría.
9.78 11.11-0.308
4.31
ox MAp
s
90 ESTADISTICA
Puesto que Ap < 0 la distribución es asimétrica negativa o a izquierdas
(desplazada hacia la izquierda).
Coeficiente de curtosis de fisher.
3 1
90 10
12.4 6.670.5 0.5 -0.0416
15.5 3
Q QK
P P
Si 0k , entonces la distribución es platicúrtica.
CLETO DE LA TORRE DUEÑAS 91
EJERCICIOS PROPUESTOS.
1. Se desea evaluar el efecto de un programa de intervención educativa en el nivel
de conservación del medio ambiente, para este fin se aplico un instrumento
antes y después de la aplicación del programa, obteniéndose los siguientes
resultados:
Estudiante 1 2 3 4 5 6 7 8 9
Antes 10 13 11 09 13 12 11 14 08
Después 13 18 14 15 13 17 13 16 12
Cuál es su conclusión del estudio.
2. Se realiza un experimento en una I.E, con la finalidad de determinar el efecto de
dos métodos de enseñanza (Tradicional y ABP) en el rendimiento académico.
Tradicional 12 14 04 09 13 16 13 05 15
ABP 14 13 12 15 15 14 16 14 16
Cuál de los métodos presenta mayor confianza. Fundamente su respesta
3. En 20 Unidades de gestión escolar, seleccionados aleatoriamente se contabilizó
el número de libreta de notas, incorrectamente llenadas durante un año escolar,
obteniéndose los siguientes resultados:
3 4 2 3 6 1 4 3 2 6
4 2 4 1 4 3 4 4 4 3
a) Calcule e interprete la media, mediana y moda
b) ¿Que tipo de distribución es?
4. Las puntuaciones de un test de inteligencia de 198 Profesores dieron los
siguientes resultados:
Puntuación [30,40] (40,50] (50,60] (60,70] (70,80] (80,90]
Nº de
personas
6 17 76 68 22 9
a) Calcula la media, la mediana y la moda.
b) Calcule la varianza, desviación y el coeficiente de variación
c) Calcule el coeficiente de curtosis y de asimetría.
92 ESTADISTICA
5. El Director de un centro educativo esta interesado en firmar un contrato de larga
duración para el aprovisionamiento de suministros. El encargado de realizar la
operación desea llevarla a cabo con la empresa que menos se retrase en
proporcionar dichos suministros por termino medio. Tras un periodo de prueba
con dos compañías, se han obtenido los siguientes datos referidos a retrasos en
suministros, medidos en hora
Empresa 1 Empresa 2
110 15 147 93 104 95 108 80 41 3 325 19 93 115 23
Asumiendo que el periodo de prueba es representativo del futuro desempeño de
la actividad ¿por que empresa debería decidirse?
6. Se mide la altura en metros de 110 estudiantes, obteniendo la siguiente tabla:
Altura Nº de jóvenes
[1,55-1,60) 18
[1,60-1,70) 31
[1,70-1,80) 24
[1,80-1,90) 20
[1,90-2,00) 17
a) Construye la tabla de frecuencias.
b) Calcule Q1, D7 y P40 , e interprete dichos valores.
c) Se consideran “bajos” aquellos alumnos cuya estatura está sobre el percentil
30. ¿Cuál es la altura máxima que pueden alcanzar?
d) Se consideran “altos” aquellos alumnos cuya altura está sobre el percentil 82.
¿Cuál será su altura mínima?
e) ¿En qué percentil está un joven cuya altura es 1,78 m.?
7. Se registra el tiempo en minutos que utilizan 30 alumnos para ejecutar una tarea,
resultando los siguientes:
CLETO DE LA TORRE DUEÑAS 93
19,15,26,17,11,23,26,22,18,20,11,18,23,25,20,16,9,22,12,23,13,18,12,13,15,20,
21,15,18,22
a) Construir una distribución de frecuencias de 5 intervalos, de amplitud constante.
b) Calcule el tiempo debajo del cual se encuentran el 25% de las tareas.
8. En un examen final de estadística, la puntuación media de un grupo de 150
estudiantes fue de 78 y la desviación típica fue de 8 puntos. En álgebra, sin
embargo, la media final del grupo fue de 73 y la desviación típica 7,6. ¿En qué
asignatura hubo mayor dispersión absoluta y en cuál mayor dispersión relativa?
9. En un estudio se anotó el número de palabras leídas en 15 segundos por un
grupo de 120 sujetos que habían recibido previamente un adiestramiento y 120
individuos que no habían recibido dicha instrucción. Los resultados fueron los
siguientes:
Número de palabras leídas No instruidos Instruidos
25 56 1
26 24 9
27 16 21
28 12 29
29 10 28
30 2 32
Compare la variabilidad en ambos grupos.
10. En un examen final de microeconomía, la puntuación media de 150 estudiantes
fue 12,8 puntos y la desviación típica 2,3 puntos. En estadística el promedio fue
10,2 puntos y la desviación típica 1,6 puntos.
a) En qué materia hay mayor dispersión relativa?
b) ¿En qué materia destaca más un alumno que obtuvo 14 puntos en ambas?
11. La siguiente tabla representa los resultados en la prueba de aptitud académica
de un grupo de 1000 jóvenes que aspiran ingresar a cierta universidad:
94 ESTADISTICA
Calificación 300-350) 350-400) 400-450) 450-500) 500-550) 550-600)
%Hi 6 28 45 63 95 100
Hallar:
a) Porcentaje de aspirantes cuya calificación es superior a 420 puntos pero inferior
a 510
b) N° de estudiantes que obtuvieron 500 puntos o más
c) La mayor nota del 30% que obtuvo la nota más baja
d) Porcentaje que obtuvo más de 480 puntos
e) Coeficiente de asimetría de Pearson e interprete
f) La curtosis e interprete.
12. Un Especialista de educación desea comparar el rendimiento académico
generado por dos métodos de enseñanza, A y B. El especialista piensa que el
método de enseñanza A presenta mayor eficiencia que el método B. Para
comprobar esta sospecha se toma una muestra aleatorias de 10 alumnos que
utilizaron el método de enseñanza A y de 10 con el método B, obteniéndose los
siguientes rendimientos en una escala vigesimal :
Método A 14 15 13 11 10 17 18 16 15 05
Método B 12 13 13 14 13 14 14 12 15 14
a) Estadísticamente. Cuál de los métodos es más recomendable para el
especialista que está interesado en:
Mayor rendimiento Académico.
Mayor nivel de confianza. Fundamente su respuesta.
b) Cuál es su conclusión respecto de la afirmación del especialista.
13. Se han tabulado el nivel de gestión de los directores de las instituciones
educativas, obteniendo los siguientes resultados.
Nivel de gestión 0-20 20-40 40-60 60-80 80-100
Frecuencia 6 12 14 9 3
Con la finalidad de una capacitación de los directores, el ministerio de
educación agrupara los directores según sus niveles de gestión en tres
categorías: El 25% de los directores con menores niveles de gestión en la
CLETO DE LA TORRE DUEÑAS 95
categoría A, el 30% de los que presentan mayores niveles de gestión en la
categoría C y el resto en la categoría B. Cuáles son los limites para cada
categoría.
14. En cierta evaluación para optar por una beca, Juan Perez obtuvo una calificación
de 310 puntos en habilidad verbal y 218 puntos en habilidad numérica. Los
parámetros de c/u son:
Habilidad verbal: 900s 245x 2
Habilidad numérica: 24s 150x
a. ¿En cuál de las dos pruebas obtuvo mejor calificación?
b. ¿En cuál de las dos pruebas el grupo es más homogéneo?
15. Una gran compañía llevó a cabo un estudio para ubicar las variables que
pudieran determinar el sueldo de un egresado universitario dos años después de
haberse graduado en un área Administrativa. Los datos recogidos se presentan
en la siguiente tabla:
(La columna del sueldo es en cientos de miles de soles.)
Edad Sexo E. Civil Sueldo
1 24 F C 6,75
2 25 M C 6,90
3 26 M S 6,90
4 27 F C 6,80
5 27 M D 7,10
6 27 F C 6,50
7 27 M S 7,25
8 25 F C 6,80
9 23 M S 6,75
10 24 M S 6,80
11 26 F C 6,75
12 29 F D 7,00
13 25 M C 7,15
14 31 F D 7,50
96 ESTADISTICA
15 26 M S 6,20
16 24 F D 7,40
17 26 F C 6,70
18 28 F S 6,95
19 25 M C 6,95
20 29 M C 7,10
a) Utilice la técnica de estadística descriptiva más apropiada para analizar cada
variable individualmente. Interprete lo obtenido.
b) Realice diagramas de cajas que le ayuden a visualizar como influye cada una
de las variables en el sueldo que gana el individuo.
CLETO DE LA TORRE DUEÑAS 97
CAPITULO IV
DISTRIBUCIONES BIDIMENSIONALES
Si resumir la información de una variable es de por si interesante, en investigación lo es
mucho más el poner de manifiesto la posible relación entre dos de ellas.
El análisis de la relación de dos variables, X e Y, depende del tipo de variables y Según
sean los tipos de cada una de ellas se usa técnicas estadísticas diferentes.
4.1 CUALITATIVA-CUALITATIVA.
Cuando las variables de estudio son cualitativas (categóricas) o cuantitativas
discretas con poca modalidades, se suele presentar las observaciones de las
variables X e Y, mediante pares ordenados (xi, yi), esta forma de presentaciones
se denomina tablas de contingencia. Las tablas de contingencia son de doble
entrada organizada por filas y columnas y donde se presenta la distribución de
frecuencias conjuntas de las dos variables.
Dada una variable bidimensional ( X, Y ), consideramos una muestra de tamaño n
en la que X toma k valores distintos, x1, . . . , xk, e Y toma l valores distintos, y1, . . ,
yl, obtenemos, por tanto, observaciones del tipo (xi, yj).
La frecuencia absoluta de un valor (xi, yj) es el número de veces que dicho valor
aparece en la muestra. Se representa por fij , se cumple
1 1
k l
ij
i j
f n
98 ESTADISTICA
La frecuencia relativa de un valor (xi , yj) es el cociente de la frecuencia absoluta fij
entre el tamaño de la muestra n, se representa por hij
ij
ij
fh
n , se cumple: 1 1
1k l
ij
i j
h
Distribuciones marginales
Nos indican el comportamiento aislado de cada una de las variables X e Y que dan
lugar a una variable bidimensional.
Frecuencia absoluta marginal de xi,
. 1 2
1
i i i il
l
ij
j
f f f f f
Frecuencia relativa marginal de xi,
..
ii
fh
n
Frecuencia absoluta marginal de yj,
1 2.
1
j j kj
k
ijj
i
f f f f f
Frecuencia relativa marginal de yj,
..
jj
fh
n
Una tabla de doble entrada de una variable bidimensional sigue la estructura que
se presenta a continuación, en la que tienen cabida las frecuencias marginales
(representadas en la última fila y última columna). Puede ser de frecuencias
absolutas o relativas.
CLETO DE LA TORRE DUEÑAS 99
X
Y
y1 y2 . . . . . yl ni.
x1 f11 f12 . . . . . f1l f1.
x2 F21 f22 . . . . . f2l f2.
. . . . . . . . . . . . . . .
xk fk1 fk2 . . . . . fkl fk.
n.j f.1 f.2 . . . . . f.l n
Ejemplo 1:
En una encuesta aplicada a los profesores egresados de una Universidad respecto a
la comprensión lectora y hábitos de estudio se obtuvo los siguientes resultados.
Habito de estudio
Comprensión lectora
Deficitario Dependiente Independiente
Bajo 12 3 0
Intermedio. 1 13 0
Alto. 3 3 5
Interprete la información.
Solución.
12 3 0 15
80.0% 20.0% .0% 100%
1 13 0 14
7.1% 92.9% .0% 100%
3 3 5 11
27.3% 27.3% 45.5% 100%
16 19 5 40
40.0% 47.5% 12.5% 100%
Frecuencia
Porcentaje
Frecuencia
Porcentaje
Frecuencia
Porcentaje
Frecuencia
Porcentaje
Habitos de
Estudio
Bajo
Intermedio
Alto
Total
Deficitario Dependiente Independiente
Compresión Lectora
Total
Chi-cuadrado=32,805 P-valor=0,000
100 ESTADISTICA
Del 100% de estudiantes con el hábito de estudio bajo, 80% de estos presentan un
deficitario nivel de comprensión lectora, en cambio del 100% de estudiantes con un
hábito de estudio intermedio, 92.9% de ellos presenta una comprensión lectora
dependiente y del 100% de estudiantes con un habito de estudio alto, el 45.5%
presenta una comprensión lectora independiente.
La información se muestra en el siguiente grafico:
Comprension lectora
0
10
20
30
40
50
60
70
80
90
100
Bajo Intermedio Alto
Habitos de estudio
Po
rcen
taje
Deficitario
Dependiente
Independiente
4.2 CUALITATIVA-CUANTITATIVA.
Supongamos que tenemos datos cuantitativos (numéricos) para varias
cualitativas (categorías), por ejemplo en un experimento donde hacemos
mediciones numéricas en dos o más grupos. En estos casos, lo que se realiza es
un estudio descriptivo de la variable numérica en cada una de las muestras y se
comparamos los resultados.
Ejemplo 2:
Un investigador esta analizando el efecto que tiene en el rendimiento académico
el uso de tres métodos de enseñanza, para tal efecto solicito a 30 docentes para
que participen en el estudio. En el cuadro siguiente se muestra el rendimiento
promedio de los alumnos de cada Docente.
CLETO DE LA TORRE DUEÑAS 101
Método de enseñanza
Clásico
Nuevo
Enfoque Ambos
8 15 13
9 16 12
10 13 17
13 16 9
14 17 10
5 16 11
12 14 13
11 13 8
9 16 9
7 17 10
a) Calcule el rendimiento promedio para cada método de enseñanza.
b) Cual de los métodos, genera rendimientos más homogéneos.
c) Represente la información mediante un grafico.
SOLUCION:
Método Mean S Variance CV Median Kurtosis
Ambos 11.200 2.658 7.067 23.74 10.500 1.38
Clásico 9.800 2.781 7.733 28.38 9.500 -0.53
Nuevo enfoque 15.300 1.494 2.233 9.77 16.000 -0.99
102 ESTADISTICA
Metodo
Re
nd
imie
nto
Nuevo enfoqueClasicoAmbos
17.5
15.0
12.5
10.0
7.5
5.0
Boxplot of Rendimiento vs Metodo
4.3 CUANTITATIVA-CUANTITATIVA.
Análisis de dos variables cuantitativas y establecimiento de una relación entre
ellas. La forma más sencilla de estudiar la posible asociación entre estas variables
es el diagrama de dispersión (Nube de puntos). Si reconocemos una tendencia,
entonces el interés ahora será el análisis de regresión.
Media y varianza
La información de las dos variables X e Y se puede resumir usando la media y la
varianza como se muestra a continuación:
Media de la variable X:
i if xx
n
Media de la variable Y:
i if yy
n
Varianza de la variable X:
CLETO DE LA TORRE DUEÑAS 103
22
2 i i
x
f xs x
n
Varianza de la variable Y:
22
2 i i
y
f ys y
n
La covarianza
Es una medida de la asociación lineal existente entre dos variables. Resume la
información contenida en el diagrama de dispersión. Presenta la siguiente
expresión:
cov( , ) .i i i
xy
f x yx y s x y
n
Si la covarianza está muy próxima a cero, no existe relación entre las variables o
si existe es marcadamente no lineal, si es positiva, hay asociación lineal positiva, y
si es negativa, hay asociación lineal negativa. Sin embargo, como la covarianza
depende de las unidades de medida de las variables, no nos permite cuantificar el
grado de asociación lineal ni comparar la asociación existente entre distintos
pares de variables. Para dar solución a este problema se obtiene el coeficiente de
correlación.
Correlación.
Estudia la relación o dependencia que existe entre dos variables que intervienen
en una distribución bidimensional.
Coeficiente de correlación lineal.
Es un número que mide el grado de dependencia entre las variables X e Y.
Se mide mediante la siguiente fórmula:
104 ESTADISTICA
yx
xy
ss
sr
.
Su valor está comprendido entre – 1 y 1.
Si r = -1 ó r = 1 todos los valores de la variable bidimensional se encuentran
situados sobre una recta.
Si – 1< r < 0 se dice que las variables X e Y están también en dependencia
aleatoria. La correlación es negativa.
Si 0 < r < 1 la correlación es positiva. Las variables X e Y están también en
dependencia aleatoria.
La correlación es tanto más fuerte a medida que r se aproxima a –1 ó 1 y es tanto
más débil a medida que se aproxima a 0.
4.3.1 Análisis de Regresión.
Regresión: conjunto de técnicas que son usadas para establecer una relación
entre una variable cuantitativa llamada variable dependiente y una o más
variables independientes, llamadas predictoras. Estas también deberían ser
cuantitativas, sin embargo algunas de ellas podrían ser cualitativas.
Modelo de regresión. Ecuación que representa la relación entre las variables
Y X
Estimación de la línea de regresión usando Mínimos Cuadrados
Minimizando el error cuadrático medio:
2 2
1 1
, ( )n n
i i i
i i
Q e y x , se tiene:
1 1 1
2 2
1 1
ˆ
( )
n n n
i i i ixyi i i
n n
xxi i
i i
n x y x yS
Sn x x
CLETO DE LA TORRE DUEÑAS 105
ˆˆ y x
La pendienteˆ
, indica el cambio promedio en la variable de respuesta cuando
la variable predictora aumenta en una unidad adicional.
El intercepto ˆ , indica el valor promedio de la variable de respuesta cuando la
variable predictora vale 0. Sin embargo carece de interpretación práctica si es
irrazonable pensar que el rango de valores de x incluye a cero.
A partir de la recta ˆˆ ˆY X podemos calcular los valores de y conocidos
los de x. La fiabilidad que podemos conceder a los cálculos obtenidos viene dada
por el coeficiente de correlación: si r es muy pequeño no tiene sentido realizar
ningún tipo de estimaciones.
Si r es próximo a – 1 ó 1, las estimaciones realizadas estarán cerca de los valores
reales.
Si r = 1 o r = -1, las estimaciones realizadas coincidirán con los valores reales.
Ejemplo 3:
Se aplicó un test para medir el conocimiento (X) y la aplicación (Y) de
estratégicas cognitivas en el proceso de enseñanza en una escala de 0- 120. Los
datos que se obtuvo fueron los siguientes:
106 ESTADISTICA
X Y
51.3 102.5
49.9 104.5
50 100.4
49.2 95.9
48.5 87
47.8 95
47.3 88.6
45.1 89.2
46.3 78.9
42.1 84.6
44.2 81.7
43.5 72.2
42.3 65.1
40.2 68.1
31.8 67.3
34 52.5
a) Trace un diagrama de dispersión.
b) Ajuste una recta de regresión.
c) Calcule la correlación lineal e interprete dicho valor.
Solución:
X
Y
5045403530
110
100
90
80
70
60
50
CLETO DE LA TORRE DUEÑAS 107
X Y X.Y X2 Y2
51.3 102.5 5258.25 2631.69 10506.25
49.9 104.5 5214.55 2490.01 10920.25
50 100.4 5020 2500 10080.16
49.2 95.9 4718.28 2420.64 9196.81
48.5 87 4219.5 2352.25 7569
47.8 95 4541 2284.84 9025
47.3 88.6 4190.78 2237.29 7849.96
45.1 89.2 4022.92 2034.01 7956.64
46.3 78.9 3653.07 2143.69 6225.21
42.1 84.6 3561.66 1772.41 7157.16
44.2 81.7 3611.14 1953.64 6674.89
43.5 72.2 3140.7 1892.25 5212.84
42.3 65.1 2753.73 1789.29 4238.01
40.2 68.1 2737.62 1616.04 4637.61
31.8 67.3 2140.14 1011.24 4529.29
34 52.5 1785 1156 2756.25
713.5 1333.5 60568.34 32285.29 114535.33
713.544.59375
16
ixx
n;
1333.583.34375
16
iyy
n;
22
2 232285.2944.59375 29.228
16
i
x
xs x
n
22
2 2114535.3383.34375 212.277
16
i
y
ys y
n;
60568.34. (44.59375).(83.34375) 68.9
16
i i
xy
x ys x y
n
108 ESTADISTICA
Recta de regresión
1 1 1
22 2
1 1
68.9ˆ 2.35729.228
( )
n n n
i i i ixyi i i
n n
xi i
i i
n x y x yS
Sn x x
ˆˆ 83.34375 2.357(44.59375) 21.76y x
ˆˆ ˆ 21.76 2.357Y X X
68.90.8747
. 29.228. 212.277
xy
x y
sr
s s
Ejemplo 4:
Las calificaciones de 40 alumnos en psicología evolutiva y en estadística han sido las
siguientes:
X
calif. en psicol.
Y
calif. en estad.
Número
de alumnos.
3
4
5
6
6
7
7
8
10
2
5
5
6
7
6
7
9
10
4
6
12
4
5
4
2
1
2
a) Determina la media y varianza de X e Y.
b) Calcule la covarianza de X e Y
c) Calcule e interprete el coeficiente de correlaciones.
CLETO DE LA TORRE DUEÑAS 109
Solución:
Disponemos los datos de la siguiente forma:
xi yi ni nixi niyi nixi2 niyi
2 nixiyi
3
4
5
6
6
7
7
8
10
2
5
5
6
7
6
7
9
10
4
6
12
4
5
4
2
1
2
12
24
60
24
30
28
14
8
20
8
30
60
24
35
24
14
9
20
36
96
300
144
180
196
98
64
200
16
150
300
144
245
144
98
81
200
24
120
300
144
210
168
98
72
200
40 220 224 1314 1378 1336
5,540
220
N
xnx
ii; 6,5
40
224
N
yny
ii
6,225,3085,32)6,5(40
1314 222
2 xN
xns
ii
x
61,16,22
xx ss
09,3)6,5(40
1378 222
2 yN
yns
ii
y ;
75,109,3ys
6,28,304,33)6,5).(3,5(40
1336.yx
N
yxns
iii
xy
El coeficiente de correlación: yx
xy
ss
sr
.
92,0)75,1).(61,1(
6,2r
La correlación es positiva, es decir, a medida que aumenta la nota de estadística
aumenta también la nota en psicología. Su valor está próximo a 1 lo que indica que se
trata de una correlación fuerte, las estimaciones realizadas están cerca de los valores
reales.
110 ESTADISTICA
EJERCICIOS PROPUESTOS.
1. De la evaluación censal, desarrollado a los docentes de la ciudad de Cusco, se
registro la información del conocimiento y aplicación de metodologías de
enseñanzas de 10 Docentes.
Docentes Conocimiento Aplicación.
1
2
3
4
5
6
7
8
9
10
16
14
18
15
13,5
17
15
10
15
14
16,5
14,5
17
15
14
18
17
10
16
15
a) Calcula la covarianza, las varianzas y el coeficiente de correlación.
b) ¿Existe correlación entre las dos variables?
c) Calcula la recta de regresión. ¿Interprete adecuadamente los resultados?
2. En una encuesta realizada a los alumnos de los centros educativos de la ciudad de
Cusco, respecto al conocimiento de los docentes de las materias que regenta,
proporciona la siguiente información:
Recuento
5 12 7 24
84 16 1 101
30 10 10 50
17 19 32 68
70 138 35 243
Comunicacion
Matematica
Biologia
Educacion fisica
Area
Total
Regular Bien Muy Bien
El profesor de la asignatura conoce
el curso
Total
CLETO DE LA TORRE DUEÑAS 111
a) Analice la información de forma adecuada
b) Interprete los resultados obtenidos y redacte algunas conclusiones.
3. Un especialista en Educación, desea analizar si la metodología de los Docentes
esta relacionado con su preparación académica, para tal efecto aplica un test, los
resultados se muestran a continuación.
Preparación
Académica Metodología
50 50
75 66
50 75
75 25
50 66
58 58
66 66
83 41
83 83
66 41
50 75
75 75
75 41
75 66
75 66
a) Trace el diagrama de dispersión ¿Que tipo de relación se observa?
b) Ajuste una recta de regresión
c) Calcula el coeficiente de correlación. ¿Interprete adecuadamente dicho
resultado?
4. La siguiente tabla muestra las distribuciones de frecuencias de las puntuaciones
finales de 100 estudiantes en matemáticas y física:
112 ESTADISTICA
Física Matemáticas
40-49 50-59 60-69 70-79 80-89 90-99
90-99 2 4 4
80-89 1 4 6 5
70-79 5 10 8 1
60-69 1 4 9 5 2
50-59 3 6 6 2
40-49 3 5 4
a) Número de alumnos que recibieron puntuación entre 70 y 79 en matemáticas y
entre 80 y 89 en física.
b) Porcentaje de estudiantes con puntuación en matemáticas inferior a 70.
c) Porcentaje de que un estudiante obtenga 70 ó más puntos en física y menos
de 80 en matemáticas.
d) Porcentaje de estudiantes que aprobó al menos una de las dos asignaturas,
suponiendo 60 la puntuación mínima para aprobar.
e) Porcentaje de que un estudiante tenga aprobadas las dos asignaturas.
f) Porcentaje de que un estudiante, que sabemos que tiene aprobada las
matemáticas, tenga aprobada también física.
g) Porcentaje de estudiantes que tienen aprobada matemáticas de entre los que
tienen aprobada física.
h) Sobre qué puntuación en física tendrá un estudiante del que sabemos que ha
obtenido 86 puntos en matemáticas.
i) Da una medida de la exactitud del resultado obtenido en h).
5. Se ha recogidos datos sobre la puntuaciones que en una encuesta dieron los
alumnos de cuatro grupos a un profesor. La información se muestra en el
cuadro siguiente:
CLETO DE LA TORRE DUEÑAS 113
NOTA GRUPO
A B C D
2 20 0 10 30
4 30 30 20 30
6 30 40 40 20
8 10 20 10 20
10 10 10 20 0
a) En que grupo tuvo el profesor mejor calificación media.
b) En cual de los grupos hubo menos divergencia de opiniones.
c) Interprete adecuadamente la tabla.
6. La tabla siguiente muestra el CI (coeficiente intelectual) de un grupo de personas
y su capacidad lectora (HL).
CI HL
109 31,8
138 24,5
86 11,8
153 18,8
156 17,3
40 11,0
70 12,2
126 20,6
68 10,8
99 5,3
112 29,3
138 8,0
103 35,8
127 19,6
63 21,4
a) Trace una diagrama de dispersión
b) Ajuste los datos a una recta de regresión.
c) Predecir la capacidad lectora de una persona con cociente intelectual de 120
d) Calcule la correlación entre ambas variables. interprete dicho valor.
114 ESTADISTICA
CAPITULO V
PROBABILIDADES
El Cálculo de Probabilidades se ocupa de estudiar ciertos experimentos que se
denominan aleatorios, cuya característica fundamental es la incertidumbre del
resultado, esto significa que es imposible predecir los resultados porque hay más de
uno posible.
En nuestra vida cotidiana asociamos usualmente el concepto de probabilidad a su
calificativo probable, considerando probable a aquellos eventos en los que tenemos
alto grado de creencia en su ocurrencia. En esta línea probabilidad es un concepto
asociado a una medida del azar.
El objetivo de la probabilidad es cuantificar las posibilidades que tengan ciertos eventos
inciertos.
5.1 EXPERIMENTO ALEATORIO.
Es una acción que da lugar a resultados identificables y se caracteriza por:
Todos los posibles resultados son conocidos previamente.
Repeticiones en situaciones análogas pueden dar resultados diferentes.
No se puede predecir el resultado del mismo antes de realizarlo, es decir, no se
sabe cuál de los posibles resultados aparecerá al final.
Los experimentos pueden ser aleatorios o deterministas. Aleatorio significa
relativo a todo acontecimiento incierto, por depender de la suerte o del azar,
mientras que los deterministas son aquellos que se caracterizan por el hecho de
que las mismas causas producen los mismos efectos.
CLETO DE LA TORRE DUEÑAS 115
Espacio muestral.
Es el conjunto de todos los resultados posibles del experimento y se denota por
. A cada elemento de se denomina punto muestral w , es decir:
/ es un punto muestralw w .
Evento o Suceso Aleatorio.
Un evento aleatorio es un subconjunto del espacio muestral y se denota con
letras mayúsculas.
El evento seguro , es aquel que ocurre siempre al realizar el experimento.
El evento imposible , es aquel que no ocurre nunca.
Los eventos elementales solo tienen un punto muestral.
El evento complementario cA , esta dado por todo los puntos muestrales que
no están en A
5.2 OPERACIONES DE EVENTOS.
Unión de eventos: Dados dos eventos A y B de un mismo espacio muestral su
unión se representa por A B y es el evento que contiene los elementos que
están en A o en B o en ambos. El evento A B ocurre si al menos uno de los
dos eventos ocurre.
Intersección de eventos: Dados dos eventos A y B de un mismo espacio
muestral su intersección se representa por A B y es el evento que contiene
los elementos que están en A y B al mismo tiempo.
El evento A B ocurre cuando ambos eventos ocurren simultáneamente.
Evento Complemento: El complemento de un evento A se representa por cA y
es el evento que contiene todos los elementos que no están en A. El evento cA
ocurre si A no ocurre.
116 ESTADISTICA
5.3 DEFINICIÓN CLÁSICA DE PROBABILIDAD:
La probabilidad de un suceso A se calcula como el número de casos favorables
al suceso A, dividido por el número de casos posibles del experimento aleatorio.
( )casos favorables
P Acasos posibles
5.4 DEFINICIÓN AXIOMÁTICA DE PROBABILIDAD.
La probabilidad es una función que asigna a cada suceso A un número real
que varia entre 0 a 1.
P : y que verifica:
A P(A)
i) 0 ( ) 1P A A
ii) 1P
iii) Si A y B son sucesos incompatibles,
P A B P A P B
Como consecuencia de estos tres axiomas, se verifican además las siguientes
propiedades:
iv) ( ) 1cP A P A
v) ( ) 0P
vi) Si A B , ( ) ( )P A P B
vii) )()()\( BAPAPBAP , A,B
viii) Si A1, A2, ...... , An son incompatibles dos a dos, entonces
1 2 1 2... ...n nP A A A P A P A P A
ix) Si A, B son dos sucesos cualesquiera, entonces
P A B P A P B P A B
x) Si A, B son dos sucesos cualesquiera, entonces
CLETO DE LA TORRE DUEÑAS 117
( ) cP A P A B P A B
5.5 PROBABILIDAD CONDICIONADA.
Queremos estudiar como cambia la probabilidad de ocurrencia de A cuando se
conoce que otro evento B ha ocurrido. En este caso habrá que redefinir el espacio
muestral considerando solamente los elementos de B como posibles resultados.
La probabilidad de A condicionada a B, esta definido como la probabilidad de
que ocurra A sabiendo que ha ocurrido B, y se define mediante:
)(
)()|(
BP
BAPBAP , P(B) 0.
En consecuencia,
P(A B) = ( ) ( )BP A PA
Independencia.
Dos sucesos A, B se dicen independientes si:
( ) ( | )P A P A B , o bien ( ) ( | )P B P B A
Es decir, se cumplirá que:
( ) ( ). ( )P A B P B P A
Si A y B son independientes, entonces A y BC son independientes, AC y B son
independientes, y AC y BC son independientes.
Observación.
Decimos que n sucesos 1 2, , nA A A son independientes si para cada par
(Ai, Aj), )()()( jiji APAPAAP si ji , si para cada trío (Ai, Aj, Ak)
)()()()( kjikji APAPAPAAAP
Si kji y así sucesivamente. En general,
118 ESTADISTICA
)()()()( 2121 nn APAPAPAAAP
Teorema de la probabilidad compuesta.
Dados n sucesos A1, A2, ......., An se verifica:
)|()|()|()()( 12121312121 nnn AAAAPAAAPAAPAPAAAP
5.6 TEOREMA DE LA PROBABILIDAD TOTAL
Si suponemos que los eventos A1, A2, A3, ...., An, forman una partición de un
espacio muestral ; esto es, que los eventos Ai son mutuamente excluyentes y
su unión es .
La partición A1, A2, ......, An , cumple con las siguientes propiedades:
i) 1 2A A i j ( disjuntos dos a dos)
ii) 1
n
ii
A
iii) ( ) 0iP A , ni ,....1 .
La probabilidad de un suceso B cualquiera es:
1 21 2
( ) ( ) ( ) ( ) ( ) ....... ( ) ( )nn
B B BP B P A P P A P P A PA A A
A1 A2 A3 …… An
E
A1 A2 A3 …… An
E
CLETO DE LA TORRE DUEÑAS 119
1
( ) ( ) ( | )n
i i
i
P B P A P B A
5.7 TEOREMA DE BAYES
El procedimiento que se utiliza para encontrar probabilidades posteriores, a partir
de probabilidades previas, se llama regla Bayesiana. Las probabilidades a priori o
previas se conocen antes de obtener información alguna del experimento en
cuestión. Las probabilidades a posteriori se determinan después de conocer los
resultados del experimento.
El teorema de Bayes consiste en un método para encontrar la probabilidad de una
causa específica cuando se observa un efecto particular. Esto es, si el evento B
ha ocurrido, ¿Cuál es la probabilidad de que fue generado por el evento A1 (que
es una causa posible ) o por el A2 (otra causa posible)?.
Si A1, A2, ......., An es una partición del espacio muestral tal que ( ) 0ip A ,
ni ,....1 , entonces para un suceso B cualquiera se verifica:
1
( ) ( ) ( | )( | )
( ) ( ) ( | )
i i ii
ni i
i
P A B P A P B AP A B
P B P A P B A, i = 1, ...., n.
1 21 2
( ) ( | )( | )
( ) ( ) ( ) ( ) ....... ( ) ( )
i ii
nn
P A P B AP A B
B B BP A P P A P P A PA A A
120 ESTADISTICA
EJERCICIOS DESARROLLADOS.
1) Un director de una institución educativa mixta, tiene 3 vacantes para el quinto
año de secundaria.
a) Cual es el espacio muestral.
b) Si el interés del director es matricular, exactamente dos estudiantes de sexo
masculino ¿Cual es la probabilidad asociado a este evento?
c) Cual es la probabilidad de que el primer estudiante aceptado sea de sexo
masculino y el último de sexo femenino.
d) Cual es la probabilidad de admitir por lo menos un estudiante de sexo
masculino
e) Cual es la probabilidad de admitir a lo más 1 estudiantes de sexo femenino.
Solución.
a) 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3, , , , , , ,M M F M M M M F F M F M FM M FM F FF M FF F
b) Sea el evento A: Estudiantes de sexo masculino
1 2 3 1 2 3 1 2 3, ,A M M F M F M FM M
( ) 3( )
( ) 8
n Ap A
n
c) Sea el evento B: Primer estudiante aceptado de sexo masculino y el último de
sexo femenino.
1 2 3 1 2 3,C M M F M F F
( ) 2( )
( ) 8
n Cp C
n
d) Sea el evento D: Se admite por lo menos un estudiante de sexo masculino.
1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3, , , , , ,D M M F M M M M F F M F M FM M FM F FF M
( ) 7( )
( ) 8
n Dp D
n
e) Sea el evento E: Se admite a lo más un estudiante de sexo femenino.
1 2 3 1 2 3 1 2 3 1 2 3, , ,E M M F M M M M F M FM M
( ) 4 1( )
( ) 8 2
n Ep E
n
CLETO DE LA TORRE DUEÑAS 121
2) La biblioteca municipal de una provincia compra libros de 3 editoriales: el 45%
de los libros son compradas del editorial A resultando defectuoso el 1%, la
editorial B suministra el 30% de los libros y de ellas es defectuoso el 2%. Las
restantes son adquiridas de la editorial C, siendo defectuoso el 3% de las
mismas. En un control de recepción de libros se selecciona un libro al azar cual
es la probabilidad:
a) De que sea defectuosa.
b) De que sea defectuosa y haya sido adquirido de la editorial B
c) Calcular la probabilidad de que el libro haya sido adquirido de la editorial C, dado
que es defectuoso.
Solución
Sean los eventos.
A: Libro adquirido de la editorial A, B: Libro adquirido de la editorial B.
C: Libro adquirido de la editorial C, D: Libro defectuoso, E: libro Bueno.
a) ( ) ( ) ( ) ( ) ( ) ( ) ( )D D Dp D p A p p B p p C pA B C
( ) 0.4*(0.01) 0.3*(0.02) 0.3*(0.03)p D
b) p(B D) = ( ) ( )Dp B pB
p(B D) =0.3*(0.02)
Libro
A
B
C
Defectuoso
Defectuoso
Defectuoso
Bueno
Bueno
Bueno
40%
30%
30%
1%
2%
3%
99%
98%
97%
122 ESTADISTICA
c) ( ) ( ) ( | )
( | )( ) ( ) ( | ) ( ) ( | ) ( ) ( | )
p C D p C p D Cp C D
p B p A p D A p B p D B p C p D C
0.3*(0.03)( | )
0.4*(0.01) 0.3*(0.02) 0.3*(0.03)p C D
3) En un estante hay 7 libros de historia y 3 de matemáticas. De los libros de historia,
tres están empastados de amarillo y el resto de rojo; mientras que de los libros de
matemáticas, uno está empastado en amarillo y dos en rojo. Suponiendo que del
estante se elige un libro al azar, ¿cuál es la probabilidad de que sea de :
a) Historia
b) Color amarillo.
c) matemáticas y de color rojo
d) matemáticas o de color rojo
d) Historia, dado que es de color amarillo.
Solución.
Historia Matemática Total
Amarillo 3 1 4
Rojo 4 2 6
Total 7 3 10
Sean los eventos:
A: Libro de matemáticas. B: Libro de historia. C: Color amarillo, D: Color rojo.
a) ( ) 7
( ) 0.7( ) 10
n Bp B
n
b) ( ) 6
( ) 0.6( ) 10
n Cp C
n
c) ( ) 2
( ) 0.4( ) 10
n A Dp A D
n
CLETO DE LA TORRE DUEÑAS 123
d) ( ) ( ) ( )
( ) ( ) ( ) ( )( ) ( ) ( )
n A n D n A Dp A D p A p D p A D
n n n
3 6 2 7( ) 0.7
10 10 10 10p A D
e)
( )
( ) ( ) 4( )( | )
( )( ) ( ) 7
( )
n B C
P B C n B CnP B C
n CP C n C
n
4) En una ciudad se publican los periódicos A, B y C. Una encuesta reciente de
lectores indica lo siguiente: 20% lee A, 16% lee B, 14% lee C, 8% lee A y B, 5% lee
A y C, 2% lee A, B y C, y 4% lee B y C. Para un adulto escogido al azar, calcular la
probabilidad de que:
a) No lea ninguno de los periódicos.
b) Lea exactamente uno de los periódicos.
c) Lea A y B.
Solución.
Sean los eventos
A: Lee el periódico A.
B: Lee el periódico B.
C: Lee el periódico C.
a) ( )c
p A B C p U p A B C
100% (9 6 6 3 2 2 7)% 75%c
p A B C
B
A
C
2% 3%
6%
2%
7%
6%
9%
124 ESTADISTICA
b) (Lea exactamente un periódico)=9%+6%+7%=22%p
c) 6%p A B
5) En una Universidad, se conoce a través de una muestra, que en los estudiantes
varones: 50 son de aspiraciones elevadas y 20 de aspiraciones modestas.
Asimismo, en los estudiantes 60 son de aspiraciones elevadas y 30 de aspiraciones
modestas. Si se selecciona dos estudiantes¿ Cual es la probabilidad de
seleccionar:
Dos estudiantes de aspiraciones elevadas?
Un estudiante con aspiraciones elevadas y uno de aspiraciones modestas.
El primer seleccionado sea de sexo masculino y el segundo de sexo
femenino.
Solución.
Masculino Femenino Total
Aspiraciones elevadas 50 60 110
Aspiraciones modestas 20 30 50
Total 70 90 160
Sean los eventos
A: Estudiante se sexo masculino.
B: Estudiante se sexo femenino.
C: Estudiante de aspiraciones elevadas.
D: Estudiante de aspiraciones modestas.
a) 110
21 2 160
2
( )C
p C CC
b) 1 2 1 2(Uno aspiraciones elevadas y uno modestas) ( ) ( )p p C D p D C
110 50 50 110
1 1 1 1
160 160
2 2
* *C C C C
C C
c) 70 90
1 11 2 160
2
*( )
C Cp A B
C
CLETO DE LA TORRE DUEÑAS 125
126 ESTADISTICA
Problemas Propuestos.
1) Calcular la probabilidad de que al lanzar un dado se obtenga un número que
sea múltiplo de dos o tres.
2) Si se lanzan dos dados, encontrar la probabilidad de obtener un 5 en el primero
y 3 en el segundo.
3) En una encuesta entre alumnos de maestría en administración se obtuvieron los
datos siguientes acerca de “el principal motivo del alumno para solicitar su
ingreso a la escuela donde está matriculado”.
Motivo
Tipo est.
Calidad de la
escuela
Costo o
comodidad
Otros
Totales
Tiempo completo 421 393 76 890
Tiempo parcial 400 593 46 1039
Totales 821 986 122 1929
a. Si un alumno es de tiempo completo. ¿Cuál es la probabilidad de que la calidad
de la institución sea el principal motivo para elegir su escuela?.
b. Si un alumno es de tiempo parcial. ¿Cuál es la probabilidad de que la calidad de
la escuela sea el motivo para elegirla?
c. Sea A el evento en que el alumno es de tiempo completo y sea B el evento que
el alumno menciona que la calidad de la escuela es el 1er motivo de su solicitud.
¿Son independientes los eventos A y B?. Justifique su respuesta.
4) Antes de que un libro sea lanzado al mercado se recogen las reacciones de un
grupo de personas a las que se les permite leer el libro previamente.
Posteriormente a las ventas del libro se les asigna el calificativo de altas,
moderadas o bajas de acuerdo a las noemas del mercado. Los resultados se
muestran en la siguiente tabla:
CLETO DE LA TORRE DUEÑAS 127
Reacciones
Ventas
Favorables Neutral Desfavorables
Altas 173 101 61
Moderadas 88 211 70
Bajas 42 113 141
a) ¿Cuál es la probabilidad de que las ventas sean altas?
b) ¿Cuál es la probabilidad de que las reacciones sean favorables?
c) Si la reacción del grupo es favorable?. ¿Cuál es la probabilidad de que las ventas
sean altas?
d) Si las ventas son bajas ¿Cual es la probabilidad de que las opiniones hayan sido
desfavorables?
e) ¿Cuál es la probabilidad de que las opiniones sean favorables y las ventas sean
altas?
f) ¿Cuál es la probabilidad de que las ventas sean favorables o desfavorables?.
¿Son esos sucesos mutuamente excluyentes? Justifique
g) ¿Son los sucesos “Opiniones desfavorables” y “Ventas Bajas” independientes?
Justifique.
5) Una prueba de selección consta de dos preguntas tipo test. Se consideran aptos
aquellos individuos que contesten correctamente a la segunda pregunta,
independientemente de cómo hayan contestado a la primera.
La primera pregunta tiene cuatro posibles respuestas. A los individuos que
contestan correctamente a la primera pregunta, se les plantea una segunda
pregunta con dos posibles respuestas, mientras que a quienes fallan la primera
pregunta les proponen una segunda cuestión con ocho posibles respuestas.
Si un individuo que se presenta a la prueba y contesta a las preguntas al azar,
a) ¿cuál es la probabilidad de que sea considerado apto?
b) ¿cuál es la probabilidad de que conteste correctamente a la primera pregunta y
mal a la segunda?
6) En un instituto hay 320 alumnos de primer curso, 280 de segundo y 200 de tercero.
Al final de curso han suspendido 60 alumnos de primero, 48 de segundo y 72 de
128 ESTADISTICA
tercero. Hallar la probabilidad de que al elegir un alumno al azar y resultando que
está suspendido, sea de 1º, de 2º o de 3º.
7) En una clase de 30 alumnos hay 18 que han aprobado matemáticas, 16 que han
aprobado inglés y 6 que no han aprobado ninguna de las dos.
Elegimos al azar un alumno de esa clase:
a) ¿Cuál es la probabilidad de que haya aprobado inglés y matemáticas?
b) Sabiendo que ha aprobado matemáticas, ¿cuál es la probabilidad de que haya
aprobado inglés?
c) ¿Son independientes los sucesos "Aprobar matemáticas" y "Aprobar inglés"?
8) La probabilidad de que un alumno estudie para su examen es 0.75. Si estudia, la
probabilidad de que apruebe el examen es 0.80. Si el alumno no estudia la
probabilidad de que no apruebe el examen es 0.90.
a. ¿Cual es la probabilidad de que el alumno apruebe el examen?
b. Si el alumno aprueba el examen ¿Cual es la probabilidad de que haya
estudiado?
9) Una dirección departamental de educación recibe 25 solicitudes para una vacante
de director de una UGEL. Entre los solicitantes 10 son hombres. Diecisiete de ellos
acreditan titulo de maestría y ocho son licenciados. Además se sabe que 7
aspirantes son mujeres que tienen grado de magíster.
¿Cual es la probabilidad de que sea seleccionado una mujer o una persona con
titulo de licenciado?
Si el postulante seleccionado es magíster ¿Cual es la probabilidad de que sea
varón?
10) 200 alumnos de la Facultad de Educación están distribuidos de acuerdo a su sexo
y lugar de procedencia de la siguiente forma: 70 son mujeres, 110 son de Cusco y
30 son mujeres y de provincias. Si se elige dos alumnos al azar calcular la
probabilidad de que:
Ambos sean mujeres y de Cusco.
Al menos uno de los dos escogidos sea hombre.
CLETO DE LA TORRE DUEÑAS 129
11) En la entrada de una facultad hay tres fotocopiadoras, A, B y C cuyos porcentajes
de fallo son 3%, 5% y 4% respectivamente. Un alumno entra en la facultad y,
como las tres fotocopiadoras están libres, elige una al azar, para realizar su
fotocopia. Al llegar a clase observa que la fotocopia es defectuosa. ¿Cuál es la
probabilidad de que fuera hecha en la máquina B?.
12) En una clase, el 20% de los chicos y el 5% de las chicas juega al tenis. El 60% de
la clase son chicos. Se eligió al azar un estudiante de la clase y resultó ser de los
que jugaban al tenis. ¿ Cuál es la probabilidad de que el estudiante elegido sea
chico?.
13) En una asignatura de una carrera el 10% de los alumnos reciben una nota final de
sobresaliente. El 70% de los estudiantes que la reciben ya la habían obtenido en
un examen realizado a mitad de curso. Además, el 10% de los alumnos que no
reciben sobresaliente al final de curso lo habían obtenido en el examen parcial.
¿Qué porcentaje de alumnos obtiene sobresaliente en el examen parcial?. ¿Cuál
es la probabilidad de que un alumno que recibe un sobresaliente en el parcial
obtenga esa calificación en el examen final?
130 ESTADISTICA
CAPITULO VI
VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD
6.1 VARIABLE ALEATORIA.
Definición.- Una variable aleatoria (v.a) X es cualquier función, que transforma
cada elemento del espacio muestral , en un número real.
:X R
X
Al conjunto de posibles valores de X se le llama rango de X (Rx)
Si Rx es finito o enumerable (rango discreto), entonces X es una v.a Discreta.
Si Rx no es enumerable (rango continuo), entonces X es una v.a Continua.
Función de Probabilidad.- Si X es una v.a discreta, la función de probabilidad de
X viene dada por:
/XP x P X x P X x ,
tal que ( ) 1X
x Rx
P x
CLETO DE LA TORRE DUEÑAS 131
Función de densidad.- Si X es una v.a continua, la función de densidad de X es
una aplicación : 0,Xf X tal que ( )
b
X
a
P a X b f x dx ,tal
que ( ) 1Xf x dx
Función de distribución.- La función de distribución de una v.a X esta dada por:
( ) ( ) ( / ( ) )XF x P X x P X x
Propiedades.
F es continua por la derecha y es creciente
Si X es una v.a discreta , entonces
P a X b F b F a P X a
Si X es una v.a continua , entonces P a X b F b F a
Si X es una v.a continua , entonces ' ( )( ) ( )
dF xF x f x
dx
lim ( ) 0x XF x y lim ( ) 1x XF x
6.2 ESPERANZA Y VARIANZA.
Esperanza
La esperanza o media de una variable aleatoria X, denotada por ( )E X o X
se define según sea la variable discreta o continua, mediante:
. ,
. ( ) ,
x Rx
x Rx
x P X x si X es discreta
E Xx f x dx si X es continua
Propiedades.
El valor esperado de una constante es dicha constante
132 ESTADISTICA
E a bX a bE X
Varianza
La varianza de una variable aleatoria X cuya media o esperanza es X
, se define
como
22 22 2
X XV X E X E X E X E X E X
Propiedades.
La raíz cuadrada de la varianza se llama desviación estándar.
22 2
X XE X
2 ( )V aX b a V X
Desigualdad de Chebyshev.
Si X es una variable aleatoria, entonces para cualquier k se cumple
2
11X XP X k
k
Ejemplo 1:
Sea X la variable aleatoria definida como la suma de los valores que aparecen al
lanzar dos dados.
a) Determine la distribución de probabilidad.
b) Calcule la probabilidad P(5<X<8)
c) La media y su varianza.
CLETO DE LA TORRE DUEÑAS 133
Solución.
a)
Resultados en
el primer dado
Resultados en el segundo dado
1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
X: Suma de los valores de los dos dados
Rx 2 3 4 5 6 7 8 9 10 11 12
P(X) 1/36 2/36 3/16 4/16 5/36 6/36 5/36 4/36 3/36 2/36 1/36
b) (5 8) (6) (7) 5/36 6/36 11/36p X p p
c) Media
. ,x Rx
E X x P X x si X es discreta
1 2 3 4 5 6 5 4 3 2 12 3 4 5 6 7 8 9 10 11 12
36 36 36 36 36 36 36 36 36 36 36E X
252
36E X
Varianza.
22 2
X E X E X
2 2 2 2 2 2 2 2 2 2 2 21 2 3 4 5 6 5 4 3 2 12 3 4 5 6 7 8 9 10 11 12
36 36 36 36 36 36 36 36 36 36 36E X
2 1974
36E X
222 2 1974 252
36 36X E X E X
134 ESTADISTICA
6.3 DISTRIBUCIONES DE PROBABILIDAD.
Existen otras variables cuyas funciones de probabilidad o densidad resultan ser
modelos de mucha utilidad para una serie de aplicaciones. Se cita brevemente
algunos de los modelos de mayor importancia.
6.3.1 Distribuciones discretas.
Un experimento de Bernoulli, es un experimento aleatorio con solo dos posibles
resultados: Éxito y Fracaso. Sea p = P (Éxito).
Distribución Binomial.
La distribución binomial aparece cuando se dan las condiciones siguientes:
-Tenemos un experimento aleatorio simple, con una situación dicotómica, es
decir Éxito y Fracaso.
- Repetimos este experimento simple n veces de manera independiente.
X = Número de Éxitos en n experimentos independientes de Bernoulli.
Función de Probabilidad:
.,0
,...,2,1,0,1
casootroen
nxsippCxP
xnxnx
X
Valor esperado: .npX Varianza: .12 pnpX
Notación: X B(n, p).
Distribución de Pascal o Binomial Negativa. Notación: X BN(r, p).
X = Número de ensayos (experimentos independientes de Bernoulli) hasta
conseguir el r-ésimo Éxito.
Función de Probabilidad:
.,0
,...2,1,,111
casootroen
rrrxsippCxP
rrxxr
X
CLETO DE LA TORRE DUEÑAS 135
Valor esperado: .p
rX Varianza:
.1
2
2
p
prX
Nota: Si r = 1, X se dice que es una variable aleatoria con distribución
geométrica de parámetro p, y se le denota por X G(p).
Distribución Hipergeométrica. Notación: X H(N, M, n).
Considérese una población de N elementos, M de los cuales son de un tipo A, y
supongamos se extraen sin reemplazo una muestra de n elementos de esta
población. Entonces:
X = Número de elementos de tipo A en la muestra.
Función de Probabilidad:
.,0
,...,2,1,0,
casootroen
nxsiC
CC
xP Nn
MNxn
Mx
X
Valor esperado: .N
MnX Varianza: .
112
N
nN
N
M
N
MnX
Notas:
1. En PX se esta usando la convención que ,0baC si a > b.
2. Si la elección de la muestra fuera con reemplazo, entonces
X , .M
B n pN
Distribución de Poisson.
La distribución de Poisson aparece en situaciones en las que se cuenta el
número de apariciones de un determinado suceso o bien en un intervalo de
tiempo dado (como el número de partículas emitidas en un segundo por un
material radioactivo, o el número de pacientes que llegan a un servicio en un
intervalo de tiempo dado) o bien en un recinto físico (como el número de fallos
en un metro de alambre de hierro producido.
136 ESTADISTICA
X = Número de eventos en t,0 .
Función de Probabilidad:
.,0
,...2,1,0,!
casootroen
xsix
e
xP
x
X
Valor esperado: .X Varianza: .2X
6.3.2 Distribuciones continuas.
Distribución Uniforme. Notación: X U .,ba
Esta distribución se da cuando la variable aleatoria X puede tomar
indistintamente cualquier valor en el intervalo a, b .
Función de densidad:
.,0
,,1
casootroen
baxsiabxf X
Valor esperado: .2
baX Varianza: .
12
22 abX
Distribución Normal. Notación: X N( , 2).
Función de densidad:
2
22
1
2
1 x
X exf
Valor esperado: .X Varianza: .22X
Nota: Cuando = 0 y 2 = 1, a X se le denota por Z y se le llama una variable
aleatoria con distribución normal estándar; vale decir, Z N (0, 1). Toda v.a.
normal X N( , 2) puede convertirse con una v.a. normal estándar
(estandarizarse) a través de la transformación:
CLETO DE LA TORRE DUEÑAS 137
XZ
1. Teorema del limite central (TLC). Si nXXX ,...,, 21 son n v.a.s
independientes, donde cada Xi tiene la misma distribución de valor esperado y
varianza 2, entonces para n suficientemente grande (en la práctica n 30) se
cumple que aproximadamente
1 N (0, 1)/
n
iiX n X
Zn n
2. Aproximación de la Binomial por la Normal. Si X B (n, p) y n es
suficientemente grande, entonces aproximadamente:
pnp
npXZ
1 N (0, 1).
Aquí, para el cálculo de probabilidades, se recomienda utilizar la llamada
corrección por continuidad: Si a b son dos números naturales, entonces
aproximadamente:
.112
1
2
1 21
21
pnp
npaFz
pnp
npbFzbXaPbXaP
6.4 OTRAS DISTRIBUCIONES CONTINUAS IMPORTANTES
DISTRIBUCION CHI-CUADRADO.
Una v.a. X tiene distribución chi-cuadrado con n grados de libertad, y se le
denota por 2X (n) .
PROPOSICION.
1. Si Z N (0, 1), entonces 2 2Z (1)
138 ESTADISTICA
2. Propiedad reproductiva. Si 2 2 2
1 2 k ... son k variables aleatorias
independientes con distribuciones chi-cuadrado de respectivamente
knnn ,...,, 21 grados de libertad, entonces
2 2
1
k
i
i
Es también una v.a. con distribución chi-cuadrado de
k
i inn1 grados
de libertad.
3. Si nXXX ,...,, 21 es una m.a de X N ( , 2), entonces
2
2
2
1 (n-1)
n SW
DISTRIBUCION T DE STUDENT.
Una v.a. X tiene distribución t de Student con n grados de libertad, y se le denota
por X t(n) .
PROPOSICION.
1. Sea X t(n) . Si n es grande, entonces aproximadamente X N (0, 1).
2. Si Z N (0, 1) y 2 2 (n) son v.a independientes, entonces
2
n
ZT
t(n). En particular, dada una m.a. nXXX ,...,, 21 de X,
extraída de una población N ( , 2), se cumple que:
t (n -1)/
XT
S n
.
CLETO DE LA TORRE DUEÑAS 139
DISTRIBUCION F DE FISHER.
Una v.a. X tiene distribución F de Fisher con n grados de libertad en el
numerador y m grados de libertad en el denominador, y se le denota por
X F (n, m) .
PROPOSICION.
1. Si X F (n, m) entonces:
X1
F (m, n).
2. Si 2
1 2(n) y 2
2 2(m) son v.a’s independientes, entonces
2
1
2
2
/ F (m, n)
/
nF
m .
En particular, si nXXX ,...,, 21 es una v.a. de X N ( 1, 12), e
mYYY ,...,, 21 una m.a de una v.a. Y N ( 2, 22), donde X e Y son
independientes, entonces
2 2
1 2
2 2
2 1
F (n -1, m - 1)S
FS
Siendo 2
1S y 22S las varianzas muestrales asociadas a las poblaciones
estadísticas determinadas por X e Y, respectivamente.
Nota: La distribución normal estándar, t de Student, chi-cuadrado y F de Fisher
poseen todas tablas en la que se tabulan algunos valores de su función de
distribución.
140 ESTADISTICA
EJERCICIOS DESARROLLADOS
1. Una prueba de inteligencia está compuesta por 10 preguntas, cada una de las
cuales tiene 4 respuestas y solo una de ellas correcta. Un alumno tiene prisa por
acabar la prueba y decide contestar aleatoriamente. Se pide
a) Probabilidad de acertar exactamente 4 preguntas
b) Probabilidad de no acertar ninguna
c) Probabilidad de acertar todas
d) Probabilidad de acertar al menos 8
e) Probabilidad de acertar a los sumo 6
f) Media y varianza
Solución
Consideremos los sucesos
A = Contestar bien P (A) = 0.25
A = No contestar bien P ( A ) = 0.75
Se trata de una distribución Binomial de parámetros B (10, 0.25 )
Sea X la variable aleatoria que representa el número de preguntas contestadas
correctamente
a) P(acertar 4) = 1460.0)75.0()25.0(4
104 64XP
b) P (no acertar ninguna) = 0563.0)75.0()25.0(0
100 100XP
c) P(acertar todas) = 0)75.0()25.0(10
1010 010XP
d) P(acertar al menos 8) = 10988 XPXPXPXP
005.00)75.0()25.0(9
10)75.0()25.0(
8
10928
e) P( acertar a lo sumo 3) = P 32103 XPXPXPXPX
CLETO DE LA TORRE DUEÑAS 141
7759.0)75.0()25.0(3
10)75.0()25.0(
2
10)75.0()25.0(
1
10)75.0()25.0(
0
10738291100
f) Media y Varianza
5.2)25.0(10np
875.1)75.0)(25.0(10)1(2 pnp
2. La probabilidad de que un estudiante obtenga el título de licenciado en Geografía
e Historia es de 0.3. Halla la probabilidad de que de un grupo de siete estudiantes
matriculados en primer curso.
a) Ninguno de los 7 finalice la carrera
b) Finalicen todos la carrera
c) Al menos 2 acaben la carrera
d) Halla la media y la desviación típica
Solución
Consideremos los sucesos:
A = Finalizar la carrera P(A) = 0.3
A = No finalizar la carrera P ( A ) = 0.7
Por tanto se trata de una distribución Binomial de parámetros B (7, 0.3)
Sea X la variable aleatoria que representa el número de estudiantes que obtienen el
título de licenciado en Geografía e Historia
a) 0824.0)7.0()3.0(0
70 70XP
b) 0002.0)7.0()3.0(7
77 07XP
c) 6705.0)7.0()3.0(1
7)7.0()3.0(
0
71101112 6170XPXPXPXP
Media y desviación típica
1.2)3.0(7np
21.1)7.0)(3.0(7)1( pnp
142 ESTADISTICA
3) El peso medio de los estudiantes de un colegio es 60 kg y la desviación típica es 6
kg. Suponiendo que los pesos están distribuidos normalmente.
a) Cual es la probabilidad de que un estudiante pese menos de 64k g?
b) Cual es la probabilidad de que un estudiante pese 57 kg o más?
c) Cual es la probabilidad de que un estudiante pese más de 63 Kg?
d) Cual es la probabilidad de que un estudiante pese entre 57 a 65 kg?
e) Cual es la probabilidad de que un estudiante pese menos de 50 Kg?
f) Cual es la probabilidad de que un estudiante pese entre 64 a 70 kg?
g) Si los estudiantes son 200, .Cuantos cabe esperar que pesen más de 57 kg y
menos de 64k g?.
Solución.
X: Peso de los trabajadores.
60 (Media poblacional)
6 (Desviación)
a) 64 64 60
( 64) ( ) ( ) ( 0.67)6
XP X P P Z P Z
0 z=0.67
(0.67)
0.5 (0.67) 0.5 0.24857=0.74857=74.857%
b) 57 57 60
( 57) ( ) ( ) ( 0.5) (0.5) 0.56
XP X P P Z P Z
0z= 0.5
(0.5)
0.19146+0.5=0.69146=69.146%
CLETO DE LA TORRE DUEÑAS 143
c) 63 63 60
( 63) ( ) ( ) ( 0.5) 0.5 (0.5)6
XP X P P Z P Z
0 z=0.5
(0.5)
0.5 0.19146=0.30854=30.854%
d) 57 65 57 60 65 60
(57 65) ( ) ( )6 6
XP X P P Z
( 0.50 0.83) (0.50) (0.83) 0.19146+0.29373=0.48519=48.519%X
P
0
z=0.83z= 0.50
(0.5) (0.83)
e) 50 50 60
( 50) ( ) ( ) ( 0.167)6
XP X P P Z P Z
0z= 0.167
(0.167)
0.5 (0.167) 0.5 0.0675=0.4325=43.25%
f) 64 70 64 60 70 60
(64 70) ( ) ( )6 6
XP X P P Z
(0.67 1.67) (1.67) (0.67) 0.45254-0.24857=0.20397=20.397%X
P
144 ESTADISTICA
0 z=1.67z=0.67
(1.67)
(0.67)
g) 57 64 57 60 64 60
(57 64) ( ) ( )6 6
XP X P P Z
( 0.5 0.67) (0.5) (0.67) 0.19146+0.24857=0.44003=44.003%X
P
Cabe esperar el 44.003% de estudiantes, es decir 0.44003*200 88
CLETO DE LA TORRE DUEÑAS 145
EJERCICIOS PROPUESTOS.
1) En un grupo de 10 alumnos de un centro educativo se ha comprobado que cada uno
de ellos falta a clase el 5% de los días. Calcula la probabilidad de que en un día
determinado. .
a) no se registre ninguna ausencia.
b) falten a clase más de 5 alumnos.
c) no asista a clase ningún alumno.
d) falte a clase un único alumno.
e) falten a clase menos de 3 alumnos.
2) La probabilidad de que un estudiante obtenga el grado de magíster es de 0.3.
Calcular la probabilidad de que de un grupo de siete estudiantes matriculados. . .
a) los siete obtenga el grado de magíster.
b) al menos dos obtengan el grado.
3) La probabilidad de que un estudiante de ingeniería fracase en sus estudios es de
0.7.
a) De un grupo de 7 estudiantes de ingeniería, calcula la probabilidad de que los 7
fracasen en sus estudios.
b) En el mismo caso que en el apartado anterior, calcula la probabilidad de que al
menos 2 acaben la carrera.
c) Se el grupo se aumenta a 40 estudiantes, calcular la probabilidad de que fracasen
entre 20 y 30 de ellos
4) Un examen tipo test tiene 100 preguntas y cada pregunta 4 respuestas diferentes, de
las que sólo una es correcta.
a) Calcular la probabilidad de que un estudiante que responde al azar acierte más de
20 preguntas.
b) Calcular la probabilidad de que de las 20 primeras preguntas acierte a lo sumo
5) Las puntuaciones de un test se distribuye normalmente con media 80 y varianza
49 ¿Cuál es la probabilidad de obtener en el test una puntuación entre 79 y 88
puntos ?.
146 ESTADISTICA
6) Se llama cociente intelectual (C.I.) al cociente entre la edad mental y la edad real.
Se sabe que la distribución del C.I. se distribuye normalmente con media 0.95 y
desviación típica 0.22. En una población con 2600 personas se desea saber:
a) Cuantas tendrían un C.I. superior a 1.3?
b) Cuantas tendrían un C.I. inferior a 0.07?
c) Cuantas tendrían un C.I. entre 0.8 y 1.15?
7) Tras realizar un test de cultura general entre los habitantes de cierta población, se
observa que las puntuaciones siguen una distribución normal, de media 68 y
desviación típica 18. Se desea clasificar a los habitantes en tres grupos (de baja
cultura general, de cultura general aceptable y de cultura general excelente), de
manera que el primer grupo abarque un 20% de la población, el segundo un 65% y
el tercero el 15% restante. .Cuales son las puntuaciones que marcan el paso de un
grupo a otro?
8) Se ha aplicado un test de fluidez verbal a 500 alumnos de la UNSAAC. Se supone
que las puntuaciones obtenidas se distribuyen según una normal de media 80 y
desviación típica 12. Se pide:
a) .Que puntuación separa el 25% de los alumnos con menos fluidez verbal?
b) .A partir de que puntuación se encuentra el 25% de los alumnos con mayor
fluidez verbal?
9) El peso medio de 500 estudiantes de cierta universidad es 72 Kg y la desviación
típica es 7. Si los pesos se distribuyen según una normal, halla:
a) El número de estudiantes que pesan entre 68 y 75 Kg.
b) El número de estudiantes que pesan más de 72 Kg.
c) El número de estudiantes que pesan menos de 62 Kg.
10) En una clase de Ingeniería Técnica se sabe que las calificaciones de Estadística se
distribuyen según una N(4, 2). Si el profesor desea aprobar al 70% de la clase, ¿a
partir de qué nota se debe considerar aprobado el examen?
11) La nota media de un examen es 5,25 y la desviación típica 2. El 10% de la clase
recibirá la calificación de sobresaliente. ¿Cuál es la nota mínima para optar a él?
Se eligen cinco alumnos al azar, ¿cuál es la probabilidad de que dos de ellos hayan
Obtenido un sobresaliente?
CLETO DE LA TORRE DUEÑAS 147
APENDICE
TABLA NORMAL ESTÁNDAR
8,5Z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0 0 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.0279 0.03188 0.03586
0.1 0.03983 0.04395 0.04776 0.05172 0.05567 0.05962 0.06356 0.0675 0.07124 0.07534
0.2 0.07926 0.08617 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409
0.3 0.11781 0.12172 0.12552 0.1293 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173
0.4 0.15542 0.1591 0.16276 0.1664 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793
0.5 0.19146 0.19497 0.19847 0.20194 0.2054 0.20884 0.21226 0.21566 0.21904 0.2224
0.6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.2549
0.7 0.25804 0.26115 0.26424 0.2673 0.27035 0.27337 0.27637 0.27935 0.2823 0.28524
0.8 0.28814 0.29103 0.29389 0.29373 0.29955 0.30234 0.3051 0.30785 0.31057 0.31327
0.9 0.31594 0.31859 0.32124 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891
1 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214
1.1 0.36433 0.3665 0.36864 0.37076 0.37286 0.37923 0.37698 0.379 0.381 0.38298
1.2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39616 0.39796 0.39973 0.40147
1.3 0.4032 0.4049 0.40658 0.40824 0.40988 0.41149 0.41308 0.41466 0.41621 0.41774
1.4 0.41924 0.42073 0.4222 0.42364 0.42507 0.42647 0.42785 0.42922 0.43056 0.43189
1.5 0.43319 0.43448 0.43574 0.43699 0.43822 0.43943 0.44062 0.44179 0.44295 0.44408
1.6 0.4452 0.4463 0.44738 0.44845 0.4495 0.45053 0.45154 0.45254 0.45352 0.45449
1.7 0.45543 0.45637 0.45728 0.45818 0.45907 0.45994 0.46079 0.46164 0.46246 0.46327
1.8 0.46407 0.46485 0.46562 0.46637 0.46712 0.46784 0.46856 0.46926 0.46995 0.47062
1.9 0.47128 0.47193 0.47257 0.4732 0.47381 0.47441 0.475 0.47558 0.47615 0.4767
2 0.47725 0.47778 0.47831 0.47882 0.47932 0.47982 0.4803 0.48077 0.48124 0.48169
2.1 0.48214 0.48257 0.48299 0.48341 0.48382 0.48422 0.48461 0.485 0.48537 0.48574
2.2 0.4861 0.48645 0.48679 0.48713 0.48745 0.48778 0.48809 0.4884 0.4887 0.48899
2.3 0.48928 0.48956 0.48983 0.49001 0.49036 0.49061 0.49086 0.4911 0.49134 0.49158
2.4 0.4918 0.49202 0.49224 0.49245 0.49266 0.49286 0.49305 0.49324 0.49343 0.49361
2.5 0.49379 0.49396 0.49413 0.4943 0.49446 0.49461 0.49477 0.49491 0.49506 0.4952
2.6 0.49534 0.49547 0.4956 0.49573 0.49585 0.49597 0.49609 0.49621 0.49632 0.49643
2.7 0.49653 0.49664 0.49674 0.49683 0.49693 0.49702 0.49711 0.4972 0.49728 0.49736
2.8 0.49744 0.49752 0.4976 0.49767 0.49774 0.49781 0.49788 0.49795 0.49801 0.49807
2.9 0.49813 0.49819 0.49825 0.4983 0.49836 0.49841 0.49846 0.49851 0.49856 0.4986
3 0.49865 0.49869 0.49874 0.49878 0.49882 0.49886 0.49889 0.49893 0.49897 0.499
3.1 0.49903 0.49906 0.4991 0.49913 0.49916 0.49918 0.49921 0.49924 0.49926 0.49929
3.2 0.49931 0.49934 0.49936 0.49938 0.4994 0.49942 0.49944 0.49946 0.49948 0.4995
3.3 0.49952 0.49953 0.49955 0.49957 0.49958 0.4996 0.49961 0.49962 0.49964 0.49965
3.4 0.49956 0.49968 0.49969 0.4997 0.49971 0.49972 0.49973 0.49974 0.49975 0.49976
3.5 0.49977 0.49978 0.49978 0.49979 0.4998 0.49981 0.49981 0.49982 0.49983 0.49983
3.6 0.49984 0.49985 0.49985 0.49986 0.49986 0.49987 0.49987 0.49988 0.49988 0.49989
3.7 0.49989 0.4999 0.4999 0.4999 0.49991 0.49991 0.49992 0.49992 0.49992 0.49992
3.8 0.49993 0.49993 0.49993 0.49994 0.49994 0.49994 0.49994 0.49995 0.49995 0.49995
3.9 0.49995 0.49995 0.49996 0.49996 0.49996 0.49996 0.49996 0.49996 0.49997 0.49997
148 ESTADISTICA
BIBLIOGRAFIA.
1. Briones, G. (1998). Métodos y técnicas de investigación para las Ciencias
Sociales. México: Trillas.
2. Blalock, H. (1994). Estadística Social. México: Fondo de Cultura Económica.
3. Carrasco, J. B. y Calderero, J. F: (2000). Aprendo a investigar en educación.
Madrid: Ediciones Rialp, S.A.
4. Cordova, Manuel (2003). Estadística descriptiva e inferencial. Editorial
Mosqueira Lima.
5. Guilford J. P. Y Fruchter B. 1984. “Estadística aplicada a la Psicología y a la
Educación”. Editorial Mc Graw Hill.
6. JESUS AMON, Estadística para Psicólogos 1, estadística descriptiva.
7. JESUS AMON, Estadística para Psicólogos 2, estadística inferencial.
8. 5PAGANO, Robert, ESTADÍSTICA PARA LAS CIENCIAS DEL
COMPORTAMIENTO, Edit. Thomson, 7ma edición, 2006, México D.F.
9. Peña D. Y Romo J. 1997. Introducción a la estadística para las Ciencias
sociales. Editorial Mc Graw Hill. Interamericana de España.
10. Siegel, S. (1956). Non Parametric Statistics for the Behaviral Sciences. New
Cork: McGraw Hill Book Company.
11. Valdivieso Serrano Luis (2004) Estadística aplicada, editorial PUCP.