Estadistica Basica.pdf
-
Upload
ramirobautista-123 -
Category
Documents
-
view
118 -
download
13
Transcript of Estadistica Basica.pdf
-
Direccin Xeral de Educacin, Formacin Profesional e Innovacin Educativa
Educacin secundaria para personas adultas
Pgina 1 de 40
mbito cientfico tecnolgico Educacin a distancia semipresencial
Mdulo 4 Unidad didctica 4
Estadstica y probabilidad
-
Pgina 2 de 40
ndice
1. Introduccin...............................................................................................................3 1.1 Descripcin de la unidad didctica................................................................................ 3 1.2 Conocimientos previos.................................................................................................. 3 1.3 Objetivos didcticos...................................................................................................... 3
2. Secuencia de contenidos y actividades..................................................................4 2.1 Estadstica .................................................................................................................... 4
2.1.1 Utilidad de la estadstica ....................................................................................................................................4
2.1.2 Poblacin y muestra...........................................................................................................................................5
2.1.3 Recogida de datos .............................................................................................................................................7
2.1.4 Confeccin de una tabla: frecuencias y significado ...........................................................................................8
2.1.5 Construccin de grficas adecuadas a cada caso...........................................................................................11
2.1.6 Parmetros estadsticos. Clculo y significado ................................................................................................16
2.2 Probabilidad................................................................................................................ 21 2.2.1 Experimento aleatorio ......................................................................................................................................21
2.2.2 Definicin de probabilidad y propiedades ........................................................................................................23
2.2.3 Ley de Laplace para el clculo de la probabilidad ...........................................................................................24
3. Resumen de contenidos.........................................................................................27 4. Actividades complementarias................................................................................28 5. Ejercicios de autoevaluacin .................................................................................30 6. Solucionarios...........................................................................................................32
6.1 Soluciones de las actividades propuestas.................................................................. 32 6.2 Soluciones de las actividades complementarias ........................................................ 36 6.3 Soluciones de los ejercicios de autoevaluacin .......................................................... 38
7. Bibliografa y recursos............................................................................................40
-
Pgina 3 de 40
1. Introduccin
1.1 Descripcin de la unidad didctica Se dedica esta unidad al tratamiento bsico de los datos estadsticos, a sus formas de re-
presentacin grfica usando el ordenador y al clculo de parmetros de centralizacin y
dispersin. La frecuencia relativa permite inducir el concepto de probabilidad y la regla de
Laplace.
1.2 Conocimientos previos Para estudiar y comprender esta unidad, se debe de tener conocimiento de las operaciones
con nmeros reales, del clculo de porcentajes y de la representacin grfica de funciones
sencillas. La construccin de grficas con la hoja de clculo exige estar familiarizado con
el manejo de la herramienta Excel.
1.3 Objetivos didcticos Comprender la importancia del conocimiento estadstico para la toma de decisiones de
todo tipo: econmicas, mdicas, polticas, acadmicas, etc.
Valorar el modo ms conveniente de recoger los datos estadsticos. En el caso de reco-
gerse de una muestra, esta tendr que ser representativa de la poblacin.
Elaborar una tabla, con los datos y las frecuencias absolutas en columnas, organizando
el clculo de las frecuencias relativas y acumuladas.
Saber calcular las medidas centrales e interpretar su significado prctico. Saber calcular
las medidas de dispersin.
Reconocer el significado de la diferencia entre dos muestras con la misma media arit-
mtica y diferente dispersin.
Organizar los datos y los clculos, y elaborar grficos estadsticos utilizando una hoja
de clculo con el ordenador, e imprimir la hoja con una buena presentacin.
Explicar el concepto de probabilidad y poner ejemplos sencillos.
Discriminar los sucesos equiprobables de los que no lo son.
Utilizar correctamente la regla de Laplace para el clculo de probabilidades en casos
sencillos.
Valorar la participacin en juegos de azar y entender el riesgo de caer en la ludopata
como una adiccin de consecuencias personales, familiares y econmicas generalmente
grave.
-
Pgina 4 de 40
2. Secuencia de contenidos y activida-des
2.1 Estadstica Es difcil establecer el origen de la estadstica, pero parece que los datos ms antiguos que
se conocen, de lo que nosotros entendemos por estadstica, son los censos chinos all por
el ao 2200 antes de Cristo.
La palabra estadstica est emparentada con Estado, ya que el propsito principal de los gobiernos era establecer registros de poblacin, de nacimientos, defunciones, cosechas,
impuestos, etc. Hoy en da, la mayor parte de las personas entiende por estadstica los con-
juntos de datos distribuidos en tablas, grficos publicados en los peridicos, etc.
2.1.1 Utilidad de la estadstica En la actualidad la estadstica se entiende como un mtodo para la toma de decisiones, de
ah la importancia que tiene en multitud de estudios cientficos de todas las ramas del sa-
ber:
Cmo decidir si un nuevo producto comercial tendr xito?
Influye el IPC en la tasa de desempleo?
Qu dir un socilogo sobre la intencin del voto, despus de analizar una encuesta?
A partir de un estudio sobre el crecimiento de la poblacin de un pas, podr un exper-
to en geografa humana calcular la poblacin del ao 2050?
Cules sern las necesidades escolares de un pas para los prximos cinco aos?
Muchas de estas preguntas tienen su respuesta gracias a la estadstica, ya que a travs de
procedimientos de inferencia estadstica se puede responder a las cuestiones formuladas
con un margen de error prefijado.
Divisiones de la estadstica
Estadstica descriptiva o deductiva: trata del recuento, la ordenacin y la clasifica-
cin de los datos obtenidos a partir de las observaciones. Se construyen tablas y se re-
presentan en grficos, que permiten simplificar en gran medida la complejidad de los
datos que intervienen en la distribucin. A partir de los datos se obtienen los parme-
tros estadsticos que caracterizan la distribucin. Esta parte de la estadstica se limita a
realizar deducciones directamente a partir de los datos y los parmetros obtenidos.
Estadstica inferencial o inductiva: formula y resuelve el problema de establecer pre-
visiones y deducciones generales sobre una poblacin a partir de resultados obtenidos
de una muestra. Utiliza resultados obtenidos mediante la estadstica descriptiva y se
apoya fuertemente en el clculo de probabilidades.
-
Pgina 5 de 40
Actividad resuelta
Se quiere hacer una encuesta para estudiar las aficiones de la gente joven a la lectura. Diga, justificadamente, cules de las preguntas siguientes le parecen razonables y cu-les no:
Solucin
a) no. b) s. c) no. d) s.
Actividad propuesta
S1. Realice una pequea investigacin para saber lo qu es el INE y a qu de dedi-ca.
2.1.2 Poblacin y muestra El objeto de estudio de esta unidad ser la estadstica descriptiva, y para empezar necesi-
tamos definir una serie de conceptos que utilizaremos ms adelante.
Si necesitamos saber cules son las preferencias de los estudiantes gallegos a la hora de
elegir carrera, sera complicado hacerle la pregunta a todo el alumnado. Por eso, el Go-
bierno decide elegir al azar un colectivo para que responda a un formulario previamente
diseado.
Estamos ante el primer paso para hacer una estadstica: del conjunto del alumnado ga-
llego (poblacin) elegiremos una muestra aleatoria. Cada individuo tiene la misma pro-babilidad de ser elegido para esta muestra, por eso la llamamos muestra aleatoria; tambin
tendremos en cuenta que esta debe ser proporcional a la composicin de la poblacin. As,
como ejemplo, diremos que si la muestra est formada por 1 000 personas, de una pobla-
cin de la que el 60 % son mujeres, sta debe tener 600 mujeres y 400 hombres para ser
representativa.
Poblacin Conjunto de elementos que cumplen una caracterstica. A los elementos de la poblacin se les conoce como individuos, debido al origen demogrfico de la estadstica, o unidades estadsti-cas.
-
Pgina 6 de 40
Muestra Cualquier subconjunto de la poblacin. El nmero de elementos de la muestra se denomina ta-mao.
Tenemos ahora una muestra de poblacin de la que queremos saber:
Deporte que practican: ftbol, baloncesto, atletismo, etc. No se pueden expresar los re-
sultados con nmeros.
Nmero de hermanos: 0, 1, 2, etc. Se pueden expresar con nmeros.
Carcter estadstico Un carcter estadstico es un aspecto de la poblacin que se puede observar. Las variantes que puede tomar un carcter son las modalidades del carcter. En el caso anterior, estamos ante dos tipos de caracteres estadsticos.
Un carcter ser cualitativo si sus modalidades no se pueden expresar con nmeros, y ser
cuantitativo cuando s que se pueden expresar. Los caracteres cualitativos se llaman varia-
bles estadsticas y pueden ser de dos tipos:
Variable estadstica discreta
La que puede tomar un nmero finito de valores numricos, o infinito numerable.
Variable estadstica continua
La que puede tomar, por lo menos tericamente, todos los valores dentro de un intervalo de la recta real.
Resumiendo diremos:
Ejemplos Caracteres estadsticos cuantitativos:
La altura de un individuo.
El dimetro de una pieza de precisin.
El cociente intelectual de un individuo.
La renta per capita de una comunidad autnoma.
Caracteres estadsticos cualitativos:
La profesin de una persona.
El color de los ojos.
La lengua que habla un individuo.
Variables estadsticas discretas:
Numero de empleados de una fbrica.
Nmero de hijos de una familia.
-
Pgina 7 de 40
Nmero de goles marcados por la seleccin de ftbol.
Numero de peridicos vendidos en un da.
Variables estadsticas continuas:
Presin sangunea de un paciente.
Dimetro de una rueda.
Medida del crneo de un beb.
Horas dormidas en una noche.
Altura de un individuo.
Actividad resuelta
De cada uno de los siguientes estudios estadsticos, indique cul es la poblacin a la que se refiere, si considera necesario elegir una muestra, y el carcter estadstico y su tipo.
a) Horas diarias de sueo de los habitantes de una provincia.
b) Preferencias literarias de las personas mayores de edad que viven en un edificio.
a) Poblacin = habitantes de la provincia. Muestra = grupo elegido entre la poblacin. Carcter = n horas dormidas, V.Y. cuantitativa, variable continua.
Solucin
b) Poblacin: habitantes del edificio mayores de 18 aos. Muestra: la misma. Carcter: cualitativo.
Actividades propuestas
S2. Indique la poblacin, la variable y el tipo (cualitativa, cuantitativa discreta o conti-nua) de: Peso al nacer de los bebs que nacieron en Barcelona en 2009.
Profesiones que quieren estudiar los estudiantes de un centro escolar.
Nmero de tarjetas amarillas mostradas en los partidos de ftbol de la liga del
ao pasado.
S3. Cmo debe de ser una muestra para ser correcta?
2.1.3 Recogida de datos La informacin estadstica llega a nosotros mediante grficas o tablas muy bien construi-
das, con las que resulta fcil entender la informacin dada. Pero para llegar a ellas, es ne-
cesario realizar un largo proceso, que se inicia ahora.
Qu queremos estudiar? Necesitamos saber lo que pretendemos estudiar; por ejemplo, qu aficiones deportivas tienen los alumnos y las alumnas de un centro.
-
Pgina 8 de 40
Seleccin de las variables que se van a analizar. Debe ser evidente cul es la variable y cules sus posibles valores.
Recogida de datos. Se efectan las medidas o se realizan las encuestas.
Organizacin de datos. Se ordenan, se pasan a papel, o mejor, se introducen en el orde-nador.
Los pasos siguientes son la elaboracin de tablas y grficas y el clculo de parmetros,
a los que dedicaremos el resto de la unidad.
2.1.4 Confeccin de una tabla: frecuencias y significado Despus de recogidos los datos hay que tabularlos, es decir, confeccionar una tabla para
organizarlos. Esto se consigue con una tabla de frecuencias, es decir, el nmero de veces
que aparece cada dato y el tanto por uno de cada dato. Tendremos en cuenta si la variable
que vamos a tabular es discreta o continua. Veamos ambos casos.
Ejemplo. En una muestra formada por 50 individuos, se les pregunt a estos el nmero
de veces que van al cine en un mes y las respuestas fueron las siguientes:
0 1 2 1 0 2 0 1 1 1 1 0 0 1 0 3 1 1 1 1 0 1 0 1 1 1 1 2 1 0 2 1 1 0 1 1 1 1 1 0 1 1 1 1 2 1 1 1 1 1
Efectuaremos un recuento de los datos ordenndolos en una tabla que muestre la fre-cuencia absoluta (nmero de veces que aparece ese dato), que llamaremos fi, y la fre-cuencia relativa (tanto por uno), que llamaremos hi
Veces que asisten al cine xi Frecuencia absoluta fi Frecuencia relativa hi
0 11 11:50 = 0,22
1 33 33:50 = 0,66
2 5 5:50 = 0,10
3 1 1:50 = 0,02
50 1
Observando la tabla podemos ver que hay cinco personas que asisten dos veces al cine
y 11 que no van nunca
Ejemplo. Se quiere realizar un estudio sobre la longitud de un tipo de tornillos que se
hacen en una fbrica. Se elige al azar una muestra de 32 y se obtienen los siguientes re-
sultados en milmetros.
161 171 167 172 170 170 165 169 170 169 172 162 169 166 174 178
167 169 168 176 169 162 168 167 175 168 164 179 172 167 170 173
Ante la dificultad de hacer un recuento de cada valor de la variable, haremos uno de los
datos agrupados en intervalos de 5 mm de amplitud. Haremos una tabla donde se mues-
tren los puntos medios (marca de clase) y las frecuencias absolutas y relativas de cada
intervalo. El nmero de clases no debe ser excesivo y todas deben tener la misma lon-
gitud.
-
Pgina 9 de 40
Si existe un nmero grande de valores diferentes, los datos se agrupan en clases o in-
tervalos.
La marca de clase ser el punto medio de ella y representa todos los datos de la cla-
se.
Longitud en mm Marca de clase xi Frecuencia absoluta fi Frecuencia relativa hi
160 x
-
Pgina 10 de 40
Solucin
a) La poblacin de estudio es las empresas de electricidad de una ciudad.
b) La variable es el nmero de TSE por empresa.
c) El tipo de variable es discreta, ya que solo puede tomar valores enteros.
d) Para construir la tabla de frecuencias, tenemos que mirar cuntas empresas tienen un determinado nmero de TSE. Hagamos una tabla, con las frecuencias absoluta, relativa, absoluta acumulada y relativa acumulada.
e) El nmero de empresas que tienen dos o menos es 2 + 4 + 21 = 27, como podemos ver en la columna de las frecuencias absolutas acumuladas, es lo que le corresponde al valor de la variable 2.
f) El nmero de empresas que tienen ms de uno y menos de tres TSE, es 21 + 15 = 36.
g) El porcentaje de las empresas que tienen ms de tres TSE es la de aquellas que tienen cuatro, cinco y seis, es decir 6 + 1 + 1 = 8. El porcentaje ser el tanto por uno multiplicado por 100, es decir la frecuencia relativa de esos valores mul-tiplicados por 100 ( 0,12 + 0,02+ 0,02) 100 = 0,16 x 100 = 16 % Vemos con este ejemplo la importancia del clculo de las frecuencias acumuladas, para responder con agi-lidad, mirando la tabla.
Actividades propuestas
S4. Con los siguientes datos, elabore una tabla de frecuencias:
0 2 4 1 0 2 3 3 1 0 4 2 3 0 1 4 2 4 1 0 5 2 1 3 0
4 2 4 3 5 1 2 3 4 0 1 2 3 2 1 3 2 0 1 4 2 3 1 2 0
S5. Las posibles respuestas a una encuesta son: MB (muy bueno), B (bueno), R (re-gular), M (malo) y MM (muy malo). Las respuestas de 50 personas fueron las si-guientes:
R B MB M R R MM MB M R
R MM R B R MB R R MB R
M R B R MB R R B R R
M R B R MB R R B R MM
R R B R R M R B B R
-
Pgina 11 de 40
Ordene los datos en una tabla con las frecuencias. Cuntas personas responden
M o MM? Qu porcentaje de personas responden B o MB?
S6. La siguiente tabla representa la puntuacin obtenida por 100 alumnos en un test que constaba de ocho preguntas.
Puntos 0 1 2 3 4 5 6 7 8
N alumnos 0 2 6 9 18 22 24 12 7
Realice la tabla de frecuencias.
Cuntos alumnos obtienen 5 puntos? Qu porcentaje representan?
Cuntos alumnos tienen 6 o ms puntos? Qu porcentaje representan?
2.1.5 Construccin de grficas adecuadas a cada caso Encontramos en los medios de comunicacin esplndidas construcciones grficas que nos
permiten con una ojeada entender de qu se nos habla y asimilar la informacin que all se
nos da. Si tenemos que representar una variable cuantitativa, utilizaremos un diagrama de
barras o un histograma, segn que las variables sean discretas o continuas. Para represen-
tar una variable cualitativa, utilizaremos un diagrama de sectores.
Diagrama de barras
Diagramas de barras Se utilizan para representar tablas de frecuencias correspondientes a variables cuantitativas discretas. Por eso, las barras son estrechas y se sitan sobre los valores puntuales de la va-riable. Tambin pueden utilizarse para representar variables cualitativas.
Ejemplo. Con los datos de la tabla, que representan las ventas de una tienda de electrodo-msticos en los meses indicados, realice el grfico correspondiente.
Histograma
Histograma Se utiliza para distribuciones de variable continua. Por eso, se usan rectngulos tan anchos como los intervalos.
Ejemplo. La tabla muestra los pesos en gramos de 42 pollos del mercado. Representare-mos los datos mediante un grfico estadstico.
-
Pgina 12 de 40
Polgonos de frecuencias
Polgonos de frecuencias
Se construyen uniendo los puntos medios de los rectngulos, bien de las barras de los dia-gramas o bien de los rectngulos de los histogramas, y prologando al principio y al final, hasta llegar al eje.
Ejemplo
Diagramas de sectores
Diagramas de sectores
A modo de tartas de colores, representan proporcionalmente la frecuencia o ngulo de cada sector. Se puede utilizar para todo tipo de variables, pero frecuentemente se usa para las va-riables cualitativas. Podemos establecer comparaciones utilizando diagramas de sectores para las mismas variables que correspondan a diferentes aos.
Ejemplo. La tabla muestra las preferencias deportivas de la juventud de una localidad.
Ftbol Baloncesto Natacin Atletismo
2 304 1 024 512 256
Para representar los datos en un diagrama de sectores tenemos que calcular el valor de ca-
da sector en funcin de la frecuencia de cada modalidad. As, el rea de cada sector tiene
que ser proporcional a la frecuencia absoluta de la modalidad correspondiente.
-
Pgina 13 de 40
El desafortunado uso de un grfico en la prensa
El grfico que se aporta apareci en La Voz de Galicia el pasado 12 de enero de 2008 para ilustrar el incremento del nme-ro de casos atendidos en los hospitales gallegos debido a la gripe. La verdad es que es muy desafortunado, ya que a prime-ra vista el grfico da una idea de que hay un aumento muy grande; pero, si nos fijamos en l, observamos que el grfico es-t mal construido, pues no se pueden unir, mediante lneas, modalidades que en principio no tienen relacin ninguna. En un carcter estadstico cualitativo (atributo), como es este, en el que las modalidades son las ciudades donde se mide la fre-cuencia con que se acude a sus hospitales, el grfico ms adecuado sera un diagrama de barras o un diagrama de secto-res.
Uso de la hoja de clculo Excel para a realizacin de un grfico Para realizar estas representaciones grficas utilizaremos una hoja de clculo. Una hoja de
clculo es un cuadro formado por celdas en que se pueden colocar nmeros, textos o fr-
mulas. Cada celda se identifica con una letra, que indica la columna, y un nmero, que in-
dica la fila.
Algunos programas de ordenador estn diseados para manejar hojas de clculo: Excel, Spreadpdr, Calco, GS Calc, Freegrid...
-
Pgina 14 de 40
Se realiz una encuesta a 28 personas para saber el nmero de hermanos de cada uno y las
respuestas fueron las siguientes:
1 2 1 5 1 0 1 2 3 2 1 2 1 3 1 2 4 2 2 0 2 2 1 2 1 2 0
Intentaremos representar estos datos con la ayuda de una hoja de clculo Excel. Daremos
los pasos siguientes:
.
Abrimos el programa Excel, dentro de Inicio > Programas > Excel y colocamos los datos formando una tabla. En la primera columna colocamos los posibles valores y en la segunda, las frecuencias absolutas de cada uno.
Seleccionamos columna de frecuencias y pulsamos en el icono que nos lleva al Asistente para grficos, que se-alamos antes. Elegimos el tipo de grfico y un subtipo, por ejemplo Columnas y Columna agrupada con efecto 3D.
-
Pgina 15 de 40
Pulsando Siguiente se pasa por varios mens para definir las caractersticas del grfico. En el men Serie, se-leccionamos Rtulos para el eje de categoras para marcar los datos de la primera columna, que luego aparece-rn en el eje horizontal.
En el men Ttulos, se indican los nombres que queremos que aparezcan en el eje horizontal (eje de catego-ras) y en el eje vertical (eje de valores). En Leyenda, se desactiva Mostrar leyenda.
Pulsando Finalizar, ya tenemos el grfico listo. Una vez acabado, llevando el puntero a cada zona se puede modificar el contenido y el formato de esa zona.
-
Pgina 16 de 40
Actividad resuelta
La frecuencia con que acude por semana a la biblioteca el alumnado de un centro esco-lar se puede observar en la tabla siguiente. Realice un diagrama de barras, uno de sec-tores y un polgono de frecuencias.
Solucin
Actividad propuesta
S7. La tabla siguiente muestra las superficies, en millones de kilmetros cuadrados, de los ocanos del mundo. Represntelos en un diagrama de sectores.
Pacfico Atlntico ndico rtico
165 81 73 27
2.1.6 Parmetros estadsticos. Clculo y significado Despus de obtener los datos de una distribucin, necesitamos sintetizar la informacin
para su posterior anlisis. Para eso, obtendremos los parmetros estadsticos que sern de
dos tipos: de centralizacin y de dispersin.
Parmetros de centralizacin
Nos indican en torno a qu valor se distribuyen los datos.
Parmetros de dispersin
Nos informan sobre cunto se alejan del centro los valores de la distribucin.
Medidas de centralizacin
Media Si llamamos, x1, x2, ... xn a los valores que toma una distribucin estadstica, la media o trmino medio, se calcula as: x = N
x
N
xxx in =
+++ ........21
Mediana Si ordenamos los datos de la distribucin de menor a mayor, la mediana, Me, es el valor que se en-cuentra en el medio; es decir, deja tantos individuos antes, como despus. Si el nmero de datos fuese par, a la mediana se le asigna el valor medio de los dos trminos centrales.
Moda Este valor es el que ms frecuencia tiene, y lo conocemos por Mo.
-
Pgina 17 de 40
Estos valores son alrededor de los que se distribuyen todos los valores de la distribucin.
Cuartiles
Los cuartiles de una serie estadstica son Q1, Q2, y Q3, de tal modo que: Q1 deja a su izquierda el 25 % de los datos. Q2 deja a su izquierda el 50 % de los datos y coincide con la mediana. Q3 deja a su izquierda el 75 % de los datos.
Medidas de dispersin
Veremos ahora unos parmetros que sirven para medir cmo de dispersos estn los datos.
En todos ellos, lo fundamental es medir el grado de separacin de los datos con respecto a
la media.
Recorrido o rango
Es la diferencia entre el dato mayor y el menor. Viene siendo la longitud del tramo dentro del cual estn los datos.
Desviacin media
Trmino medio de las distancias de los datos a la media. Se en-cuentra con la media de las dife-rencias en valor absoluto.
Varianza
Es el trmino medio de los cuadrados de las distan-cias de los datos a la me-dia.
La varianza tiene el problema de que las unidades en que se expresa, al estar elevadas al
cuadrado, desvirtan las medidas. As, por ejemplo, si estudiamos las estaturas, al elevar
al cuadrado las unidades seran cm2, y esto no representa una longitud, sino una superficie.
Por eso extraemos su raz cuadrada, es decir, la desviacin tpica.
Desviacin tpica Es la raz cuadrada de la varianza. ianzavar=
A partir de ahora prestaremos especial atencin a los parmetros, media ( x ) y desviacin tpica ( ).
Uso de la calculadora
Para el clculo de estos parmetros podemos utilizar la calculadora, de pantalla sencilla o descriptiva, pero siempre una calculadora cientfica y trabajando en modo estadstico: modo SD.
-
Pgina 18 de 40
Prepare la calculadora en modo SD.
Borre los datos anteriores: INV AC.
Introduzca los datos, escribiendo los valores y pulsando la tecla DATA.
Resultados (teclas):
n: da el nmero de datos introducidos.
x : da el valor de la media. n : da el valor de la desviacin tpica.
Actividades resueltas
Juan fue anotando las temperaturas de su pueblo durante los siete das de una semana:
19 C 21 C 19 C 18C 18 C 20 C 18C
Qu valores representan las temperaturas de esa semana?
Solucin
Calculamos la media:
As que la media ser x = 19 C Calculamos la mediana: si ordenamos los datos de menor a mayor tendremos: 18, 18, 18,19, 19, 20, 21,
as que el trmino que deja tantos elementos antes como despus es 19C. As que la mediana ser Me = 19 C.
Calculamos la moda: si observamos los datos vemos que 18 C es la temperatura que ms se repite. As que la moda ser Mo = 18 C
Calculamos los cuartiles: Q1, Q2 y Q3. Q2 coincide con la mediana, por lo que ser 19 C. Q1 ser el trmino que deje antes el 25 % de los valores.
Dados los datos siguientes, los ordenamos en una tabla de frecuencias y calculamos las medidas de centralizacin.
12 10 11 13 12 11 13 12 13 13 12 13 11 12 13 13 11 12 11 12 11 14 12 14 12 11 12 13 11 13
Solucin
Haremos primero un recuento de los datos y los ordenaremos en la tabla de frecuencias.
Calculamos la media. Tendremos que sumar los datos de la variable y dividir por el nmero total de datos,
-
Pgina 19 de 40
pero si nos fijamos en los datos, vemos que varios estn repetidos, es decir, su frecuencia absoluta es ma-yor que 1, por lo que resulta ms fcil, multiplicar un determinado valor por su frecuencia. Es ms fcil calcular 12 x 10 que sumar el valor 12 diez veces: aplicamos multiplicacin en lugar de la suma reiterada. Si nos fijamos en la tercera columna, representa esta operacin. Por lo tanto, la media quedar:
x = 1,1230
363=
Solucin
Calculamos la moda. Ser el valor que tenga mayor frecuencia, ya que esto quiere decir que es el valor que ms se repite. Luego, la media ser Mo = 12
Calculamos la mediana. Como en este caso tenemos un nmero de datos par, ser la media de los dos trminos centrales, cuando estos estn ordenados. Los dos son el 12. Entonces, la mediana ser:
Me = 122
1212=
+
Esta informacin que ofrecen los parmetros de centralizacin nos dice que estos datos estn todos alre-dedor del valor 12. Surge, entonces, la siguiente pregunta: si todos estn alrededor del valor 12, son todos prximos a 12? Esta pregunta tiene sentido, si pensamos que para obtener 12 de media podemos partir de 2 y 22 o bien de 14 y 10. En ambos casos la media es 12, pero los datos de partida son bien diferentes. Esto hace necesario conocer ms sobre los datos de la distribucin, y para eso tenemos los parmetros de dispersin, que nos informarn de cmo estn de aproximados los datos de la tabla
Obtener las medidas de dispersin de la siguiente distribucin de notas:
2 4 4 4 5 7 9 9 10
Solucin
Recorrido o rango : 10-2= 8 x = 6
DM = 44,29
22
9
......646462==
+++
Var = ( ) ( ) 11,79
64
9
......646222
==++
= 67,211,7 =
Despus de obtener los parmetros veremos su significado. Conjuntamente, la media y la desviacin tpica nos informan de cmo estn distribuidos los datos; en este caso de cmo son las notas de partida. La media vale 6 y la desviacin tpica, 2,67. Esto nos dice que entre 6 - 2,67 y 6 + 2,67, se encuentra la mayor parte de las notas, alrededor del 68 %, como se puede comprobar mirando los datos iniciales. El rango vale 8, y est marcndonos el tipo de datos de partida; las notas estn muy dispersas. Tendremos en cuenta que para obtener un 6 de media, lo podemos hacer con un 2 y un 10, pero tambin con un 7 y un 5; en este caso el recorrido sera 2, mucho ms corto.
-
Pgina 20 de 40
Actividad propuesta
S8. Dadas las distribuciones siguientes:
Determine la media y la desviacin tpica de cada una.
Represente en unos diagramas de barras cada distribucin.
Comente los resultados relacionando en cada caso la media y la desviacin t-
pica.
-
Pgina 21 de 40
2.2 Probabilidad
2.2.1 Experimento aleatorio En nuestra vida diaria nos encontramos muchas veces con acontecimientos de los que no
podemos predecir si ocurrirn o no. Dependen del azar.
Intentaremos predecir el resultado de estos experimentos: lanzar un dado, jugar a la bo-
noloto, lanzar una moneda al aire y medir la longitud de una circunferencia de la que co-
nocemos el radio.
Experimento aleatorio
Es aquel en el que no se puede predecir el resultado antes de realizarlo.
Para estudiar el azar y sus propiedades, realizaremos experimentos aleatorios y analizare-
mos diferentes situaciones. Tomemos como ejemplo el lanzamiento de un dado. Los posi-
bles resultados del lanzamiento de un dado serian:
Todos estos resultados forman el espacio muestral:
Y { }6,5,4,3,2,1= Todos los subconjuntos del espacio muestral se llaman sucesos. Algunos de ellos son:
A ={ }2,1 B = { }6,3 C = { }6,4,2 Diremos, entonces, que experimento aleatorio es aquel que depende del azar.
Espacio muestral
Son todos los posibles resultados de un experimento aleatorio.
Sucesos aleatorios
Son subconjuntos extrados del espacio muestral. A continuacin se exponen diferentes tipos de suce-sos.
Suceso elemental
Cada uno de los resultados posibles de un experimento.
Suceso compuesto
Cada suceso formado por dos o ms elementos del espacio muestral.
-
Pgina 22 de 40
Suceso seguro
El suceso que siempre se verifica.
Suceso imposible
El que no se realiza nunca.
Suceso contrario Si C es un suceso, llamaremos C , suceso contrario, al que se verifica cuando no se verifica C.
Actividad resuelta
Veamos en la prctica los conceptos que aparecen aqu. Tenemos un experimento alea-torio que consiste en lanzar al aire dos monedas; anotamos el resultado.
Solucin
El espacio muestral Y = { cc, cx, xc, xx} Sucesos elementales sern A ={ cc} B = {cx} C = {xc} D = {xx} Suceso compuesto, por ejemplo F = { cc, xc} Suceso seguro ser el suceso Y, ya que se verifica siempre uno de los posibles resultados cuando hace-
mos un lanzamiento de dos monedas. Suceso imposible ser G = {ccc}, ya que solo tenemos dos monedas, nunca pueden salir tres caras. Si queremos buscar un suceso contrario tendremos que partir de un cierto suceso.
Si A = { cc} A = { xc, cx, xx} Si F = {cc, xc} F = { cx, xx}
Actividades propuestas
S9. Determinar si los siguientes experimentos son o no aleatorios.
Lanzar una moneda al aire. Meter una botella en un cubo de
agua y ver qu cantidad vierte. Extraer una carta de una baraja.
Observar el nmero de das con lluvia de un mes.
Medir una circunferencia de 2 cm de radio.
Tirar una piedra y medir su acele-racin.
S10. Gire la aguja de la ruleta y observa dnde para:
Cul es el espacio muestral en casa caso? Escriba los sucesos elementales y un
suceso compuesto. Ponga un ejemplo de suceso seguro para cada caso. Ponga un
ejemplo de suceso imposible para cada caso.
-
Pgina 23 de 40
S11. Lanzamos un par de dados sobre la mesa. Anote el espacio muestral y los si-guientes sucesos: Suceso A: obtener una pareja de nmeros iguales.
Suceso B: obtener ocho puntos en la tirada.
2.2.2 Definicin de probabilidad y propiedades La probabilidad de un suceso indica el grado de confianza que podemos tener de que
acontezca. Lo expresaremos mediante un nmero comprendido entre 0 y 1. Para designar
la probabilidad de un suceso S, pondremos P[S].
Cuando la probabilidad sea un nmero prximo a cero, el suceso ser poco probable.
Siempre que la probabilidad sea un nmero prximo a uno, ser muy probable.
Ejemplo. Se lanza 1 000 veces una moneda y 1 000 veces una chincheta. Resultados:
Moneda Chincheta
F es la frecuencia absoluta y h la frecuencia relativa.
La suma de las frecuencias relativas siempre es 1
Observemos que, en el caso de la moneda, las frecuencias relativas de cara (c) y de cruz
(x), son prximas a 0,5. El valor de la frecuencia relativa es muy prximo al valor de la
probabilidad.
h [c] 0,5 y a h[x] 0,5
-
Pgina 24 de 40
Entonces P[c] = 0,5 y P[x] = 0,5
Los sucesos cara y el suceso cruz son sucesos contrarios o complementarios.
En el caso de la chincheta, las frecuencias relativas de P1 (punta hacia arriba) y P2
(hacia abajo) son muy distintas de 0,5.
Sus probabilidades son nmeros desconocidos, pero seguramente prximos a sus fre-
cuencias relativas.
Probabilidad de un suceso
Es el nmero al que se acerca la frecuencia relativa cuando un experimento se repite un nmero grande de veces.
Propiedades de la probabilidad:
La suma de las probabilidades de los sucesos elementales de un espacio muestral es 1.
La suma de la probabilidad de un suceso y la de su contrario es 1.
2.2.3 Ley de Laplace para el clculo de la probabilidad Cuando estamos ante un experimento aleatorio en que todos los sucesos elementales tie-
nen la misma probabilidad de salir, decimos que son equiprobables. Sera el caso del lan-zamiento de un dado, todos los nmeros tienen a misma probabilidad de salir.
Si calculamos el espacio muestral, estamos ante un espacio de sucesos equiprobables.
En esta situacin la regla de Laplace dice lo siguiente:
Regla de Laplace
La probabilidad de que se verifique un suceso A es:
Ejemplo: lanzamos un dado. Encontraremos la probabilidad de los siguientes sucesos:
A = { 2, 4, 6} B = {3, 4} C = {2} Y = {1, 2, 3, 4, 5, 6 }
A y B son sucesos compuestos, C es un suceso elemental e Y es el suceso seguro.
El espacio muestral es Y = {1, 2, 3, 4, 5, 6}, por lo tanto, hay seis casos posibles. Se trata
de un espacio de casos equiprobables y podemos aplicar la regla de Laplace.
P [ A ] =2
1
6
3= P [ B ] =
3
1
6
2= P [C ] =
6
1 P [ Y ] = 1
6
6=
Este ltimo suceso es el suceso seguro, y su probabilidad es 1.
Ejemplo: de una rifa se han vendido 1 000 papeletas numeradas del 1 al 1 000. Cul es la
probabilidad de que me toque si he comprado una papeleta? Y si compro siete?
-
Pgina 25 de 40
Lgicamente, todas las papeletas tienen la misma probabilidad de salir. Si solo compro
una papeleta, la probabilidad de ganar ser:
1000
1
Si compramos siete papeletas tendremos siete oportunidades entre mil de ganar, por lo que
la probabilidad ser:
1000
7
Los casos favorables son las papeletas compradas en cada caso, y los posibles son el total
de las papeletas de la rifa.
Actividad resuelta
En una bolsa que contiene una bola blanca y cien negras, sacamos una al azar.
a) Si B es el suceso sacar bola blanca y N sacar bola negra, entonces el espacio de sucesos Y ={ B,N } es un espacio de sucesos equiprobables?
b) Escriba un espacio muestral correspondiente a esta experiencia aleatoria que est
formado por sucesos elementales equiprobables.
Solucin a) Evidentemente no, ya que tenemos ms bolas negras que blancas.
b) Si las bolas negras estuviesen numeradas, y el espacio fuese Y = {B, N1, N2,N3.N100}
Actividades propuestas
S12. Indique en cada situacin si es posible aplicar la regla de Laplace y, en caso po-sitivo, escriba el espacio muestral correspondiente: Tirar una chincheta sobre la mesa y observar si cae con la punta hacia arriba o
apoyada en la punta y en la cabeza.
Extraer dos bolas consecutivas de una bolsa que contiene dos bolas blancas y
una negra.
S13. Un videoclub automtico estropeado reparte al azar las pelculas entre los clien-tes. Si tiene 30 infantiles, 125 de accin, 200 dramas y 94 comedias, cul es la probabilidad de que la pelcula sea comedia? Y de que no sea drama?
S14. Consideramos un experimento que consiste en lanzar un dado dodecadrico con las caras numeradas del 1 al 12. Calcule las probabilidades siguientes:
Sacar un 3 Sacar un mltiplo de 3 No sacar mltiplo de 3 Sacar nmero negativo Sacar menos de 20
-
Pgina 26 de 40
S15. Lanzamos dos dados y sumamos sus puntuaciones. Puede realizar un cuadro de doble entrada para no olvidar ningn resultado.
Cul es la probabilidad de que la suma sea 2?
Cul es la probabilidad de que la suma sea 1? C-mo se llama este suceso?
Cul es a probabilidad de que la suma sea menor que 6? Cul es el suceso contrario? Y su probabi-lidad?
-
Pgina 27 de 40
3. Resumen de contenidos
-
Pgina 28 de 40
4. Actividades complementarias S16. Indique para cada uno de los casos propuestos, la poblacin, la variable y el tipo
de variable.
Peso al nacer de los nios nacidos en
Lugo en 2007
Profesiones que quieren tener los estudiantes de un
centro
N de animales de compaa en los
hogares espaoles
Tiempo semanal dedicado por los
vigueses a la lectura del peridico
N de tarjetas amari-llas en los partidos de
la 10 sesin de la liga actual
S17. Recogemos en una tabla los vehculos matriculados durante el mes de octubre de 2007, aproximadamente.
Cul es el porcentaje de motocicletas matriculadas? Calcule el nmero exacto de vehculos matriculados si
sabemos que el nmero de autobuses fue de 279. El conjunto de los vehculos matriculados es poblacin
o muestra? De qu tipo de variable se trata?
S18. Mostramos la composicin del organismo humano en dos edades de la vida.
Cmo varia el porcentaje de agua corporal?
Si una persona de 25 aos pesa 75 kg, cul es la cantidad de agua que compone su organismo? Y de teji-do graso?
S19. Preguntados por el numero de libros ledos en el ultimo mes, un grupo de estu-diantes respondi lo siguiente:
Construya la tabla de frecuencias y realice el diagrama correspondiente.
-
Pgina 29 de 40
S20. Contando el nmero de erratas por pgina en un libro, Ana cont estos datos:
N de erratas 0 1 2 3 4 5
N de pginas 50 40 16 9 3 2
Determine la media y la desviacin tpica.
Cul es la moda?
Cul es el porcentaje de pginas con menos de dos erratas? Y con ms de
dos?
S21. Las tres distribuciones siguientes tienen la misma media. Cul es?
A B C
Sus desviaciones tpicas son 3,8; 1,3; y 2,9. Observando las grficas diga a quin
corresponde cada una.
S22. De cada una de las siguientes situaciones, indique si se le puede asignar pro-babilidad por la regla de Laplace, o no.
Lanzar una moneda al aire
En un equipo de ftbol, que un jugador meta un
gol
En un laboratorio far-macutico, que un
medicamento cure una enfermedad
En una bolsa con tres bolas rojas y dos blan-cas, sacar una y mirar
el color
S23. En una fbrica de sifones se seleccionaron 100 sifones de la produccin diaria y se comprob que uno era defectuoso. Qu probabilidad se le puede asignar al suceso sifn defectuoso?
S24. Un experimento consiste en extraer una bola de una urna que contiene una bola roja, una amarilla, una azul y una verde. Escriba el espacio muestral y calcule la probabilidad de sacar una bola de cada color.
S25. En una urna tenemos nueve bolas numeradas del 1 al 9. Extraemos una bola al azar. Determine la probabilidad de cada suceso:
A = sacar nmero par y A = sacar nmero impar
B = sacar nmero inferior a 15 C = sacar nmero negativo
S26. Realice una pequea investigacin sobre los juegos de azar, para comprobar cmo su prctica puede derivar en una enfermedad.
-
Pgina 30 de 40
5. Ejercicios de autoevaluacin
1. Un fabricante de tornillos analiza si cada tornillo es correcto o defectuoso. Indique el tipo de variable.
Discreta.
Continua.
Cualitativa.
2. Un fabricante de tornillos mide los tornillos de una partida para calcular su media. De qu tipo de variable se trata?
Discreta.
Continua.
Cuantitativa.
3. Tenemos que representar una distribucin de variable discreta, cul es el mejor grfico?
Diagrama de barras.
Histograma.
Diagrama de sectores.
4. Tenemos que representar grficamente una variable cualitativa, qu diagrama la represen-ta mejor?
Diagrama de barras.
Histograma.
Diagrama de sectores.
5. La media y la moda son:
Medidas de centralizacin.
Medidas de dispersin.
Miden las estadsticas.
6. Cul es la media de la siguiente distribucin: 2, 4, 4, 4, 5, 7, 9, 9, 10?
6
5
7
-
Pgina 31 de 40
7. Y a desviacin tpica?
3
2,4
2,6
8. Si tenemos la media y la desviacin tpica de una distribucin, cuntos datos hay en el in-tervalo ),( + xx ?
40 %
50 %
68 %
9. Lanzamos un dado. La probabilidad de obtener nmero par es:
3
1
2
1
1
10. La probabilidad de un suceso A es 0,6, la probabilidad de su contrario A ser:
1
0,7
0,4
-
Pgina 32 de 40
6. Solucionarios
6.1 Soluciones de las actividades propuestas S1.
A travs de la pgina www.ine.es, podr comprobar que el INE, es el Instituto Na-cional de Estadstica y encontrar a qu se dedica.
S2.
a) Poblacin: bebs nacidos en la provincia de Barcelona. Variable estadstica
continua.
b) Poblacin: alumnado del centro escolar elegido. Variable estadstica cualita-
tiva.
c) Poblacin: nmero de partidos jugados en la liga. Variable estadstica discre-
ta.
S3.
Para realizar una muestra lo podemos hacer por sorteo, y diremos que es una
muestra aleatoria simple. Si la poblacin se divide en estratos que clasifican sus
elementos (edad, tipo de trabajo, sexo) y conocemos su proporcin, conviene res-
petar la proporcin al elegir la muestra, se trata de una muestra estratificada.
S4.
Variable Frecuencia absoluta
0 9
1 10
2 12
3 9
4 8
5 2
Total 50
S5.
Variable Frecuencia absoluta
MB 6
B 9
R 27
M 5
MM 3
Total 50
Si sumamos el nmero de personas que responden M o MM, resultan ser 8.
-
Pgina 33 de 40
Si sumamos el nmero de personas que responden B o MB, resultan ser 15, que
son el 30 % del total.
S6.
Variable Frecuencia absoluta
0 0
1 2
2 6
3 9
4 18
5 22
6 24
7 12
8 7
total 100
Los alumnos que obtienen 5 puntos son 22 y representan el 22 % del total.
Los alumnos que reciben 6 o ms puntos son 24+12+7 = 43, y son el 43%.
S7.
S8.
Notas.
6=x 27,3= Siendo la desviacin tpica 3,27, parece claro que los datos de esta tabla estn bastante dispersos con respecto a la media, lo que se observa en
el diagrama de barras:
-
Pgina 34 de 40
Estaturas.
164=x 1,6= Aqu, por el contrario, tenemos poca desviacin con respecto a la media, los datos estn agrupados en torno a ella.
S9.
Lanzar una moneda y extraer una carta de la baraja son experimentos aleatorios;
los otros no.
S10.
1) Y = {1,2,3,4,5} Sucesos elementales A = {1}, B = {2}, C = {3}, D= {4}, F
={5} Suceso compuesto G = {1, 2} Suceso seguro = {sacar menos de 5} Suce-
so imposible = {sacar ms de 6}.
2) Y = {verde, amarillo, azul, naranja, carne} Sucesos elementales A = {verde}
Suceso compuesto {verde, carne} Suceso seguro ={sacar verde o carne o azul
o naranja o amarillo} Suceso imposible ={rojo}
S11.
Espacio muestral
Y = { (1,1,), (1,2),(1,3),(1,4),(1,5),(1,6),(2,1),..................................(6,1),
(6,2),(6,3),(6,4),(6,5),(6,6)}
Suceso A = {obtener una pareja de nmeros iguales} = {(1,1), (2,2), (3,3),
(4,4), (5,5), (6,6)}
Suceso B = {Obtener 8 puntos en la tirada} = { (2,6),(4,4), 6,2) }
S12.
En el caso de la chincheta, no se trata de sucesos equiprobables, como vimos en el
ejemplo. En el caso de las bolas, tampoco, ya que el nmero de bolas blancas y
negras es distinto.
S13.
p(sea comedia) =
449
94
-
Pgina 35 de 40
p(no sea drama) =
449
249
S14.
p(sacar 3) = 12
1
p(sacar mltiplo de 3) = 12
4
p(no sacar mltiplo de 3) = 12
8
p(sacar negativo) = 0 ; p(sacar < 20) = 1
S15.
p(suma sea 2) = 36
1
p(suma sea 1) = 0
Suceso imposible p(suma sea
-
Pgina 36 de 40
6.2 Soluciones de las actividades complementarias S16.
1) Poblacin: nios nacidos en Lugo en el 2007. Variable: cuantitativa conti-
nua.
2) Poblacin: el centro escolar. Variable: cualitativa.
3) Poblacin: la poblacin espaola. Variable: cuantitativa discreta.
4) Poblacin: los habitantes de Vigo. Variable: cuantitativa continua.
5) Poblacin: partidos jugados en la liga de ftbol. Variable: cuantitativa dis-
creta.
S17.
Porcentaje de motocicletas matriculadas: 100 69-17-1,25-015-02.= 12,4. O
sea, 12,4%
Nmero total: 279 x 100: 0,15 = 186 000 en total.
El conjunto de los vehculos es la poblacin.
La variable es cuantitativa discreta.
S18.
De agua, pasa de 62 a 53; disminuye en un 8,55 % (se calcula haciendo 53/62).
Ser el 62 % de 75 = 46,5 kg, y el 15 % de 75 = 11,25 kg de grasa.
S19.
S20.
Media = 1,008 d.t. = 1,15 Moda = 0 erratas. Porcentaje con < 2 erratas = 90/120 = 75%. Y con ms de 2 erratas el
15% restante
-
Pgina 37 de 40
S21.
La media es 7 y las desviaciones tpicas, analizando la distribucin de los datos,
son: C va con 3,9; A va con 1,3; y B con 2,9.
S22.
Al lanzar una moneda al aire, s.
Que un jugador meta gol, no.
Que un medicamento cure una enfermedad, no.
En una bolsa con bolas, s.
S23.
Suceso ={sifn defectuoso} = 0,01
S24.
Y = {Roja, amarilla, azul, verde}
P (sacar roja) = 0,25, e igual para cada uno de los otros.
S25.
p(A) =9
4
p(sacar impar) = 9
5
p(B) = 1
p(C) = 0
S26.
Este ejercicio pretende analizar las posibilidades de ganar en juegos de azar y
comprobar que esta aficin puede llegar a ser perjudicial.
-
Pgina 38 de 40
6.3 Soluciones de los ejercicios de autoevaluacin
1.
Cualitativa.
2.
Continua.
3.
Diagrama de barras.
4.
Diagrama de sectores.
5.
Medidas de centralizacin.
6.
6
7.
2,6
-
Pgina 39 de 40
8.
68 %
9.
2
1
10.
0,4
-
Pgina 40 de 40
7. Bibliografa y recursos
Bibliografa Matemticas 3. Editorial Anaya.
baco. Matemticas 3. Editorial SM.
Enlaces de internet [www.ine.es]
[http://descartes.cnice.mec.es/materiales_didacticos/estadistica_1_ciclo/indice.htm]
[http://descartes.cnice.mec.es/materiales_didacticos/Azar_y_probabilidad/index.htm]
[http://descartes.cnice.mec.es/materiales_didacticos/Calculadora_estadistica/manual.html]
Otros recursos
Calculadora y ordenador.