probabilidad

97
UNIDAD 1.

description

unidad de 1 a 5

Transcript of probabilidad

Poblacin y muestra aleatoria.

Unidad 1.Poblacin y muestra aleatoria.Poblacin.Es el conjunto de elementos que son objeto de estudio estadstico. Muestra aleatoria.Cada uno de los elementos de la poblacin. El nmero total de individuos de la poblacin se suele representar por la letra N.Obtencin de datos estadsticos.Son nmeros que pueden ser comparados, analizados e interpretados y el campo del cual son tomados se identifica como poblacin o universo.

Para qu necesitamos recolectar datos?Proporciona la introduccin imprescindible para un estudio de investigacin.Medir el desempeo en un servicio o proceso de produccin.Ayudar en la formulacin de alternativas para la toma de decisiones.Satisfacer nuestra curiosidad.

Hay, por lo menos, tres maneras de obtener datos y son los siguientes:Utilizar los datos publicados por fuentes gubernamentales, industriales o particulares.A travs de la experimentacin.Realizando encuestas.

ejemplo

La profesora ha hecho una encuesta a los veinte estudiantes de su clase.

Los nmeros que ves en la tabla son el resultado de realizar el recuento, y se denominan datos estadsticos: 2, 5, 7,... Medidas de tendencia centralLa medidas de centralizacin nos indican en torno a qu valor (centro) se distribuyen los datos.La medidas de centralizacin son:ModaLa moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo.Se puede hallar la moda para variables cualitativas y cuantitativas.Hallar la moda de la distribucin:2, 3, 3, 4, 4, 4, 5, 5 Mo= 4 Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas.1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.2, 2, 3, 3, 6, 6, 9, 9Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de las dos puntuaciones adyacentes.0, 1, 3, 3, 5, 5, 7, 8Mo = 4

Medidas de dispersin Las medidas de centralizacin ayudan a determinar el centro de gravedad de una distribucin estadstica. Para describir el comportamiento general de la serie se necesita, sin embargo, una informacin complementaria para saber si los datos estn dispersos o agrupados. As, las medidas de dispersin pueden definirse como los valores numricos cuyo objeto es analizar el grado de separacin de los valores de una serie estadstica con respecto a las medidas de tendencia central consideradas.Las medidas de dispersin son de dos tipos: Medidas de dispersin absoluta: como recorrido, desviacin media, varianza y desviacin tpica, que se usan en los anlisis estadsticos generales. Medidas de dispersin relativa: que determinan la dispersin de la distribucin estadstica independientemente de las unidades en que se exprese la variable. Se trata de parmetros ms tcnicos y utilizados en estudios especficos, y entre ellas se encuentran los coeficientes de apertura, el recorrido relativo, el coeficiente de variacin (ndice de dispersin de Pearson) y el ndice de dispersin mediana.

EJEMPLO.Calcular la desviacin media de la distribucin: 3, 8, 8, 8, 9, 9, 9, 18SolucinSe calcula la media aritmtica:

Se calcula la desviacin media.

CUARTILESCuartiles

Los cuartiles son los valores de la variable que dividen los datos en cuatro partes, por su puesto, una vez ordenados de menor a mayor.Los cuartiles son:Q1primer cuartil o cuartil inferior, hay un cuarto de los datos menores que l, dicho de otro modo el 25% de los datos son menores. Coincide con P25.Q2segundo cuartil o cuartil intermedio, el 50% de los datos son menores que l. Coincide con la mediana, D5 y P50.Q3 tercer cuartil o cuartil superior, deja el 75% de los datos de debajo. Coincide con P75.En el caso de variables discretas para obtener Q1buscamos la primera observacin que supere el 25% de los datos, esta observacin ocupar el lugar donde nes el total de observaciones y E representa la parte entera. Q2 coincide con la Mediana por tanto al calcular la mediana lo estamos calculando yQ3ocupar el lugar .En el caso en que tengamos una variable continua, como conocemos la relacin existente entre los percentiles y los cuartiles la frmula a usar ser una adaptacin:donde k=1,2,3.

eJEMPLOCalcular los cuartiles las series estadsticas:3, 5, 2, 7, 6, 4, 9.3, 5, 2, 7, 6, 4, 9, 1.10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 181

2

326/4 = 6.5 Q1 = 7 Q2 = Me = 10 (26 3)/4 = 19.5 Q3 = 14 [10, 15)[15, 20)[20, 25)[25, 30)[30, 35)fi 35742xi fi Fi [10, 15)12.533[15, 20)17.558[20, 25)22.5715[25, 30)27.5419[30, 35)32.5221212.Una distribucin estadstica viene dada por la siguiente tabla:Hallar los cuartiles 1 y 3.

xi fi Fi [0, 5)2.533[5, 10)7.558[10, 15)12.5715[15, 20)17.5823[20, 25)22.5225[25, )31.463131Calcular los Cuartiles 2 y 3:

4.El histograma de la distribucin correspondiente al peso de 100 alumnos de Bachillerato es el siguiente:

GrficosLasrepresentacionesgrficasdebenconseguirqueunsimpleanlisisvisualofrezcalamayorinformacinposible.Segneltipodelcarcterqueestemosestudiando,usaremosunarepresentacingrficauotra.Segnsealavariable,losgrficosmsutilizadosson:Diagramasdebarra.Diagramasdesectores.Histogramas

DIAGRAMASDEBARRASEsuntipodegrficoestadsticoqueseutilizaparavariablescualitativasydiscretas.EnelejeXsesitan:Lasmodalidadesdelavariablecualitativa.Losvaloresdelavariablecualitativadiscreta.ysobreellosselevantanbarrascuyaalturaseaproporcionalasusfrecuencias.Siseunenlosextremossuperioresdelasbarrasconunalneapoligonalseobtieneelpolgonodefrecuencias.

ejemploEjemplo1:Unestudiohechoenunconjuntode25personasconobjetodedeterminarsugruposanguneohaconducidoalossiguientesresultadosA,B,A,A,A,AB,O,A,A,A,O,B,O,A,B,O,B,O,A,B,B,A,A,O,B.

Cajas y alambresLos diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentacin visual que describe varias caractersticas importantes, al mismo tiempo, tales como la dispersin y simetra.Para su realizacin se representan los tres cuartiles y los valores mnimo y mximo de los datos, sobre un rectngulo, alineado horizontal o verticalmente. Construccin:Comparar distribucionesDiagrama de Caja a travs de Excel

Una grfica de este tipo consiste en una caja rectangular, donde los lados ms largos muestran el recorrido intercuartlico. Este rectngulo est dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relacin con los cuartiles primero y tercero(recordemos que el segundo cuartil coincide con la mediana). Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mnimo y mximo de la variable. Las lineas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen tienen un lmite de prolongacin, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente

ejemploUtilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que representan la edad de un colectivo de 20 personas. 36 25 37 24 39 20 36 45 31 3139 24 29 23 41 40 33 24 34 40 Para calcular los parmetros estadstico, lo primero es ordenar la distribucin20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45 Calculo de CuartilesQ1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribucin. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmtica de dicho valor y el siguiente:Q1=(24 + 25) / 2 = 24,5Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmtica de dicho valor y el siguiente:me= Q2 = (33 + 34)/ 2 =33,5 Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribucin. En nuestro caso, como 3N / 4 = 15, resulta Q2=(39 + 39) / 2 = 39

Diagrama de paretoEl Diagrama de Pareto consiste en un grfico de barras similar al histograma que se conjuga con una ojiva o curva de tipo creciente y que representa en forma decreciente el grado de importancia o peso que tienen los diferentes factores que afectan a un proceso, operacin o resultado.

Ejemplo

Precio del foco para la venta: $8.90Total de foco devueltos:167 unidades.De los 82 clientes directos que adquieren el producto, determinamos que 19 clientes son los que nos han devuelto el producto en el transcurso del ao 2005DEVOLUCIN DE FOCO AHORRADOR DE 65W EN UNIDADESEl objetivo del ejemplo es obtener las posibles causas de la devolucin del producto, lo cual analizaremos a los 19 clientes de acuerdo al Principio y Diagrama de Pareto.PRIMER PASO: Ordenar a los clientes de acuerdo a la frecuencia de devolucin en forma descendente.SEGUNDO PASO: Calcular el porcentaje, en lo cual debemos dividir el valor de la frecuencia de cada cliente por el total de devolucin.

Uso del softwareEl uso de ordenadores y calculadoras facilita el que los alumnos comprendan mejor temas complejos de matemticas. Es evidente que en muchos casos la tecnologa agiliza y supera, la capacidad de clculo de la mente humana, con ayuda de la tecnologa, los alumnos tienen ms tiempo para concentrarse en enriquecer su aprendizaje matemtico.

Unidad 2.Probabilidad de eventosUn experimento o fenmeno aleatorio es un proceso o accin cuyo resultado incierto.Ejemplos: Lanzar una moneda al aire y observar la cara superior.Marcar un telfono al azar del directorio y observar si contestan, no contestan o est ocupado

Es el conjunto de todos los posibles resultados de una experiencia aleatoria, lo representaremos por E (o bien por la letra griega ).

Espacio muestralEJEMPLO

Espacio muestral de una moneda:E = {C, X}. Espacio muestral de un dado:E = {1, 2, 3, 4, 5, 6}.Suceso aleatorioSuceso aleatorio es cualquier subconjunto del espacio muestral. Por ejemplo al tirar un dado un suceso sera que saliera par, otro, obtener mltiplo de 3, y otro, sacar 5.

Ejemplos de espacios muestrales1. Una bolsa contiene bolas blancas y negras. Se extraen sucesivamente tres bolas.E = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b); (n, n,n)}2. El suceso A = {extraer tres bolas del mismo color}.A = {(b,b,b); (n, n,n)}3. El suceso B = {extraer al menos una bola blanca}.B= {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b)}4. El suceso C = {extraer una sola bola negra}.C = {(b,b,n); (b,n,b); (n,b,b)}Ocurrencia de eventosLa unin de dos eventos es el evento que esta formado por todos los resultados contenidos en cualquiera de los eventos. La unin se denota por :

La interseccin de dos eventos es el evento que esta formado por los resultados contenidos en ambos eventos. La interseccin se denota por:

El complemento de un evento en un espacio muestral es el conjunto de resultados en el espacio muestral que no estn en el evento. Este componente del evento E se denota como E'Ejemplo

Permutaciones y combinacionesHay dos tipos de permutaciones:Se permite repetir: como la cerradura de arriba, podra ser "333".Sin repeticin: por ejemplo los tres primeros en una carrera. No puedes quedar primero y segundo a la vez.

Diagramas de arbolPara la construccin de un diagrama en rbol se partir poniendo una rama para cada una de las posibilidades, acompaada de su probabilidad.En el final de cada rama parcial se constituye a su vez, un nudo del cual parten nuevas ramas, segn las posibilidades del siguiente paso, salvo si el nudo representa un posible final del experimento (nudo final). Hay que tener en cuenta: que la suma de probabilidades de las ramas de cada nudo ha de dar 1.

Los axiomas de probabilidad son las condiciones mnimas que deben verificarse para que una funcin definida sobre un conjunto de sucesos determine consistentemente sus probabilidades.Axiomas de probabilidadEjemplo.

Independencia y probabilidad condicional

Ejemplo.

TEOREMA DE BAYES.El Teorema de Bayes viene a seguir el proceso inverso al que hemos visto en el Teorema de la probabilidad total:Teorema de la probabilidad total: a partir de las probabilidades del suceso A (probabilidad de que llueva o de que haga buen tiempo) deducimos la probabilidad del suceso B (que ocurra un accidente).Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un accidente) deducimos las probabilidades del suceso A (estaba lloviendo o haca buen tiempo?).La frmula del Teorema de Bayes es:

EJEMPLOEjercicio 1: El parte meteorolgico ha anunciado tres posibilidades para el fin de semana:a) Que llueva: probabilidad del 50%.b) Que nieve: probabilidad del 30%c) Que haya niebla: probabilidad del 20%.Segn estos posibles estados meteorolgicos, la posibilidad de que ocurra un accidente es la siguiente:a) Si llueve: probabilidad de accidente del 10%.b) Si nieva: probabilidad de accidente del 20%c) Si hay niebla: probabilidad de accidente del 5%.Resulta que efectivamente ocurre un accidente y como no estabamos en la ciudad no sabemos que tiempo hizo (nev, llovo o hubo niebla). El teorema de Bayes nos permite calcular estas probabilidades: Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se denominan "probabilidades a priori" (lluvia con el 60%, nieve con el 30% y niebla con el 10%).Una vez que incorporamos la informacin de que ha ocurrido un accidente, las probabilidades del suceso A cambian: son probabilidades condicionadas P (A/B), que se denominan "probabilidades a posteriori".Vamos a aplicar la frmula:

Unidad 3.Variables aleatorias.La variable que asocia un nmero con el resultado de un experimento aleatorio se le denomina como variable aleatoria.En otras palabras:"Una variable aleatoria es una funcin que asigna un nmero real a cada resultado en el espacio muestral de un experimento aleatorio."La variable aleatoria se denota tal como la letra mayscula X y con una letra minscula como x, el valor posible de X. El conjunto de los posibles valores de la variable aleatoria X recibe el nombre de rango de X.Por ejemplo: El sistema de comunicacin por voz de una empresa tiene 48 lneas externas. En un determinado momento, se observa el sistema y algunas lneas estn ocupadas. Sea X la variable aleatoria que denota el nmero de lneas en uso. Entonces X puede tomar cualquier valor entero de cero a 48Ntese que sobre un espacio muestral puede definirse mas de una variable aleatoria.

ejemploSe sacan dos bolas de manera sucesiva sin reemplazo de una urna que contiene cuatro bolas rojas y tres negras. Los posibles resultados y los valores y de la variable aleatoria Y, donde Y es el nmero de bolas rojas, son: EM y RR 2 RN 1 NR 1 NN 0

Distribucin de probabilidad discreta.Se denomina distribucin de variable discreta a aquella cuya funcin de probabilidad slo toma valores positivos en un conjunto de valores de finitooinfinito numerable. A dicha funcin se le llama funcin de masa de probabilidad. En este caso la distribucin de probabilidad es la suma de la funcin de masa, por lo que tenemos entonces que:

Y, tal como corresponde a la definicin de distribucin de probabilidad, esta expresin representa la suma de todas las probabilidades desde hasta el valor .

Ejemplo.xpix pix2 pi21/362/364/3632/366/3618/3643/3612/3648/3654 /3620/3 6100/3665/3630/36180/3676/3642/36294/3685/3640/36320/3694 /3636/36324/36103/3630/36300/36112/3622/36242/36121/3612/36144/36754.83

Se lanza un par de dados. Se define la variable aleatoria X como la suma de las puntuaciones obtenidas. Hallar la funcin de probabilidad, la esperanza matemtica y la varianza

Distribucin hipergeomtricaEnteora de la probabilidadladistribucin hipergeomtricaes unadistribucindiscreta relacionada conmuestreos aleatoriosy sin reemplazo. Supngase que se tiene una poblacin deNelementos de los cuales,dpertenecen a la categoraAyN-da laB. La distribucin hipergeomtrica mide la probabilidad de obtenerx( ) elementos de la categoraAen una muestra sin reemplazo denelementos de la poblacin original.La distribucin hipergeomtrica es aplicable a muestreos sin reemplazo y labinomiala muestreos con reemplazo. En situaciones en las que el nmero esperado de repeticiones en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda. Esto es as cuandoNes grande y el tamao relativo de la muestra extrada,n/N, es pequeo.

En una urna o recipiente hay un total deNobjetos, entre los cuales hay una cantidadade objetos que son defectuosos, si se seleccionan de esta urnanobjetos al azar, y sin reemplazo, cul es la probabilidad de obtenerxobjetos defectuosos?Solucin:Luego; donde:p(x,n) = probabilidad de obtenerxobjetos defectuosos de entrenseleccionadosmuestras denobjetos en donde hayxque son defectuosos yn-xbuenostodas las muestras posibles de seleccionar denobjetos tomadas de entreNobjetos en total = espacio muestralConsiderando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de seleccionan 4 objetos al azar, cul es la probabilidad de que 2 sean defectuosos?Solucin:N = 10 objetos en totala = 3 objetos defectuososn = 4 objetos seleccionados en muestrax = 2 objetos defectuosos deseados en la muestra

donde:

probabilidad asociada a cada muestra de 4 objetos que se seleccionaron, con lo que se demuestra que las probabilidades no son constantes

formas o maneras de obtener 2 objetos defectuosos entre los 4 seleccionados = muestras de 4 objetos entre los que 2 son defectuososComo se observa en el desarrollo de la solucin del problema, la pretensin es demostrar que las probabilidades asociadas a cada uno de los resultados no son constantes.Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar sera:

Distribucin de posicinEs unadistribucin de probabilidaddiscretaque expresa, a partir de una frecuencia de ocurrencia media, la probabilidad de que ocurra un determinado nmero de eventos durante cierto perodo de tiempo.La funcin de masa o densidad de la distribucin de Poisson esDonde

kes el nmero de ocurrencias del evento o fenmeno (la funcin nos da la probabilidad de que el evento suceda precisamentekveces). es un parmetro positivo que representa el nmero de veces que se espera que ocurra el fenmeno durante un intervalo dado.

ejemploUn agente de seguros vende plizas a cinco personas de la misma edad y que disfrutan de buena salud. Segn las tablas actuales, la probabilidad de que una persona en estas condiciones viva 30 aos o ms es 2/3. Hllese la probabilidad de que, transcurridos 30 aos, vivan:Soluciones:1Las cinco personasB(5, 2/3)p = 2/3q = 1/3

2Al menos tres personas

3Exactamente dos personas

Distribucin de probabilidad continuaEnteora de la probabilidadunadistribucin de probabilidadse llamacontinuasi sufuncin de distribucinescontinua. Puesto que la funcin de distribucin de unavariable aleatoriaX viene dada por , la definicin implica que en una distribucin de probabilidad continuaXse cumple P[X=a] = 0 para todonmero reala, esto es, la probabilidad de queXtome el valoraes cero para cualquier valor dea. Si la distribucin deXes continua, se llama aXvariable aleatoria continua.En las distribuciones de probabilidad continuas, la distribucin de probabilidad es la integral de lafuncin de densidad, por lo que tenemos entonces que:

ejemploLos trenes de una cierta lnea de cercanas pasan cada 20 minutos. Cuandollegamos a la estacin, ignoramos cundo pas el ltimo.La medida de la probabilidad del tiempo que tendremos que esperar a que paseel siguiente tren (TIEMPO DE ESPERA), se obtiene con la ayuda de la grfica adjunta. Observa que bajo ella hay 100 cuadritos.La probabilidad de que tengamos que esperar entre 10 y 16 minutos es del 30%(30 cuadritos de un total de 100). Es decir: P[10 x 16] = 0,30Procediendo de forma similar, halla las siguientes probabilidades e interpretalo que significan:a) P[x 2] b) P[5 x 10] c) P[x 10] d) P[5 x 6]a) P[x 2] = = 0,10La probabilidad de tener que esperar menos de 2 minutos es 0,10 (del 10%).b)P[5 x 10] = = 0,25La probabilidad de tener que esperar entre 5 y 10 minutos es del 25%.c) P[x 10] = = 0,50La probabilidad de tener que esperar menos de 10 minutos es del 50%.d)P[5 x 6] = = 0,05La probabilidad de tener que esperar entre 5 y 6 minutos es del 5%.

Distribucin tEs unadistribucin de probabilidadque surge del problema deestimarlamediade unapoblacinnormalmente distribuidacuando eltamao de la muestraes pequeo.Aparece de manera natural al realizar laprueba t de Studentpara la determinacin de las diferencias entre dos medias muestrales y para la construccin delintervalo de confianzapara la diferencia entre las medias de dos poblaciones cuando se desconoce ladesviacin tpicade una poblacin y sta debe ser estimada a partir de los datos de una muestra.La distribucin t de Student es la distribucin de probabilidad del cociente

dondeZtiene unalateralde media nula ymediana1xtiene una [[distribucin bilateral] con

grados de confianzaoyzsonindependientes

ejemploLos valores de las matriculas de estudiantes en una universidad privada tienen un comportamiento aproximadamente normal, donde el promedio es de 2.100.000. Se seleccionan 8 liquidaciones, siendo los valores los siguientes: 1.950.000, 2.100.000, 2.250.000, 1.890.000, 2.250.000, 1.950.000, 2.050.000, 2.350.000. Determine la probabilidad de que: El promedio sea menor de 2.000.000. El promedio se encuentre entre 2.000.000 y 2.200.000 El promedio sea mayor o igual a 2.500.000Solucin :Sea X = Liquidacin matriculas.m = 2.100.000 ; s = ?=2.098.750 s=168.644.8085 n=8a) P(