estadistica

download estadistica

of 47

description

estadistica basica

Transcript of estadistica

  • GESTION EMPRESARIALCENTRO DE SERVICIOS FINANCIEROSSENA

  • HISTORIABabilonia

    Egipto

    Hebreos3000 ac. Tablillas de arcilla-recopilar datos

    Analizaban datos poblacin y de la renta del imperio.

    Censo realizado por Moiss al salir de Egipto

  • HISTORIAChina

    Grecia

    RomaCensos 2238 AC.Estadstica agrcola, industrial y comercial.

    Censos con fines tributarios, sociales y militares.

    1er. Gobierno en recopilar cantidad datos:PoblacinSuperficieRentaRealizaban cada 5 aos un censo:Nacimientos, defunciones y matrimonios.Recuento peridico de ganadoRiquezas contenidas en tierras conquistadas.

  • HISTORIA

    Edad media

    Mtodo cientfico

    Capitn John Gaunt

    Laplace, Gauss y LegendreRecuento de tierras pertenecientes a la iglesia. 758 DC. Pipino El Breve, 762 DC. Carlomagno.

    Grandes aportes al mtodo cientfico, Leonardo Da Vinci, Coprnico, Galileo, Descartes.

    1662, efectu las predicciones sobre el numero de personas que moran por diferentes enfermedades y proporciones de nacimientos de varones y mujeres que deban esperar

    Conceptos bsicos 1800 a 1820, teora de errores y teora de mnimos cuadrados.

  • DEFINICIONTcnicas y procedimientos que permiten:RecogerOrdenarAnalizarPresentarDe manera que a partir de ellos se puedan inferir conclusiones.

  • POBLACIONSe utiliza para referirnos a un conjunto de cosas, personas o situaciones, que tienen alguna caracterstica comn que permite agruparlos.

  • MUESTRASubconjunto de una determinada poblacin, parte ms representativa.

  • EJERCICIODefine si corresponde a poblacin o a muestra:Las elecciones presidenciales.Censo nacional.El salario de 20 empleados de una multinacional.Hacer una encuesta a 100 personas que entraron a una tienda de las 896 que entraron a dicha tienda en un da.Hacer un estudio con todos los ancianos de un Asilo.

  • VARIABLE ESTADISTICACUANTITATIVASCUALITATIVASPesoEdadSueldoNumero de hijosSexoEstado civilColor de ojosGrado de instruccinCaracterstica de los elementos de la poblacin que se investiga.

  • VENTAJAS DEL MUESTREOAhorro de tiempo.Reduccin de costos.Posibilidad de una mayor profundidad y exactitud de resultados.Rapidez y operatividad de la informacin.

  • DESVENTAJAS DEL MUESTREODificultad de utilizacin de la tcnica de muestreo.Una muestra mal seleccionada o sesgada distorsiona los resultados.Limitaciones propias del tipo de muestreo.

  • TIPOS DE MUESTREOPROBABILISTICONO PROBABILISTICOMuestreo aleatorio simple.Muestreo aleatorio sistemtico.Muestreo aleatorio estratificado.Muestreo aleatorio por conglomerados.Accidental.Por cuotas.Por conveniencia.

  • MUESTREO ALEATORIO SIMPLE.Se escoge al azar, todos los elementos tienen la misma posibilidad de ser escogido.

  • MUESTREO ALEATORIO SISTEMTICO.Se seleccionan los elementos de una manera ordenada, el 1er. Elemento es seleccionado al azar.K=N/n donde,N=Tamao de la Poblacinn=Tamao de la muestraK=Intervalos

  • MUESTREO ALEATORIO ESTRATIFICADOConsiste en dividir la poblacin previamente en grupos o clases que se suponen homogneos en la caracterstica a estudiar.Cada estrato asignara una cuota de los elementos de la muestra.Asignacin proporcional = El tamao de cada estrato en la muestra es proporcional a su tamao en la poblacin.

  • MUESTREO ALEATORIO POR CONGLOMERADOSCuando la poblacin se encuentra dividida de manera natural en grupos que se suponen que contienen toda la variabilidad de la poblacin.

    Ejemplo: Zonas geogrficas.

  • NO PROBABILISTICOAccidental

    Por conveniencia

    Por cuotasEscoge aquellos elementos que estn disponibles en el momento.

    Fijar cuotas, cada cuota consiste en un numero de elementos que renen ciertas condiciones.

  • DEFINICIONES BASICASMedia aritmtica = promedioVarianza es una medida de dispersin.Desviacin estndar es una medida de dispersin, es la raz cuadrada de la varianza, es el promedio de la distancia de cada punto con respecto a la media.Marco muestral es el listado de los elementos que pertenecen a la poblacin, de los cuales se obtendr la muestra

  • FASES DE PROCESO DE ESTADISTICA

  • TIPOS DE ESTADISTICAESTADSTICA DESCRIPTIVAESTADSTICA INFERENCIALEs un conjunto de procedimientos que tienen por objeto presentar masas de datos por medio de tablas, grficos y/o medidas de resumen. De acuerdo a lo anterior, la estadstica descriptiva es la primera etapa a desarrollar en un anlisis de informacin.Es una parte de laEstadsticaque comprende los mtodos y procedimientos para deducir propiedades (hacer inferencias) de una poblacin, a partir de una pequea parte de la misma (muestra).

  • VARIABLE ESTADISTICASon c/u de las caractersticas o cualidades que poseen los individuos de la poblacin.

  • TABLA DE FRECUENCIASUna forma de presentar ordenadamente un grupo de observaciones, es a travs de tablas de distribucin de frecuencias. La estructura de estas tablas depende de la cantidad y tipo de variables que se estn analizando, siendo las ms simples las que se refieren a una variable

  • EJEMPLO TABLA DE FRECUENCIASe tienen las notas de una prueba de matemtica para 1000 alumnos de enseanza media de un determinado colegio.

  • DISTRIBUCION DE FRECUENCIAS

  • EJEMPLO TABLA DE FRECUENCIA

    DATOSFRECUENCIA ABSOLUTAFRECUENCIA ABSOLUTA ACUMULUDAFRECUENCIA RELATIVAFRECUENCIA RELATIVA ACUMULADASUMATORIAxi.nxiniNifiFixi.n1,2110,0010,0011,2 1,44 1,4230,0020,0032,8 3,92 1,6360,0030,0064,8 7,68 1,88140,0080,01414,4 25,92 218320,0180,03236 72,00 2,214460,0140,04630,8 67,76 2,419650,0190,06545,6 109,44 2,622870,0220,08757,2 148,72 2,8251120,0250,11270 196,00 3261380,0260,13878 234,00 3,2271650,0270,16586,4 276,48 3,4311960,0310,196105,4 358,36 3,6352310,0350,231126 453,60 3,8382690,0380,269144,4 548,72 4453140,0450,314180 720,00 4,2463600,0460,36193,2 811,44 4,4484080,0480,408211,2 929,28 4,6524600,0520,46239,2 1.100,32 4,8585180,0580,518278,4 1.336,32 5605780,060,578300 1.500,00 5,2566340,0560,634291,2 1.514,24 5,4546880,0540,688291,6 1.574,64 5,6517390,0510,739285,6 1.599,36 5,8507890,050,789290 1.682,00 6468350,0460,835276 1.656,00 6,2448790,0440,879272,8 1.691,36 6,4409190,040,919256 1.638,40 6,6329510,0320,951211,2 1.393,92 6,8319820,0310,982210,8 1.433,44 71810000,0181126 882,00 N10001 4.716,20 23.966,76

  • TIPOS DE GRAFICOSEl histograma:Es una representacingrficade unavariableen forma de barras, donde la superficie de cada barra es proporcional a lafrecuenciade los valores representados.

  • TIPOS DE GRAFICOSEl polgono de frecuencias:Es un grfico de puntos en el cual se muestra la distribucin dibujada punto por punto representando los valores especficos de la variable bajo estudio.

  • TIPOS DE GRAFICOSLa ojiva o polgono de frecuencia acumulada:Muestra justamente las frecuencias acumuladas.

  • TIPOS DE GRAFICOSGrfico circular o torta:Permite ver la distribucin interna de los datos que representan un hecho, en forma de porcentajes sobre un total.

    CANTIDAD%Rojos2512,50%Verde3618,00%Azules4422,00%Gris8542,50%Blancos105,00%TOTAL200100,00%

    Grfico2

    25

    36

    44

    85

    10

    COLOR DEL CELULAR

    Hoja1

    DATOSFRECUENCIA ABSOLUTAFRECUENCIA ABSOLUTA ACUMULUDAFRECUENCIA RELATIVAFRECUENCIA RELATIVA ACUMULADASUMATORIAxi.n

    xiniNifiFixi.n

    1.20110.0010.0011.21.44

    1.40230.0020.0032.83.92

    1.60360.0030.0064.87.68rojos2512.50%

    1.808140.0080.01414.425.92verde3618.00%

    2.0018320.0180.0323672.00azules4422.00%

    2.2014460.0140.04630.867.76gris8542.50%

    2.4019650.0190.06545.6109.44blancos105.00%

    2.6022870.0220.08757.2148.72200100.00%

    2.80251120.0250.11270196.00

    3.00261380.0260.13878234.00

    3.20271650.0270.16586.4276.48

    3.40311960.0310.196105.4358.36

    3.60352310.0350.231126453.60

    3.80382690.0380.269144.4548.72

    4.00453140.0450.314180720.00

    4.20463600.0460.36193.2811.44

    4.40484080.0480.408211.2929.28

    4.60524600.0520.46239.21,100.32

    4.80585180.0580.518278.41,336.32

    5.00605780.060.5783001,500.00

    5.20566340.0560.634291.21,514.24

    5.40546880.0540.688291.61,574.64

    5.60517390.0510.739285.61,599.36

    5.80507890.050.7892901,682.00

    6.00468350.0460.8352761,656.00

    6.20448790.0440.879272.81,691.36

    6.40409190.040.9192561,638.40

    6.60329510.0320.951211.21,393.92

    6.80319820.0310.982210.81,433.44

    7.001810000.0181126882.00

    N100014,716.2023,966.76

    Hoja1

    COLOR DEL CELULAR

    Hoja2

    Hoja3

  • MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central son valores numricos que tienden a localizar la parte central de un conjunto de datos. Nos dan un centro de la distribucin de frecuencias, es un valor que se puede tomar como representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos.

  • LA MEDIA ARITMTICA Es la suma de los valores de todas las observaciones divididas por el nmero total de datos.

    DondeXt : El valor de cada elemento de 1 hasta nn : Cantidad total de datos

  • LA MEDIA ARITMTICA Cuando se tiene una distribucin de frecuencias el promedio se calcula por:

  • MEDIANASe define como el valor que deja igual nmero de observaciones a su izquierda que a su derecha, es decir, divide al conjunto de datos en dos partes iguales. Si los datos no estn tabulados la mediana se determina, ordenando las observaciones de menor a mayor y determinando el valor central. Si la cantidad de datos es impar, la mediana se representa justamente por ese valor. En cambio, si la cantidad es par, la mediana es el promedio de los datos centrales.

  • MEDIANA

  • MODA Es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. Puede haber ms de una moda en una distribucin. UNIMODALBIMODALMULTIMODAL

  • MEDIDAS DE DISPERSINLas medidas de dispersin indican la mayor o menor concentracin de los datos con respecto a las medidas de centralizacin.Mayor dispersinMenor dispersin

  • DESVIACIN ESTNDAR Tambin llamada desviacin tpica, es una medida de dispersin usada en estadstica que nos dice cunto tienden a alejarse los valores puntuales del promedio en una distribucin. Especficamente, la desviacin estndar es "el promedio de la distancia de cada punto respecto del promedio".

  • DESVIACIN ESTNDAR La frmula para calcular la desviacin estndar es:Dado que se tiene una distribucin de frecuencias, la desviacin se calcula por:

  • VARIANZALa varianza (que es el cuadrado de la desviacin estndar:2) se define as:Es la media de las diferencias con la mediaelevadas al cuadrado.

  • PROCEDIENDO PARA ESTIMAR EL TAMAO DE MUESTRAIdentificar si se trata de una poblacin infinita o finita.Se determina la desviacin estndar.Se define el nivel de confianza Z, utilizando la funcin de distribucin normal.Se define el error de estimacin E (diferencia entre la media muestral y la media poblacional que esta dispuesta a aceptar la investigacin).Se calcula el valor del tamao de muestra representativo.

  • TIPO DE POBLACIONPoblacin finitaPoblacin infinitaCuando el nmero de elementos que la forman es finito, por ejemplo el nmero de alumnos de un centro de enseanza, o grupo clase.Cuando el nmero de elementos que la forman es infinito, o tan grande que pudiesen considerarse infinitos. Como por ejemplo si se realizarse un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas calidades que esta poblacin podra considerarse infinita.

  • Poblacin infinitaEjemplo: A cuantas personas tendramos que estudiar para conocer la prevalencia de diabetes?Seguridad = 95%; Precisin = 3%: Proporcin esperada = asumamos que puede ser prxima al 5%; si no tuvisemos ninguna idea de dicha proporcin utilizaramos el valor p = 0,5 (50%) que maximiza el tamao muestral:donde:Za 2 = 1.962 (ya que la seguridad es del 95%) p = proporcin esperada (en este caso 5% = 0.05) q = 1 p (en este caso 1 0.05 = 0.95) d = precisin (en este caso deseamos un 3%)

  • Poblacin finitadonde:N = Total de la poblacin Za2 = 1.962 (si la seguridad es del 95%) p = proporcin esperada (en este caso 5% = 0.05) q = 1 p (en este caso 1-0.05 = 0.95) d = precisin (en este caso deseamos un 3%).

  • EJERCICIOEl dueo de un almacn quiere saber a que edad especifica puede enfocar su estrategia para captar mas clientes, toma la edad de 10 de sus clientes quienes son representativos de la totalidad de sus clientes y las edades son: 25, 30, 45, 50, 27, 32, 33, 35, 25, 37.Se desea conocer la media aritmtica, mediana, moda, varianza y desviacin estndar.Adems se requiere una tabla de frecuencias, un histograma y un grafico circular donde se presenten las edades en intervalos de 10 aos, adems de los datos solicitados en el punto anterior.Al realizar los anteriores anlisis, que se concluye?.

  • TIPOS DE GRAFICOSDiagrama de Pareto:Es una grfica para organizar datos de forma que estos queden en orden descendente, de izquierda a derecha y separados por barras. Permite, pues, asignar un orden de prioridades.

    CAUSAFRECUENCIAFRECUENCIA RELATIVA ACUMULADAcausa 125023,97%causa 220043,14%causa 318060,40%causa 414073,83%causa 54678,24%causa 64182,17%causa 74086,00%causa 83889,65%causa 93192,62%causa 102795,21%causa 112597,60%causa 1225100,00%