Resumen estadistica descriptiva resumen
Click here to load reader
-
Upload
carlo-herrera -
Category
Documents
-
view
4.275 -
download
0
Transcript of Resumen estadistica descriptiva resumen
Estadística descriptiva
La estadística descriptiva es una gran parte de la estadística que se dedica a
recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de
describir apropiadamente las características de ese conjunto. Este análisis es muy
básico. Aunque hay tendencia a generalizar a toda la población, las primeras
conclusiones obtenidas tras un análisis descriptivo, es un estudio calculando una
serie de medidas de tendencia central, para ver en qué medida los datos se
agrupan o dispersan en torno a un valor central. Esto es lo que podria ser un
concepto aproximado.
Estadística y Los Conceptos.
La Estadística es la ciencia que se encarga de recolectar datos de una población
o muestra. Los conceptos estadísticos se han trabajado intuitivamente desde la
antigüedad, las primeras culturas recopilaban datos poblacionales por medio de
censos como los realizados Egipto y por Moisés (según consta la Biblia) y el
empadronamiento que fue efectuado por los romanos en Judea, solo a partir del
siglo pasado Adolfo Qutelec (1796-1874) creo diferentes métodos para realizar
observaciones con el fin de determinar el tipo de datos que regulan algunos
fenómenos.
Lista de conceptos básicos en orden cronológico de estudio
La siguiente lista en orden cronológico para su estudio, recopila conceptos
básicos con los que, todo aquel que se pretenda iniciar en las
técnicas Estadísticas, debería estar familiarizado.
Probabilidad
Definición de
Estadística
Definición de
Descriptiva
Población
Estadístico
Frecuencia
Estadística
Media
Mediana
Desviación
estándar
Varianza
Varianza con
probabilidad
Moda
Tabla de
frecuencias
Análisis de
frecuencia
acumulada
Histograma
Estadística
Inferencia
Encuesta
Error estadístico
Variable
aleatoria
Variable
estadística
Análisis de series
temporales
Censo
Combinatoria
Diseño
experimental
Distribución
bionomíal
Distribución
normal
Distribución t
Grados de
libertad
Muestreo
Muestra
Parámetro
estadístico
Prueba de χ²
Regresión
estadística
Rango
Notación sumatoria
—o—
Los números cuya suma se indica en una notación sigma pueden ser naturales,
complejos u objetos matemáticos más complicados. Si la suma tiene
un número infinito de términos, se conoce como serie infinita.
Dada una sucesión:
Ésta se puede representar como la suma de los primeros términos con la notación
de sumatoria o notación sigma.
El nombre de esta notación se denomina de la letra griega
(sigma mayúscula, que corresponde a nuesta S de "suma" ).
La notación sigma es de la siguiente manera:
La suma de los primeros pares
Impares
*Ejemplo:
Medidas de tendencia central
Las medidas de tendencia central (media, mediana y moda) sirven como puntos de
referencia para interpretar las calificaciones que se obtienen en una prueba.
En resumen, el propósito de las medidas de tendencia central es:
Mostrar en qué lugar se ubica la persona promedio o típica del grupo.
Sirve como un método para comparar o interpretar cualquier puntaje en relación con el
puntaje central o típico.
Sirve como un método para comparar el puntaje obtenido por una misma persona en dos
diferentes ocasiones.
Sirve como un método para comparar los resultados medios obtenidos por dos o más
grupos.
Las medidas de tendencia central más comunes son:
La media aritmética: comúnmente conocida como media o promedio. Se representa por
medio de una letra M o por una X con una línea en la parte superior.
La mediana: la cual es el puntaje que se ubica en el centro de una distribución. Se
representa como Md.
La moda: que es el puntaje que se presenta con mayor frecuencia en una distribución. Se
representa Mo.
Medidas de forma
Las medidas de forma permiten comprobar si una distribución de frecuencia tiene
características especiales como simetría, asimetría, nivel de concentración de datos y
nivel de apuntamiento que la clasifiquen en un tipo particular de distribución.
Las medidas de forma son necesarias para determinar el comportamiento de los datos y
así, poder adaptar herramientas para el análisis probabilístico.
Medidas de forma: Son indicadores estadísticos que permiten identificar si una distribución
de frecuencia presenta uniformidad.
Medidas de dispersión
Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la
distribución.
Las medidas de dispersión son:
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribución
estadística.
Desviación media
La desviación respecto a la media es la diferencia entre cada valor de la variable
estadística y la media aritmética.
Di = x - x
La desviación media es la media aritmética de los valores absolutos de las desviaciones
respecto a la media.
La desviación media se representa por
Varianza
La varianza es una medida estadística que mide la dispersión de los valores respecto a un
valor central (media), es decir, es el cuadrado de las
desviaciones:
DATOS NO AGRUPADOS.
Los datos no agrupados son los datos sin procesar, y las estadísticas correctas pueden ser
determinadas. Los datos no agrupados son usualmente el punto de inicio de los análisis.
Es el conjunto de datos obtenidos en la recopilación, una vez que se han recopilado los
datos, el siguiente paso consiste en organizarlos.
1.- los datos son brutos(es decir, no se presentan clasificados)
2.- no es necesario clasificar ni generar una tabla de frecuentas, ya que no tiene “mucho
sentido”.
3.- elementos que menor tamaño (generalmente menor a 20 elementos).Esto no sucede
así siempre.
Aunque contemos con menos de 20 elementos, debe de verificarse que los datos no sean
significativos, Esto es: que la información no sea “repetitiva”, de esta forma, sabremos que
no se podrá clasificar y por lo tanto ser resumida en una “tabla de frecuencias”.
En caso de que una vez que hayamos ordenado los elementos, se cuente con datos
significativos. Procedemos a clasificarlos (si es posible, ya que también debemos de
buscar la lógica al clasificar los elementos) para convertirlos en “datos agrupados”.
4.- los datos no agrupados, también pueden ser ordenados y de la misma forma, también
se pueden obtener graficas, determinar media, desviación estándar, etc.
El hecho de que los datos “no agrupados” pueden ordenarse, no significa que se
conviertan en “datos agrupados”.
Ejemplos:
Vas a investigar la edad a un grupo de 20 Niños en datos no agrupados (es decir, vienen
los 20 niños y asi como te dan la edad asi la anotas
2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,6 (Total 20 niños)
Estos son datos no agrupados por qué no los has clasificado y contado
1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5,6 (Total 20 niños)
Los datos no agrupados también los puedes ordenar, por ejemplo de la edad menor a la
edad mayor, no están contabilizados ni clasificados solamente están ordenados
Para que sean datos agrupados tienes que contarlos y clasificarlos, por ejemplo cuántos
niños había de cada año. (y siguen siendo 20 niños)
Edad..........Frecuencia
1..................2
2..................4
3..................7
4..................4
5..................2
6..................1
Total............20
Medidas de posición
Las medidas de posición nos facilitan información sobre la serie de datos que estamos
analizando. La descripción de un conjunto de datos, incluye como un elemento de
importancia la ubicación de éstos dentro de un contexto de valores posible.
Son indicadores usados para señalar que porcentajes de datos dentro de una distribución
de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se
encuentra en el centro de la distribución de frecuencia, por lo que también se llaman
medida de tendencia central.
Medidas de posición más comunes:
- Cuartiles: hay tres cuartiles que dividen a una distribución en 4 partes iguales:
primero, segundo y tercer cuartil.
- Deciles: hay nueve deciles que la dividen en 10 partes iguales: (del primero al
noveno decil).
- Percentiles: hay noventa y nueve percentiles que dividen a una serie en 100 partes
iguales.
Medidas de Forma
Comparan la forma que tiene la representación gráfica, bien sea el histograma o el
diagrama de barras de la distribución, con la distribución normal.
MEDIDA DE ASIMETRÍA
Diremos que una distribución es simétrica cuando su mediana, su moda y su media
aritmética coinciden.
Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o
relativas) descienden más lentamente por la derecha que por la izquierda.
Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos
que la distribución es asimétrica a la izquierda.
Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es
el Coeficiente de Asimetría de Pearson:
Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la
derecha y negativo cuando existe asimetría a la izquierda.
MEDIDA DE APUNTAMIENTO O CURTOSIS
Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se
definen 3 tipos de distribuciones según su grado de curtosis:
Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los
valores centrales de la variable (el mismo que presenta una distribución
normal). Distribución leptocúrtica: presenta un elevado grado de concentración
alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un
reducido grado de concentración alrededor de los valores centrales de la variable.
EJEMPLO 1
El número de diás necesarios por 10 equipos de trabajadores para terminar 10 instalaciones
de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la
media, mediana, moda, varianza y desviación típica.
SOLUCIÓN:
La media: suma de todos los valores de una variable dividida entre el número total de
datos de los que se dispone:
La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la
otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la
secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los
dos valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media
de estos dos valores nos dará a su vez 60, que es el valor de la mediana.
La moda: el valor de la variable que presenta una mayor frecuencia es 60
La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la
variable y la media aritmética de la distribución.
Sx2=
La desviación típica S: es la raíz cuadrada de la varianza.
S = √ 427,61 = 20.67
El rango: diferencia entre el valor de las observaciones mayor y el menor
80 - 15 = 65 días
El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la
media aritmética CV = 20,67/52,3 = 0,39
Cuadro sinóptico de Estadística Descriptiva
Medidas descriptivas
Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que nos
resumen la información contenida en ella.