Análisis exploratorio(1).pdf
-
Upload
tanya-huerfano -
Category
Documents
-
view
44 -
download
3
Transcript of Análisis exploratorio(1).pdf
ANÁLISIS EXPLORATORIO
TEMA 3:
LOCALIZACIÓN: MEDIA, MEDIANA, CUARTÍLES
VARIABILIDAD: VARIANZA, DESVIACIÓN ESTÁNDAR (DE),, CV, RANGO, RANGO ENTE CUARTILES. NOTA: ERROR ESTÁNDAR (EE) ES TAMBIÉN UNA DESVIACIÓN ESTÁNDAR.
FORMA: HISTOGRAMAS, DIAGRAMAS DE CAJA, TALLOS Y HOJAS.
Docente : Adrián SantanaLic. En Matemáticas (Universidad de Cundinamarca)
Esp. en Estadística Aplicada (Fundación Universitaria Los Libertadores)M. Cs. Estadísticas (Universidad Nacional de Colombia)
En el capitulo anterior hemos visto cómo se pueden resumir los datos
obtenidos del estudio de una muestra (o una población) en una tabla
estadística o un gráfico.
No obstante, tras la elaboración de la tabla y su representación grafica, en
la mayoría de las ocasiones resulta más eficaz “condensar” dicha
información en algunos números que la expresen de forma clara y
concisa.
Los fenómenos biológicos no suelen ser constantes, por lo que seria
necesario que junto a una medida que indique el valor alrededor del cual
se agrupan los datos, se asocie una medida que haga referencia a la
variabilidad que refleje dicha fluctuación. FUNDACIÓN UNIVERSITARIA LOS LIBERTADORES Estadistica y Probabilidad 2
En este sentido pueden examinarse varias características, siendo las más comunes:
• Las medidas de tendencia central o de localización de los datos• La dispersión o variación con respecto a este centro; • Los datos que ocupan ciertas posiciones. • La simetría de los datos. • La forma en la que los datos se agrupan.
FUNDACIÓN UNIVERSITARIA LOS LIBERTADORES Estadistica y Probabilidad 3
MEDIDAS DE LOCALIZACIÓN
MEDIDA
POBLACION MUESTRA
MEDIA
xf x dx( )
n
x
x
n
i
i 1
MEDIANA f x dx
x
( )
1
2
Estadísticas de orden:
x x x x n( ) ( ) ( ) ( )...0 1 2
Si n impar 2/)1(~
nxx
Si n par 2
~ )12/(2/
nn xxx
MODA
max f(xx
)
max f(xx
)
CUANTILAS
(Cuartíles, Deciles, etc)
f x dx p
x
( )
Similar a la mediana pero divido
sobre 4 en el caso de cuartiles o
sobre 10 en los deciles.
FUNDACIÓN UNIVERSITARIA LOS LIBERTADORES Estadistica y Probabilidad 11
Estadistica y ProbabilidadFUNDACIÓN UNIVERSITARIA LOS LIBERTADORES 13
Ejercicios Estadística matemática pág. 6
Ejercicios copias
Estadistica y ProbabilidadFUNDACIÓN UNIVERSITARIA LOS LIBERTADORES 22
Tomado De Walpole, Probabilidad Y Estadística 8ª Edicion.
Hallar media, varianza y desviación estándar.
Estadistica y ProbabilidadFUNDACIÓN UNIVERSITARIA LOS LIBERTADORES 23
Ejercicio del calculo de las medidas de dispersión:
Calcular el rango, la varianza y desviación típica de las siguientes cantidades medidas en metros.
3,3,4,4,5.
Estadistica y ProbabilidadFUNDACIÓN UNIVERSITARIA LOS LIBERTADORES 32
Diagrama de caja y bigotes (BOX-plot)
Finding the median, quartiles and inter-quartile range.
12, 6, 4, 9, 8, 4, 9, 8, 5, 9, 8, 10
4, 4, 5, 6, 8, 8, 8, 9, 9, 9, 10, 12
Order the data
Inter-Quartile Range = 9 - 5½ = 3½
Example 1: Find the median and quartiles for the data below.
Lower Quartile
= 5½
Q1
Upper Quartile
= 9
Q3
Median = 8
Q2
Upper Quartile
= 10
Q3
Lower Quartile
= 4
Q1
Median = 8
Q2
3, 4, 4, 6, 8, 8, 8, 9, 10, 10, 15,
Finding the median, quartiles and inter-quartile range.
6, 3, 9, 8, 4, 10, 8, 4, 15, 8, 10
Order the data
Inter-Quartile Range = 10 - 4 = 6
Example 2: Find the median and quartiles for the data below.
2, 5, 6, 6, 7, 8, 8, 8, 9, 9, 10, 15
Median = 8 hours and the inter-quartile range = 9 – 6 = 3 hours.
Battery Life: The life of 12 batteries recorded in hours is:
2, 5, 6, 6, 7, 8, 8, 8, 9, 9, 10, 15
Mean = 93/12 = 7.75 hours and the range = 15 – 2 = 13 hours.
Discuss the calculations below.
The averages are similar but the measures of spread are significantly different since the extreme values of 2 and 15 are not included in the inter-quartile range.
4 5 6 7 8 9 10 11 12
Median
Lower Quartile
Upper Quartile
Lowest Value
Highest Value
BoxWhiskerWhisker
130 140 150 160 170 180 190
Boys
Girlscm
Box and Whisker Diagrams.
Box plots are useful for comparing two or more sets of data like that shown below for heights of boys and girls in a class.
Anatomy of a Box and Whisker Diagram.
BOX
PLOTS
Lower Quartile
= 5½
Q1
Upper Quartile
= 9
Q3
Median = 8
Q2
4 5 6 7 8 9 10 11 12
4, 4, 5, 6, 8, 8, 8, 9, 9, 9, 10, 12
Example 1: Draw a Box plot for the data below
Drawing a Box Plot.
Upper Quartile
= 10
Q3
Lower Quartile
= 4
Q1
Median = 8
Q2
3, 4, 4, 6, 8, 8, 8, 9, 10, 10, 15,
Example 2: Draw a Box plot for the data below
Drawing a Box Plot.
3 4 5 6 7 8 9 10 11 12 13 14 15
Upper Quartile = 180
Qu
Lower Quartile = 158
QL
Median = 171
Q2
Question: Stuart recorded the heights in cm of boys in his class as shown below. Draw a box plot for this data.
Drawing a Box Plot.
137, 148, 155, 158, 165, 166, 166, 171, 171, 173, 175, 180, 184, 186, 186
130 140 150 160 170 180 190cm
2. The boys are taller on average.
Question: Gemma recorded the heights in cm of girls in the same class and
constructed a box plot from the data. The box plots for both boys and girls are shown below. Use the box plots to choose some correct statements comparing heights of boys and girls in the class. Justify your answers.
Drawing a Box Plot.
130 140 150 160 170 180 190
Boys
Girls
cm
1. The girls are taller on average.
3. The girls show less variability in height.
4. The boys show less variability in height.
5. The smallest person is a girl.
6. The tallest person is a boy.
10
20
30
40
50
60
70
0
Cum
ulat
ive F
requ
enc
y
10 20 30 40 50 60 70
Minutes LateM
edia
n =
27
LQ
= 2
1
UQ
= 3
8
IQR = 38 – 21 = 17 mins
½
¼
¾
0 10 20 30 40 50 60
Box Plot from Cumulative Frequency Curve
CFC
? ?
We can now construct a partial box plot from our earlier work on
cumulative frequency curves.
MEDIDAS DE VARIABILIDAD
MEDIDA POBLACIÓN
MUESTRA
VARIANZA
2
2
x f x dx( )
1
1
2
2
n
xx
s
n
i
i
DESVIACIÓN ESTÁNDAR
2
2ss
COEFICIENTE DE VARIACIÓN
100
x
s
RANGO Xmáx - Xmin xmáx - xmin
RANGO ENTRE CUARTILES
Q Q3 1
13 qq
FUNDACIÓN UNIVERSITARIA LOS LIBERTADORES Estadistica y Probabilidad 43
Estadistica y ProbabilidadFUNDACIÓN UNIVERSITARIA LOS LIBERTADORES 46
Momento Central De Tercer Orden
El primer momento, es la media
El segundo momento menos el primer momento es la varianza.
El tercer momento sobre el cubo de la desviación estándar, es la asimetría
Estadistica y ProbabilidadFUNDACIÓN UNIVERSITARIA LOS LIBERTADORES 51
Ejercicio:
Ejercicio bio, pag 65.
Estadistica y ProbabilidadFUNDACIÓN UNIVERSITARIA LOS LIBERTADORES 55
Ejercicios Bioestadística pág.. 68
Ejercicios Wackerly pág.. 10
Dispersogramas
Independiente
Dependiente
FUNDACIÓN UNIVERSITARIA LOS LIBERTADORES Estadistica y Probabilidad 56