Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2:...
Transcript of Parte 2: Distribuciones muestrales - WordPress.com · 2015-01-19 · muestrales”. Parte 2:...
Página | 1 IMADIL TEMA 5. Notas
Tema 5. “Fundamentos de la inferencia estadística:
Introducción a la probabilidad y distribuciones
muestrales”.
Parte 2: Distribuciones muestrales
1. Variables Aleatorias
Existen situaciones aleatorias cuyo estudio se simplifica si, en vez de considerar el resultado
del experimento aleatorio en cuestión, se toma como punto de partida una función numérica
de sus posibles resultados. La simplificación conceptual que suele conllevar este proceso así
como el hecho de que es mucho más fácil operar con valores numéricos que con conjuntos de
sucesos hace que esta transformación, en la mayoría de los casos, ayude a conocer la
naturaleza del fenómeno que se está tratando.
Por ejemplo, si consideramos un examen en el que se enuncian veinte afirmaciones y
los alumnos tienen que indicar si son verdaderas o falsas, es obvio que el nivel de
conocimiento, sobre esta materia, de un alumno queda reflejado en su patrón de respuestas,
que podría ser el siguiente:
V, V, V, F, F, V, V, F, V, F, F, F, V, V, F, V, F, F, V, V.
Considerando todos los patrones de respuesta posibles junto con sus probabilidades
de aparición entre los alumnos de una clase tendríamos la distribución de los resultados de la
prueba en esa clase. Aunque es cierto que en esa distribución está contenida toda la
información de que disponemos sobre el nivel de ejecución de ese examen, también es cierto
que dicha información es difícil de manejar y de resumir. Bajo determinadas condiciones (que
las preguntas sean de igual dificultad y hagan referencia a un único rasgo) podemos simplificar
extraordinariamente el manejo de la situación si asignamos a cada alumno una calificación
numérica obtenida calculando el número de respuestas correctas y restándole a dicho número
la cifra de respuestas incorrectas. Así, si las respuestas correctas eran:
V, V, V, F, V, V, V, F, V, F, V, F, V, V, F, V, F, F, V, V.
el alumno del patrón anterior obtendría una calificación de 16 = 18 aciertos - 2 errores.
Esta asignación de números a los sucesos elementales de un experimento aleatorio
simplifica el manejo de la situación de dos formas: En primer lugar asigna el mismo número a
sucesos que son equivalentes, con lo cual reduce el número de resultados a considerar (En las
condiciones anteriormente enunciadas, dos individuos con la misma puntuación tienen el
mismo grado de conocimiento de la materia, con independencia de cual haya sido su patrón
de respuestas) y en segundo lugar permite realizar mediante las operaciones estadísticas, que
ya conocemos, síntesis numéricas como promedios, medidas de dispersión, etc.
Página |2 IMADIL José María Salinas y José Luis Padilla
A estas funciones que asignan a cada suceso elemental de un experimento aleatorio un
número real, cuando verifiquen determinadas condiciones que especificaremos a lo largo del
tema, las denominaremos variables aleatorias.
2. Distribución de probabilidad de una variable aleatoria
En una primera aproximación, podemos decir que la sucesión de probabilidades con las que
una variable aleatoria toma sus distintos valores constituye la distribución de probabilidad de
esa variable. Vemos por consiguiente que para especificar la distribución de una variable
debemos conocer tanto sus posibles valores como la probabilidad de aparición de los mismos.
Un sencillo ejemplo nos ayudará a clarificar como determinar la distribución de una
variable aleatoria. Sea un experimento aleatorio consistente en lanzar simultáneamente tres
monedas y consideremos la función que asigna a cada lanzamiento el número de caras que
aparecen en el mismo. Esta función va a ser la variable aleatoria de la cual estudiaremos su
distribución. En primer lugar determinaremos los posibles valores, obviamente estos son:
0 si al lanzar no sale ninguna cara, es decir salen tres cruces
1 si sale una cara y dos cruces, cualquiera que sea el orden en que aparecen
2 si aparecen dos caras y una cruz
3 si las tres monedas muestran la cara
Veamos ahora como calcular la probabilidad de que se presente cada uno de estos
valores. Para que aparezca el valor 0 tiene que ocurrir que salgan tres cruces al lanzar las
monedas y solamente en ese caso se puede dar el valor 0, por consiguiente parece bastante
obvio que la probabilidad de que el número de caras sea cero es la misma que la que se dé el
suceso:
( +, +, + )
Como la probabilidad de que aparezca cruz al lanzar una moneda es 1/2 y el resultado
del lanzamiento de cada moneda es independiente de los resultados de las restantes,
aplicando las propiedades del cálculo de probabilidades tenemos que:
Pr(X =0) = Pr( +, +, +) = Pr( + + +) = 1/2 · 1/2 · 1/2 = 1/8
Para que la variable aleatoria número de caras valga 1 tiene que ocurrir que salga una
cara y sólo una al lanzar las tres monedas, por consiguiente tiene que aparecer el suceso
elemental C, +, + o bien que aparezca el suceso +, C, + o el suceso +, +, C por consiguiente la
probabilidad del valor 1 es la misma que la probabilidad del suceso unión de los tres sucesos
elementales reseñados, como estos sucesos son incompatibles tendremos que:
Pr(X=1) = Pr[(C, +, +)(+, C, +)(+, +, C)] = Pr(C, +, +) + Pr(+, C, +) + Pr(+, +, C)
siguiendo el mismo razonamiento anterior tendremos que:
Pr(C, +, +) = 1/2 · 1/2 · 1/2 = 1/8
Página | 3 IMADIL TEMA 5. Notas
Pr(+, C, +) = 1/2 · 1/2 · 1/2 = 1/8 y
Pr( +, C, +) = 1/2 · 1/2 · 1/2 = 1/8
por consiguiente:
Pr( X = 1 ) = 1/8 + 1/8 + 1/8 = 3/8
De forma análoga para que el número de caras valga 2 tiene que ocurrir uno de los
siguientes sucesos: ( C, C, + ) o ( C, +, C ) o ( +, C, C ) y por tanto:
Pr(X=2) = Pr[(C, C, +)(C, +, C)(+, C, C)] = Pr(C, C, +) + Pr(C, +, C) + Pr(+, C, C)
de lo que resulta que:
Pr( X = 2 ) = 1/8 + 1/8 + 1/8 = 3/8
Finalmente para que el número de caras tome el valor 3 tiene que ocurrir el suceso ( C,
C, C ) luego:
Pr( X= 3) = Pr( C, C, C ) = Pr ( C C C ) = 1/2 · 1/2 · 1/2 = 1/8
Presentando en forma de tabla esta distribución tendríamos:
X Pr
0 1/8
1 3/8
2 3/8
3 1/8
Resumiendo el proceso seguido, vemos que la distribución se ha obtenido calculando
las probabilidades de los distintos valores de la variable aleatoria y que para ello hemos
calculado la probabilidad del suceso que da origen a que ese valor se presente. En términos
matemáticos este suceso se denomina imagen inversa del valor, por ello la condición para que
una función, del tipo que hemos visto, sea una variable aleatoria es que se pueda calcular las
probabilidades de las imágenes inversas de los valores que presenta o lo que es lo mismo, que
las imágenes inversas pertenezcan al sigma-álgebra que es la familia de sucesos sobre los que
está definida la probabilidad.
La condición anterior de que puedan calcularse las probabilidades de las imágenes
inversas habrá que exigirla siempre para poder calcular la distribución de la variable aleatoria,
no obstante esta condición puede adoptar una forma ligeramente distinta según se trate de
variables aleatorias discretas o continuas cuyas características pasamos a estudiar.
3. Variable aleatoria discreta
Si el conjunto de valores posibles de una variable aleatoria es numerable se dice que dicha
variable es discreta. Recordaremos, que un conjunto es numerable cuando puede ponerse en
correspondencia biunívoca con un subconjunto de los números naturales es decir que hay un
primer valor, un segundo y así sucesivamente. En términos prácticos, el que una variable
Página |4 IMADIL José María Salinas y José Luis Padilla
aleatoria sea discreta se traduce en que sus valores, aunque sean infinitos, son números fijos y
aislados. Esto no implica que necesariamente tenga que tomar como valores números enteros,
por ejemplo, una variable aleatoria que tomase los valores 0,5 1 1,5 2 2,5 3 3,5 ... sería
una variable aleatoria discreta.
Como indicamos antes, la distribución de probabilidad de una variable aleatoria
discreta es la sucesión de probabilidades con las que la variable toma cada valor, obsérvese
que la variable utilizada en el ejemplo era discreta, ahora bien esta distribución puede
describirse especificando la Función de probabilidad o alternativamente indicando cual es la
Función de distribución de dicha variable.
Función de Probabilidad
A toda regla que permita asociar a cada valor xi de la variable aleatoria su probabilidad pi la
llamaremos Función de Probabilidad y la designaremos (x). Esta regla o correspondencia
entre los valores de la variable y sus probabilidades la podemos especificar bien mediante una
tabla o bien mediante una expresión analítica que permita calcular en función de los valores,
las probabilidades que les corresponden.
Por ejemplo, la distribución de probabilidad que aparece en la siguiente tabla:
xi 0 1 2 3 4
pi 3/20 1/5 3/10 1/5 3/20
Puede también especificarse mediante la siguiente expresión:
( ) Pr( )x X x
x
3
5 2 2
Como pueden comprobar.
Obviamente, en una distribución de probabilidad debe de verificarse que la suma de
todas las probabilidades sea igual a la unidad
( )xii 1
Función de Distribución
De forma general, tanto para variables discretas como continuas, se define la Función de
Distribución, F(x), de una variable aleatoria, X , como la función que para cada valor x nos
proporciona la probabilidad de que la variable aleatoria tome valores inferiores o iguales a x,
es decir:
F(x) = Pr( X x )
Para variables aleatorias discretas la Función de Distribución es igual a la suma de las
probabilidades de los valores inferiores o iguales a x :
Página | 5 IMADIL TEMA 5. Notas
F x xix xi
( ) ( )
Por ejemplo, la distribución de la variable aleatoria número de caras al lanzar tres
monedas, tenía la siguiente Función de Probabilidad:
xi 0 1 2 3
pi 1/8 3/8 3/8 1/8
Por consiguiente, la Función de Distribución tomaría los siguientes valores:
F(0) = Pr(X 0) = Pr(X = 0) = 1/8
F(1) = Pr(X 1) = Pr(X = 0) + Pr(X = 1) = 1/8 + 3/8 = 4/8
F(2) = Pr(X 2) = Pr(X = 0) + Pr(X=1) + Pr(X = 2) = 1/8 + 3/8 + 3/8 = 7/8
F(3) = Pr(X 3) = Pr(X = 0) + Pr(X = 1) + Pr(X = 2) + Pr(X = 3) = 1
Hay que hacer notar que la función de distribución está definida para cualquier
número real, es decir que toma un valor también para valores que no tome la variable
aleatoria, por ejemplo:
F(1,272) = Pr(X 1,272) = Pr(X = 0) + Pr(X = 1) = 1/8 + 3/8 = 4/8
Ahora bien, puede observarse que para cualquier valor de x comprendido entre 1 y 2 la
Función de distribución toma el valor 4/8, es decir que la Función de Distribución sólo cambia
de valor en los puntos de existencia de la función de probabilidad. Esto hace que las Funciones
de Distribución de las variables aleatorias discretas tengan una forma característica de curva
escalonada.
4. Variable aleatoria continua
Una variable aleatoria se dice que es continua si sus valores posibles son todos los números
reales de un intervalo, o dicho de otra forma, una variable es continua si dados dos valores
cualesquiera, existe siempre un valor intermedio. Puede ayudar a clarificar este concepto el
pensar en el cómo lo opuesto de lo que era una variable aleatoria discreta, es decir sus valores
en vez de ser valores aislados que se situarían como marcas aisladas y diferenciadas en la recta
real, constituyen en este caso un continuo de puntos que rellena sin solución de continuidad
un intervalo de la recta real.
Tenemos por tanto, que una variable aleatoria continua puede tomar una infinidad no
numerable de valores y por consiguiente la probabilidad de un valor aislado es nula. Esto hace
que la función de probabilidad, tal y como la definimos para el caso de variables discretas,
carezca ahora de sentido, ya que al ser nula en todos los puntos no tiene utilidad a la hora de
describir la distribución de probabilidad .
Página |6 IMADIL José María Salinas y José Luis Padilla
Cuando manejemos una variable aleatoria continua no podremos hablar de la
probabilidad de un valor, sino que tendremos que referirnos a la probabilidad de que el valor
de la variable esté comprendido en un intervalo de valores. De esta forma, la condición para
que una función que asigna números reales a los sucesos elementales sea una variable
aleatoria tiene en cuenta que las probabilidades que deben de poderse calcular son las de los
intervalos y por consiguiente exige que pertenezcan al sigma álgebra las imágenes inversas de
los intervalos (-, x] para todo valor de x.
Función de Distribución
La condición anterior implica que no haya ninguna dificultad en definir la Función de
Distribución de una variable aleatoria continua pues está definida la probabilidad de que la
variable aleatoria pertenezca a los intervalos el tipo anterior, pero esas probabilidades son
precisamente las que definen la Función de Distribución, en efecto:
Pr , PrX x X x F x
A partir de la Función de Distribución es posible calcular la probabilidad de cualquier
intervalo del tipo (a, b] pues:
Pr , Pr Pr ( ) ( )X a b X b X a F b F a
Para ver como varía la probabilidad de un intervalo a otro deberemos tomar en
consideración tanto la probabilidad de esos intervalos como su amplitud y comparar las
probabilidades promedio o densidad de probabilidad. La densidad de probabilidad de un
intervalo se determina dividiendo la probabilidad de que la variable aleatoria pertenezca a ese
intervalo por su amplitud, es decir:
F b F a
b a
( ) ( )
Función de Densidad
Por distintas razones es conveniente disponer de una función que nos indique como varía la
probabilidad, o un valor relacionado con ella, de un punto a otro de la distribución esta
necesidad viene a cubrirla la Función de Densidad que habitualmente se designa por f(x).
Veamos cual es el proceso mediante el cual se construye esa función, para cada valor x
de la variable aleatoria se toma un intervalo de la forma ( )x x y se calcula la densidad de
probabilidad de ese intervalo, mediante la expresión del apartado anterior, con lo cual
tendríamos:
Página | 7 IMADIL TEMA 5. Notas
F x x F x
x
( ) ( )
A continuación tomaría un incremento de x menor y repetiría el cálculo anterior, con lo
cual tendría un nuevo valor. Repitiendo este proceso indefinidamente con intervalos de
amplitud decreciente tendría una sucesión de densidades de probabilidad, el límite de esa
sucesión será precisamente el valor de la Función de Densidad en el punto x. En términos de
una expresión matemática lo anteriormente expuesto sería:
f x limF x x F x
xx( )
( ) ( )
0
Pero esta expresión es precisamente la que define el concepto de derivada de una
función, por consiguiente podemos afirmar que la Función de Densidad es la derivada de la
Función de Distribución, es decir:
f x F x( ) ( )
Recordando que la integración es la operación inversa de la derivación también
podemos escribir:
F x f x dxx
( ) ( )
Por consiguiente, conocida la Función de Distribución de una variable aleatoria puede
conocerse su Función de Densidad y viceversa. Por ello la distribución de una variable aleatoria
continua puede caracterizarse tanto mediante su Función de Densidad como por su Función de
Distribución.
5. Esperanza Matemática
Al igual que en el caso de las variables estadísticas es conveniente disponer de unos valores
numéricos que sinteticen la distribución de las variables aleatorias, dando idea de su posición
global de su dispersión y de otras características. De esta forma podremos comparar distintas
distribuciones y resumir en uno o dos números los elementos esenciales que nos interesa
examinar. Para ello comenzamos definiendo el concepto de Esperanza Matemática de una
variable aleatoria también denominado Valor Esperado o Media.
Se define la Esperanza Matemática de una variable aleatoria discreta como la suma de
los productos de los valores de la variable por sus respectivas probabilidades:
E X x pi ii
Página |8 IMADIL José María Salinas y José Luis Padilla
Por ejemplo, en el caso de la variable aleatoria número de caras al lanzar tres monedas
la Esperanza Matemática sería:
E[X] = 0·1/8 + 1·3/8 + 2·3/8 + 3·1/8 = 3/8 + 6/8 + 3/8 = 12/8 = 1,5
Esto nos indica que si lanzásemos las tres monedas un gran número de veces nos
aparecerían por término medio 1,5 caras en cada lanzamiento o dicho de otra forma que si
lanzamos tres monedas n veces el número total de caras en los n lanzamientos sería
aproximadamente 1,5·n
La Esperanza Matemática de una variable aleatoria continua se define como la integral
de los valores de la variable por la Función de Densidad:
E X x f x dx
( )
Propiedades
1ª La Esperanza de una constante es esa misma constante
E a a
2ª La Esperanza de una constante por una variable es igual a la constante por la Esperanza de
la variable
E a X a E X
3ª La Esperanza de una suma es igual a la suma de las Esperanzas
E X Y E X E Y
Varianza
Una medida de dispersión de las distribuciones de variables aleatorias que es habitualmente
utilizada es la Varianza. Se define la Varianza de una variable aleatoria como la Esperanza de
los cuadrados de las diferencias a la media
Varianza X E X E X 2
Página | 9 IMADIL TEMA 5. Notas
Modelos Teóricos de Distribuciones. Introducción
En general, la determinación de la distribución de una variable aleatoria y el cálculo de las
características que hemos visto en el tema anterior, es un problema arduo que sólo puede
abordarse de forma directa, es decir calculando la probabilidad de cada valor, en contadas
ocasiones. Por ello se prefiere la utilización de Modelos Teóricos que son representaciones
esquemáticas de experimentos aleatorios ideales. El carácter abstracto de las condiciones que
se imponen a estos experimentos aleatorios ideales es lo que permite conocer, con relativa
facilidad, la distribución de la variable aleatoria considerada.
Por ejemplo, si tomamos como variable aleatoria el número que aparece al lanzar un
dado será muy fácil calcular su distribución si yo considero un dado ideal, es decir un hexaedro
perfecto construido de un material perfectamente homogéneo cuya densidad es constante en
todos los puntos del cubo, pues en este caso todas las caras tendrán la misma probabilidad de
aparecer y por consiguiente todos los valores tendrán igual probabilidad, 1/6.
Por el contrario, un dado real de los que podemos adquirir en las tiendas no cumplirá
las condiciones anteriormente descritas y por consiguiente la distribución de la aparición de los
números de sus caras diferirá en mayor o menor medida de la distribución antes descrita, si
quisiéramos determinar su distribución real tendríamos que realizar un número ingente de
lanzamientos para calcular las distintas probabilidades.
Bajo los supuestos de un modelo teórico será posible conocer la distribución de una
variable aleatoria y todas sus características que habrán sido previamente calculadas de forma
general. Por tanto, el primer paso en el estudio de una situación caracterizada por una variable
aleatoria no será hallar directamente la distribución, sino buscar el modelo teórico que mejor
se adecua al problema en cuestión. A continuación en el tema se verá una selección, muy
breve, de algunas de las distribuciones mas sencillas y conocidas.
Distribución Normal
La distribución Normal constituye un modelo teórico de distribución de una variable continua
al cual se ajusta, al menos de forma aproximada, la distribución de un gran número de
medidas de características psicológicas, biológicas, demográficas, etc.
Fue hallada en 1733 por De Moivre como límite de la distribución Binomial y
redescubierta por Gauss y Laplace, ochenta años después, al estudiar la distribución de los
errores de observación.
La Función de Densidad de una variable aleatoria X que siga una distribución Normal
tiene la siguiente expresión:
f x e
x
( )/
( )
1
2
1 22
2
Página |10 IMADIL José María Salinas y José Luis Padilla
Como vemos la distribución Normal depende de dos parámetros, , la media, y , la
desviación típica, esto nos indica que especificadas la media y desviación típica de una variable
aleatoria normal queda perfectamente determinada su distribución, que denotaremos N(,).
Algunas características básicas de esta distribución pueden ser conocidas estudiando la
representación gráfica de la Función de Densidad que se conoce con el nombre de campana de
Gauss.
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Como podemos ver, la curva tiene un único máximo en un punto cuya abscisa coincide
con la media, como la moda de una distribución continua es el valor en el que toma el máximo
la Función de Densidad , resulta que en una distribución Normal, media y moda van a coincidir.
También podemos observar que la representación es simétrica respecto al eje vertical
trazado el punto de abscisa , por tanto la probabilidad de encontrar de encontrar valores
inferiores a es la misma que la de encontrar valores superiores, luego es la mediana de
esta distribución, en consecuencia podemos afirmar que en una distribución Normal media,
mediana y moda coinciden.
Esta curva tiene una asíntota horizontal que es el eje de abscisas, por consiguiente la
función de densidad va a existir para cualquier valor x comprendido entre - y +, o lo que es
lo mismo, que una variable aleatoria, en principio, puede tomar cualquier número real. Sin
embargo la aproximación al eje es bastante rápida de tal forma que la probabilidad de
Página | 11 IMADIL TEMA 5. Notas
encontrar valores que disten mas de cuatro desviaciones típicas de la media es prácticamente
despreciable.
Esta curva tiene dos puntos de inflexión, cuyas abscisas son - y +
respectivamente.
El área comprendida entre la curva y el eje de abscisas es igual a la unidad ya que en
virtud de las propiedades de la Función de Distribución se verifica:
1
F f x dx( ) ( )
Normal Estandarizada
Dentro de las distribuciones Normales va a jugar un papel destacado la Normal de media cero
y desviación típica uno N(0,1) cuya función de densidad tendrá la siguiente expresión:
f x ex
( ) 1
2
2
2
Veamos la razón del papel singular asignado a esta distribución N(0,1). Como ya
dijimos en una distribución continua carece de sentido plantearse cual es la probabilidad de
que la variable tome un valor aislado, por ello cuando se utiliza la distribución Normal las
cuestiones que se plantean hacen referencia a la probabilidad de que la variable tome valores
dentro de un determinado intervalo (a, b] el calculo de esta probabilidad requiere evaluar la
siguiente integral:
Pr( ) ( ) ( )/
( )
a X b F b F a e dx
x
a
b
1
2
1 2
2
2
El problema reside en que la función a integrar no tiene una primitiva expresable
analíticamente, por ello el valor de la integral debería obtenerse por métodos numéricos para
cada intervalo, para obviar estos cálculos la Función de Distribución de la Normal cero uno, se
encuentra tabulada ya que, como vamos a ver a continuación, conociendo los valores de la
Función de Distribución de la N(0,1) pueden conocerse los de cualquier otra distribución
Normal.
Si en la expresión de la Función de Distribución de una Normal cualquiera de media y
desviación típica :
F x X x e dxx
x
( ) Pr( )/
1
2
1 2
2
Hacemos el cambio de variable:
Página |12 IMADIL José María Salinas y José Luis Padilla
zx
dzdx
tendremos que:
Pr( )X x e dzz
z
1
2
2
2
Pero esa es precisamente la expresión de la Función de Distribución de la Normal cero
uno. Por consiguiente para calcular el valor de la Función de Distribución, de cualquier
distribución Normal, en un punto x, basta conocer el valor el valor de la Función de
Distribución de la N(0,1) en el punto que se obtiene tipificando el valor de x, es decir:
Pr( ) Pr PrX xX x
Zx
Por ejemplo, suponiendo que el Cociente Intelectual sigue una distribución Normal de
media 100 y desviación típica 10 ¿ Cual es la probabilidad de que un individuo seleccionado al
azar posea un Cociente Intelectual menor o igual que 90 ?
Pr( ) Pr Pr( ) ,X Z Z
90
90 100
101 01587
Esta misma propiedad puede utilizarse en sentido inverso para calcular los Percentiles
de una distribución Normal cualquiera o de forma genérica el valor de la variable que deja por
encima o por debajo de si una determinada probabilidad.
Por ejemplo, supongamos que hacemos una selección de personal para un puesto en
el cual los individuos necesitan un alto nivel de aptitud mecánica. Para ello utilizamos un test
de aptitud mecánica cuyas puntuaciones, según el baremo, siguen una distribución Normal de
media 50 y desviación típica 15. Si necesitamos sujetos que se encuentren entre el 10% de la
población con mayores aptitudes mecánicas ¿ Que puntuación mínima debemos exigir a los
candidatos para admitirlos?
Pr( ) , Pr( ) ,X x X x 0 1 0 9
Restando la media y dividiendo por la desviación típica ambos miembros de la
desigualdad obtenemos:
Pr , Pr ,X x
Zx
50
15
50
150 9
50
150 9
Por otra parte en las tablas de la Normal(0,1) podemos determinar el valor de la
variable que deja por debajo de si una probabilidad de 0,9, es decir:
Página | 13 IMADIL TEMA 5. Notas
Pr( , ) ,Z 1 28 0 9
Comparando las dos igualdades anteriores deducimos que necesariamente se cumple
que:
x
50
151 28,
luego:
x 1 28 15 50 69 2, ,
Propiedades
Aparte de la importancia que tiene la distribución Normal como modelo teórico al que
supuestamente se adapta la distribución de un gran número de variables biológicas, sociales y
psicológicas cuestión que no discutiremos en este momento, su amplia utilización también ha
venido potenciada por las propiedades de tipo algebraico que posee esta distribución y que
permiten realizar con facilidad cálculos y derivaciones muy complejas si se considera otros
tipos de distribuciones. De entre estas propiedades solo mencionaremos dos, relativas a la
distribución de la suma y diferencia de variables Normales, por la importancia que tendrán en
próximos temas.
Sea una variable X1 que sigue una distribución Normal de media 1 y varianza 1
2 . Sea
otra variable X2 que sigue una distribución Normal de media 2 y varianza 2
2 . Entonces la
suma de esas 2 variables X1 + X2 sigue también una distribución Normal de media la suma de
las medias y de varianza la suma de las varianzas más dos veces el producto del coeficiente de
correlación por las dos desviaciones típicas, es decir:
X X N1 2 1 2 1
2
2
2
1 22 ,
Cuando esas dos variables sean independientes el coeficiente de correlación de
Pearson valdrá cero y por tanto la distribución de la suma será:
X X N1 2 1 2 1
2
2
2 ,
De forma semejante se puede establecer que la distribución de la diferencia de dos
variables Normales sigue una distribución Normal de media la diferencia de las medias y de
varianza la suma de las varianzas menos el producto del coeficiente de correlación por las
desviaciones típicas, es decir:
X X N1 2 1 2 1
2
2
2
1 22 ,
y si ambas variables son independientes: X X N1 2 1 2 1
2
2
2 ,