Inferência Estat ística e Distribui ções...

Post on 02-Dec-2018

218 views 0 download

Transcript of Inferência Estat ística e Distribui ções...

Probabilidade e EstatProbabilidade e Estat íísticasticaProf. Dr. Narciso GonProf. Dr. Narciso Gon ççalves da Silvaalves da Silvahttp://paginapessoal.utfpr.edu.br/ngsilvahttp://paginapessoal.utfpr.edu.br/ngsilva

Inferência EstatInferência Estat íística e Distribuistica e Distribui çções ões AmostraisAmostrais

Inferência EstatInferência Estatíísticastica

O objetivo principal da inferência estatística é obter informações sobre determinada característica da população baseando-se apenas das informações obtidas de uma amostra.

Parâmetro: quantidades da população, em geral, desconhecidas e sobre as quais temos interesse. Representados por letras gregas: µ, σ, etc.

Estatística: quantidades calculadas com base nos elementos da amostra. Representadas por letras do alfabeto latino: , s, etc.

Inferência EstatInferência Estatíísticastica

Estimador: é uma estatística destinada a estimar um parâmetro de interesse da população. Por exemplo: é um estimador de µ.

Estimativa: é o valor numérico do estimador.

µ

n N

p̂ p

Denomina ção Estimador Parâmetro

Média

Variância

Número de elementos

Propor ção

X2S

µ̂

Inferência EstatInferência Estatíísticastica

Vício ou viesado: um estimador é não viciado ou não viesado para um parâmetro θ se , ou seja, se a esperança matemática do estimador é igual ao valor do parâmetro.

Consistência: um estimador é consistente, se àmedida que o tamanho da amostra aumenta, sua esperança matemática converge para o parâmetro de interesse e sua variância converge para zero.

Eficiência: dados dois estimadores e , não

viciados para uma parâmetro , dizemos que é

mais eficiente que se V( ) < V( ).

^

1θ^

2θθ

^

1θ^

2θ^

^

DistribuiDistribuiçções Amostraisões Amostrais

As estatísticas e os parâmetros são funções de variáveis aleatórias e são, também, variáveis aleatória, portanto possuem distribuição de probabilidade, esperança matemática e variância.

Distribuições amostrais são distribuições de probabilidades para estimadores como média, variância e proporção.

1. Distribui1. Distribuiçção Amostral da Mão Amostral da Méédiadia

Considere uma população em que a VA X assume os valores do conjunto {1, 3, 5, 5, 7}. A distribuição de probabilidade de X é dada por:

µ = E(X) = 1.1/5 + 3.1/5 + 5.2/5 + 7.1/5 = 4,2

σ²= V(X) = (1-4,2)2.1/5 + (3-4,2)2.1/5 + … + (7 – 4,2)2.1/5 = 4,16

X = x 1 3 5 7

P(X = x) 1/5 1/5 2/5 1/5

1. Distribui1. Distribuiçção Amostral da Mão Amostral da Méédiadia

Vamos relacionar todas as amostras possíveis de tamanho n = 2, selecionadas ao acaso e com reposição dessa população, e encontrar a distribuição da média amostral de tal que:

sendo:: valor selecionado na primeira extração, : valor selecionado na segunda extração

221 xx=x +

x

x1

x2

1. Distribui1. Distribuiçção Amostral da Mão Amostral da Méédiadia

1. Distribui1. Distribuiçção Amostral da Mão Amostral da Méédiadia

A distribuição de probabilidade para a média amostral é:

x

xσ² = V( ) = (1 – 4,2)2.1/25 + ... + (7 – 4,2)2.1/25 = 2,08

µ = E( ) = 1.(1/25) + 2.(2/25) + … + 7.(1/25) = 4,2x

σ² = V( ) = 4,16/2

1. Distribui1. Distribuiçção Amostral da Mão Amostral da Méédiadia

Repetindo o mesmo procedimento para amostras de tamanho n = 3, tem-se a seguinte distribuição de probabilidade para a média amostral:

x

x

E( ) = 1.(1/125) + ... + 7.(1/125)

E( ) = 4,2

V( ) = (1–4,2)2.1/125 + … + (7-4,2)2.1/125

V( ) = 1,39 = 4,16/3

x

x

1. Distribui1. Distribuiçção Amostral da Mão Amostral da Méédiadia

Os histogramas correspondentes da variável aleatória X e da variável aleatória para n = 2 e n = 3 estão apresentados abaixo:

x

Dos histogramas observamos que: • Conforme n aumenta os valores

da média amostral tendem a se concentrar cada vez mais em torno da E(X), pois a variância diminui

• Os valores extremos passam a ter pequenas probabilidades de ocorrência

• Conforme n aumenta, a forma da distribuição das médias se aproxima da distribuição normal

1. Distribui1. Distribuiçção Amostral da Mão Amostral da Méédiadia

1. Distribui1. Distribuiçção Amostral da Mão Amostral da Méédiadia

1. Distribui1. Distribuiçção Amostral da Mão Amostral da Méédiadia

1. Distribui1. Distribuiçção Amostral da Mão Amostral da Méédiadia

Observação:

Logo, se X tem média µ e variância então

1. Distribui1. Distribuiçção Amostral da Mão Amostral da Méédiadia

Exemplo 1:Uma variável aleatória X assume os valores 3, 6 e 8 com, respectivamente, probabilidades 0,4; 0,3 e 0,3. Uma amostra de 40 observações com reposição éobtida aleatoriamente. Qual a probabilidade da média amostral ser maior que 5?

Exemplo 2:O faturamento diário de um supermercado estánormalmente distribuído com média de R$ 20.000,00 e desvio-padrão de R$ 2000,00. Qual a probabilidade do faturamento ultrapassar R$ 1230000,00 em 60 dias?

1. Distribui1. Distribuiçção Amostral da Mão Amostral da Méédiadia

Exemplo 3:Considere que a distribuição dos níveis de colesterol para todos os homens de 20 a 74 anos está normalmente distribuído com média 211 mg e desvio-padrão de 46 mg. Selecionando 25 homens desta população, determine: a) A proporção destes 25 homens que terá um valor médio inferior a 230 mg;b) O valor médio de nível de colesterol que limita os 10% dos valores mais baixos da distribuição amostral;c) Os limites superior e inferior que incluem 95% das médias das amostras de tamanho 25;d) Qual deve ser o tamanho das amostras para que 95% de suas médias se encontrem a ±5 mg da média da população?

1. Distribui1. Distribuiçção Amostral da Mão Amostral da Méédiadia

Se amostra de tamanho n é retirada de uma população finita (sem reposição) de tamanho N (N > n), utiliza-se o fator de correção para a variância.

Exemplo:As lâmpadas fabricadas por uma indústria tem duração média de 800 horas e desvio-padrão de 100 horas. Éescolhida aleatoriamente 200 lâmpadas de um lote de 2000 lâmpadas. Determine a probabilidade da média destas lâmpadas escolhidas ser superior a 810 horas.

2. Distribui2. Distribuiçção Amostral da Proporão Amostral da Proporççãoão

Considere que a proporção de elementos de uma população com determinada característica é p.

Para cada elemento da população pode ser definida uma VA X tal que:

Ou seja, X é uma VA com distribuição de Bernoulli com E(X) = p e V(X) = p.(1 – p).

2. Distribui2. Distribuiçção Amostral da Proporão Amostral da ProporççãoãoSeja x1, x2, ... , xn uma amostra simples retirada aleatoriamente com reposição dessa população e, seja, Sn = x1 + x2 + .... + xn o total de elementos portadores da característica na amostra.

Sn tem distribuição binomial com parâmetros n e p.

A proporção amostral pode ser reescrita como:

Logo,

Então, é um estimador não viciado e consistente para p.

2. Distribui2. Distribuiçção Amostral da Proporão Amostral da Proporççãoão

Utilizando o Teorema do Limite Central tem-se que a distribuição amostral de para n suficientemente grande tem distribuição normal com µ = p e σ2 = p.(1 – p)/n.

Ou seja,

2. Distribui2. Distribuiçção Amostral da Proporão Amostral da Proporççãoão

Exemplos:

1)A proporção de peças defeituosas de um lote é de 40%. Foi coletada aleatoriamente uma amostra de 30 peças com reposição. Determine a probabilidade desta amostra fornecer uma proporção de peças defeituosas menor que 50%.

2)Qual a probabilidade de ocorrer entre 40% e 50% de caras em 120 lançamentos de uma moeda não viciada?

3. Distribui3. Distribuiçção Amostral da Diferenão Amostral da Diferençça de Ma de Méédiasdias

Sejam duas populações 1 e 2, com médias µ1 e µ2 e desvios-padrão σ1 e σ2, respectivamente. São retiradas, independentemente e com reposição, amostras de tamanho n1 da população 1 e de tamanho n2 da população 2. De todas as possíveis amostras retiradas pode-se obter a distribuição amostral da diferença entre as duas médias. Se n1 e n2 forem suficientemente grandes:

), -(~)-(2

22

1

21

2121 n+nNxxσσ

µµ

Logo:

2

22

1

21

2121 ) -(- )-(

n+n

xx=z

σσ

µµ

Exemplo:

As lâmpadas elétricas do fabricante A têm duração média de 1400 horas, com desvio-padrão de 200 horas, enquanto as do fabricante B têm duração média de 1200 horas, com desvio-padrão de 100 horas. Se forem ensaiadas amostras aleatórias de 125 lâmpadas de cada marca, qual será a probabilidade de que as lâmpadas da marca A tenham vida média maior do que as da marca B de pelo menos 160 horas ?

3. Distribui3. Distribuiçção Amostral da Diferenão Amostral da Diferençça de Ma de Méédiasdias

4. Distribui4. Distribuiçção Amostral da Diferenão Amostral da Diferençça de Propora de Proporççõesões

Considere que seja extraídas amostras de tamanho n1 da população 1 cuja proporção de elementos com uma determinada característica seja p1 e que se seja extraídas amostras de tamanho n2 da população 2 cuja proporção de elementos com a referida característica seja p2. A distribuição amostral da diferença das duas proporções édada por:

Logo:

Exemplo:

Duas pessoas A e B jogam uma partida do tipo “cara e coroa” onde cada uma lança 50 vezes uma moeda não viciada. O jogador A vencerá o jogo se conseguir 5 ou mais caras do que o jogador B e, se isso não ocorrer, o jogador B vencerá. Determine a probabilidade de cada jogador ganhar.

4. Distribui4. Distribuiçção Amostral da Diferenão Amostral da Diferençça de Propora de Proporççõesões

Tabela ZTabela Z