Der MINIstrantenkurs Katholisches Bibelwerk Stuttgart, 2005
Transcription
Der MINIstrantenkurs Katholisches Bibelwerk Stuttgart, 2005
Inferência Estatística Estimação de Parâmetros Pedro Paulo Balestrassi www.pedro.unifei.edu.br [email protected] 35-36291161 / 88776958 (cel) Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 1 Inferência Estatística: uma amostra ajudando a entender uma população População Amostragem Ex.: Para a distribuição normal os parâmetros são m e s2. Estimação de parâmetros Inferência e escolha da Distribuição Estatística Cálculo de Probabilidades Os termos população e distribuição são equivalentes. (Usando a Distribuição acima) Informação para tomada de decisão Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br Uso de uma amostra aleatória para inferir (aprender) algo sobre uma população. 2 Duas formas de se fazer inferência estatística 1)Estimação de Parâmetros: * Estimativas Pontuais * Estimativas Intervalares 2) Teste de Hipóteses População Estimativa Pontual Estimativa Intervalar Média μ Desconhecida Média 𝑥 =50~μ Estou 95% confiante que a média μ deve estar entre 40 e 60 Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 3 Estimador é uma VA e estimativa é um determinado valor Um estimador (ex.: 𝛉): é uma variável aleatória. Uma estimativa (ex.:E(𝛉)) é um valor específico do estimador. θ Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br X 4 Estimador e estimativa: nomenclatura da área Para um estimador 𝛉, de um parâmetro θ, como uma estimativa E(𝛉) tem-se: • Estimador não tendencioso 𝛉 deve ter: E(𝛉)=θ. • ENTVM (Estimador Não Tendencioso de Variância Mínima): O estimador não tendencioso de menor variância. • Bootstrap: Um método computacional de se obter estimativas. • Erro Quadrático Médio de um estimador: EQM(𝛉)=𝑬 𝛉 − 𝛉 ( um critério para se comparar diferentes estimadores) 𝟐 • Estimador de Máxima Verossimilhança: Uma forma de se produzir ENTVM através da maximização de uma função (de verossimilhança) Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 5 Variância Mínima – um exemplo Desvio padrão 0.55 0.73 A média é um estimador de Variância Mínima em relação a Mediana Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 6 Erro Padrão (Standard Error): uma medida de variabilidade para média e proporções Variável Quantitativa Variável Qualitativa 𝑆𝐸(𝑥 ) = 𝑆𝐸 𝑝 = 𝑠 𝑛 ~ 𝜎 𝑛 𝑝 1−𝑝 = 𝑛 𝑝𝑞 𝑛 (Proveniente da Distribuição de Bernoulli) Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 7 Estimativas pontuais de uma proporção - exemplo Para se avaliar a taxa de desemprego em determinado Estado, escolhese uma amostra aleatória de 1000 habitantes em idade de trabalho e contam-se os desempregados: 87. Estimar a proporção de desempregados em todo o Estado (população). Avaliar o erro padrão de estimativa. Uma possível representação 𝑝 = 0,087 ± 0,009 Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 8 Estimativas pontuais de uma média – exemplo 1/2 A planilha ao lado representa 20 medidas da espessura da parede “Top Wall”, em polegadas, após o processo “Bodymaker” de fabricação de latas. 1) Esse processo pode ser considerado Normal? 2) Quais as estimativas pontuais da Média e do Desvio Padrão das espessuras? 3) Qual o intervalo de 95% de Confiança para a Média e o Desvio Padrão? Body_Top_Wall_20.MTW Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 9 Estimativas pontuais de uma média – exemplo 2/2 Normal A nderson-Darling N ormality Test Estimativas Pontuais 0,0058 0,0060 0,0062 0,0064 A -S quared P -V alue 0,38 0,371 M ean S tDev V ariance S kew ness Kurtosis N 0,006181 0,000201 0,000000 -0,272270 -0,044069 20 M inimum 1st Q uartile M edian 3rd Q uartile M aximum 0,0066 0,005791 0,006035 0,006237 0,006318 0,006597 95% C onfidence Interv al for M ean Estimativas Intervalares 0,006087 0,006276 95% C onfidence Interv al for M edian 0,006068 0,006309 95% C onfidence Interv al for S tD ev 95% Confidence Intervals 0,000153 0,000294 Mean Median 0,00610 0,00615 0,00620 0,00625 0,00630 Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 10 Entenda o Central Limit Theorem pelo Quality Gamebox Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 11 Central Limit Theorem: tudo termina em normal 𝜎𝑥 = 𝑆𝐸 𝑥 = 𝜎 𝑛 Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 12 CLT: Moivre/Laplace/Liapunov “Para uma população qualquer com média m e desvio padrão s, a distribuição da média amostral X para amostras de tamanho n suficientemente grande é aproximadamente normal com média m e desvio padrão s n , isto é: X m ~ N : (0,1)” Ou seja: s n Se X:(m, s) então a distribuição amostral de X é N:(m, Erro Padrão = Standard Error=SE= s Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br s n) n 13 CLT- exemplo 1/3 Ainda com respeito ao exemplo anterior onde se tinha 20 medidas da espessura da parede Top Wall, em polegadas, após o processo Bodymaker. 1) Qual a probabilidade de se obter uma espessura de 0,0063”? 2) Qual a probabilidade de se obter uma espessura maior que 0,0067”? 3) Qual a probabilidade de se obter uma espessura média maior que 0,0067” em 9 medidas? Body_Top_Wall_20.mtw Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 14 CLT- exemplo 2/3 1) P(X = 0.0063)=0 (Probabilidade está relacionado a área!) 2) P(X > 0.0067) Suposições: Observe que X é a variável aleatória espessura 1) Normalidade 2) Desvio Padrão da Amostra é igual ao da População P( X 0.0067) 1 0.995 0.005 0.5% Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 15 CLT- exemplo 3/3 Input Constant 3) P( X > 0.0067) Mean X m 0.0067 0.00618 X 0.0067 e z s 0.000201 n 9 Usando o TCL P(X 0.0067) 0 O desvio padrão aqui se torna o Erro Padrão Observe que a variável aleatória agora é espessura média Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 16 IC (m :95%) ... para Sigma Conhecido Para uma população com média m e desvio padrão s. A partir da Distribuição da Média Amostral tem-se: Z X m s Fixando em 0.05, ou seja, 1- =0.95, ~ N : (0,1) n P(1.96 Z 1.96) 0.95 Pelos resultados do Teorema do Limite Central 0.95 0.025 0.025 X -1.96 0 1.96 Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br z 17 Veja a diferença entre Confiança e Significância : Nível de significância Pelos resultados do TCL: 1- : Nível de confiança P(1.96 Z 1.96) 0.95 X m P 1.96 1.96 0.95 s n Margem de Erro P X 1.96(s n ) m X 1.96(s ˆ ;ˆ X 1.96s 0 1 ) n ; X 1.96 s n ) 0.95 ) n IC (m :95%) Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 18 A interpretação de Intervalo de Confiança P X 1.96(s n ) m X 1.96(s n ) 0.95 Isso não significa que a probabilidade do parâmetro m cair dentro de um intervalo especificado seja igual a 95%. m sendo o parâmetro, está ou não, dentro do intervalo “95% é a probabilidade de que intervalos aleatórios contenham m .” Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 19 IC: exemplo Pew É conhecido agora que na Eleição presidencial dos Estados Unidos de 2008, Obama foi eleito com 7,2% dos votos. Diferentes pesquisas de véspera, com a mesma margem de erro de 3 pontos percentuais, deram resultados diferentes. De 20 pesquisas, 3 erraram. Esse resultado foi menos preciso que o esperado. Fox News =7,2% Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 20 Visão prática e probabilística de IC IC(m:95%) Visão Probabilística Visão Prática 95% é a probabilidade de que intervalos aleatórios contenham m . Estamos 95% confiantes de que o intervalo computado contém m Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 21 IC – exemplo 1/4 Uma amostra da Resistência ao Estufamento das latas para a inspeção final em um processo de fabricação de latas é dada na planilha ao lado. Tal resistência obedece a uma distribuição normal com desvio padrão de 1 psi . 1) Qual a limitação desse tipo de problema? 2) Qual o intervalo de 95% de confiança para a Resistência Média? Resistência.mtw Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 22 IC – exemplo 2/4 1) Qual a limitação desse tipo de problema? Nesse Problema o Desvio Padrão foi dado. Isso não é comum! Dificilmente se conhece a variância de uma população quando sua média é desconhecida! Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 23 IC – exemplo 3/4 2) Qual o intervalo de 95% de confiança para a Resistência Média. Substituindo os valores da média e do Desvio Padrão=1 na expressão tem-se: ICm : (1 )100) X Z 2 s ) n ;X Z 2 s n ) ICm : 95%) 90.604;91.616 Por que os valores da Graphical Summary gerados pelo Minitab diferem ligeiramente do intervalo acima calculado? Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 24 IC – exemplo 4/4 A nderson-Darling N ormality Test 90 91 92 A -S quared P -V alue 0,32 0,504 M ean S tD ev V ariance S kew ness Kurtosis N 91,111 0,834 0,696 0,31815 1,47862 15 M inimum 1st Q uartile M edian 3rd Q uartile M aximum 93 Como são feitos tais cálculos? 89,450 90,608 91,143 91,631 93,029 95% C onfidence Interv al for M ean 90,649 91,573 95% C onfidence Interv al for M edian 90,712 91,502 95% C onfidence Interv al for S tD ev 95% Confidence Intervals 0,611 1,315 Mean Median 90,6 90,8 91,0 91,2 91,4 91,6 Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 25 IC (m :95%) ... para Sigma Desconhecido Margem de Erro IC (m : (1 )100) X t 2 S ( X m) t S n ) n ; X t 2 S n ) 1 n 2 S ( X X ) i n 1 i 1 2 1- /2 /2 t - t/2 0 t/2 Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 26 A distribuição t de Student “Distribuição t de Student”, com v graus de liberdade v=n-1 ( X m) t S n n 1 2 S2 ( X X ) i n 1 i 1 Normal hv(t) Tal distribuição é usualmente tabelada para alguns valores de v e t Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 27 Student t: exemplo 1/5 A especificação da Largura da Flange das latas para a inspeção final é definida como 0.082’’+/- 0.010’’ e obedece a uma distribuição normal. As medidas da Largura da Flange para uma determinada linha/turno estão dadas na planilha. a) Qual o intervalo de 95% de confiança para a largura Média? Defina para esse caso o Grau de Liberdade e o Nível de significância? b) Qual a diferença básica em relação ao exemplo anterior? c) As medidas estão dentro das especificações? Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br flange.mtw 28 Student t: exemplo 2/5 A nderson-Darling N ormality Test 0,078 0,080 0,082 0,084 0,086 0,088 0,090 a) Obtido em função do Desvio Padrão amostral e da 95% Confidence Intervals estatística t de Student Mean A -S quared P -V alue 0,50 0,177 M ean S tD ev V ariance S kew ness Kurtosis N 0,083522 0,003446 0,000012 0,963258 0,690605 15 M inimum 1st Q uartile M edian 3rd Q uartile M aximum 0,078978 0,081315 0,083037 0,084877 0,090641 95% C onfidence Interv al for M ean 0,081614 0,085430 95% C onfidence Interv al for M edian 0,081427 0,084706 95% C onfidence Interv al for S tD ev 0,002523 0,005434 Median 0,081 0,082 0,083 0,084 0,085 0,086 Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 29 Student t: exemplo 3/5 b) Qual a diferença básica em relação ao exemplo anterior da Resistência? Esse problema é bastante real. Usualmente não se tem o Desvio Padrão populacional. A Estatística t de Student visa corrigir essa distorção. Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 30 Student t: exemplo 4/5 c) As medidas estão dentro das especificações? Capabilidade é uma medida fundamental em 6 Sigma Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 31 Student t: exemplo 5/5 LSL USL Within Ov erall P rocess Data LS L 0,072 Target * USL 0,092 S ample M ean 0,0835222 S ample N 15 S tD ev (Within) 0,00332226 S tD ev (O v erall) 0,00344573 P otential (Within) C apability Cp 1,00 C PL 1,16 C PU 0,85 C pk 0,85 O v erall C apability Pp PPL PPU P pk C pm O processo apresenta um Ppk razoável (o ideal é 1.5) mas que pode ser melhorado em um projeto 6 Sigma! 0,072 O bserv ed P erformance P P M < LS L 0,00 P P M > U S L 0,00 P P M Total 0,00 0,076 E xp. Within P erformance P P M < LS L 261,99 P P M > U S L 5358,40 P P M Total 5620,38 0,080 0,084 0,97 1,11 0,82 0,82 * 0,088 0,092 E xp. O v erall P erformance P P M < LS L 413,02 P P M > U S L 6939,85 P P M Total 7352,87 Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 32 Margem de Erro: exemplo 1/2 Suponha que uma pesquisa eleitoral entre dois candidatos A e B seja feita. De 1000 pessoas entrevistadas 550 votariam no candidato A. 𝑋 550 𝑝= = = 0,55 𝑛 1000 𝑆𝐸 𝑝 = 𝑝 1−𝑝 𝑛 = 𝑝𝑞 𝑛 = (0,55)(0,45) 1000 =0,0157 IC[p:(1- α)100]= 𝑝 ±Zα/2𝑆𝐸 𝑝 Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 33 Margem de Erro: exemplo 2/2 𝑋 550 𝑝= = = 0,55 𝑛 1000 Test and CI for One Proportion Sample X N Sample p 90% CI 1 550 1000 0,550000 (0,524123; 0,575877) Sample X N Sample p 95% CI 1 550 1000 0,550000 (0,519166; 0,580834) Sample X N Sample p 99% CI 1 550 1000 0,550000 (0,509477; 0,590523) Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 34 Amostragem a partir da margem de Erro (d) - exemplo Zα/2𝑆𝐸 𝑝 =d Zα/2 𝑝𝑞 𝑛 =d 2 𝑍𝛼/2 𝑝𝑞 𝑛= 𝑑2 Obs.: Quando não existir uma suposição inicial do valor da proporção 𝑝, uma boa regra é assumir o valor de 0.5. Considerando d=3% e α=5%, com os dados do exemplo anterior: n=1056 Usando Minitab (preferível): <Power and Sample Size> <Sample Size for Estimation> n= 1097 (Uma estimativa usando a distribuição de Fisher) Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 35 Fórmulas Clássicas de IC - 1/3 Uma regra geral: Use no mínimo 12 observações para obter qualquer intervalo de confiança Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 36 Fórmulas Clássicas de IC - 2/3 Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 37 Fórmulas Clássicas de IC - 3/3 Estimação de Parâmetros | Pedro Paulo Balestrassi | www.pedro.unifei.edu.br 38