Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Aula 10
Fundamentos Téoricos da Inferência por
Verossimilhança
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Conceitos● Lei da Verossimilhança● Princípio da verossimilhança● Abordagem baseada em valor de
evidência● Comparação com abordagem
frequentista● Teorema de Bayes● Comparação com abordagem bayesiana
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Testes de Hipótese
Sir Karl Popper (1902-1994)
● Basta uma observação proibida por uma hipótese para refutá-la
● Nos aproximamos da verdade pela rejeição das hipóteses falsas.
● Portanto nossa preferência por certas hipóteses tem validade lógica.
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Resultado Negativo Também é Resultado?
ww
w.d
espa
ir.co
m
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Como o conhecimento progride na prática?
John R. Platt1918-1992
Thomas C. Chamberlin1843-1928
The method of multiple working hypotheses. Science, 15:92–96 (1890)
Strong Inference: Certain systematic methods of scientific thinking may produce much more rapid progress than others. Science 146:347-353 (1964)
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Lei da Verossimilhança(Um Enunciado informal)
Dado que:● Há mais de uma explicação para um conjunto de
dados.● Cada hipótese atribui uma probabilidade diferente
aos dados.
Então:
A EXPLICAÇÃO MAIS PLAUSÍVEL SERÁ AQUELA QUE ATRIBUIR A MAIOR PROBABILIDADE AOS DADOS.
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Lei da Verossimilhança
Dada uma variável aleatória X, cujo comportamento pode ser descrito por duas hipóteses, H
1 e H
2 , sendo que:
● A hipótese H1afirma que a observação X=x seria observada com
probabilidade p1(x).
● A hipótese H2 afirma que a observação X=x seria observada com
probabilidade p2(x).
Então:
A observação X=x é uma evidência em favor de H1 vis-a-vis (face-a-face) H
2 se, e
somente se p1(x) > p
2(x)
A força de evidência em favor de H1 vis-a-vis H
2 é dada pela razão de
verossimilhança: p1 x
p2 x
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Lei da Verossimilhança:A observação governa
● Experimento binomial
● 20 cobaias (tentativas)
● Observação: N de mortos
● Hipóteses:
● H1: p = 0,5
● H2: p = 0,3
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Princípio da Verossimilhança
Dado que:
● Uma evidência X=x favorece a hipótese H1 vis a vis a
hipótese H2
● Uma evidência Y=y favorece a hipótese H3 vis a vis a
hipótese H4
● As razões de verossimilhança são iguais:
Então:
As duas observações são equivalentes em termos de evidência.
p1 x
p2 x =
p3 y
p4 y
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Dois delineamentos podem gerar a mesma evidência?
Objetivo:
Estimar a eficácia de uma dada droga, em termos de probabilidade de cura.
Controle:
A probabilidade de morte na ausência de tratamento é de 50%.
Laboratório Rico:
Fez o teste em 12 cobaias e contabilizou as mortes
Laboratório Pobre:
Testou uma cobaia por vez, até contabilizar 3 mortes.
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Lab. 1: Três de Doze Morreram
DADO: De 12 cobaias tratadas 3 morreram.
H1: atribui uma probabilidade de 0,054 a este resultado.
H2: atribui uma probabilidade de 0,258 a este resultado.
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Lab. 2: Três de Doze Morreram
DADO: a terceira morte ocorreu após 9 curas.
H1: atribui uma probabilidade de 0,013 a este resultado.
H2: atribui uma probabilidade de 0,065 a este resultado.
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Razões de Verossimilhança
Laboratório 1:P(H2|3)/P(H1|3) = 0,054 / 0,258 = = 4,8Dado o resultado de 3 mortes em 12 tentativas, H2 é 4,8 vezes mais plausível que H1.
Laboratório 2:P(H2|9)/P(H1|9) = 0,065 / 0,013 = = 4,8Dado o resultado de 9 tentativas até a terceira morte, H2 é 4,8 vezes mais plausível que H1.
As duas observações são equivalentes em termos de evidência.
Q.E.D
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Perfis de Verossimilhança
A função de verossimilhança caracteriza toda evidência contida nos dados a respeito de uma hipótese.
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Lab.1 - Teste de Significância
DADO: três mortes em 12 cobaias.
H0: o tratamento não teve efeito.
TESTE: A probabilidade de que 3 ou menos mortes ocorram caso a hipótese nula esteja correta é de p= 0,073
CONCLUSÃO: não rejeitamos a hipótese nula.
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Lab.2 - Teste de Significância
DADO: terceira morte após 9 curas.
H0: o tratamento não teve efeito.
TESTE: A probabilidade de que 9 ou mais curas ocorram caso a hipótese nula esteja correta é de p= 0,033
CONCLUSÃO: rejeitamos a hipótese nula.
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Conclusões:Princípio da Verossimilhança
Dado que:
● O valor de evidência de uma observação é sempre relativo às hipóteses comparadas, o que é expresso pela razão de verossimilhança,
● mas que a magnitude desta razão é uma medida absoluta de valor de evidência, independente das hipóteses comparadas, ou dos procedimentos que deram origem aos dados.
Então:
● A evidência contida nos dados a respeito de qualquer hipótese está totalmente caracterizada pela função de verossimilhança.
● Logo, uma vez tomados os dados, o espaço amostral é irrelevante, bem como suas expectativas prévias.
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
O Reverendo e seus fiéis
Thomas Bayes1702–1761
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Probabilidade Condicional
P A∣B=P A∩B
P B
Qual a probabilidade de um valor maior que 4 se o primeiro lançamento deu 1?
3/356 /35
=0,5
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Teorema de Bayes
P A∣B=P A∩B
P BP B∣A=
P A∩BP A
P A∣BP B=P B∣AP A
P A∣B=P B∣AP A
P B
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Estatística BayesianaRedefinição do Teorema
P H∣D =P D∣H P H
∑ P D∣H iP H i
H = hipótesesD = dados
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Teorema de Bayes Exemplo Clássico
● 1% da população de um país tem uma certa doença
● O teste para a doença produz falsos negativos em 0,1% de suas aplicações
● O teste para a doença produz falsos positivos em 0,5% de suas aplicações
● Uma pessoa tomada ao acaso teve resultado positivo
● Dada esta observação, qual a probabilidade dessa pessoa estar doente?
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Teorema de BayesExemplo Clássico
P D∣H 2=0,999
P H 1=0,99
∑ P D∣H iP H i=0,99×0,0010,01×0,999=0,01098
P H 1∣D=0,99×0,001
0,01098=0,0902
P H 2=0,01P D∣H 1=0,001
A pessoa não está doente
A pessoa está doente
A pessoa não está doente, dado um teste positivo
A pessoa está doente, dado um teste positivo
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
O argumento Bayesiano do Baralho
Se uma carta tomada ao acaso de um baralho é um ás de espadas, isto indica que a hipótese de que o baralho tem apenas ases de espada é 52 vezes mais plausível do a hipótese de que o baralho é normal.
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Teorema de BayesArgumento do Baralho
P D∣H 1=1,0
P H 1=0,001
∑ P D∣H iP H i=1,0×0,0011 /52×0,999=0,0202
P H 1∣D=1,0×0,001
0,0202=0,05
H1: O baralho tem só ases de espadas H2: O baralho é um baralho comum D : sorteio de uma carta e ela é um ás de espada
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Teorema de BayesArgumento do Baralho
P D∣H1=1,0
P H1=0,5
∑ P D∣H iP H i =1,0×0,51 /52×0,5=0,5096
P H 1∣D=1,0×0,50,5096
=0,981
H1: O baralho tem só ases de espadas H2: O baralho é um baralho comum D : sorteio de uma carta e ela é um ás de espada
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Probabilidades a priori são necessárias?
P H∣D=P D∣H
∑ P D∣H i⋅
P H
∑ P H i
Razão de verossimilhanças
Razão de risco (odds-ratio)
A razão de verossimilhanças é o que modifica as chances relativas de uma hipótese estar correta, em relação às demais.
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Divagações: Não seria a evidência
sempre relativa?
● Frequentistas: espaço amostral
● Bayesianos: conhecimento a priori
● Verossimilhantistas: hipóteses concorrentes.
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
As 3 Perguntas de Royall
● Qual o valor de evidência dos dados?
● No que devo acreditar?
● O que devo fazer?
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Méritos da Abordagem de Verossimilhança
● A razão de verossimilhança é uma expressão direta do valor de evidência dos dados.
● É possível comparar quantas hipóteses se desejar, o que pode ou não incluir a tradicional "hipótese nula".
● Toma o dado como um fato e não como uma das realizações de um conjunto teórico de experimentos que podem ser repetidos, o que é mais adequado para estudos mensurativos.
● Os modelos estatísticos associados com cada hipótese devem ser explicitados.
LCF5877 / BIE8751
João L. F. Batista & Paulo Inácio Prado
Para saber mais
Royall, R.M. (1999) Statistical Evidence - A likelihood paradigm. New York, Chapman & Hall.
Edwards, A.W.F. (1972) Likelihood. New York, Cambridge Univ. Press.
Taper, M. L. & Lele, S. R. (2004). The Nature of Scientific Evidence – Statistical, Philosophical and Empirical Considerations. Chicago, Chicago University Press.
Sober, E. (2008). Evidence and Evolution: the logic behind the science. Cambridge, Cambridge University Press.