71

Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Uma análise sobre

duas medidas de evidência:

p-valor e s-valor

Eriton Barros dos Santos

Dissertação apresentadaao

Instituto de Matemática e Estatísticada

Universidade de São Paulopara

obtenção do títulode

Mestre em Ciências

Programa: Estatística

Orientador: Prof. Dr. Alexandre Galvão Patriota

Durante o desenvolvimento deste trabalho o autor recebeu auxílio �nanceiro da CAPES

São Paulo, Agosto de 2016

Page 2: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Uma análise sobre duas medidas de evidência:p-valor e s-valor

Esta versão da dissertação contém as correções e alterações sugeridas

pela Comissão Julgadora durante a defesa da versão original do trabalho,

realizada em 04/08/2016. Uma cópia da versão original está disponível no

Instituto de Matemática e Estatística da Universidade de São Paulo.

Comissão Julgadora:

• Profa. Dra. Silvia Lopes de Paula Ferrari - IME-USP

• Profa. Dra. Denise Aparecida Botter - IME-USP

• Prof. Dr. Rafael Bassi Stern - UFSCar

Page 3: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Agradecimentos

Primeiramente, aos meus pais, Eridan e Nilton, e minha irmã, Sarah, por todo o apoio e

amor e por acreditarem em minhas escolhas.

Ao meu orientador, Alexandre G. Patriota, por contribuir de forma signi�cativa para a

minha formação acadêmica, como, também, pelas sugestões, contribuições e por acreditar

que fosse capaz de desenvolver esse trabalho.

Aos meus amigos, Bruno, Daniel, Eliardo, Gabriela, Gilberto (Tomtom), Itailma (Tata),

Joelson (Boy) e Marcos (Mombaça), pelo apoio, brincadeiras, noites comendo pizza, conse-

lhos e momentos de felicidade que jamais esquecerei.

Aos participantes da banca examinadora, pelas sugestões.

À CAPES, pelo apoio �nanceiro.

i

Page 4: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

ii

Page 5: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Resumo

SANTOS, E. B. Uma análise sobre duas medidas de evidência: p-valor e s-valor.

2016. Dissertação (Mestrado) - Instituto de Matemática e Estatística, Universidade de São

Paulo, São Paulo, 2016.

Este trabalho tem como objetivo o estudo de duas medidas de evidência, a saber: o p-

valor e o s-valor. A estatística da razão de verossimilhanças é utilizada para o cálculo dessas

duas medidas de evidência. De maneira informal, o p-valor é a probabilidade de ocorrer um

evento extremo sob as condições impostas pela hipótese nula, enquanto que o s-valor é o

maior nível de signi�cância da região de con�ança tal que o espaço paramétrico sob a hi-

pótese nula e a região de con�ança tenham ao menos um elemento em comum. Para ambas

as medidas, quanto menor forem seus respectivos valores, maior é o grau de inconsistência

entre os dados observados e a hipótese nula postulada. O estudo será restrito a hipóteses

nulas simples e compostas, considerando independência e distribuição normal para os da-

dos. Os resultados principais deste trabalho são: 1) obtenção de fórmulas analíticas para

o p-valor, utilizando probabilidades condicionais, e para o s-valor; e 2) comparação entre

o p-valor e o s-valor em diferentes cenários, a saber: variância conhecida e desconhecida, e

hipóteses nulas simples e compostas. Para hipóteses nulas simples, o s-valor coincide com

o p-valor, e quando as hipóteses nulas são compostas, a relação entre o p-valor e o s-valor

são complexas. No caso da variância conhecida, se a hipótese nula for uma semi-reta o p-

valor é majorado pelo s-valor, se a hipótese é um intervalo fechado a diferença entre as duas

medidas de evidência diminui conforme o comprimento do intervalo da hipótese testada.

No caso de variância desconhecida e hipóteses nulas compostas, o s-valor é majorado pelo

p-valor para valores pequenos do s-valor, por exemplo, quando o s-valor é menor do que 0.05.

Palavras-chave: Medidas de evidência, P-valor, S-valor, Teste de hipóteses.

iii

Page 6: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

iv

Page 7: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Abstract

SANTOS, E. B.An analysis on two measures of evidence: p-value and s-value. 2016.

Dissertation (master's degree) - Institute of Mathematics and Statistics, University of São

Paulo, São Paulo, 2016.

This work aims to study two measures of evidence, namely: the p-value and s-value. The

likelihood ratio statistic is used to calculate these two evidence measures. Informally, the

p-value is the probability of an extreme event under the conditions imposed by the null hy-

pothesis, while the s-value is the greatest con�dence level of the con�dence region such that

the parameter space under the null hypothesis and the con�dence region have at least one

element in common. For both measures, the smaller are the respective values, the greater

is the degree of inconsistency between the observed values and the null hypothesis. In this

study, we will consider simple and composite null hypotheses and it will be restricted to

independently and normally distributed data. The main results are: 1) to obtain the analy-

tical formulas for the p-value, by using conditional probabilities, and for the s-value, and 2)

to compare the p-value and s-value under di�erent scenarios, namely: known and unknown

variance, and simple and composite null hypotheses. For simple null hypotheses, the s-value

coincides with the p-value, and for composite null hypotheses, the p-value and the s-value

relationships are complex. In the case of known variance, if the null hypothesis is a half-line

the p-value is smaller than the s-value, if the null hypothesis is a closed interval the di�e-

rence between the two measures of evidence decreases with the interval width speci�ed in

the null hypothesis. In the case of unknown variance and composite hypotheses, the s-value

is smaller than the p-value when the value of the s-value is small.

Keywords: Hypothesis testing, Measures of evidence, P-value, S-value.

v

Page 8: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

vi

Page 9: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Sumário

Lista de Figuras ix

1 Introdução 1

1.1 Objetivos e contribuições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 Organização do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Medidas de evidência 5

2.1 Conceitos gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2 P-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2.1 De�nição do p-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.3 S-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.3.1 De�nição do s-valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3 Resultados 13

3.1 Teoremas relacionados com o p-valor . . . . . . . . . . . . . . . . . . . . . . 14

3.2 Teoremas relacionados com o s-valor . . . . . . . . . . . . . . . . . . . . . . 17

3.3 Comparações entre p-valor e s-valor . . . . . . . . . . . . . . . . . . . . . . . 18

3.3.1 Caso normal com variância conhecida . . . . . . . . . . . . . . . . . . 18

3.3.2 Caso normal com variância desconhecida . . . . . . . . . . . . . . . . 20

4 Conclusões 23

4.1 Sugestões para Pesquisas Futuras . . . . . . . . . . . . . . . . . . . . . . . . 24

A P-valor 25

A.1 Teorema 3.1.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

A.1.1 Caso i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

A.1.2 Caso ii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

A.1.3 Caso iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

A.2 Teorema 3.1.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

A.2.1 Caso i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

A.2.2 Caso ii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

A.2.3 Caso iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

vii

Page 10: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

viii SUMÁRIO

B S-valor 41

B.1 Teorema 3.2.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

B.1.1 Caso i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

B.1.2 Caso ii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

B.1.3 Caso iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

B.2 Teorema 3.2.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

C Comparações entre p-valor e s-valor 51

C.1 Caso normal com variância conhecida . . . . . . . . . . . . . . . . . . . . . . 51

C.1.1 1o caso: Θ0 = {θ ∈ Θ : θ = µ0} . . . . . . . . . . . . . . . . . . . . . . 53

C.1.2 2o caso: Θ0 = {θ ∈ Θ : θ ≥ µ0} e x /∈ Θ0 . . . . . . . . . . . . . . . . 53

C.1.3 3o caso: Θ0 = {θ ∈ Θ : µ0 ≤ θ ≤ µ1} e x /∈ Θ0 . . . . . . . . . . . . . 53

C.2 Caso normal com variância desconhecida . . . . . . . . . . . . . . . . . . . . 54

C.2.1 1o caso: Θ0 = {θ ∈ Θ : µ = µ0, σ2 = σ2

0} . . . . . . . . . . . . . . . . 54

C.2.2 2o caso: Θ0 = {θ ∈ Θ : µ = µ0} e θ̂ /∈ Θ0 . . . . . . . . . . . . . . . . 54

C.2.3 3o caso: Θ0 = {θ ∈ Θ : µ ≥ µ0} e θ̂ /∈ Θ0 . . . . . . . . . . . . . . . . 55

Referências Bibliográ�cas 57

Page 11: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Lista de Figuras

2.1 Representação grá�ca do s-valor calculado em θ = µ0. . . . . . . . . . . . . . 9

3.1 Grá�cos da relação entre o s-valor e o p-valor para o 3o caso da variância

conhecida quando x < µ0, σ2 = 1 e n = 1 (assumindo a Conjectura A.1.3 na

Seção A.1.3, ver Apêndice A, é verdadeira). . . . . . . . . . . . . . . . . . . 20

3.2 Grá�cos da relação entre o s-valor e o p-valor para o 3o caso da variância

conhecida quando x > µ1, σ2 = 1 e n = 1 (assumindo a Conjectura A.1.3 na

Seção A.1.3, ver Apêndice A, é verdadeira). . . . . . . . . . . . . . . . . . . 21

3.3 Grá�cos da relação entre o s-valor e o p-valor para o 2o caso da variância

desconhecida. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.4 Grá�cos da relação entre o s-valor e o p-valor para o 3o caso da variância

desconhecida. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

A.1 Ponto de máximo local de g em Θ0, quando x ∈ Θ0. . . . . . . . . . . . . . . 27

A.2 Ponto de máximo local de g em Θ0, quando x ∈ Θc0. . . . . . . . . . . . . . . 27

A.3 Ponto de máximo local de g em Θ0, quando µ0 ≤ x ≤ µ1. . . . . . . . . . . . 29

A.4 Ponto de máximo local de g em Θ0, quando x < µ0. . . . . . . . . . . . . . . 30

A.5 Ponto de máximo local de g em Θ0, quando x > µ1. . . . . . . . . . . . . . . 30

B.1 Grá�co da função Zn(y) = y − n · ln (y) + n · ln (n)− n. . . . . . . . . . . . . 46

ix

Page 12: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

x LISTA DE FIGURAS

Page 13: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Capítulo 1

Introdução

Na ciência há o interesse em confrontar hipóteses cientí�cas com dados obtidos de expe-rimentos a �m de descartar hipóteses que con�itam com os dados. O teste de hipótese esta-tístico é amplamente utilizado para confrontar tais hipóteses, como na saúde (Blackwelder ,1982; Gail e Simon , 1985), na economia (Amisano e Giacomini , 2007; Katircioglu , 2009),em ecologia (Hobbs e Hilborn , 2006; Loehle , 1987) e em outras áreas. Usualmente, hi-póteses que não con�itam com os dados experimentais são mantidas para serem testadasfuturamente em outros domínios experimentais.

Há várias técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se:o teste de signi�cância �sheriano (Fisher , 1925), o teste mais poderoso de Neyman-Pearson(Neyman e Pearson , 1933), o fator de Bayes (Je�reys , 1961), o Full Bayesian Signi�canceTest (FBST) (Pereira e Stern , 1999), entre outros. O teste de signi�cância �sheriano, cujamedida de evidência é o p-valor, considera somente a hipótese nula a ser testada, enquanto osdemais, i.e., o teste de Neyman-Pearson, o fator de Bayes e o FBST, consideram também umahipótese alternativa. Entretanto, Mudholkar e Chaubey (2009) consideram uma hipótesealternativa para o p-valor com a �nalidade de discutirem o conceito de função poder. EmDiniz et al. (2012), os autores encontraram uma relação assintótica entre o p-valor e o FBST.Recentemente, Patriota (2013) introduziu uma medida de evidência denominada s-valor,a qual foi proposta como uma alternativa ao p-valor. Esta dissertação estuda e compara,especi�camente, as medidas de evidência p-valor e s-valor.

Na estatística clássica1, a hipótese nula contém uma a�rmação sobre quantidades deinteresse não aleatórias que são de�nidas no modelo estatístico clássico. Tais quantidades deinteresse, também conhecidas como parâmetros, são representadas por θ, e o espaço de todasas quantidades de interesse por Θ (espaço paramétrico). No Capítulo 2, Seção 2.1, é de�nidomatematicamente o modelo estatístico clássico. Por exemplo, no caso de normalidade dosdados, as quantidades de interesse são a média populacional µ e a variância populacionalσ2. Nesse caso, as seguintes hipóteses estatísticas podem ser formuladas: �µ = 0�, �σ2 = 1�,�µ = σ2�, entre outras. De maneira geral, a hipótese nula contém uma a�rmação do tipo�θ ∈ Θ0�, em que Θ0 ⊆ Θ. As duas medidas de evidência estudadas nesta dissertação serãode�nidas informalmente a seguir, entretanto, no Capítulo 2, elas são de�nidas formalmente.O p-valor é a probabilidade de ocorrer um evento extremo sob as condições impostas pelahipótese nula, ou seja, o p-valor deve ser calculado sob a restrição θ ∈ Θ0. O s-valor, por suavez, é o maior nível de signi�cância da região de con�ança tal que o espaço paramétrico sob

1O termo �estatística clássica� se refere à teoria estatística que tem como base o modelo estatístico clássicopresente no livro de Lehmann et al. (1991) (Theory of point estimation). Nesta dissertação não entraremosna discussão Clássico-versus-Frequentista, pois o entendimento desses dois conceitos varia de autor paraautor (Lehmann , 2012).

1

Page 14: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

2 INTRODUÇÃO 1.1

a hipótese nula, Θ0, e a região de con�ança tenham ao menos um elemento em comum.Cox (1977) discute regras de uso e formas de interpretar o p-valor. Segundo o autor,

o p-valor é uma medida que deve ser usada como um grau de coerência da hipótese nulano estudo e, também, deve ser vista como um guia, e não como uma regra de decisão, naqual é necessária a aceitação ou rejeição de hipóteses. Para o cálculo do p-valor, o autorrecomenda encontrar uma estatística de teste que tenha o seguinte comportamento: quantomaior é o valor observado da estatística de teste, maior é a inconsistência entre os dadosexperimentais e a hipótese nula. Lehmann (2012) também aborda a maneira de interpretar op-valor e suas diferenças em relação ao teste de Neyman-Pearson. Conforme Lehmann, Fisherconsiderava que o p-valor deveria ser entendido como uma medida do grau de discrepânciaentre a hipótese nula e os dados observados. Ainda segundo Lehmann (2012), Fisher nãorecomendava que um p-valor menor que 0.05 indicasse uma real discrepância.

Seguindo as recomendações dos autores acima, o p-valor deve ser interpretado como umamedida de inconsistência que está submetida ao domínio do estudo. O domínio do estudoimpõe as condições e restrições em que os dados foram amostrados. Assim, esse modo deinterpretação mostra que a plausibilidade da hipótese nula depende do domínio em queela é testada e as conclusões do p-valor estão também restritas ao mesmo domínio. Porexemplo, quando se testa uma lei física no domínio macroscópico, é possível veri�car umaconsistência com os movimentos dos planetas do nosso sistema solar, mas isso não implica queela necessariamente se manterá consistente fora desse domínio, como no domínio quântico.

Além dos problemas de interpretação, o p-valor apresenta ainda algumas limitações epeculiaridades teóricas. De acordo com Schervish (1996), Izbicki et al. (2012), Patriota(2013) e Izbicki e Esteves (2015), o p-valor não respeita alguns princípios lógicos aplicadosem hipóteses aninhadas. Sejam H e H ′ hipóteses estatísticas tais que H → H ′, segundo alógica clássica, é esperado que os dados observados apresentem mais evidências contrárias aH do que à H ′. Schervish (1996) mostra que o p-valor não respeita essa propriedade lógicapara hipóteses nulas intervalares. Patriota (2013) apresenta dois exemplos em casos multi-dimensionais em que o p-valor não respeita esse princípio lógico: teste de vetor de médias eteste de coe�cientes angulares de um modelo linear. Izbicki et al. (2012) e Izbicki e Esteves(2015) apresentam o mesmo tipo de violação em um problema de genética.

1.1 Objetivos e contribuições

Os objetivos principais deste trabalho são estudar e comparar o p-valor e o s-valor,assumindo que os dados amostrais são independentes e identicamente distribuídos de acordocom uma distribuição normal com média µ e variância σ2.

As contribuições principais deste trabalho são as seguintes:

• Introduzir formalmente os conceitos de p-valor e s-valor, utilizando o modelo estatísticoclássico via função supremo.

• Calcular as medidas de evidência para a hipótese H0 : θ ∈ Θ0, considerando distribui-ção normal, para os seguintes casos:

Page 15: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

1.2 ORGANIZAÇÃO DO TRABALHO 3

a) Variância populacional σ2 conhecida, θ = µ e Θ = R

a.1) Θ0 = {θ ∈ Θ : θ = µ0} = {µ0};a.2) Θ0 = {θ ∈ Θ : θ ≥ µ0};a.3) Θ0 = {θ ∈ Θ : µ0 ≤ θ ≤ µ1};

b) Variância populacional σ2 desconhecida, θ = (µ, σ2)T e Θ = R×R+

b.1) Θ0 = {θ ∈ Θ : µ = µ0 e σ2 = σ20} = {(µ0, σ

20)T};

b.2) Θ0 = {θ ∈ Θ : µ = µ0};b.3) Θ0 = {θ ∈ Θ : µ ≥ µ0};

em que µ0, µ1 e σ20 são valores �xos e −∞ < µ0 < µ1 <∞. O caso a.3 considerando a

variância populacional desconhecida não foi explorado, pois não conseguimos procedercom as demostrações do seu teorema.

• Comparar o s-valor com o p-valor para os casos apresentados acima.

1.2 Organização do Trabalho

No Capítulo 2, as medidas de evidência são de�nidas matematicamente e interpretadas.Na Seção 2.1, o modelo estatístico, a hipótese nula geral e a estatística da razão de verossi-milhanças são de�nidas. Na Seção 2.2, o p-valor é interpretado e de�nido matematicamente.Na Seção 2.3, os problemas lógicos do p-valor são discutidos, e o s-valor é apresentado comouma alternativa. Nessa seção, o s-valor também é de�nido matematicamente.

No Capítulo 3, os resultados referentes às medidas de evidência p-valor e s-valor sãoapresentados, considerando que a amostra é independente e identicamente distribuída deacordo com uma distribuição normal. Na Seção 3.1, dois teoremas são enunciados sobreo p-valor para os seguintes casos: a.1, a.2, a.3, b.1, b.2 e b.3 descritos na Seção 1.1. NaSeção 3.2, dois teoremas são enunciados sobre o s-valor para os mesmos casos da seçãoanterior. Na Seção 3.3, as comparações entre o s-valor e o p-valor são desenvolvidas para oscasos mencionados anteriormente.

No Capítulo 4, as conclusões do trabalho e as sugestões para trabalhos futuros são des-tacadas.

Os Apêndices A, B e C apresentam as demonstrações dos teoremas e os resultados doCapítulo 3.

Page 16: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

4 INTRODUÇÃO 1.2

Page 17: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Capítulo 2

Medidas de evidência

No contexto de teste de hipóteses, há dois modos principais para estudar a plausibilidadeda hipótese nula a partir dos dados: medida de evidência e construção de teste. Entretanto,a medida de evidência será o foco deste trabalho. Na Seção 2.1, de�nições gerais que serãonecessárias nesta dissertação são apresentadas. Na Seção 2.2, uma revisão formal é feita damedida de evidência p-valor, cujo uso é largamente disseminado no meio cientí�co. Adicio-nalmente, uma medida de evidência denominada s-valor, introduzida por Patriota (2013),é formalmente de�nida na Seção 2.3.

2.1 Conceitos gerais

Nesta seção, modelo estatístico, hipótese nula geral e estatística da razão de verossimi-lhanças são de�nidos.

O modelo estatístico pode ser de�nido como (X , F , P), em que X ⊆ Rn é o espaçoamostral, F uma σ-álgebra gerada por subconjuntos de X e P = {Pθ : θ ∈ Θ} uma famíliade medidas de probabilidade, em que Θ é o espaço paramétrico e Θ ⊆ Rp, em que p < ∞.Se p é in�nito, o modelo estatístico é não paramétrico, porém, esse caso não será tratadoneste trabalho. O modelo estatístico também pode ser representado por (X , Q), em queQ = {fθ : θ ∈ Θ} e fθ é a função (densidade) de probabilidade conjunta dos dados. Nestetrabalho, iremos considerar que fθ é uma função densidade de probabilidade conjunta, ouseja, o vetor aleatórioX = (X1, . . . , Xn) ∈ X é composto por variáveis aleatórias contínuas.

Seja Y uma estatística em função deX, utilizaremos a notação YPθ∼ gθ para representar que

Y tem função densidade de probabilidade gθ, sob a restrição de que a medida de probabilidadede X é Pθ.

A hipótese nula é de�nida por

H0 : θ ∈ Θ0,

em que Θ0 ⊆ Θ é um conjunto fechado.A estatística da razão de verossimilhanças é de�nida como

λ(x; Θ0) =supθ∈Θ0

L(θ;x)

supθ∈Θ L(θ;x), (2.1)

em que L(θ;x) = fθ(x) é a função de verossimilhança e x é o valor observado do vetor alea-tórioX. Se o estimador de máxima verossimilhança existe e pertence ao espaço paramétricoΘ, então a estatística da razão de verossimilhanças em (2.1) pode ser reduzida a seguinte

5

Page 18: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

6 MEDIDAS DE EVIDÊNCIA 2.1

forma:

λ(x; Θ0) =L(θ̂0;x)

L(θ̂;x),

em que θ̂0 e θ̂ são os estimadores de máxima verossimilhança restritos a Θ0 e Θ, respectiva-mente. Ou seja, os estimadores devem satisfazer:

L(θ̂0;x) = supθ∈Θ0

L(θ;x)

e

L(θ̂;x) = supθ∈Θ

L(θ;x).

Assumindo que a função de verossimilhança é não negativa e unimodal, tem-se os seguin-tes resultados (Shi e Tao , 2008, pp. 72):

• 0 ≤ λ(x; Θ0) ≤ 1.

• À medida em que θ̂ se distancia de θ̂0, λ(x; Θ0) se aproxima de 0. Por outro lado, àmedida em que θ̂ se aproxima de θ̂0, λ(x; Θ0) se aproxima de 1.

• λ(X; Θ0)Pθ−→ 1 quando n −→ ∞, para θ ∈ Θ0, em que �

Pθ−→� signi�ca convergênciaem probabilidade de acordo com a medida de probabilidade Pθ. Ou seja, para cadaε > 0 e θ ∈ Θ0,

limn−→∞

Pθ (|λ(X; Θ0)− 1| > ε) = 0.

Segundo Bahadur e Raghavachari (1972), a razão de verossimilhanças é uma estatísticade teste assintoticamente ótima, sob certas condições de regularidade, para o caso em quea amostra é independente e identicamente distribuída. Esses autores também estudam ocomportamento da razão de verossimilhanças em casos gerais, quando a amostra não éindependente ou identicamente distribuída. Eles concluem que os resultados assintoticamenteótimos também podem se estender para esses casos gerais.

Seja T (X; Θ0) = −2 lnλ(X; Θ0) e H0 a hipótese de interesse, em que Θ0 é um conjuntoformado por igualdades ou desigualdades polinomiais em θ tal que não exista ponto desingularidade, então, sob certas condições de regularidade (Cox e Hinkley , 1974, cap. 9) esob as condições impostas por H0, a variável aleatória T (X; Θ0) converge em distribuiçãopara uma distribuição qui-quadrado com v graus de liberdade (Drton , 2009). Em notaçãomatemática,

T (X; Θ0)DPθ−→ χ2

v,

para cada θ ∈ Θ0, em que �DPθ−→� signi�ca convergência em distribuição de acordo com a

medida de probabilidade Pθ. Ou seja, para cada u ∈ R e θ ∈ Θ0,

limn−→∞

Pθ [T (X; Θ0) ≤ t] = Fχ2 (u; v) ,

em que v = dim(Θ)−dim(Θ0), dim(·) é uma função que retorna a dimensão de um conjuntoe Fχ2(·; v) é a função acumulada da distribuição qui-quadrado com v graus de liberdade.

Entretanto, no caso em que Θ0 é um conjunto formado por igualdades ou desigualdadespolinomiais em θ, podem existir pontos de singularidades em Θ0 (e.g., o conjunto algébrico

Page 19: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

2.2 P-VALOR 7

Θ0 = {θ = (θ1, θ2)T ∈ R2 : θ22 = θ3

1} tem uma singularidade em θ = (0, 0)T ) para osquais a distribuição de T(X; Θ0) não converge para uma distribuição χ2

v (Drton , 2009). Emnotação matemática, se θ∗ ∈ Θ0 é um ponto de singularidade, então, sob as condições deregularidade1 de�nidas em Drton (2009),

T (X; Θ0)DPθ∗−→ U,

em queW não é necessariamente uma variável aleatória qui-quadrado. Por exemplo, U podeser o mínimo de qui-quadrados ou mistura de qui-quadrados, conforme os exemplos 1.1 e 1.2exibidos em Drton (2009).

2.2 P-valor

O teste de signi�cância �sheriano consiste em calcular o p-valor e utilizá-lo como umgrau de discordância entre a hipótese nula postulada H0 e os dados observados. Cox (1977)recomenda encontrar uma estatística positiva TH0 tal que quanto maior for o seu valorobservado TH0 = t, maior deve ser a discordância entre H0 e os dados observados. Essaestatística TH0 , recomendada por Cox, é denominada estatística do teste.

Fisher (1955) discute os problemas na utilização dos testes de signi�cância como proce-dimento de decisão:

The attempt to reinterpret the common tests of signi�cance used in scienti�cresearch as though they constituted some kind of acceptance procedure and led to�decisions� in Wald's sense, originated in several misapprehensions and has led,apparently, to several more.

Segundo Cox (1977), o p-valor deve ser usado como um guia, e não como uma regra dedecisão, na qual é necessária a aceitação ou rejeição de hipóteses:

Application of the signi�cance test consists of computing approximately the valueof p-value and using it as a summary measure of the degree of consistency withH0, in the respect under study. [...] Such a procedure is to be distinguished sharplyfrom a decision problem in which `acceptance' or `rejection' is required. [...] Weshall later discuss how p-value is to be used, but broadly it is to be regarded as aguide, and no more, to interpretation.

Nesta dissertação, o p-valor será utilizado conforme os autores acima recomendam: comouma medida de discrepância entre H0 e os dados observados, e não como uma regra dedecisão entre a hipótese nula e uma hipótese alternativa.

2.2.1 De�nição do p-valor

Nesta seção, o p-valor é de�nido matematicamente a �m de evitar problemas de interpre-tação. É comum de�nir o p-valor de maneira informal, utilizando probabilidade condicional.Porém, a quantidade que condiciona, θ ∈ Θ0, não está descrita na σ-álgebra do modelo esta-tístico clássico (X , F , P). Por isso, não utilizaremos essa de�nição informal neste trabalho.

1Ver as de�nições 2.1 (modelo regular) e 2.5 (condições de regularidade de Cherno�) apresentadas emDrton (2009).

Page 20: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

8 MEDIDAS DE EVIDÊNCIA 2.3

Seja TH0(X) uma estatística do teste para testar H0 e t(x) o seu valor observado. Op-valor é de�nido por (Shi e Tao , 2008, pp. 71)

p(Θ0;x) = supθ∈Θ0

Pθ [TH0(X) ≥ t(x)] . (2.2)

No caso em que H0 é uma hipótese simples, ou seja, Θ0 = {θ0}, o p-valor tem distribuição

uniforme padrão, ou seja, p(Θ0;x)Pθ∼ U(0, 1), sempre que TH0 (X) for uma variável aleatória

contínua (Cox , 1977).Para o estudo do trabalho será considerado que TH0 (X) = T (X; Θ0) = −2 ln [λ (X; Θ0)]

pelas razões mencionadas na Seção 2.1. Assim, o p-valor baseado na estatística da razão deverossimilhanças tem a seguinte forma:

p(Θ0;x) = supθ∈Θ0

Pθ [λ(X; Θ0) ≤ λ(x; Θ0)] .

Quanto menor é o p-valor, maior é a �distância� entre os estimadores θ̂0 e θ̂.

2.3 S-valor

O teste de signi�cância com base no p-valor é um método bastante utilizado no meiocientí�co para testar hipóteses. Entretanto, o p-valor tem algumas limitações e peculiaridadesteóricas e quando utilizado deve-se ter noção de seus problemas. Segundo Schervish (1996),Izbicki et al. (2012), Patriota (2013) e Izbicki e Esteves (2015), o p-valor nem semprerespeita alguns princípios lógicos aplicados em hipóteses aninhadas, como já mencionado noCapítulo 1. Sejam H e H ′ hipóteses estatísticas tais que H → H ′, segundo a lógica clássica,é esperado que os dados observados apresentem mais evidência contrária a H do que a H ′.Ou seja, o grau de discordância entre H e os dados observados deve ser sempre maior ouigual ao grau de discordância entre H

′e os dados observados. Contudo, o p-valor não satisfaz

essa relação lógica esperada.Em Schervish (1996), o autor discute essa incoerência lógica a respeito da hipótese nula

quando Θ0 é um intervalo fechado e a exempli�ca com o problema seguinte. Considere queX é uma variável aleatória com distribuição N(µ, 1) e se deseja testar as seguintes hipóteses:H0 : µ ∈ [−0.5, 0.5] e H

′0 : µ ∈ [−0.82, 0.52]. Segundo o problema, observou-se x = 2.18

e p-valores 0.0502 e 0.0498 para H0 e H′0, respectivamente. Com isso, tem-se que conforme

o x observado, o grau de discordância da hipótese H′0 é maior que o grau de H0. Esse

comportamento não satisfaz a relação lógica discutida acima.Patriota (2013) discute esse problema lógico em dois exemplos. O primeiro exemplo trata

de variáveis aleatórias independentes e identicamente distribuídas de acordo com uma normalbivariada, tais queX i ∼ N2(µ, I), i ∈ {1, . . . , 100}, µ = (µ1, µ2)T e I é uma matriz identidade(2×2), e se deseja testar as seguintes hipóteses: H01 : µ = (0, 0)T e H02 : µ1 = µ2. Conformeesse problema, o vetor de médias observado foi x = (0.14,−0.16)T e os p-valores foram 0.10(H01) e 0.03 (H02). Assim, observou-se que o grau de discordância é maior para H02 do quepara H01. O segundo exemplo trata de teste de hipóteses em relação aos coe�cientes doseguinte modelo linear: y = xb+ ε, em que b = (b1, b2)T é o vetor de parâmetros do modelo,x é a matriz de covariáveis (n×2), ε ∼ N(0, In) com In sendo uma matriz identidade (n×n).As hipóteses de interesse desse exemplo são H01 : b1 = 0, H02 : b2 = 0 e H03 : b = (0, 0)T e osp-valores calculados são 0.03, 0.045 e 0.10, respectivamente. Assim, foi observado um graude discordância maior para as hipóteses H01 e H02 do que para a hipótese H03. Porém, noteque H03 −→ H01 e H03 −→ H02.

Page 21: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

2.3 S-VALOR 9

Izbicki et al. (2012) e Izbicki e Esteves (2015) apresentam essa incongruência lógica dop-valor em genética. O problema consiste em um estudo de caso-controle com o intuitode veri�car se os genótipos e os alelos são homogeneamente distribuídos entre os grupos.As hipóteses são de�nidas como HG

0 : γ = π (estudo genótipo) e HA0 : γAA + 1

2γAB =

πAA + 12πAB (estudo alelo), em que γ = {γAA, γAB, γBB}, π = {πAA, πAB, πBB} e γi e πi são

as probabilidades que o paciente do grupo caso e controle, respectivamente, tenha o genótipoi, i ∈ {AA,AB,BB}. Observou-se o grau de discordância maior para a hipótese HA

0 do quepara HG

0 .A �m de contornar esses problemas, Patriota (2013) desenvolveu uma nova medida de

evidência, o s-valor, que satisfaz as relações lógicas discutidas acima.

2.3.1 De�nição do s-valor

Para contornar os problemas do p-valor, primeiramente, é necessário criar uma medidade evidência cuja métrica não dependa dos subconjuntos de Θ. A de�nição do s-valor envolveregiões de con�ança com base na razão de verossimilhanças. Utilizou-se a razão de verossimi-lhanças, pois existem outros procedimentos cujos conjuntos de con�ança produzidos podemnão estar contidos no espaço paramétrico (Sprott , 2000).

Assumindo regularidade do modelo estatístico (Cox e Hinkley , 1974), a região de con-�ança baseada na estatística da razão de verossimilhanças com nível de signi�cância α, emque α = 1− ϕ e ϕ é o nível de con�ança da região, é dada por

Λα (x) = {θ ∈ Θ : T (x; {θ}) ≤ Fα} ,

em que Fα é tal que F (Fα) = 1− α, com F (·) sendo a função de distribuição acumulada davariável aleatória T (X; {θ}) = −2 ln [λ(X; {θ})].

De acordo com Patriota (2013), o s-valor para testar H0 : θ ∈ Θ0 é de�nido matemati-camente por

s(Θ0;x) = max {0, sup {α ∈ (0, 1) : Λα(x) ∩Θ0 6= ∅}} , (2.3)

em que sup{∅} = −∞. Na Figura 2.1 é representado o s-valor de um ponto de vista grá�coquando deseja-se testar H0 : θ = µ0 e os dados se distribuem conforme uma distribuiçãoN(θ, σ2). Pelo grá�co é possível perceber que o α3 é o maior dentre os α's que respeita acondição: Λα(x) ∩Θ0 6= ∅.

Figura 2.1: Representação grá�ca do s-valor calculado em θ = µ0.

Page 22: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

10 MEDIDAS DE EVIDÊNCIA 2.3

Quanto mais �distante� o estimador θ̂0 estiver do estimador de máxima verossimilhançaθ̂, menor é o s-valor. Quando não se conhece a distribuição exata da razão de verossimilhan-ças, calcula-se um s-valor aproximado usando sua distribuição assintótica. De acordo comPatriota (2013), as propriedades do s-valor são:

i. s(∅;x) = 0 e s(Θ;x) = 1;

ii. Se Θ1 ⊆ Θ2, então s(Θ1;x) ≤ s(Θ2;x);

iii. Para quaisquer Θ1,Θ2 ⊂ Θ, tem-se s(Θ1 ∪Θ2;x) = max {s(Θ1;x), s(Θ2;x)};

iv. Seja Θ1 ⊂ Θ, então s(Θ1;x) = supθ∈Θ1s({θ};x);

v. Se θ̂ ∈ Θ1 ∩Θc1, então s(Θ1;x) = s(Θc

1;x) = 1.

As propriedades i, iii e iv contemplam a ideia de uma medida de possibilidade, logoo s-valor é uma medida possibilística em Θ (Patriota , 2013). Em Dubois e Prade (2001)e Dubois (2006), os autores discutem o conceito e as interpretações sobre a medida depossibilidade e suas diferenças em relação à medida de probabilidade. Segundo Dubois(2006),

In quantitative theories..., degrees of possibility are numbers that generally standfor upper probability bounds. Of course the probabilistic view is only one amongother interpretive settings for possibility measures.

As regras da medida de possibilidade incorporam uma característica peculiar: tanto umevento como seu complementar podem ser completamente possíveis, veja por exemplo apropriedade v acima. Dubois e Prade (2001) comentam o seguinte:

Let us take an example, considered already by Aristotle, namely the proposition:�There will be a sea battle tomorrow (p) and there will not be a sea battle tomorrow(¬p)�. This proposition, of the form �p and ¬p� is always false, because of thenon-contradiction law. Similarly, the proposition �p or ¬p� is always true, becausetertium non datur. [...] In this case, at least intuitively, it seems reasonable to saythat it is possible that there will be a sea battle tomorrow but at the same time,it is possible that there will not be a sea battle tomorrow. [...] ... the propositionpossible p is not the same as p, and possible ¬p is not the negation of possible p.Hence the fact that the proposition �possible p and possible ¬p� may be true doesnot question the law of non-contradiction.

Utilizando interpretações de medida de possibilidade, s(Θ0;x) = 1 indica que a amos-tra observada não traz informações que discordem de Θ0, 0 < s(Θ0;x) < 1 indica que aamostra observada traz alguma informação que discordem de Θ0, s(Θ0;x) = 0 indica que aamostra observada discorda completamente de Θ0, s(Θ1;x) < s(Θ2;x) indica que a amostraobservada traz mais informações que discordem de Θ1 do que de Θ2. O s-valor utiliza aregião de con�ança baseada na razão de verossimilhanças como critério de discordância. Ouseja, s(Θ0;x) = s0 indica que s0 é o maior nível de signi�cância tal que o Θ0 e a região decon�ança tenham ao menos um elemento em comum.

Com isso, o s-valor não deve ser interpretado utilizando as regras da medida de probabili-dade, e sim utilizando as propriedades destacadas nos itens i�v. Em termos possibilísticos, apropriedade i indica que um conjunto vazio é impossível de ocorrer e que Θ é completamentepossível. Já a propriedade ii mostra que o s-valor respeita a ideia de hipóteses aninhadas,

Page 23: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

2.3 S-VALOR 11

ou seja, é esperado mais evidências contrárias a Θ2 do que a Θ1. Em iii, tem-se que o s-valor da união de eventos é igual ao s-valor do evento mais provável, ou seja, os eventosmenos prováveis são dominados pelo evento de maior possibilidade. Note que a propriedadeiv implica em iii. A propriedade v representa o caso em que os dados não mostram indíciosfavoráveis para Θ1 nem para Θc

1, ou seja, não há informações su�ciente para concluir qualconjunto é mais possível. Para uma revisão geral sobre medida de possibilidade consulteDubois e Prade (2001) e Dubois (2006).

Dualmente, o grau de crença em Θ0 re�ete a falta de plausibilidade da negação de Θ0 eé de�nida por uma função de necessidade (Dubois e Prade , 2001):

Ns(Θ0;x) = 1− s(Θc0;x). (2.4)

A de�nição em (2.4) avalia até que ponto o conjunto Θ0 é necessário (Dubois e Prade ,2001). Se Ns(Θ0;x) = 1, então a função de necessidade indica que o conjunto Θ0 é total-mente necessário, pois seu complementar é impossível. Se Ns(Θ0;x) > 0, então a função denecessidade indica que a necessidade de Θ0 é esperada, pois há evidências contrárias ao seucomplementar. Se Ns(Θ0;x) = 0, então a função de necessidade indica a possibilidade deuma indecisão, pois o conjunto Θ0 e seu complementar podem ser completamente possíveis.Assim, pelas de�nições em (2.3) e (2.4), poder-se-ia aceitar a proposição H0 : θ ∈ Θ0 ses(Θ0;x) = 1 e Ns(Θ0;x) = 1. Para mais informações consulte a Seção 4 de Patriota (2013).

Page 24: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

12 MEDIDAS DE EVIDÊNCIA 2.3

Page 25: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Capítulo 3

Resultados

Neste capítulo, mostraremos os principais resultados desenvolvidos nesta dissertação, re-ferentes ao p-valor e ao s-valor. Os resultados encontrados têm como suposição uma amostraindependente e identicamente distribuída de acordo com uma distribuição N(µ, σ2). As duasmedidas de evidência são calculadas a partir da estatística da razão de verossimilhanças.

Neste capítulo, os teoremas são referentes às seguintes hipóteses nulas já mencionadasna Seção 1.1:

a) Variância populacional σ2 conhecida, θ = µ e Θ = R

a.1) Θ0 = {θ ∈ Θ : θ = µ0} = {µ0};a.2) Θ0 = {θ ∈ Θ : θ ≥ µ0};a.3) Θ0 = {θ ∈ Θ : µ0 ≤ θ ≤ µ1};

b) Variância populacional σ2 desconhecida, θ = (µ, σ2)T e Θ = R×R+

b.1) Θ0 = {θ ∈ Θ : µ = µ0 e σ2 = σ20} = {(µ0, σ

20)T};

b.2) Θ0 = {θ ∈ Θ : µ = µ0};b.3) Θ0 = {θ ∈ Θ : µ ≥ µ0};

em que µ0, µ1 e σ20 são valores �xos e −∞ < µ0 < µ1 < ∞. As provas dos teoremas deste

capítulo foram compiladas nos Apêndices A e B.Na literatura estatística existem alguns autores que calcularam o p-valor para alguns

casos acima, utilizando a estatística da razão de verossimilhanças. Brownlee (1965, p. 120) eShi e Tao (2008, p. 74�75) abordam o conceito de p-valor para o caso a.1. Pestman (1998, p.156�158) apresenta um exemplo de p-valor para o caso b.2. Severini (2000, p. 100) mencionaque o p-valor pode ser calculado com base na estatística da razão de verossimilhanças se adistribuição exata ou assintótica da razão for conhecida. Shi e Tao (2008, p. 75�76) tambémcalculam o p-valor para diversas situações. Dentre elas, os casos b.2 e uma variação de a.2(θ ≤ µ0) são apresentados.

Com isso, podemos veri�car que os resultados referentes ao p-valor para os casos a.3, b.1e b.3 são contribuições dessa dissertação. Vale ressaltar que todos os resultados referentesao s-valor são novos.

Os teoremas relacionados ao p-valor e ao s-valor estão descritos nas Seções 3.1 e 3.2,respectivamente, e as suas respectivas demonstrações nos Apêndices A e B. As comparaçõesentre o p-valor e o s-valor são expostas na Seção 3.3 e os detalhamentos dessas comparaçõessão oferecidos no Apêndice C.

13

Page 26: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

14 RESULTADOS 3.1

No Apêndice A, as demonstrações dos teoremas relacionados ao p-valor (Seção 3.1) sãolongas, pois detalhamos todas as contas necessárias para suas provas. Note que para o cálculodo p-valor, de�nido em (2.2), é preciso calcular a distribuição de probabilidade induzida porT (X; Θ0) e posteriormente calcular o supremum de Pθ [T (X; Θ0) ≥ T (x; Θ0)] sob a restriçãoθ ∈ Θ0. De maneira geral, o cálculo da distribuição de λ é um dos passos mais complexos, poisele exige transformações de variáveis e integrais cujas complexidades dependem da hipótesenula. Entretanto, para o cálculo do s-valor, apesar de serem necessárias transformações devariáveis e integrais, elas não dependem da hipótese nula, o que facilita consideravelmenteo seu cálculo.

3.1 Teoremas relacionados com o p-valor

Nesta seção, os Teoremas 3.1.1 e 3.1.2 expressam formas analíticas para o p-valor. NoTeorema 3.1.1, o interesse é testar as seguintes hipóteses nulas: a.1, a.2 e a.3.; e, no Teo-rema 3.1.2, o interesse é testar as seguintes hipóteses nulas: b.1, b.2 e b.3.

Teorema 3.1.1 (Caso normal com variância conhecida) Sejam X1, X2, . . . , Xn variá-veis aleatórias independentes e identicamente distribuídas com distribuição N(µ, σ2), sendoσ2 um valor numérico conhecido. Considere a seguinte hipótese nula:

H0 : θ ∈ Θ0,

em que θ = µ, Θ0 ⊂ Θ e Θ = R. O p-valor de�nido em (2.2) é explicitado para os seguintescasos:

i. Se Θ0 = {θ ∈ Θ : θ = µ0} = {µ0}, então

p(Θ0;x) = 1− Fχ2

(n

(x− µ0)2

σ2; 1

), (3.1)

em que Fχ2(·; v) é a função acumulada da distribuição χ2 com v graus de liberdade;

ii. Se Θ0 = {θ ∈ Θ : θ ≥ µ0}, então

p(Θ0;x) =

{1 , se x ≥ µ0

Φ(√

n (x−µ0)σ

), se x < µ0

; (3.2)

iii. Se Θ0 = {θ ∈ Θ : µ0 ≤ θ ≤ µ1}, então

p(Θ0;x) =

1 , se µ0 ≤ x ≤ µ1

supθ∈Θ0

f0(θ) , se x < µ0

supθ∈Θ0

f1(θ) , se x > µ1

, (3.3)

em que

f0(θ) = 1− Φ

(max (2µ0 − x, µ1)− θ√

σ2/n

)+ Φ

(x− θ√σ2/n

)

Page 27: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

3.1 TEOREMAS RELACIONADOS COM O P-VALOR 15

e

f1(θ) = 1− Φ

(x− θ√σ2/n

)+ Φ

(min (2µ1 − x, µ0)− θ√

σ2/n

).

Se a Conjectura A.1.3 proposta na Seção A.1.3 (ver Apêndice A) é verdadeira, entãoeste p-valor é dado por

p(Θ0;x) =

1 , se µ0 ≤ x ≤ µ1

f0(µ1) , se x < µ0

f1(µ0) , se x > µ1

.

O Teorema 3.1.1 mostra que as formas analíticas obtidas dependem da distância euclidi-ana ao quadrado entre a estimativa de máxima verossimilhança x e as bordas do conjuntoΘ0, i.e., µ0 ou µ1, dado que x /∈ Θ0. Com isso, tem-se que quanto maior for essa distância,menor será o p-valor e, por conseguinte, maior será a discrepância entre Θ0 e a amostraobservada.

Na obtenção da Expressão (3.1) não há di�culdades teóricas, pois quando σ2 é conhecido

T (X; Θ0)Pθ∼ χ2

1, para θ ∈ Θ0, e a etapa referente ao cálculo do supremum restrito a θ ∈Θ0 resume-se a substituir θ por µ0. Para mais detalhes da prova dessa Expressão (3.1),consulte a Seção A.1.1. Note que a Fórmula (3.1) é apresentada por Brownlee (1965, p.120) e Shi e Tao (2008, p. 74�75). Em contrapartida, para o cálculo da Expressão (3.2) énecessário analisar o comportamento do numerador da razão de verossimilhanças em doiscasos, a saber: x ∈ Θ0 e x /∈ Θ0. Depois, é preciso calcular sup

θ∈Θ0

Pθ [T (X; Θ0) ≥ T (x; Θ0)].

Para mais detalhes da prova dessa Expressão (3.2), consulte a Seção A.1.2. Por �m, para odesenvolvimento da Expressão (3.3) é necessário analisar o comportamento do numeradorda razão de verossimilhanças em três casos, a saber: x < µ0, µ0 ≤ x ≤ µ1 e x > µ1. Após, épreciso calcular sup

θ∈Θ0

Pθ [T (X; Θ0) ≥ T (x; Θ0)]. Para mais detalhes da prova dessa Expressão

(3.3), consulte a Seção A.1.3.

Teorema 3.1.2 (Caso normal com variância desconhecida) Sejam X1, X2, . . . , Xn va-riáveis aleatórias independentes e identicamente distribuídas com distribuição N(µ, σ2). Con-sidere a seguinte hipótese nula:

H0 : θ ∈ Θ0,

em que θ = (µ, σ2)T, Θ0 ⊂ Θ e Θ = R×R+. O p-valor de�nido em (2.2) é explicitado para

os seguintes casos:

i. Se Θ0 = {θ ∈ Θ : µ = µ0, σ2 = σ2

0} = {(µ0, σ20)T}, então

p(Θ0;x) = 1− FT [T (x; Θ0)] , (3.4)

em que

FT (b) =

∫ n

g0(b)

fχ2(u1;n−1)Fχ2

(b− g−1

0 (u1); 1)du1 +

+

∫ g1(b)

n

fχ2(u2;n−1)Fχ2

(b− g−1

1 (u2); 1)du2

Page 28: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

16 RESULTADOS 3.1

é a função de distribuição acumulada exata de T (X; Θ0) = −2 ln[λ(X; Θ0)] e fχ2(·; v)é a função densidade de probabilidade da distribuição qui-quadrado com v graus deliberdade,

g0(b) = −n ·W0

(−e−

1n

(b+n))

e g1(b) = −n ·W1

(−e−

1n

(b+n)),

ui+1 = gi

((ns2n

σ20

)− n · ln

(ns2n

σ20

)+ n · ln (n)− n

), i = {0, 1}

e

s2n =

1

n

n∑i=1

(xi − x)2.

Note que Wi, i = {0, 1}, pertence a um conjunto de funções denominado função W deLambert e maiores detalhes sobre esse conjunto podem ser encontrados em Olver et al.(2010, pp. 111) e em Corless et al. (1996).

ii. Se Θ0 = {θ ∈ Θ : µ = µ0}, então

p(Θ0;x) = 1− Ft (q(x; Θ0);n− 1) + Ft (−q(x; Θ0);n− 1) , (3.5)

em que Ft(·; v) é a função acumulada da distribuição t-Student central com v graus deliberdade,

q(x; Θ0) =√

(n− 1)[c(x; Θ0)−2/n − 1]

e

c(x; Θ0) =n∑i=1

(xi − x)2 /n∑i=1

(xi − µ0)2 ,

em que λ (x; Θ0) = [c(x; Θ0)]n/2.

iii. Se Θ0 = {θ ∈ Θ : µ ≥ µ0}, então

p(Θ0;x) =

{1 , se x ≥ µ0

Ft (−q(x; Θ0);n− 1) , se x < µ0, (3.6)

em que q(x; Θ0) foi de�nido no item ii acima.

O Teorema 3.1.2 mostra que a forma analítica obtida no caso i é a função de sobrevivênciade T (X; Θ0). Os demais casos dependem de onde a concentração de dados está localizada,dado que x /∈ Θ0, pois o p-valor é igual a 1 se x ∈ Θ0.

Na obtenção da Expressão (3.4) é necessário encontrar a função de distribuição acumu-lada de T (X; Θ0). Para isso, é preciso trabalhar com uma transformação de variável aleatóriaque necessita particionar o seu domínio de tal forma que cada parte tenha inversa. Alémdisso, é necessário calcular uma integral dupla, cuja solução requer inverter os limites deintegração. Para a prova dessa Expressão (3.4), consulte a Seção A.2.1. Entretanto, paramais detalhes dessa prova é sugerido ler algumas partes da Seção B.2. Na derivação daExpressão (3.5) a estatística da razão de verossimilhanças pode ser escrita em termos de√n(X − µ)/Sn−1, em que S2

n−1 = (1/n)∑n

i=1

(Xi −X

)2, cuja distribuição não depende de

Page 29: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

3.2 TEOREMAS RELACIONADOS COM O S-VALOR 17

θ, ou seja,√n(X−µ)/Sn−1

Pθ∼ t(n−1), para θ ∈ Θ0. Esse fato auxilia no cálculo do supremumrestrito a θ ∈ Θ0, resumindo-se a substituir µ por µ0. Para mais detalhes da prova dessa Ex-pressão (3.5), consulte a Seção A.2.2. Note que a fórmula (3.5) é apresentada por Pestman(1998, p. 156�158) e Shi e Tao (2008, p. 75�76). No desenvolvimento da Expressão (3.6) éexigido analisar o comportamento do numerador da razão de verossimilhanças em dois casos,a saber: x ≥ µ0 e x < µ0. Depois, é preciso calcular o sup

θ∈Θ0

Pθ [T (X; Θ0) ≥ T (x; Θ0)], que

requer a aplicação da distribuição t-Student não central e as suas propriedades. Para maisdetalhes da prova dessa Expressão (3.6), consulte a Seção A.2.3.

3.2 Teoremas relacionados com o s-valor

Nesta seção, os Teoremas 3.2.1 e 3.2.2 expressam formas analíticas para o s-valor. NoTeorema 3.2.1, o interesse é testar as seguintes hipóteses nulas: a.1, a.2 e a.3; e, no Teo-rema 3.2.2 é avaliado para o caso da variância desconhecida, que pode ser utilizado paratestar qualquer combinação entre µ e σ2, inclusive para b.1, b.2 e b.3.

Teorema 3.2.1 (Caso normal com variância conhecida) Sejam X1, X2, . . . , Xn variá-veis aleatórias independentes e identicamente distribuídas com distribuição N(µ, σ2), com σ2

conhecido. Considere a seguinte hipótese nula:

H0 : θ ∈ Θ0,

em que θ = µ, Θ0 ⊂ Θ e Θ = R. Assim, o s-valor de�nido em (2.3) pode ser descrito dasseguintes formas:

i. Se Θ0 = {θ ∈ Θ : θ = µ0} = {µ0}, então

s(Θ0;x) = 1− Fχ2

(n

(x− µ0)2

σ2; 1

); (3.7)

ii. Se Θ0 = {θ ∈ Θ : θ ≥ µ0}, então

s(Θ0;x) =

{1 , se x ≥ µ0

1− Fχ2

(n (x−µ0)2

σ2 ; 1)

, se x < µ0; (3.8)

iii. Se Θ0 = {θ ∈ Θ : µ0 ≤ θ ≤ µ1}, então

s(Θ0;x) =

1 , se µ0 ≤ x ≤ µ1

g(µ0) , se x < µ0

g(µ1) , se x > µ1

, (3.9)

em que

g(µi) = 1− Fχ2

(n

(x− µi)2

σ2; 1

), i ∈ {0, 1} .

O Teorema 3.2.1 mostra que as formas analíticas obtidas também dependem da distânciaeuclidiana ao quadrado entre a estimativa de máxima verossimilhança x e as bordas do

Page 30: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

18 RESULTADOS 3.3

conjunto Θ0, i.e., µ0 ou µ1, dado que x /∈ Θ0, pois o s-valor é igual a 1 se x ∈ Θ0. Assim,tem-se que quanto maior for essa distância, menor será o s-valor e, por conseguinte, maiorserá a discrepância entre Θ0 e a amostra observada. Note que as formas analíticas do s-valorutilizam a mesma função distribuição de probabilidade, enquanto que as formas analíticasdo p-valor utilizam diferentes distribuições de probabilidade, as quais variam com a hipótesenula.

Para obter o Teorema 3.2.1 é fundamental encontrar a função densidade de probabi-lidade ou a função de distribuição acumulada de T (X; {θ}) = −2 ln[λ(X; {θ})]. Após, énecessário basicamente utilizar a de�nição do s-valor. Para mais detalhes referentes a provado Teorema 3.2.1, consulte as Seções B.1.1, B.1.2 e B.1.3.

Teorema 3.2.2 (Caso normal com variância desconhecida) Sejam X1, X2, . . . , Xn va-riáveis aleatórias independentes e identicamente distribuídas com distribuição N(µ, σ2). Con-sidere, também, a seguinte hipótese nula:

H0 : θ ∈ Θ0,

em que θ = (µ, σ2)T, Θ = R×R+ e Θ0 é um conjunto não vazio. Então, o s-valor de�nido

em (2.3) se resume a

s (Θ0;x) =

{1, se x ∈ Θ0

αs, se x /∈ Θ0

,

em que αs = 1− FT [T (X; Θ0)] e FT (·) é de�nida no Teorema 3.1.2.

O Teorema 3.2.2 mostra que a forma analítica do s-valor obtida é a mesma do p-valor parao caso i no Teorema 3.1.2, ao qual refere-se a hipóteses simples. Entretanto, esse teoremado s-valor pode ser utilizado para qualquer Θ0 não vazio, ou seja, os casos b.1, b.2 e b.3,e casos não triviais, tais como Θ0 = {θ ∈ Θ : µ = σ2}, Θ0 = {θ ∈ Θ : µ/σ2 ≥ 1}, Θ0 ={θ ∈ Θ : µ = ln(σ2)}, entre outras. Para mais detalhes referentes a prova do Teorema 3.2.2,consulte a Seção B.21.

3.3 Comparações entre p-valor e s-valor

Nesta seção, uma comparação entre o p-valor e o s-valor é feita quando θ̂ /∈ Θ0, poispara o caso em que θ̂ ∈ Θ0, o s-valor e o p-valor são iguais a 1. Essas comparações são feitasconsiderando os casos a.1, a.2, a.3, b.1, b.2 e b.3 mencionados na Seção 1.1.

3.3.1 Caso normal com variância conhecida

Seja H0 : θ ∈ Θ0, em que θ = µ, Θ0 ⊆ Θ e Θ = R. Assim, pode-se tomar os seguintescasos:

1 O Teorema 3.2.2 foi obtido cronologicamente primeiro do que o Teorema 3.1.2 caso i.

Page 31: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

3.3 COMPARAÇÕES ENTRE P-VALOR E S-VALOR 19

1o caso: Θ0 = {θ ∈ Θ : θ = µ0}

Para este primeiro caso, tem-se a mesma expressão que um teste Z bilateral para ambasas medidas (p-valor e s-valor). Portanto, a relação entre o s-valor e o p-valor é dada por:

s (Θ0;x) = p (Θ0;x) .

Logo, para esse primeiro caso, tem-se que o p-valor é igual ao s-valor.

2o caso: Θ0 = {θ ∈ Θ : θ ≥ µ0} e x /∈ Θ0

Para este segundo caso, tem-se que o p-valor é dado por:

p (Θ0;x) = Φ

(√n

(x− µ0)

σ

),

que tem a expressão de um teste Z unilateral. O s-valor é dado por:

s (Θ0;x) = 1− Fχ2

(n

(x− µ0)2

σ2; 1

)= 2Φ

(√n

(x− µ0)

σ

),

que tem a expressão de um teste Z bilateral como no primeiro caso. Portanto, a relaçãoentre o s-valor e o p-valor é dada por:

s (Θ0;x) = 2 · p (Θ0;x) .

Todavia, p(Θ0;x) ∈ [0, 1/2) para esse segundo caso.

3o caso: Θ0 = {θ ∈ Θ : µ0 ≤ θ ≤ µ1} e x /∈ Θ0

Assumir-se-á que a Conjectura A.1.3 na Seção A.1.3 (ver Apêndice A) é verdadeira.Assim, para este terceiro caso, tem-se que dividir em duas partes.

• x < µ0

Supondo a hipótese nula desse terceiro caso e que x < µ0, tem-se que o p-valor é dadopor:

p(Θ0;x) = 1− Φ

(max(2µ0−x−µ1,0)√

σ2/n

)+ Φ

(x−µ1√σ2/n

).

O s-valor é dado por:

s (Θ0;x) = 1− Fχ2

(n

(x− µ0)2

σ2; 1

)= 2Φ

(√n

(x− µ0)

σ

).

Portanto, a relação entre o s-valor e o p-valor é dada por:

p(Θ0;x) = 1− Φ

(max

(µ0−µ1−Φ−1(s(Θ0;x)/2)

√σ2/n,0

)√σ2/n

)+ Φ

(µ0−µ1√σ2/n

+ Φ−1 (s(Θ0;x)/2)

).

Para mais detalhes consulte a Seção C.1.3.

Page 32: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

20 RESULTADOS 3.3

Figura 3.1: Grá�cos da relação entre o s-valor e o p-valor para o 3o caso da variância conhecida

quando x < µ0, σ2 = 1 e n = 1 (assumindo a Conjectura A.1.3 na Seção A.1.3, ver Apêndice A, é

verdadeira).

• x > µ1

Supondo a hipótese nula desse terceiro caso e que x > µ1, tem-se que o p-valor é dadopor:

p(Θ0;x) = 1− Φ

(x−µ0√σ2/n

)+ Φ

(min(2µ1−x−µ0,0)√

σ2/n

).

O s-valor é dado por:

s (Θ0;x) = 1− Fχ2

(n

(x− µ1)2

σ2; 1

)= 2Φ

(√n

(µ1 − x)

σ

).

Portanto, a relação entre o s-valor e o p-valor é dada por:

p(Θ0;x) = 1− Φ

(µ1−µ0√σ2/n− Φ−1 (s(Θ0;x)/2)

)+ Φ

(min

(µ1−µ0+Φ−1(s(Θ0;x)/2)

√σ2/n,0

)√σ2/n

).

Para mais detalhes consulte a Seção C.1.3.Pelas Figuras 3.1 e 3.2, tem-se que a diferença entre p-valor e s-valor diminui conforme

o comprimento do intervalo [µ0, µ1].

3.3.2 Caso normal com variância desconhecida

Seja H0 : θ ∈ Θ0, em que θ = (µ σ2) e Θ = R × R+, tal que Θ0 ⊆ Θ. Assim, pode-setomar os seguintes casos:

1o caso: Θ0 ={θ ∈ Θ : µ = µ0, σ

2 = σ20

}Para este primeiro caso, tem-se que o p-valor é igual ao s-valor.

Page 33: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

3.3 COMPARAÇÕES ENTRE P-VALOR E S-VALOR 21

Figura 3.2: Grá�cos da relação entre o s-valor e o p-valor para o 3o caso da variância conhecida

quando x > µ1, σ2 = 1 e n = 1 (assumindo a Conjectura A.1.3 na Seção A.1.3, ver Apêndice A, é

verdadeira).

2o caso: Θ0 = {θ ∈ Θ : µ = µ0} e θ̂ /∈ Θ0

Para este segundo caso, tem-se que o p-valor é dado por:

p(Θ0;x) = 2 [1− Ft (q(x; Θ0);n− 1)] ,

em que q(x; Θ0) é de�nido no Teorema 3.1.2 e a expressão do p-valor coincide com um testet bilateral. O s-valor é dado por:

s (Θ0;x) = 1− FT [T (x; Θ0)] .

Portanto, a relação entre o s-valor e o p-valor é dada por:

s (Θ0;x) = 1− FT

n2

2ln

[F−1t

(1− p(x;Θ0)

2;n− 1

)]2

n− 1+ 1

.

Para mais detalhes consulte a Seção C.2.2.Pela Figura 3.3, tem-se que p(Θ0;x) ≥ s(Θ0;x) quando o tamanho amostral é su�cien-

temente grande.

3o caso: Θ0 = {θ ∈ Θ : µ ≥ µ0} e θ̂ /∈ Θ0

Para este terceiro caso, tem-se que o p-valor é dado por:

p(Θ0;x) = 1− Ft (q(x; Θ0);n− 1) ,

em que q(x; Θ0) é de�nido no Teorema 3.1.2 e sua expressão coincide com um teste t unila-teral. O s-valor é dado por:

s (Θ0;x) = 1− FT [T (x; Θ0)] .

Page 34: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

22 RESULTADOS 3.3

Figura 3.3: Grá�cos da relação entre o s-valor e o p-valor para o 2o caso da variância desconhecida.

Portanto, a relação entre o s-valor e o p-valor é dada por:

s (Θ0;x) = 1− FT

[n2

2ln

[[F−1t (1− p (x; Θ0) ;n− 1)

]2n− 1

+ 1

]].

Para mais detalhes consulte a Seção C.2.3.

Figura 3.4: Grá�cos da relação entre o s-valor e o p-valor para o 3o caso da variância desconhecida.

Pela Figura 3.4, tem-se que o s-valor é majorado pelo p-valor para valores pequenos dos-valor, por exemplo, quando s(Θ0;x) < 0.05.

Page 35: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Capítulo 4

Conclusões

Neste trabalho, estudamos as medidas de evidência p-valor e s-valor, assumindo que osdados amostrais são independentes e identicamente distribuídos de acordo com uma distri-buição normal com média µ e variância σ2. Para esse estudo, foram desenvolvidas fórmulasanalíticas para o p-valor e para o s-valor nos seguintes cenários:

a) Variância populacional σ2 conhecida, θ = µ e Θ = R

a.1) Θ0 = {θ ∈ Θ : θ = µ0} = {µ0};a.2) Θ0 = {θ ∈ Θ : θ ≥ µ0};a.3) Θ0 = {θ ∈ Θ : µ0 ≤ θ ≤ µ1};

b) Variância populacional σ2 desconhecida, θ = (µ, σ2)T e Θ = R×R+

b.1) Θ0 = {θ ∈ Θ : µ = µ0 e σ2 = σ20} = {(µ0, σ

20)T};

b.2) Θ0 = {θ ∈ Θ : µ = µ0};b.3) Θ0 = {θ ∈ Θ : µ ≥ µ0};

em que µ0, µ1 e σ20 são valores �xos e −∞ < µ0 < µ1 <∞.

As medidas p-valor e s-valor foram comparadas para todos os casos acima. Para os casosa.1 e b.1, o s-valor coincide com o p-valor. Em a.2, constatou-se que o p-valor é majoradopelo s-valor; observe que nesse caso p(Θ0;x) ∈ [0, 1/2). Para os demais casos, encontramosrelações complexas entre o p-valor e o s-valor, que a principio não conseguimos encontraruma interpretação simples. No caso a.3, considerando que a Conjectura A.1.3 na Seção A.1.3(ver Apêndice A) é verdadeira, observou-se por grá�cos que quanto menor o comprimento dointervalo [µ0, µ1] menor é a diferença entre essas duas medidas. Em b.2, quando o tamanhoamostral é su�cientemente grande, tem-se que o s-valor é majorado pelo p-valor. Já no casob.3, observou-se que p(Θ0;x) ∈ [0, 1/2) e que o s-valor é majorado pelo p-valor para valorespequenos do s-valor, por exemplo, quando s(Θ0;x) < 0.05. Não foi possível identi�car queuma medida sempre majora a outra, ou seja, o p-valor ser sempre majorado pelo s-valor, ouvice-versa.

23

Page 36: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

24 CONCLUSÕES

4.1 Sugestões para Pesquisas Futuras

Objetivamos estudar o s-valor para o caso de 2 normais independentes com a mesmavariância (conhecida e desconhecida), e ambas as medidas de evidência p-valor e s-valorutilizando as seguintes famílias de distribuições:

• Família exponencial (Poisson, binomial, exponencial etc.);

• Família elíptica (normal, t-Student, exponencial-potência etc.).

Entretanto, as hipóteses a serem estudadas dependerão da distribuição de probabilidadedos dados amostrais.

Page 37: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Apêndice A

P-valor

Neste Apêndice, as demonstrações dos Teoremas 3.1.1 e 3.1.2, omitidas na Seção 3.1,são apresentadas nas Seções A.1 e A.2, respectivamente. Sejam X1, X2, . . . , Xn variáveisaleatórias independentes e identicamente distribuídas com distribuição N(µ, σ2). O σ2 éconsiderado conhecido na Seção A.1 e desconhecido na Seção A.2. O desenvolvimento dos p-valores nos Teoremas 3.1.1 e 3.1.2 tem como estatística de teste a razão de verossimilhanças.

A.1 Teorema 3.1.1

A.1.1 Caso i

Nesta seção, a hipótese nula considerada é H0 : θ ∈ Θ0, em que θ = µ, Θ0 = {θ ∈ Θ :θ = µ0} e Θ = R. A estatística da razão de verossimilhanças para este caso é dada por

λ(x; Θ0) =supθ∈Θ0

L(θ;x)

supθ∈Θ L(θ;x)

=(2πσ2)−

n2 exp{− 1

2σ2

∑ni=1(xi − µ0)2}

(2πσ2)−n2 exp{− 1

2σ2

∑ni=1(xi − x)2}

= exp

{− 1

2σ2

[n∑i=1

x2i − 2µ0

n∑i=1

xi + nµ20 −

n∑i=1

x2i + 2nx2 − nx2

]}

= exp

{− 1

2σ2

[nµ2

0 − 2µ0nx+ nx2]}

= exp{− n

2σ2(µ0 − x)2

}.

Assim, utilizando a de�nição do p-valor em (2.2), tem-se que

p(Θ0;x) = supθ∈Θ0

[n(X − µ0)2

σ2≥ T (x; Θ0)

],

em que T (x; Θ0) = −2 ln [λ(x; Θ0)] e n(X−µ0)2

σ2

Pµ0∼ χ2(1). Logo,

p(Θ0;x) = 1− Fχ2

(n (x− µ0)2

σ2; 1

),

em que Fχ2(·; v) é a função acumulada da distribuição χ2 com v graus de liberdade.

25

Page 38: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

26 APÊNDICE A

A.1.2 Caso ii

Nesta seção, a hipótese nula considerada é H0 : θ ∈ Θ0, em que θ = µ, Θ0 = {θ ∈ Θ :θ ≥ µ0} e Θ = R. A estatística da razão de verossimilhanças para este caso é dada por

λ(x; Θ0) =supθ∈Θ0

L(θ;x)

supθ∈Θ L(θ;x)

=supθ∈Θ0

{exp

{− 1

2σ2

∑ni=1(xi − θ)2

}}exp

{− 1

2σ2

∑ni=1(xi − x)2

} . (A.1)

Agora, estudaremos o numerador de (A.1). Note que

exp

{− 1

2σ2

[n∑i=1

x2i − 2θ

n∑i=1

xi + nθ2

]}∝ exp

{− 1

2σ2

[nθ2 − 2θ

n∑i=1

xi

]}= exp

{− n

2σ2

[θ2 − 2θx+ x2 − x2

]}∝ exp

{− n

2σ2(θ − x)2

}= hx(θ).

Considere gx(θ) = ln[hx(θ)]. Com isso,

• g′x(θ) = − nσ2 (θ − x);

• g′′x(θ) = − nσ2 < 0, então existe o ponto de máximo;

• g′x(θ) = 0⇒ θ = x, logo o ponto de máximo de gx(θ) é x.

Como a função logarítmica é uma função estritamente crescente, então o ponto de máximode hx(θ) é o mesmo de gx(θ). A �m de estudar o supremum do numerador da estatística darazão de verossimilhanças, considere os seguintes casos:

1. Se x ∈ Θ0, então gx(x) = supθ∈Θ0

gx(θ), conforme pode ser visualizado na Figura A.1.

2. Se x ∈ Θc0, em que Θc

0 = {Θ − Θ0}, então gx(µ0) = supθ∈Θ0

gx(θ), conforme pode ser

visualizado na Figura A.2.

Page 39: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

TEOREMA 3.1.1 27

Figura A.1: Ponto de máximo local de g em Θ0, quando x ∈ Θ0.

Figura A.2: Ponto de máximo local de g em Θ0, quando x ∈ Θc0.

Assim,

λ(x; Θ0) =

{1 , se x ∈ Θ0

e−n

2σ2(x−µ0)2 , se x ∈ Θc

0

. (A.2)

Utilizando a de�nição do p-valor em (2.2), se λ(x; Θ0) = 1, tem-se

p(Θ0;x) = supθ∈Θ0

Pθ [T (X; Θ0) ≥ 0] = 1.

Para o caso em que λ(x; Θ0) < 1, utilizando a fórmula da probabilidade total

P (A) = P (A ∩B) + P (A ∩Bc)

Page 40: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

28 APÊNDICE A

tem-se que

p(Θ0;x) = supθ∈Θ0

{Pθ[T (X; Θ0) ≥ T (x; Θ0), X ∈ Θ0

]+

Pθ[T (X; Θ0) ≥ T (x; Θ0), X ∈ Θc

0

]}. (A.3)

Para o cálculo de Pθ[T (X; Θ0) ≥ T (x; Θ0), X ∈ Θ0

], note que, por (A.2), a variável

aleatória λ(X; Θ0) é degenerada no ponto 1, dado que X ∈ Θ0. Note que 0 ≤ λ(x; Θ0) < 1,então, tem-se que

Pθ[T (X; Θ0) ≥ T (x; Θ0), X ∈ Θ0

]= Pθ

[X ∈ Θ0

]Pθ[T (X; Θ0) ≥ T (x; Θ0)

∣∣X ∈ Θ0

]= Pθ

[X ∈ Θ0

]Pθ[1 ≤ λ(x; Θ0)

∣∣X ∈ Θ0

]= 0. (A.4)

Para Pθ[T (X; Θ0) ≥ T (x; Θ0), X ∈ Θc

0

]deve-se considerar que x < µ0, pois X ∈ Θc

0.Com isso, tem-se que

Pθ[T (X; Θ0) ≥ T (x; Θ0), X ∈ Θc

0

]= Pθ

[n(X − µ0)2

σ2≥ n(x− µ0)2

σ2, X < µ0

]= Pθ

[|X − µ0| ≥ |x− µ0|, X < µ0

]= Pθ

[|X − µ0| ≥ µ0 − x,X < µ0

]= Pθ

[X ≥ 2µ0 − x,X < µ0

]+ Pθ

[X ≤ x,X < µ0

]= Pθ

[X ≤ x

]= Φ

(x− θ√σ2/n

)(A.5)

em que T (x; Θ0) = −2 ln[λ(x; Θ0)] = n(x−µ0)2

σ2 e Pθ[X ≥ 2µ0 − x,X < µ0

]= 0. Substituindo

(A.4) e (A.5) em (A.3), tem-se que, quando x < µ0,

p(Θ0;x) = supθ∈Θ0

Φ

(x− θ√σ2/n

).

Note que Φ é uma função decrescente em θ, como Θ0 = {θ ∈ R : θ ≥ µ0}, o supremumrestrito desse conjunto ocorre em θ = µ0. Portanto,

p(Θ0;x) =

{1 , se x ≥ µ0

Φ(−√n (µ0−x)

σ

), se x < µ0

.

A.1.3 Caso iii

Nesta seção, a hipótese nula considerada é H0 : θ ∈ Θ0, em que θ = µ, Θ0 = {θ ∈ R :µ0 ≤ θ ≤ µ1} e Θ = R. A estatística da razão de verossimilhanças para este caso é dada por

Page 41: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

TEOREMA 3.1.1 29

λ(x; Θ0) =supθ∈Θ0

L(θ;x)

supθ∈Θ L(θ;x)

=supθ∈Θ0

{exp

{− 1

2σ2

∑ni=1(xi − θ)2

}}exp

{− 1

2σ2

∑ni=1(xi − x)2

} . (A.6)

De forma análoga ao Caso ii, analisaremos o numerador em (A.6), utilizando a funçãogx(θ). Para isso, deve-se considerar os seguintes casos:

1. Se µ0 ≤ x ≤ µ1, então gx(x) = supθ∈Θ0

gx(θ), conforme pode ser visualizado na Figura A.3.

2. Se x < µ0, então gx(µ0) = supθ∈Θ0

gx(θ), conforme pode ser visualizado na Figura A.4.

3. Se x > µ1, então gx(µ1) = supθ∈Θ0

gx(θ), conforme pode ser visualizado na Figura A.5.

Figura A.3: Ponto de máximo local de g em Θ0, quando µ0 ≤ x ≤ µ1.

Page 42: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

30 APÊNDICE A

Figura A.4: Ponto de máximo local de g em Θ0, quando x < µ0.

Figura A.5: Ponto de máximo local de g em Θ0, quando x > µ1.

Assim,

λ(x; Θ0) =

1 , se µ0 ≤ x ≤ µ1

e−n

2σ2(x−µ0)2 , se x < µ0

e−n

2σ2(x−µ1)2 , se x > µ1

. (A.7)

Utilizando a de�nição do p-valor em (2.2), se λ(x; Θ0) = 1, tem-se que

p(Θ0;x) = supθ∈Θ0

Pθ [T (X; Θ0) ≥ 0] = 1.

Para o caso em que λ(x; Θ0) < 1, utilizando a seguinte propriedade:

P (A) = P (A ∩B) + P (A ∩ C) + P (A ∩D)

Page 43: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

TEOREMA 3.1.1 31

tal que A = B ∪ C ∪D, B ∩ C = ∅, B ∩D = ∅ e C ∩D = ∅, ou seja, B, C e D formamuma partição de A, tem-se que

p(Θ0;x) = supθ∈Θ0

{Pθ[T (X; Θ0) ≥ T (x; Θ0), X ∈ Θ0

]+

Pθ[T (X; Θ0) ≥ T (x; Θ0), X < µ0

]+

Pθ[T (X; Θ0) ≥ T (x; Θ0), X > µ1

]}. (A.8)

Para o cálculo de Pθ[T (X; Θ0) ≥ T (x; Θ0), X ∈ Θ0

], note que, por (A.7), a variável

aleatória λ(X; Θ0) é degenerada no ponto 1, dado que X ∈ Θ0. Note que 0 ≤ λ(x; Θ0) < 1,então, tem-se que

Pθ[T (X; Θ0) ≥ T (x; Θ0), X ∈ Θ0

]= Pθ

[X ∈ Θ0

]Pθ[T (X; Θ0) ≥ T (x; Θ0)

∣∣X ∈ Θ0

]= Pθ

[X ∈ Θ0

]Pθ[1 ≤ λ(x; Θ0)

∣∣X ∈ Θ0

]= 0. (A.9)

Para as seguintes probabilidades,

Pθ[T (X; Θ0) ≥ T (x; Θ0), X < µ0

]e

Pθ[T (X; Θ0) ≥ T (x; Θ0), X > µ1

],

deve-se considerar dois casos, a saber: x < µ0 e x > µ1.Quando x < µ0, tem-se, respectivamente, que

Pθ[T (X; Θ0) ≥ T (x; Θ0), X < µ0

]= Pθ

[n(X − µ0

)2

σ2≥ n (x− µ0)2

σ2, X < µ0

]= Pθ

[∣∣X − µ0

∣∣ ≥ |x− µ0| , X < µ0

]= Pθ

[∣∣X − µ0

∣∣ ≥ µ0 − x,X < µ0

]= Pθ

[X ≥ 2µ0 − x,X < µ0

]+ Pθ

[X ≤ x,X < µ0

]= Pθ

[X ≤ x

]= Φ

(x− θ√σ2/n

), (A.10)

em que Pθ[X ≥ 2µ0 − x,X < µ0

]= 0, e

Page 44: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

32 APÊNDICE A

Pθ[T (X; Θ0) ≥ T (x; Θ0), X > µ1

]= Pθ

[n(X − µ0

)2

σ2≥ n (x− µ0)2

σ2, X > µ1

]= Pθ

[∣∣X − µ0

∣∣ ≥ |x− µ0| , X > µ1

]= Pθ

[∣∣X − µ0

∣∣ ≥ µ0 − x,X > µ1

]= Pθ

[X ≥ 2µ0 − x,X > µ1

]+ Pθ

[X ≤ x,X > µ1

]= Pθ

[X > max (2µ0 − x, µ1)

]= 1− Φ

(max (2µ0 − x, µ1)− θ√

σ2/n

), (A.11)

em que Pθ[X ≤ x,X > µ1

]= 0. Quando x > µ1, tem-se, respectivamente, que

Pθ[T (X; Θ0) ≥ T (x; Θ0), X < µ0

]= Pθ

[n(X − µ1

)2

σ2≥ n (x− µ1)2

σ2, X < µ0

]= Pθ

[∣∣X − µ1

∣∣ ≥ |x− µ1| , X < µ0

]= Pθ

[∣∣X − µ1

∣∣ ≥ x− µ1, X < µ0

]= Pθ

[X ≥ x,X < µ0

]+ Pθ

[X ≤ 2µ1 − x,X < µ0

]= Pθ

[X ≤ min (2µ1 − x, µ0)

]= Φ

(min (2µ1 − x, µ0)− θ√

σ2/n

), (A.12)

em que Pθ[X ≥ x,X < µ0

]= 0, e

Pθ[T (X; Θ0) ≥ T (x; Θ0), X > µ1

]= Pθ

[n(X − µ1

)2

σ2≥ n (x− µ1)2

σ2, X > µ1

]= Pθ

[∣∣X − µ1

∣∣ ≥ |x− µ1| , X > µ1

]= Pθ

[∣∣X − µ1

∣∣ ≥ x− µ1, X > µ1

]= Pθ

[X ≥ x,X > µ1

]+ Pθ

[X ≤ 2µ1 − x,X > µ1

]= Pθ

[X ≥ x

]= 1− Φ

(x− θ√σ2/n

), (A.13)

em que Pθ[X ≤ 2µ1 − x,X > µ1

]= 0.

Se x < µ0, substitui-se (A.9), (A.10) e (A.11) em (A.8), e se x > µ1, substitui-se (A.9),(A.12) e (A.13) em (A.8). Logo, tem-se que o p-valor é dado por

p(Θ0;x) =

1 , se x ∈ Θ0

supθ∈Θ0

f0(θ) , se x < µ0

supθ∈Θ0

f1(θ) , se x > µ1

,

Page 45: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

TEOREMA 3.1.1 33

em que

f0(θ) = 1− Φ

(max (2µ0 − x, µ1)− θ√

σ2/n

)+ Φ

(x− θ√σ2/n

)(A.14)

e

f1(θ) = 1− Φ

(x− θ√σ2/n

)+ Φ

(min (2µ1 − x, µ0)− θ√

σ2/n

). (A.15)

Conjectura A.1.3: Sejam as funções f0(θ) e f1(θ) expressadas nas Equações (A.14) e(A.15), respectivamente. Então, tem-se que:

f0(µ1) = supθ∈Θ0

f0(θ)

e

f1(µ0) = supθ∈Θ0

f1(θ).

Se a Conjectura A.1.3 é verdadeira, tem-se que o p-valor pode ser expressado da seguinteforma:

p(Θ0;x) =

1 , se µ0 ≤ x ≤ µ1

f0(µ1) , se x < µ0

f1(µ0) , se x > µ1

.

Page 46: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

34 APÊNDICE A

A.2 Teorema 3.1.2

A.2.1 Caso i

Nesta seção, a hipótese nula considerada é H0 : θ ∈ Θ0, em que θ = (µ, σ2)T , Θ0 =

{θ ∈ Θ : µ = µ0, σ2 = σ2

0} e Θ = R × R+. Conforme os cálculos em B.2, a funçãoacumulada de T (X; Θ0) = −2 ln [λ(X; Θ0)], sob H0, ou seja, quando Θ0 = {(µ0, σ

20)T}, é

dada por

FT (b) =

∫ n

g0(b)

fχ2(u1;n− 1)Fχ2

(b− g−1

0 (u1); 1)du1 +

∫ g1(b)

n

fχ2(u2;n− 1)Fχ2

(b− g−1

1 (u2); 1)du2,

em que fχ2(·; v) é a função densidade de probabilidade de uma distribuição χ2 com v grausde liberdade,

g0(b) = −n ·W0

(−e−

1n

(b+n))

e g1(b) = −n ·W1

(−e−

1n

(b+n)),

e

ui+1 = gi

((ns2n

σ20

)− n · ln

(ns2n

σ20

)+ n · ln (n)− n

), i = {0, 1}.

As funções Wi, i = {0, 1}, pertencem a um conjunto de funções denominado função Wde Lambert e maiores detalhes sobre esse conjunto podem ser encontrados em Olver et al.(2010, p. 111) e em Corless et al. (1996).

Assim, o p-valor de�nido em (2.2) é

p(Θ0;x) = supθ∈Θ0

[1− FT [T (x; Θ0)]]

= 1− infθ∈Θ0

FT [T (x; Θ0)] .

Como não existe θ em FT [T (x; Θ0)], o p-valor é dado por

p(Θ0;x) = 1− FT [T (x; Θ0)] .

A.2.2 Caso ii

Nesta seção, a hipótese nula considerada é H0 : θ ∈ Θ0, em que θ = (µ, σ2)T , Θ0 =

{θ ∈ Θ : µ = µ0} e Θ = R×R+. A estatística da razão de verossimilhanças para este casoé dada por

λ(x; Θ0) =supθ∈Θ0

L(θ;x)

supθ∈Θ L(θ;x)

=(σ̂2

0)−n2 exp

{− 1

2σ̂20

∑ni=1(xi − µ0)2

}(s2n)−

n2 exp

{− 1

2s2n

∑ni=1(xi − x)2

} ,

Page 47: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

TEOREMA 3.1.2 35

em que σ̂20 = 1

n

∑ni=1 (xi − µ0)2. Logo,

λ(x; Θ0) =

(s2n

σ̂20

)n2

exp

{−1

2

[1

σ̂20

n∑i=1

(xi − µ0)2 − 1

s2n

n∑i=1

(xi − x)2

]}

=

(s2n

σ̂20

)n2

=

( ∑ni=1 (xi − x)2∑ni=1 (xi − µ0)2

)n2

.

Utilizando a de�nição do p-valor em (2.2), tem-se

p(Θ0;x) = supθ∈Θ0

Pθ [T (X; Θ0) ≥ T (x; Θ0)]

= supθ∈Θ0

(∑ni=1

(Xi −X

)2∑ni=1 (Xi − µ0)2

)n2

≤ λ(x; Θ0)

, (A.16)

tal que λ(x; Θ0) ∈ [0, 1]. Com isso, tem-se

(∑ni=1

(Xi −X

)2∑ni=1 (Xi − µ0)2

)n2

≤ λ(x; Θ0)

= Pθ

[∑ni=1

(Xi −X

)2∑ni=1 (Xi − µ0)2 ≤ [λ(x; Θ0)]

2n

]

= Pθ

[∑ni=1 (Xi − µ0)2∑ni=1

(Xi −X

)2 ≥ [λ(x; Θ0)]−2n

]

= Pθ

[∑ni=1 (Xi − µ0)2

(n− 1)S2n−1

≥ [λ(x; Θ0)]−2n

],(A.17)

em que S2n−1 = 1

n−1

∑ni=1

(Xi −X

)2. Sabe-se que

n∑i=1

(Xi − µ0)2 =n∑i=1

(Xi −X

)2+ n

(X − µ0

)2

= (n− 1)S2n−1 + n

(X − µ0

)2. (A.18)

Page 48: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

36 APÊNDICE A

Substituindo (A.18) em (A.17), tem-se que

(∑ni=1

(Xi −X

)2∑ni=1 (Xi − µ0)2

)n2

≤ λ(x; Θ0)

= Pθ

[1 +

n(X − µ0

)2

(n− 1)S2n−1

≥ [λ(x; Θ0)]−2n

]

= Pθ

[n(X − µ0

)2

S2n−1

≥ (n− 1)[λ(x; Θ0)−

2n − 1

]]

= Pθ

[√n∣∣X − µ0

∣∣Sn−1

≥√

(n− 1)[λ(x; Θ0)−

2n − 1

]]

= 1− Pθ

[√n∣∣X − µ0

∣∣Sn−1

<

√(n− 1)

[λ(x; Θ0)−

2n − 1

]]= 1− Pθ [−q(x; Θ0) < Qθ(X; Θ0) < q(x; Θ0)] , (A.19)

em que q(x; Θ0) =

√(n− 1)

[λ(x; Θ0)−

2n − 1

]eQθ(X; Θ0) =

[√n(X − µ

)+√n (µ− µ0)

]/Sn−1.

Substituindo (A.19) em (A.16), tem-se que

p(Θ0;x) = supθ∈Θ0

{1− Pθ

[−q(x; Θ0) <

√n(X − µ

)+√n (µ− µ0)

Sn−1

< q(x; Θ0)

]}

= 1− infθ∈Θ0

[−q(x; Θ0) <

√n(X − µ

)+√n (µ− µ0)

Sn−1

< q(x; Θ0)

]

= 1− Pθ0

[−q(x; Θ0) <

√n(X − µ0

)Sn−1

< q(x; Θ0)

]

O p-valor será calculado utilizando-se o seguinte teorema de Casella e Berger (2002, p.218):

Teorema A.2.1 Sejam X1, . . . , Xn uma amostra aleatória de uma distribuição N(µ, σ2).Então,

(i) X e S2n−1 são independentes de acordo com Pθ, para cada θ ∈ Θ;

(ii)(n−1)S2

n−1

σ2

Pθ0∼ χ2n−1;

(iii)√n(X−µ0)Sn−1

Pθ0∼ tn−1,

em que θ0 = (µ0, σ2)T , χ2

v denota uma variável aleatória qui-quadrado com v graus de liber-dade e tv denota uma variável aleatória t de Student com v graus de liberdade.

Logo, o p-valor para testar H0 é dado por

p(Θ0;x) = 1− Ft (q(x; Θ0);n− 1) + Ft (−q(x; Θ0);n− 1) ,

em que Ft (·; v) é uma função acumulada de uma distribuição t de Student com v graus deliberdade.

Page 49: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

TEOREMA 3.1.2 37

A.2.3 Caso iii

Nesta seção, a hipótese nula considerada é H0 : θ ∈ Θ0, em que θ = (µ, σ2)T , Θ0 =

{θ ∈ Θ : µ ≥ µ0} e Θ = R×R+. A estatística da razão de verossimilhanças para este casoé dada por

λ(x; Θ0) =supθ∈Θ0

L(θ;x)

supθ∈Θ L(θ;x)

=supθ∈Θ0

{(σ2)−

n2 exp

{− 1

2σ2

∑ni=1 (xi − µ)2}}

(s2n)−

n2 exp

{− 1

2s2n

∑ni=1(xi − x)2

} . (A.20)

O vetor θ que maximiza a função (2πσ2)−n2 exp

{− 1

2σ2

∑ni=1 (xi − µ)2} em (A.20) é θ̂ =

(x, s2n)T . Com isso, tem-se os seguintes casos:

1. Se x ≥ µ0, então o vetor de máximo local em Θ0 é θ̂0 = (x, s2n)T ;

2. Se x < µ0, então o vetor de máximo local em Θ0 é θ̂0 =(µ0, σ̂

2µ0

)T, em que σ̂2

µ0=

(1/n)∑n

i=1 (xi − µ0)2.

Logo,

λ (x; Θ0) =

1 , se θ̂ ∈ Θ0( ∑ni=1(xi−x)2∑ni=1(xi−µ0)2

)n2

, se θ̂ ∈ Θc0

. (A.21)

Utilizando a de�nição do p-valor em (2.2), se λ (x; Θ0) = 1, tem-se que

p(Θ0;x) = supθ∈Θ0

Pθ [T (X; Θ0) ≥ 0] = 1.

Para o caso em que λ (x; Θ0) < 1, utilizando a propriedade da probabilidade total

P (A) = P (A ∩B) + P(A ∩Bc

)= P (B)P (A|B) + P (Bc)P (A|Bc),

tem-se que

p(Θ0;x) = supθ∈Θ0

{Pθ

[θ̂ ∈ Θ0

]Pθ

[T (X; Θ0) ≥ T (x; Θ0)

∣∣∣θ̂ ∈ Θ0

]+

+Pθ

[θ̂ ∈ Θc

0

]Pθ

[T (X; Θ0) ≥ T (x; Θ0)

∣∣∣θ̂ ∈ Θc0

]}.

= supθ∈Θ0

{Pθ

[θ̂ ∈ Θ0

]Pθ

[λ (X; Θ0) ≤ λ (x; Θ0)

∣∣∣θ̂ ∈ Θ0

]+

+Pθ

[θ̂ ∈ Θc

0

]Pθ

[λ (X; Θ0) ≤ λ (x; Θ0)

∣∣∣θ̂ ∈ Θc0

]}. (A.22)

Para o cálculo de Pθ[λ(X; Θ0) ≤ λ(x; Θ0)

∣∣∣θ̂ ∈ Θ0

], note que, por (A.21), a variável

aleatória λ(X; Θ0) é degenerada no ponto 1, dado que θ̂ ∈ Θ0. Por isso, tem-se que

[θ̂ ∈ Θ0

]Pθ

[λ (X; Θ0) ≤ λ (x; Θ0)

∣∣∣θ̂ ∈ Θ0

]= Pθ

[θ̂ ∈ Θ0

]Pθ

[1 ≤ λ (x; Θ0)

∣∣∣θ̂ ∈ Θ0

]= 0, (A.23)

Page 50: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

38 APÊNDICE A

pois λ (x; Θ0) ∈ [0, 1)⇒ Pθ

[1 ≤ λ (x; Θ0)

∣∣∣θ̂ ∈ Θ0

]= 0.

Depois, calcula-se esta probabilidade:

P1 = Pθ

[θ̂ ∈ Θc

0

]Pθ

[λ (X; Θ0) ≤ λ (x; Θ0)

∣∣∣θ̂ ∈ Θc0

]= Pθ

[θ̂ ∈ Θc

0

]· Pθ

(∑ni=1

(Xi −X

)2∑ni=1 (Xi − µ0)2

)n2

≤ λ (x; Θ0)∣∣∣θ̂ ∈ Θc

0

= Pθ

[θ̂ ∈ Θc

0

]· Pθ

[√n∣∣X − µ0

∣∣Sn−1

≥ q0(x; Θ0)∣∣∣θ̂ ∈ Θc

0

]

= Pθ

[√n∣∣X − µ0

∣∣Sn−1

≥ q0(x; Θ0), θ̂ ∈ Θc0

]

= Pθ

[√n∣∣X − µ0

∣∣Sn−1

≥ q0(x; Θ0), θ̂ ∈ (−∞, µ0)×R+

]

= Pθ

[√n∣∣X − µ0

∣∣Sn−1

≥ q0(x; Θ0), X < µ0, S2n ∈ R+

]

= Pθ

[√n∣∣X − µ0

∣∣Sn−1

≥ q0(x; Θ0), X < µ0

]

= Pθ

[√n∣∣X − µ0

∣∣Sn−1

≥ q0(x; Θ0),

√n(X − µ0

)Sn−1

< 0

],

em que q0(x; Θ0) =

√(n− 1)

[c0(x; Θ0)−

2n − 1

]e c0(x; Θ0) =

∑ni=1 (xi − x)2 /

∑ni=1 (xi − µ0)2.

Para solucionar essa probabilidade P1, considere os seguintes conjuntos:

A =

{√n∣∣X − µ0

∣∣Sn−1

≥ q0(x; Θ0)

}e

B =

{√n(X − µ0

)Sn−1

< 0

}.

Logo, pode-se reescrever o conjunto A da seguinte forma: A = A1 ∪ A2, em que

A1 =

{√n(X − µ0

)Sn−1

≤ −q0(x; Θ0)

}e

A2 =

{√n(X − µ0

)Sn−1

≥ q0(x; Θ0)

}.

Page 51: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

TEOREMA 3.1.2 39

Assim, tem-se que

P1 = Pθ

[√n∣∣X − µ0

∣∣Sn−1

≥ q0(x; Θ0),

√n(X − µ0

)Sn−1

< 0

]= Pθ [(A1 ∪ A2) ∩B]

= Pθ [(A1 ∩B) ∪ (A2 ∩B)]

= Pθ [A1 ∩B] + Pθ [A2 ∩B] ,

pois (A1 ∩B) ∪ (A2 ∩B) = ∅. Logo,

P1 = Pθ

[θ̂ ∈ Θc

0

]Pθ

[λ (X; Θ0) ≤ λ (x; Θ0)

∣∣∣θ̂ ∈ Θc0

]= Pθ

[√n(X − µ0

)Sn−1

≤ −q0(x; Θ0),

√n(X − µ0

)Sn−1

< 0

]+

+Pθ

[√n(X − µ0

)Sn−1

≥ q0(x; Θ0),

√n(X − µ0

)Sn−1

< 0

]

= Pθ

[√n(X − µ0

)Sn−1

≤ −q0(x; Θ0)

]

= Pθ

[√n(X − µ

)+√n (µ− µ0)

Sn−1

≤ −q0(x; Θ0)

]. (A.24)

Substituindo (A.23) e (A.24) em (A.22), tem-se

p(Θ0;x) =

1 , se x ≥ µ0

supθ∈Θ0

Ft

(−q0(x; Θ0); n− 1,

√n(µ−µ0)σ

), se x < µ0

,

em que Ft (·; v, δ) é uma função acumulada de uma distribuição t de Student não central comv graus de liberdade e com parâmetro de não centralidade δ. Quando δ = 0, Ft (·; v, 0) =Ft (·; v), ou seja, a função acumulada de uma distribuição t de Student não central se reduza uma função acumulada de uma distribuição t de Student central.

Agora, considere a seguinte igualdade:

Ft (q; v, δ) = P

[Z + δ√V/v

≤ q

]= P

[Z − q

√V/v ≤ −δ

], (A.25)

em que Z ∼ N (0, 1) e V ∼ χ2v.

Pelas propriedades de função acumulada, tem-se que, quando δ cresce, a probabilidadeem (A.25) tende a 0, e quando δ decresce, a probabilidade em (A.25) tende a 1. Logo,Ft(·; v, δ) é uma função decrescente em relação a δ.

Como√n(µ − µ0)/σ ∈ R+, então a função

√n(µ − µ0)/σ é mínima quando µ = µ0 ou

σ2 →∞. Como (µ, σ2)T ∈ Θ0, µ ∈ [µ0,∞) e σ2 ∈ R+, então

supθ∈Θ0

Ft

(−q0(x; Θ0); n− 1,

√n (µ− µ0)

σ

)= Ft (−q0(x; Θ0); n− 1, 0) .

Page 52: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

40 APÊNDICE A

Logo, o p-valor é

p(Θ0;x) =

{1 , se x ≥ µ0

Ft (−q0(x; Θ0); n− 1) , se x < µ0.

Page 53: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Apêndice B

S-valor

Neste Apêndice, as demonstrações dos Teoremas 3.2.1 e 3.2.2, omitidas na Seção 3.2,são apresentadas nas Seções B.1 e B.2, respectivamente. Sejam X1, X2, . . . , Xn variáveisaleatórias independentes e identicamente distribuídas com distribuição N(µ, σ2). O σ2 éconsiderado conhecido na Seção B.1 e desconhecido na Seção B.2.

B.1 Teorema 3.2.1

B.1.1 Caso i

Nesta seção, a hipótese nula considerada é H0 : θ ∈ Θ0, em que θ = µ, Θ0 = {θ ∈ Θ :θ = µ0} e Θ = R. Seja

L(θ;x) = (2πσ2)−n2 exp

{− 1

2σ2

n∑i=1

(xi − θ)2

},

em que a estimativa de máxima verossimilhança para θ, nesse caso, é x. Assim,

T (X; {θ}) =n(X − θ

)2

σ2

Pθ∼ χ2(1), ∀ θ ∈ Θ.

Pela de�nição (2.3), primeiramente, tem-se que encontrar a região de con�ança Λα(x).Com isso,

n (x− θ)2

σ2≤ Fα

(x− θ)2 ≤ σ2

nFα

|x− θ| ≤√σ2

nFα,

Logo,

Λα(x) =

[x−

√σ2

nFα;x+

√σ2

nFα

].

Para satisfazer Λα(x) ∩ Θ0 6= ∅, pelo menos um ponto de Θ0 deve estar na região de

41

Page 54: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

42 APÊNDICE B

con�ança. Com isso, o α que resolver o sup {α ∈ (0, 1) : Λα (x) ∩Θ0 6= ∅} seria o maior nívelde signi�cância que gera a menor região de con�ança que contém um ponto de Θ0 na bordade sua região. Assim,

x−√σ2

nFα = µ0 ou x+

√σ2

nFα = µ0,

então

Fα =n (x− µ0)2

σ2

Fχ2 (Fα; 1) = Fχ2

(n (x− µ0)2

σ2; 1

),

em que Fχ2(·; v) é uma função acumulada de uma distribuição χ2 com v graus de liberdade.Portanto,

1− αs = Fχ2

(n (x− µ0)2

σ2; 1

)

αs = 1− Fχ2

(n (x− µ0)2

σ2; 1

).

Logo, o s-valor é dado por

s (Θ0;x) = αs.

B.1.2 Caso ii

Nesta seção, a hipótese nula considerada é H0 : θ ∈ Θ0, em que θ = µ, Θ0 = {θ ∈ Θ :θ ≥ µ0} e Θ = R. Pela Seção B.1.1, tem-se que, a região de con�ança Λα(x) é dada por:

Λα(x) =

[x−

√σ2

nFα;x+

√σ2

nFα

].

Para satisfazer Λα(x) ∩ Θ0 6= ∅, pelo menos um ponto de Θ0 deve estar na região decon�ança. Com isso, o α que resolver o sup {α ∈ (0, 1) : Λα (x) ∩Θ0 6= ∅} seria o maior nívelde signi�cância que gera a menor região de con�ança que contém um ponto de Θ0 na bordade sua região. Sendo assim, as soluções seriam duas:

1o Se x ≥ µ0, então s (Θ0;x) = 1;

2o Se x < µ0, então a borda superior da região de con�ança deve ser igual a µ0.

Page 55: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

TEOREMA 3.2.1 43

Assim,

x+

√σ2

nFα = µ0

Fα =n (x− µ0)2

σ2

Fχ2 (Fα; 1) = Fχ2

(n (x− µ0)2

σ2; 1

),

em que Fχ2(·; v) é uma função acumulada de uma distribuição χ2 com v graus de liberdade.Portanto,

1− αs = Fχ2

(n (x− µ0)2

σ2; 1

)

αs = 1− Fχ2

(n (x− µ0)2

σ2; 1

).

Logo, o s-valor é dado por

s (Θ0;x) =

{1 , se x ≥ µ0

αs , se x < µ0.

B.1.3 Caso iii

Nesta seção, a hipótese nula considerada é H0 : θ ∈ Θ0, em que θ = µ, Θ0 = {θ ∈ Θ :µ0 ≤ θ ≤ µ1} e Θ = R. Pela Seção B.1.1, tem-se que, a região de con�ança Λα(x) é dadapor:

Λα(x) =

[x−

√σ2

nFα;x+

√σ2

nFα

].

Para satisfazer Λα(x) ∩ Θ0 6= ∅, pelo menos um ponto de Θ0 deve estar na região decon�ança. Com isso, o α que resolver o sup {α ∈ (0, 1) : Λα (x) ∩Θ0 6= ∅} seria o maior nívelde signi�cância que gera a menor região de con�ança que contém um ponto de Θ0 na bordade sua região. Sendo assim, as soluções seriam três:

1o Se µ0 ≤ x ≤ µ1, então s (Θ0;x) = 1;

2o Se x < µ0, então a borda superior da região de con�ança deve ser igual a µ0;

3o Se x > µ1, então a borda inferior da região de con�ança deve ser igual a µ1.

No primeiro caso, em que x < µ0, tem-se que

x+

√σ2

nFα = µ0

Fα =n (x− µ0)2

σ2

Fχ2 (Fα; 1) = Fχ2

(n (x− µ0)2

σ2; 1

),

Page 56: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

44 APÊNDICE B

em que Fχ2(·; v) é uma função acumulada de uma distribuição χ2 com v graus de liberdade.Portanto,

1− αs0 = Fχ2

(n (x− µ0)2

σ2; 1

)

αs0 = 1− Fχ2

(n (x− µ0)2

σ2; 1

).

No caso em que x > µ1, tem-se que

x−√σ2

nFα = µ1

Fα =n (x− µ1)2

σ2

Fχ2 (Fα; 1) = Fχ2

(n (x− µ1)2

σ2; 1

)

1− αs1 = Fχ2

(n (x− µ1)2

σ2; 1

)

αs1 = 1− Fχ2

(n (x− µ1)2

σ2; 1

).

Logo, o s-valor é dado por:

s (Θ0;x) =

1 , se µ0 ≤ x ≤ µ1

αs0 , se x < µ0

αs1 , se x > µ1

.

B.2 Teorema 3.2.2

Nesta seção, a hipótese nula considerada é H0 : θ ∈ Θ0, em que θ = (µ, σ2)T , Θ0 (umconjunto não vazio) e Θ = R×R+. Para essa seção, a estimativa de máxima verossimilhançaé θ̂ = (x, s2

n)T . Assim,

T (x; {θ}) = 2

[−n

2ln(2πs2

n

)− 1

2s2n

n∑i=1

(xi − x)2 +n

2ln(2πσ2

)+

+1

2σ2

n∑i=1

(xi − µ)2

]

= n[ln(2πσ2

)− ln

(2πs2

n

)]+

1

σ2

n∑i=1

(xi − µ)2 − 1

s2n

n∑i=1

(xi − x)2

=1

σ2

[n∑i=1

(xi − x)2 + n (x− µ)2

]− n− n · ln

(s2n

σ2

)= n

s2n

σ2+ n

(x− µ)2

σ2− n · ln

(ns2n

σ2

)+ n · ln (n)− n.

Page 57: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

TEOREMA 3.2.2 45

Logo,

T (X; {θ}) = nS2n

σ2+ n

(X − µ

)2

σ2− n · ln

(nS2n

σ2

)+ n · ln (n)− n.

Com isso, sabe-se que

Y1(X; {θ}) = nS2n

σ2

Pθ∼ χ2(n−1), ∀ θ ∈ Θ,

Y2(X; {θ}) = n

(X − µ

)2

σ2

Pθ∼ χ2(1), ∀ θ ∈ Θ

e

Y1(X; {θ}) ⊥ Y2(X; {θ}).

Assim, como o objetivo é encontrar a distribuição de T (X; {θ}), note que

T (X; {θ}) = Y1(X; {θ}) + Y2(X; {θ})− n · ln (Y1(X; {θ})) + n · ln (n)− n= Z(X; {θ}) + Y2(X; {θ}),

em que Z(X; {θ}) = Y1(X; {θ})−n·ln (Y1(X; {θ}))+n·ln (n)−n. A �m de evitar sobrecargade notação, serão removidos os argumentos das funções, e serão adotadas as seguintes formas:

T ≡ T (X; {θ}),Y1 ≡ Y1(X; {θ}),Y2 ≡ Y2(X; {θ}),Z ≡ Z(X; {θ}).

Estudaremos as seguintes transformações de variáveis:

T = Z + Y2 e J = Y2. (B.1)

A �m de encontrar a distribuição de T , primeiramente, deve-se encontrar a distribuição

de Z, pois Y2Pθ∼ χ2

(1). Observe que Z tem um comportamento parecido com uma funçãoquadrática, como mostra a Figura B.1. Então, tem-se que particionar o domínio de Z emduas partes que possuam inversas. Assim, tem-se que

1a parte:

Z = Y1 − n · ln (Y1) + n · ln (n)− n, para Y1 ∈ (0, n];

2a parte:

Z = Y1 − n · ln (Y1) + n · ln (n)− n, para Y1 ∈ (n,∞).

Page 58: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

46 APÊNDICE B

Figura B.1: Grá�co da função Zn(y) = y − n · ln (y) + n · ln (n)− n.

Manipulando Z tem-se que

Z = Y1 − n · ln (Y1) + n · ln (n)− nZ + n = Y1 − n · ln (Y1) + n · ln (n)

− 1

n(Z + n) = −Y1

n+ ln (Y1)− ln (n)

− 1

n(Z + n) = −Y1

n+ ln

(Y1

n

)e−

1n

(Z+n) =Y1

n· e−

Y1n

−e−1n

(Z+n) = −Y1

n· e−

Y1n . (B.2)

Para encontrar a inversa em (B.2) é necessário utilizar a função W de Lambert (videCorless et al. (1996) e Olver et al. (2010, pp. 111) para maiores detalhes). A função Wde Lambert, também chamada de função ômega ou logaritmo do produto, é um conjunto defunções, ou seja, os ramos da relação inversa da função f(y) = y · ey, tal que y ∈ C. Assim,

y = f−1 (y · ey) = W (y · ey) .

Com isso, aplicando a função W de Lambert em (B.2) tem-se que

W(−e−

1n

(Z+n))

= −Y1

n

Y1 = −n ·W(−e−

1n

(Z+n)).

Logo, a inversa para a 1a parte é

g0(Z) = −n ·W0

(−e−

1n

(Z+n)),

Page 59: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

TEOREMA 3.2.2 47

em que W0 é o ramo principal da função de Lambert, e a inversa da 2a parte é

g1(Z) = −n ·W1

(−e−

1n

(Z+n)),

em que W1 é o ramo não principal da função de Lambert. Com isso, a função densidade deZ é dada por

fZ(z) = fY1 (g0(z))

∣∣∣∣δg0(z)

δz

∣∣∣∣+ fY1 (g1(z))

∣∣∣∣δg1(z)

δz

∣∣∣∣ .Como Z e Y2 são independentes, a função de densidade conjunta da transformação (B.1)

é dada por

fT,J(t, j) = fZ(t− j)fY2(j).

A distribuição marginal da variável T e sua função acumulada, respectivamente, são dadaspor

fT (t) =

∫ ∞0

fT,J(t, j) dj

=

∫ ∞0

fZ(t− j)fY2(j) dj

=

∫ ∞0

(fY1 (g0(t− j)) |g′0(t− j)|+

+fY1 (g1(t− j)) |g′1(t− j)|) I (t− j)(0;∞)

fY2(j) dj

=

∫ t

0

(fY1 (g0(t− j)) |g′0(t− j)|+ fY1 (g1(t− j)) |g′1(t− j)|) fY2(j) dj

e

FT (b) =

∫ b

0

fT (t) dt

=

∫ b

0

∫ t

0

(fY1 (g0(t− j)) |g′0(t− j)|+ fY1 (g1(t− j)) |g′1(t− j)|) fY2(j) dj dt

= F1(b) + F2(b),

em que

F1(b) =

∫ b

0

∫ t

0

fY1 (g0(t− j)) |g′0(t− j)|fY2(j) dj dt

e

F2(b) =

∫ b

0

∫ t

0

fY1 (g1(t− j)) |g′1(t− j)|fY2(j) dj dt.

Os próximos passos são necessários para obter F1 e F2. Considere a seguinte transfor-mação u1 = g0(t − j), então tem-se que du1 = −g′0(t − j)dj e j = t − g−1

0 (u1), em que

Page 60: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

48 APÊNDICE B

g−10 (u1) = u1 − n · ln(u1) + n · ln(n)− n. Note que g0(0) = n. Portanto,

F1(b) =

∫ b

0

∫ t

0

fY1 (g0(t− j)) |g′0(t− j)|fY2(j) dj dt

=

∫ b

0

∫ t

0

fY1 (g0(t− j)) (−g′0(t− j)) fY2(j) dj dt

=

∫ b

0

∫ n

g0(t)

fY1 (u1) fY2(t− g−10 (u1)) du1 dt

=

∫ n

g0(b)

∫ b

g−10 (u1)

fY1 (u1) fY2(t− g−10 (u1)) dt du1

=

∫ n

g0(b)

fY1 (u1)

∫ b

g−10 (u1)

fY2(t− g−10 (u1)) dt du1.

Tome v1 = t− g−10 (u1) e dv1 = dt,

F1(b) =

∫ n

g0(b)

fY1 (u1)

∫ b

g−10 (u1)

fY2(t− g−10 (u1)) dt du1

=

∫ n

g0(b)

fY1 (u1)

∫ b−g−10 (u1)

0

fY2(v1) dv1 du1

=

∫ n

g0(b)

fY1(u1)FY2(b− g−1

0 (u1))du1

=

∫ n

g0(b)

fY1(u1)Fχ2

(b− g−1

0 (u1); 1)du1.

Para F2(b) foi utilizado o mesmo método. Com isso, considere a seguinte transformaçãou2 = g1(t − j), então tem-se que du2 = −g′1(t − j)dj e j = t − g−1

1 (u2), em que g−11 (u2) =

u2 − n · ln(u2) + n · ln(n)− n. Note que g1(0) = n. Portanto,

F2(b) =

∫ b

0

∫ t

0

fY1 (g1(t− j)) |g′1(t− j)|fY2(j) dj dt

=

∫ b

0

∫ t

0

fY1 (g1(t− j)) g′1(t− j)fY2(j) dj dt

= −∫ b

0

∫ n

g1(t)

fY1 (u2) fY2(t− g−11 (u2)) du2 dt

=

∫ b

0

∫ g1(t)

n

fY1 (u2) fY2(t− g−11 (u2)) du2 dt

=

∫ g1(b)

n

∫ b

g−11 (u2)

fY1 (u2) fY2(t− g−11 (u2)) dt du2

=

∫ g1(b)

n

fY1 (u2)

∫ b

g−11 (u2)

fY2(t− g−11 (u2)) dt du2.

Page 61: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

TEOREMA 3.2.2 49

Tome v2 = t− g−11 (u2) e dv2 = dt,

F2(b) =

∫ g1(b)

n

fY1 (u2)

∫ b

g−11 (u2)

fY2(t− g−11 (u2)) dt du2

=

∫ g1(b)

n

fY1 (u2)

∫ b−g−11 (u2)

0

fY2(v2) dv2 du2

=

∫ g1(b)

n

fY1(u2)FY2(b− g−1

1 (u2))du2

=

∫ g1(b)

n

fY1(u2)Fχ2

(b− g−1

1 (u2); 1)du2.

Portanto, a distribuição acumulada da variável aleatória T é explicitada por:

FT (b) =

∫ n

g0(b)

fY1(u1)Fχ2

(b− g−1

0 (u1); 1)du1 +

∫ g1(b)

n

fY1(u2)Fχ2

(b− g−1

1 (u2); 1)du2.

Observe que FT (·) não depende de θ.Pela de�nição do s-valor em (2.3), primeiramente, tem-se que encontrar a região de

con�ança Λα(x), tal que Λα(x) ∩Θ0 6= ∅. Com isso,

Λα(x) ∩Θ0 6= ∅ ⇒ T (x; {θ}) ≤ Fα, ∀ θ ∈ Θ0

⇒ ns2n

σ2+ n

(x− µ0)2

σ2− n · ln

(ns2n

σ2

)+ n · ln (n)− n ≤ Fα, ∀ θ ∈ Θ0.

Assim,

T (x; {θ}) ≤ Fα, ∀ θ ∈ Θ0

FT [T (x; {θ})] ≤ 1− α, ∀ θ ∈ Θ0

α ≤ 1− FT [T (x; {θ})] , ∀ θ ∈ Θ0.

Logo, aplicando o sup em α, tem-se que

αs = supθ∈Θ0

[1− FT [T (x; {θ})]]

= 1− infθ∈Θ0

FT [T (x; {θ})] .

Como a função FT é estritamente crescente e não depende de θ, então

αs = 1− FT[

infθ∈Θ0

T (x; {θ})]

= 1− FT [T (x; Θ0)] ,

pois

infθ∈Θ0

T (x; {θ}) = infθ∈Θ0

−2 ln [λ(x; {θ})]

= −2 ln[ supθ∈Θ0

λ(x; {θ})]

= −2 ln [λ(x; Θ0)]

= T (x; Θ0).

Page 62: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

50 APÊNDICE B

Portanto, se Θ0 6= ∅, então o s-valor é dado por

s (Θ0;x) =

{1 , se x ∈ Θ0

αs , se x /∈ Θ0. (B.3)

Note que a equação B.3 para o s-valor é obtida de forma geral para uma hipótese nula Θ0

não vazia arbitrária. Contudo, nesse trabalho, focamos nosso estudo nas seguintes hipótesesnulas:

i. H0 : θ ∈ Θ0, em que Θ0 = {θ ∈ Θ : µ = µ0, σ2 = σ2

0};

ii. H0 : θ ∈ Θ0, em que Θ0 = {θ ∈ Θ : µ = µ0};

iii. H0 : θ ∈ Θ0, em que Θ0 = {θ ∈ Θ : µ ≥ µ0}.

Page 63: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Apêndice C

Comparações entre p-valor e s-valor

Neste Apêndice, os cálculos omitidos na Seção 3.3 são apresentados na Seção C.1 e naSeção C.2

C.1 Caso normal com variância conhecida

Primeiramente, sejam X1, X2, . . . , Xn variáveis aleatórias independentes e identicamentedistribuídas com distribuição N(µ, σ2), com σ2 conhecido. E considere que H0 : θ ∈ Θ0, emque θ = µ, Θ0 ⊆ Θ, Θ = R e o conjunto Θ0 será especi�cado posteriormente.

Para esta seção, deve-se colocar o p-valor e o s-valor sob a mesma família paramétricade distribuição. Com isso, o s-valor para o caso normal com variância conhecida será repre-sentado por uma N(0, 1) quando necessário.

Nos casos em que Θ0 = {θ ∈ Θ : θ ≥ µ0} ou Θ0 = {θ ∈ Θ : µ0 ≤ θ ≤ µ1} e x̄ < µ0, os-valor é dado por

s(Θ0;x) = 1− Pµ0

(Z2 ≤ n

(x− µ0)2

σ2

),

em que Z2 ∼ χ2(1).

51

Page 64: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

52 APÊNDICE C

Com isso,

s(Θ0;x) = 1− Pµ0

(Z2 ≤ n

(x− µ0)2

σ2

)

= 1− Pµ0(|Z| ≤

√n|x− µ0|

σ

)= 1− Pµ0

(−√n|x− µ0|

σ≤ Z ≤

√n|x− µ0|

σ

)= 1− Pµ0

(Z ≤

√n|x− µ0|

σ

)+ Pµ0

(Z ≤ −

√n|x− µ0|

σ

)= 1− Pµ0

(Z ≤ −

√n

(x− µ0)

σ

)+ Pµ0

(Z ≤

√n

(x− µ0)

σ

)= Pµ0

(Z ≥ −

√n

(x− µ0)

σ

)+ Pµ0

(Z ≤

√n

(x− µ0)

σ

)= 2 · Pµ0

(Z ≤

√n

(x− µ0)

σ

)= 2 · Φ

(√n

(x− µ0)

σ

),

em que Z ∼ N(0, 1).No caso em que Θ0 = {θ ∈ Θ : µ0 ≤ θ ≤ µ1} e x̄ > µ1, o s-valor é dado por

s(Θ0;x) = 1− Pµ1

(Z2 ≤ n

(x− µ1)2

σ2

),

em que Z2 ∼ χ2(1). Com isso,

s(Θ0;x) = 1− Pµ1

(Z2 ≤ n

(x− µ1)2

σ2

)

= 1− Pµ1(|Z| ≤

√n|x− µ1|

σ

)= 1− Pµ1

(−√n|x− µ1|

σ≤ Z ≤

√n|x− µ1|

σ

)= 1− Pµ1

(Z ≤

√n|x− µ1|

σ

)+ Pµ1

(Z ≤ −

√n|x− µ1|

σ

)= 1− Pµ1

(Z ≤

√n

(x− µ1)

σ

)+ Pµ1

(Z ≤ −

√n

(x− µ1)

σ

)= Pµ1

(Z ≥

√n

(x− µ1)

σ

)+ Pµ1

(Z ≤ −

√n

(x− µ1)

σ

)= 2 · Pµ1

(Z ≤ −

√n

(x− µ1)

σ

)= 2 · Φ

(−√n

(x− µ1)

σ

),

em que Z ∼ N(0, 1).

Page 65: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

CASO NORMAL COM VARIÂNCIA CONHECIDA 53

C.1.1 1o caso: Θ0 = {θ ∈ Θ : θ = µ0}Neste primeiro caso, o p-valor é dado por

p(Θ0;x) = 1− Pµ0

(Z2 ≤ n

(x− µ0)2

σ2

),

e o s-valor por

s(Θ0;x) = 1− Pµ0

(Z2 ≤ n

(x− µ0)2

σ2

).

Logo, o s-valor é igual ao p-valor nesse caso.

C.1.2 2o caso: Θ0 = {θ ∈ Θ : θ ≥ µ0} e x /∈ Θ0

Neste segundo caso, o p-valor é dado por

p(Θ0;x) = Pµ0

(Z ≤

√n

(x− µ0)

σ

),

e o s-valor por

s(Θ0;x) = 2 · Pµ0(Z ≤

√n

(x− µ0)

σ

).

Logo, o s-valor é duas vezes maior que o p-valor nesse caso.

C.1.3 3o caso: Θ0 = {θ ∈ Θ : µ0 ≤ θ ≤ µ1} e x /∈ Θ0

Neste terceiro caso, considerando que a conjectura proposta na Seção A.1.3 (ver ApêndiceA) é verdadeira, tem-se que dividi-lo em dois casos, quando x < µ0 ou x > µ1.

i. x < µ0

Nesse caso, o p-valor é dado por

p(Θ0;x) = 1− Φ

(max (2µ0 − x− µ1, 0)√

σ2/n

)+ Φ

(x− µ1√σ2/n

),

e o s-valor por

s(Θ0;x) = 2Φ

(√n

(x− µ0)

σ

),

em que é possível isolar o termo x em função de s(Θ0;x), ou seja, x = µ0+Φ−1 (s(Θ0;x)/2)√σ2/n.

Então, a relação entre o p-valor e o s-valor é dada por

p(Θ0;x) = 1− Φ

max(µ0 − µ1 − Φ−1 (s(Θ0;x)/2)

√σ2/n, 0

)√σ2/n

+ Φ

(µ0 − µ1√σ2/n

+ Φ−1 (s(Θ0;x)/2)

).

Page 66: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

54 APÊNDICE C

ii. x > µ1

Nesse caso, o p-valor é dado por

p(Θ0;x) = 1− Φ

(x− µ0√σ2/n

)+ Φ

(min (2µ1 − x− µ0, 0)√

σ2/n

),

e o s-valor por

s(Θ0;x) = 2Φ

(−√n

(x− µ1)

σ

),

em que é possível isolar o termo x em função de s(Θ0;x), ou seja, x = µ1−Φ−1 (s(Θ0;x)/2)√σ2/n.

Então, a relação entre o p-valor e o s-valor é dada por

p(Θ0;x) = 1− Φ

(µ1 − µ0√σ2/n

− Φ−1 (s(Θ0;x)/2)

)+ Φ

min(µ1 − µ0 + Φ−1 (s(Θ0;x)/2)

√σ2/n, 0

)√σ2/n

.

C.2 Caso normal com variância desconhecida

Sejam X1, X2, . . . , Xn variáveis aleatórias independentes e identicamente distribuídascom distribuição N(µ, σ2). E considere que H0 : θ ∈ Θ0, em que θ = (µ, σ2)T , Θ0 ⊆ Θ eΘ = R×R+.

C.2.1 1o caso: Θ0 ={θ ∈ Θ : µ = µ0, σ

2 = σ20

}Neste caso, o p-valor é dado por

p(Θ0;x) = 1− FT [T (x; Θ0)] ,

e o s-valor por

s(Θ0;x) = 1− FT [T (x; Θ0)] .

Logo, o s-valor é igual ao p-valor nesse caso.

C.2.2 2o caso: Θ0 = {θ ∈ Θ : µ = µ0} e θ̂ /∈ Θ0

Para este segundo caso, o p-valor é dado por:

p(Θ0;x) = 2 [1− Ft (q(x; Θ0);n− 1)] ,

em que

q(x; Θ0) =√

(n− 1)[c(x; Θ0)−2/n − 1]

e

c(x; Θ0) =n∑i=1

(xi − x)2 /

n∑i=1

(xi − µ0)2 ,

tal que λ (x; Θ0) = [c(x; Θ0)]n/2.

Page 67: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

CASO NORMAL COM VARIÂNCIA DESCONHECIDA 55

O s-valor é dado por:

s (Θ0;x) = 1− FT [T (x; Θ0)] .

Note que

λ (x; Θ0) = [c(x; Θ0)]n/2

=

[[q(x; Θ0)]2

n− 1+ 1

]−n24

e

q (x; Θ0) = F−1t

(1− p(x; Θ0)

2;n− 1

).

Portanto,

s (Θ0;x) = 1− FT

n2

2ln

[F−1t

(1− p(x;Θ0)

2;n− 1

)]2

n− 1+ 1

.

C.2.3 3o caso: Θ0 = {θ ∈ Θ : µ ≥ µ0} e θ̂ /∈ Θ0

Para este terceiro caso, o p-valor é dado por:

p(Θ0;x) = 1− Ft (q(x; Θ0);n− 1) .

O s-valor é dado por:

s (Θ0;x) = 1− FT [T (x; Θ0)] .

Fazendo operações similares as estudadas na Seção C.2.2 tem-se que

s (Θ0;x) = 1− FT

[n2

2ln

[[F−1t (1− p (x; Θ0) ;n− 1)

]2n− 1

+ 1

]].

Page 68: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

56 APÊNDICE C

Page 69: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

Referências Bibliográ�cas

Amisano e Giacomini (2007) Gianni Amisano e Ra�aella Giacomini. Comparing densityforecasts via weighted likelihood ratio tests. Journal of Business & Economic Statistics,25(2):177�190. Citado na pág. 1

Bahadur e Raghavachari (1972) RR Bahadur e M Raghavachari. Some asymptoticproperties of likelihood ratios on general sample spaces. Em Proceedings of the SixthBerkeley Symposium on Mathematical Statistics and Probability, volume 1, páginas 129�152. Univ of California Press. Citado na pág. 6

Blackwelder (1982)William C Blackwelder. �proving the null hypothesis� in clinical trials.Controlled clinical trials, 3(4):345�353. Citado na pág. 1

Brownlee (1965) Kenneth Alexander Brownlee. Statistical theory and methodology inscience and engineering, volume 150. Wiley New York. Citado na pág. 13, 15

Casella e Berger (2002) George Casella e Roger L Berger. Statistical inference, volume 2.Duxbury Paci�c Grove, CA. Citado na pág. 36

Corless et al. (1996) Robert M Corless, Gaston H Gonnet, David EG Hare, David J Je�reye Donald E Knuth. On the lambertw function. Advances in Computational mathematics,5(1):329�359. Citado na pág. 16, 34, 46

Cox (1977) David R Cox. The role of signi�cance tests [with discussion and reply]. Scan-dinavian Journal of Statistics, páginas 49�70. Citado na pág. 2, 7, 8

Cox e Hinkley (1974) David R Cox e David V Hinkley. Theoretical Statistics. Chapman-Hall, London. Citado na pág. 6, 9

Diniz et al. (2012)Marcio Diniz, Carlos AB Pereira, Adriano Polpo, Julio M Stern e SergioWechsler. Relationship between bayesian and frequentist signi�cance indices. InternationalJournal for Uncertainty Quanti�cation, 2(2). Citado na pág. 1

Drton (2009) Mathias Drton. Likelihood ratio tests and singularities. The Annals ofStatistics, páginas 979�1012. Citado na pág. 6, 7

Dubois (2006) Didier Dubois. Possibility theory and statistical reasoning. Computationalstatistics & data analysis, 51(1):47�69. Citado na pág. 10, 11

Dubois e Prade (2001) Didier Dubois e Henri Prade. Possibility theory, probabilitytheory and multiple-valued logics: A clari�cation. Annals of mathematics and Arti�cialIntelligence, 32(1-4):35�66. Citado na pág. 10, 11

Fisher (1955) Ronald Fisher. Statistical methods and scienti�c induction. Journal of theRoyal Statistical Society. Series B (Methodological), páginas 69�78. Citado na pág. 7

57

Page 70: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

58 REFERÊNCIAS BIBLIOGRÁFICAS

Fisher (1925) Ronald Aylmer Fisher. Statistical methods for research workers. GenesisPublishing Pvt Ltd. Citado na pág. 1

Gail e Simon (1985) M. Gail e R. Simon. Testing for qualitative interactions between tre-atment e�ects and patient subsets. Biometrics, 41(2):361�372. ISSN 0006341X, 15410420.URL http://www.jstor.org/stable/2530862. Citado na pág. 1

Hobbs e Hilborn (2006) N Thompson Hobbs e Ray Hilborn. Alternatives to statisticalhypothesis testing in ecology: a guide to self teaching. Ecological Applications, 16(1):5�19.Citado na pág. 1

Izbicki e Esteves (2015) Rafael Izbicki e Luís Gustavo Esteves. Logical consistency insimultaneous statistical test procedures. Logic Journal of IGPL, 23(5):732�758. Citado na

pág. 2, 8, 9

Izbicki et al. (2012) Rafael Izbicki, Victor Fossaluza, Ana Gabriela Hounie, Eduardo YoshioNakano e Carlos Alberto de Braganca Pereira. Testing allele homogeneity: the problemof nested hypotheses. BMC genetics, 13(1):103. Citado na pág. 2, 8

Je�reys (1961) Harold Je�reys. Theory of probability. Oxford Univeristy Press, 3 ed. Citadona pág. 1

Katircioglu (2009) Salih T Katircioglu. Revisiting the tourism-led-growth hypothesis forturkey using the bounds test and johansen approach for cointegration. Tourism Manage-ment, 30(1):17�20. Citado na pág. 1

Lehmann (2012) Erich L Lehmann. The �sher, neyman-peerson theories of testing hy-potheses: One theory or two? Em Selected Works of EL Lehmann, páginas 201�208.Springer. Citado na pág. 1, 2

Lehmann et al. (1991) Erich Leo Lehmann, George Casella e George Casella. Theory ofpoint estimation. Wadsworth & Brooks/Cole Advanced Books & Software. Citado na pág. 1

Loehle (1987) Craig Loehle. Hypothesis testing in ecology: psychological aspects and theimportance of theory maturation. Quarterly Review of Biology, 62(4):397�409. Citado na pág.

1

Mudholkar e Chaubey (2009) Govind S Mudholkar e Yogendra P Chaubey. On de�ningp-values. Statistics & Probability Letters, 79(18):1963�1971. Citado na pág. 1

Neyman e Pearson (1933) Jerzy Neyman e Egon S Pearson. The testing of statisticalhypotheses in relation to probabilities a priori. Em Mathematical Proceedings of the Cam-bridge Philosophical Society, volume 29, páginas 492�510. Cambridge Univ Press. Citado na

pág. 1

Olver et al. (2010) Frank WJ Olver, Daniel W Lozier, Ronald F Boisvert e Charles WClark. NIST handbook of mathematical functions. Cambridge University Press. Citado na

pág. 16, 34, 46

Patriota (2013) Alexandre G Patriota. A classical measure of evidence for general nullhypotheses. Fuzzy Sets and Systems, 233:74�88. Citado na pág. 1, 2, 5, 8, 9, 10, 11

Pereira e Stern (1999) Carlos Alberto de Bragança Pereira e Julio Michael Stern. Evi-dence and credibility: full bayesian signi�cance test for precise hypotheses. Entropy, 1(4):99�110. Citado na pág. 1

Page 71: Eriton Barros dos Santos - Biblioteca Digital de Teses e ......Há áriasv técnicas para realizar um teste de hipótese estatístico, dentre elas destacam-se: o teste de signi cância

REFERÊNCIAS BIBLIOGRÁFICAS 59

Pestman (1998) Wiebe R Pestman. Mathematical statistics: an introduction, volume 1.Walter de Gruyter. Citado na pág. 13, 17

Schervish (1996) Mark J Schervish. P values: what they are and what they are not. TheAmerican Statistician, 50(3):203�206. Citado na pág. 2, 8

Severini (2000) Thomas A Severini. Likelihood methods in statistics. Citado na pág. 13

Shi e Tao (2008) Ning-Zhong Shi e Jian Tao. Statistical hypothesis testing: theory andmethods. World Scienti�c. Citado na pág. 6, 8, 13, 15, 17

Sprott (2000) David A Sprott. Statistical inference in science. Springer, New York. Citado

na pág. 9