Introdução a planejamento e otimização de experimentos Aula 3 – Testes estatísticos Prof. Ricardo de Freitas Branco

Introdução a planejamento e otimização de experimentos

Aula 3 – Testes estatísticos

Prof. Ricardo de Freitas Branco

2

Aula anterior• Planejamento 22

• Efeitos e modelo

• Gráfico e discussão (interação)

3

Hipóteses estatísticas• Teste de hipótese: regra de decisão estatística que permite, com base em

informações contidas nos dados amostrais, concluir sobre parâmetros

populacionais.

• Hipótese estatística: é uma suposição sobre algum parâmetro da

população, que será posta a prova através de um teste de hipótese.

Consideram-se sempre, duas hipóteses: H0 e Ha denominadas hipótese

nula e hipótese alternativa.

• Hipótese nula: H0 é a hipótese que está sendo posto à prova (exemplo: o

pH da população é igual a 5,0)

H0:µ = 5,0

4

Hipóteses estatísticas• Hipótese alternativa: Ha é a hipótese que será aceita, se H0 for rejeitada

no teste

Ha: O pH médio da população alvo é diferente de 5,0 – Teste bilateral

Ha: O pH médio da população alvo é menor que 5,0 – Teste unilateral a esquerda

Ha: O pH médio da população alvo é maior que 5,0 – Teste unilateral a direita

*Apenas uma delas, estabelecida a priori, será utilizada.

5

Hipóteses estatísticas• Mecanismo dos erros

Como o teste de hipóteses é sempre baseado em amostras aleatórias, há

sempre um risco de erro.

É importante lembrar que uma outra amostra retirada poderia fornecer valores

diferentes daquelas utilizadas na realização do teste.

Para bem entender o mecanismo das hipóteses e dos erros, façamos a

análise exploratória através do seguinte exemplo sobre um teste clínico

6


Para bem entender o mecanismo das hipóteses e dos erros, façamos a

análise exploratória através do seguinte exemplo sobre um teste clínico

Ao observar certas alterações físicas, João supões estar com hepatite. Após

rápida reflexão, formula as hipóteses

H0 : João está com hepatite

Ha: João não está com hepatite

7


Dirigi-se ao laboratório para realização de um teste clínico, com uma amostra do seu

sangue.

Como é bem sabido todo teste clínico agrega possibilidade de erro, maior ou menor

conforme eficiência do método adotado, de qualidade de equipamento, dos

reagentes, dos técnicos e assim por diante...

Sendo assim, com maior ou menor probabilidade, é sempre possível ocorrer um dos

resultados descritos (o que pode acontecer ?)

RealidadeResultado do teste clínico

Positivo Negativo

João está com hepatite

Resultado correto; não há

erroFalso negativo

João não está com hepatite Falso positivo

Resultado correto ;não há

erro

8


Qual dentre os dois erros possíveis você considera que agregará consequencias práticas

mais graves ?

Do ponto de vista de um teste estatístico:

Erro Tipo I (primeira espécie): Rejeitar H0 quando H0 verdadeiro

A probabilidade de se cometer um erro de tipo I, também conhecida como nível de

significância do teste, é denotada por α e escolhida a priori pelo pesquisador. Em geral, o

nível de significância α = 0,05 (5 %) é muito bem aceito pela comunidade científica.

Realidade na populaçãoResultado do teste estatístico

Não se rejeita H0 Rejeita-se H0

H0 verdadeira Resultado correto; não há erro Erro tipo I

H0 é falsa Erro tipo II Resultado correto;não há erro

9


Erro Tipo II (segunda espécie): não rejeitar H0 quando H0 é falso

É denotada por β

Poder do teste estatístico: É a probabilidade de rejeitar H0 quando H0 falso (Qual é a

equação ?)

P = 1- β

Testes com P>90 são bem aceitos. (embora algumas vezes inviáveis)

Probabilidade de significância p-valor é a probabilidade de ocorrência de valores

da variável V do teste mais extremos que o obtido através dessa amostra.

Assim a decisão pode ser feita em termos de p-valor: rejeitamos ou não H0,

conforme p-valor seja, respectivamente, menor ou não que o nível α, de

significância escolhido anteriormente.

10


As figuras mostram um esboço gráfico para um teste unilateral à direita, com variável

do teste V = t de Student (ou F de Snedecor) e α = 0,05 : a) Rejeição de H0 e b)

não rejeição de H0

α = 0,05 = nível de significância = área à direita de ttab (Ftab)

P-valor = área à direita de tcalc (Fcalc)

11

α = 0,05 = nível de significância = área à direita de ttab

P-valor = área à direita de tcalc

12

CÁLCULOS NECESSÁRIOS PARA OS TESTES• Exemplo da aula anterior

Ensaio pH TemperaturaResposta (atividade, U)

Totais MédiasRepetições

1 -1 -1 218 212 170 600 200

2 1 -1 73 76 67 216 72

3 -1 1 399 411 402 1212 404

4 1 1 222 258 270 750 250

13

CÁLCULOS NECESSÁRIOS PARA OS TESTES• Contrastes e totais de contrastes

Contrastes Totais Valor do contraste

A (pH) 216 +750 - 600 - 1212 -846

B (T) 1212 +750 - 600 - 216 1146

AB (pHxT) 750 + 600 - 216 - 1212 -78

14

CÁLCULOS NECESSÁRIOS PARA OS TESTES• Soma dos quadrados

SQ (A)= A2/ e.r A = Contrastes da variável A

e = ensaios únicos

SQ(A) = SQ (pH) = [-846]2/(4.3) = 59643

SQ(B) = SQ (T) = [1146]2/(4.3) = 109443

SQ(AB) = SQ (pH.T) = [-78]2/(4.3) = 507

15

CÁLCULOS NECESSÁRIOS PARA OS TESTES• Soma dos quadrados totais corrigida e a soma dos quadrados dos

resíduos

SQTc = somatória dos quadrados dos resultados – n.ẏ2

SQRes = SQTc – SQ(A) – SQ(B) – SQ(AB)

SQTc = 815436 - 12. (231,5)2 = 172329

SQRes = 172329 – 59643 – 109443 – 507 = 2736

16

CÁLCULOS NECESSÁRIOS PARA OS TESTES• Teste com distribuição F de Snedecor

QM (x)= SQ(x)/gl (x) R2 = (SQTc-SQRes)/SQTc

Fcalc (x)= QM(x)/QMRes Para o nosso caso Ftab = [gl(den.); gl(divi.);5%] =

l

[1;10;5%] = 4,96Fontes de variação

Graus de liberdade

Soma dos Quadrados

Quadrados médios Fcalc p-valor

Hipótese

pH 1 59643 59643 174,39 <0,001 H0:β1 = 0

Temp 1 109443 109443 320 <0,001 H0:β2 = 0

pH x Temp 1 507 507 1,48 0,2581 H0:β12 = 0

Resíduo 8 2736 342R2 = 98,41 %

Total 11 172329 -

17

CÁLCULOS NECESSÁRIOS PARA OS TESTES• Teste t de Student

Estimativa da variância

Var (Â) = Var (ẏpH+ - ẏpH-) = (1/2r +1/2r).QMRes = (1/6+1/6).342 = 114

Para a média:

Var (ẏ) = QMRes/n = 342/12 = 28,5

Erro padrão da estimativa

ep (Â) = Var(Â)1/2 = √114 = 10,68

ep (ӯ) = Var (ӯ) 1/2 = √ 28,5 = 5,34

18

CÁLCULOS NECESSÁRIOS PARA OS TESTES• Análise de variância – Teste com distribuição F de Snedecor

tcalc (E)= Ê/ep (E)

Para o nosso caso ttab [n-p;5%/bilateral=[8;5%/2] = ± 2,31 p = n° parâmetros testados

Fatores Efeitos Erro padrão tcalc (8 gl) p-valor

Estimativa por intervalo (95 %)

L. Inf. L. Sup

Média 231,5 5,34 43,36 <0,001 219,19 243,81

pH -141 10,68 -13,21 <0,001 -165,62 -116,38

Temp. 191 10,68 17,89 <0,001 166,38 215,62

pH x Temp. -13 10,68 -1,22 0,2581 -37,62 11,62

19

CÁLCULOS NECESSÁRIOS PARA OS TESTES• Gráfico de Pareto

Gráfico de Pareto

-13,20

17,89

p=0,05 (5%)

Valor de tcalc (efeito padronizado ou normatizado)

pH x Temp. (AB)

pH (A)

Temp. (B)

-1,21

20

CÁLCULOS NECESSÁRIOS PARA OS TESTES• Valores preditos e valores observados

Valores preditos em função dos valores observados

0 50 100 150 200 250 300 350 400 450

Valores observados

0

50

100

150

200

250

300

350

400

450

Valo

res

pred

itos

(mod

elo)

21

CÁLCULOS NECESSÁRIOS PARA OS TESTES• Superfície de resposta

Superfície de resposta

> 400 < 400 < 300 < 200 < 100

22

CÁLCULOS NECESSÁRIOS PARA OS TESTES• Curva de contorno

Curva de contorno

> 400 < 400 < 350 < 300 < 250 < 200 < 150 < 100 < 50

-1,2 -1,0 -0,8 -0,6 -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2

pH

-1,2

-1,0

-0,8

-0,6

-0,4

-0,2

0,0

0,2

0,4

0,6

0,8

1,0

1,2

tem

pera

tura

23

CÁLCULOS NECESSÁRIOS PARA OS TESTES• Gráfico de resíduos (normalidade)

Resíduos em função dos experimentos (n)

-2 0 2 4 6 8 10 12 14

numero do experimento

-40

-35

-30

-25

-20

-15

-10

-5

0

5

10

15

20

25

Res

íduo

s

24

CÁLCULOS NECESSÁRIOS PARA OS TESTES• Gráficos para identificar normalidade - gráfico para verificar normalidade

Distribuição dos resíduos em torno da reta que indica normalidade

-40 -35 -30 -25 -20 -15 -10 -5 0 5 10 15 20 25

Resíduos

-3,0

-2,5

-2,0

-1,5

-1,0

-0,5

0,0

0,5

1,0

1,5

2,0

2,5

3,0

Valo

res

espe

rado

s da

cur

va n

orm

al

,01

,05

,15

,35

,55

,75

,95

,99

25

Para fazer em casa• Fazer os mesmos cálculo para o estudo de caso 1

Tabelas com testes F e t; gráficos de Pareto e val. pred x val. obs.

• Entregar impresso na próxima semana

26

Conclusão Testes estatísticos são necessários (para que ?)

Existem diversos testes de significância

Importante avaliar graficamente também

27

Próxima aula• Sem repetições e adição dos pontos centrais

• 23

Documents

Introdução a planejamento e otimização de experimentos Aula 3 – Testes estatísticos Prof. Ricardo de Freitas Branco