Upload
aurelio-barreto-di-castro
View
217
Download
0
Embed Size (px)
Citation preview
Introdução a planejamento e otimização de experimentos
Aula 3 – Testes estatísticos
Prof. Ricardo de Freitas Branco
2
Aula anterior• Planejamento 22
• Efeitos e modelo
• Gráfico e discussão (interação)
3
Hipóteses estatísticas• Teste de hipótese: regra de decisão estatística que permite, com base em
informações contidas nos dados amostrais, concluir sobre parâmetros
populacionais.
• Hipótese estatística: é uma suposição sobre algum parâmetro da
população, que será posta a prova através de um teste de hipótese.
Consideram-se sempre, duas hipóteses: H0 e Ha denominadas hipótese
nula e hipótese alternativa.
• Hipótese nula: H0 é a hipótese que está sendo posto à prova (exemplo: o
pH da população é igual a 5,0)
H0:µ = 5,0
4
Hipóteses estatísticas• Hipótese alternativa: Ha é a hipótese que será aceita, se H0 for rejeitada
no teste
Ha: O pH médio da população alvo é diferente de 5,0 – Teste bilateral
Ha: O pH médio da população alvo é menor que 5,0 – Teste unilateral a esquerda
Ha: O pH médio da população alvo é maior que 5,0 – Teste unilateral a direita
*Apenas uma delas, estabelecida a priori, será utilizada.
5
Hipóteses estatísticas• Mecanismo dos erros
Como o teste de hipóteses é sempre baseado em amostras aleatórias, há
sempre um risco de erro.
É importante lembrar que uma outra amostra retirada poderia fornecer valores
diferentes daquelas utilizadas na realização do teste.
Para bem entender o mecanismo das hipóteses e dos erros, façamos a
análise exploratória através do seguinte exemplo sobre um teste clínico
6
Hipóteses estatísticas• Mecanismo dos erros
Para bem entender o mecanismo das hipóteses e dos erros, façamos a
análise exploratória através do seguinte exemplo sobre um teste clínico
Ao observar certas alterações físicas, João supões estar com hepatite. Após
rápida reflexão, formula as hipóteses
H0 : João está com hepatite
Ha: João não está com hepatite
7
Hipóteses estatísticas• Mecanismo dos erros
Dirigi-se ao laboratório para realização de um teste clínico, com uma amostra do seu
sangue.
Como é bem sabido todo teste clínico agrega possibilidade de erro, maior ou menor
conforme eficiência do método adotado, de qualidade de equipamento, dos
reagentes, dos técnicos e assim por diante...
Sendo assim, com maior ou menor probabilidade, é sempre possível ocorrer um dos
resultados descritos (o que pode acontecer ?)
RealidadeResultado do teste clínico
Positivo Negativo
João está com hepatite
Resultado correto; não há
erroFalso negativo
João não está com hepatite Falso positivo
Resultado correto ;não há
erro
8
Hipóteses estatísticas• Mecanismo dos erros
Qual dentre os dois erros possíveis você considera que agregará consequencias práticas
mais graves ?
Do ponto de vista de um teste estatístico:
Erro Tipo I (primeira espécie): Rejeitar H0 quando H0 verdadeiro
A probabilidade de se cometer um erro de tipo I, também conhecida como nível de
significância do teste, é denotada por α e escolhida a priori pelo pesquisador. Em geral, o
nível de significância α = 0,05 (5 %) é muito bem aceito pela comunidade científica.
Realidade na populaçãoResultado do teste estatístico
Não se rejeita H0 Rejeita-se H0
H0 verdadeira Resultado correto; não há erro Erro tipo I
H0 é falsa Erro tipo II Resultado correto;não há erro
9
Hipóteses estatísticas• Mecanismo dos erros
Erro Tipo II (segunda espécie): não rejeitar H0 quando H0 é falso
É denotada por β
Poder do teste estatístico: É a probabilidade de rejeitar H0 quando H0 falso (Qual é a
equação ?)
P = 1- β
Testes com P>90 são bem aceitos. (embora algumas vezes inviáveis)
Probabilidade de significância p-valor é a probabilidade de ocorrência de valores
da variável V do teste mais extremos que o obtido através dessa amostra.
Assim a decisão pode ser feita em termos de p-valor: rejeitamos ou não H0,
conforme p-valor seja, respectivamente, menor ou não que o nível α, de
significância escolhido anteriormente.
10
Hipóteses estatísticas• Mecanismo dos erros
As figuras mostram um esboço gráfico para um teste unilateral à direita, com variável
do teste V = t de Student (ou F de Snedecor) e α = 0,05 : a) Rejeição de H0 e b)
não rejeição de H0
α = 0,05 = nível de significância = área à direita de ttab (Ftab)
P-valor = área à direita de tcalc (Fcalc)
11
α = 0,05 = nível de significância = área à direita de ttab
P-valor = área à direita de tcalc
12
CÁLCULOS NECESSÁRIOS PARA OS TESTES• Exemplo da aula anterior
Ensaio pH TemperaturaResposta (atividade, U)
Totais MédiasRepetições
1 -1 -1 218 212 170 600 200
2 1 -1 73 76 67 216 72
3 -1 1 399 411 402 1212 404
4 1 1 222 258 270 750 250
13
CÁLCULOS NECESSÁRIOS PARA OS TESTES• Contrastes e totais de contrastes
Contrastes Totais Valor do contraste
A (pH) 216 +750 - 600 - 1212 -846
B (T) 1212 +750 - 600 - 216 1146
AB (pHxT) 750 + 600 - 216 - 1212 -78
14
CÁLCULOS NECESSÁRIOS PARA OS TESTES• Soma dos quadrados
SQ (A)= A2/ e.r A = Contrastes da variável A
e = ensaios únicos
SQ(A) = SQ (pH) = [-846]2/(4.3) = 59643
SQ(B) = SQ (T) = [1146]2/(4.3) = 109443
SQ(AB) = SQ (pH.T) = [-78]2/(4.3) = 507
15
CÁLCULOS NECESSÁRIOS PARA OS TESTES• Soma dos quadrados totais corrigida e a soma dos quadrados dos
resíduos
SQTc = somatória dos quadrados dos resultados – n.ẏ2
SQRes = SQTc – SQ(A) – SQ(B) – SQ(AB)
SQTc = 815436 - 12. (231,5)2 = 172329
SQRes = 172329 – 59643 – 109443 – 507 = 2736
16
CÁLCULOS NECESSÁRIOS PARA OS TESTES• Teste com distribuição F de Snedecor
QM (x)= SQ(x)/gl (x) R2 = (SQTc-SQRes)/SQTc
Fcalc (x)= QM(x)/QMRes Para o nosso caso Ftab = [gl(den.); gl(divi.);5%] =
l
[1;10;5%] = 4,96Fontes de variação
Graus de liberdade
Soma dos Quadrados
Quadrados médios Fcalc p-valor
Hipótese
pH 1 59643 59643 174,39 <0,001 H0:β1 = 0
Temp 1 109443 109443 320 <0,001 H0:β2 = 0
pH x Temp 1 507 507 1,48 0,2581 H0:β12 = 0
Resíduo 8 2736 342R2 = 98,41 %
Total 11 172329 -
17
CÁLCULOS NECESSÁRIOS PARA OS TESTES• Teste t de Student
Estimativa da variância
Var (Â) = Var (ẏpH+ - ẏpH-) = (1/2r +1/2r).QMRes = (1/6+1/6).342 = 114
Para a média:
Var (ẏ) = QMRes/n = 342/12 = 28,5
Erro padrão da estimativa
ep (Â) = Var(Â)1/2 = √114 = 10,68
ep (ӯ) = Var (ӯ) 1/2 = √ 28,5 = 5,34
18
CÁLCULOS NECESSÁRIOS PARA OS TESTES• Análise de variância – Teste com distribuição F de Snedecor
tcalc (E)= Ê/ep (E)
Para o nosso caso ttab [n-p;5%/bilateral=[8;5%/2] = ± 2,31 p = n° parâmetros testados
Fatores Efeitos Erro padrão tcalc (8 gl) p-valor
Estimativa por intervalo (95 %)
L. Inf. L. Sup
Média 231,5 5,34 43,36 <0,001 219,19 243,81
pH -141 10,68 -13,21 <0,001 -165,62 -116,38
Temp. 191 10,68 17,89 <0,001 166,38 215,62
pH x Temp. -13 10,68 -1,22 0,2581 -37,62 11,62
19
CÁLCULOS NECESSÁRIOS PARA OS TESTES• Gráfico de Pareto
Gráfico de Pareto
-13,20
17,89
p=0,05 (5%)
Valor de tcalc (efeito padronizado ou normatizado)
pH x Temp. (AB)
pH (A)
Temp. (B)
-1,21
20
CÁLCULOS NECESSÁRIOS PARA OS TESTES• Valores preditos e valores observados
Valores preditos em função dos valores observados
0 50 100 150 200 250 300 350 400 450
Valores observados
0
50
100
150
200
250
300
350
400
450
Valo
res
pred
itos
(mod
elo)
21
CÁLCULOS NECESSÁRIOS PARA OS TESTES• Superfície de resposta
Superfície de resposta
> 400 < 400 < 300 < 200 < 100
22
CÁLCULOS NECESSÁRIOS PARA OS TESTES• Curva de contorno
Curva de contorno
> 400 < 400 < 350 < 300 < 250 < 200 < 150 < 100 < 50
-1,2 -1,0 -0,8 -0,6 -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2
pH
-1,2
-1,0
-0,8
-0,6
-0,4
-0,2
0,0
0,2
0,4
0,6
0,8
1,0
1,2
tem
pera
tura
23
CÁLCULOS NECESSÁRIOS PARA OS TESTES• Gráfico de resíduos (normalidade)
Resíduos em função dos experimentos (n)
-2 0 2 4 6 8 10 12 14
numero do experimento
-40
-35
-30
-25
-20
-15
-10
-5
0
5
10
15
20
25
Res
íduo
s
24
CÁLCULOS NECESSÁRIOS PARA OS TESTES• Gráficos para identificar normalidade - gráfico para verificar normalidade
Distribuição dos resíduos em torno da reta que indica normalidade
-40 -35 -30 -25 -20 -15 -10 -5 0 5 10 15 20 25
Resíduos
-3,0
-2,5
-2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
2,0
2,5
3,0
Valo
res
espe
rado
s da
cur
va n
orm
al
,01
,05
,15
,35
,55
,75
,95
,99
25
Para fazer em casa• Fazer os mesmos cálculo para o estudo de caso 1
Tabelas com testes F e t; gráficos de Pareto e val. pred x val. obs.
• Entregar impresso na próxima semana
26
Conclusão Testes estatísticos são necessários (para que ?)
Existem diversos testes de significância
Importante avaliar graficamente também
27
Próxima aula• Sem repetições e adição dos pontos centrais
• 23