76
Planejamento da pesquisa científica: incerteza e estatística Edilson Batista de Oliveira Embrapa Florestas

incerteza e estatística - cnpsa.embrapa.br · Raiz quadrada . 1. Raiz quadrada Dados de contagem Ex: número de insetos. 2. Logarítmica Log (x) Log (X + 1) Log (X + 0,5) 2. Logarítmica

Embed Size (px)

Citation preview

Planejamento da pesquisa científica:

incerteza e estatística

Edilson Batista de OliveiraEmbrapa Florestas

Anos 70

Anos 80

Anos 90

Século 21

Pesquisa em laboratórios na Embrapa

Precisão em Laboratórios:

•Experimentos completos

•Participação com análises

1. Fatores ambientais de difícil controle

2. Alterações/Imprecisão em equipamentos

3. Fontes de contaminação (químicos, patógenos)

4. Técnicas de estatística

Laboratórios

LEE, P.J.; RAWLINGS, J.O. Design of experiments in growth

chambers – Uniformity trials in the NCSU Phytotron.

Crop Science, v. 22, p. 551-8, 1982.

(Ensaio de uniformidade com soja)o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

O o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

O o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o

Criação do “Growth Chambers Committee”

Alguns fatores ambientais

Luminosidade

Temperatura

Umidade

CO2

Laboratórios

Usar delineamentos experimentais convencionais

(Casualização, Repetição e Controle Local)

Técnicas de estatística

Substrato A

Substrato B

Agrupando as repetições

EP = ((p(1-p))/n)^0,5

p=proporção de sucesso (ex: enraizadas)

n = tamanho da amostra

Erro padrão para

proporções e porcentagens

no Excel

DelineamentoInteiramente Casualizado

T2

T3

T1T3 T1

T1

T1

T3

T3

T2

T2

T2

Blocos casualizados

T1

T1

T3

T2T3

T1

T2

T2

T3

T3T2

T1

Bloco I

Bloco III

Bloco II

Bloco IV

Experimento fatorial em blocos ao acaso

Bloco I

T1T2

Trat (A) Trat (B)

T3

T1

T3 T2

T1 T2 T3

Blocos casualizados com parcelas subdivididas

Bloco I

T1 T2 T3

T1T3T2

Parcela

Subparcela

Fatores e níveis

FATORES: 1 - Concentrações de Hormônios

2 - Substratos

NÍVEIS: 0, 5 e 10 mg de Hormônio/litro

• Substrato A Substrato B

Níveis

Nível qualitativo: Inseticidas A e B

Nível quantitativo: Dosagens 2 - 4 -6 -8 g/l

Temperaturas

de fatores

Interação

Experimento Fatorial

Análise de variância

Estatística Não Paramétrica

• Dispensa normalidade

• Independe da distribuição

• Permite trabalhar com dados de diferentes populações

• Aplicavel a dados dicotômicos

Razões para seu uso

Restrições ao seu uso

• Não leva em consideração a magnitude dos dados

• Menos poderoso que os paramétricos quando as exigências são cumpridas

• Difícil testar interações

• Tabelas complexas para interpretar

Análise multivariada

Coeficientes de Variação

CV(%) < 10 baixoCV(%) 10 – 20 médioCV(%) > 20 alto

Cuidado com esta interpretação.Ela é utilizada para experimentos agrícolas de campo.

‘Hipóteses básicas para a ANOVA

1- Aditividade dos efeitos do modelo

2- Independência dos erros

3- Homogeneidade de variâncias

4- Erros com distribuição normal

O que fazer quando isto não ocorre?

Resposta:

1.Examinar cuidadosamente os dados Verifique a possibilidade de erros de medição.

Descubra os motivos biológicos do problema.

2.Fazer análise de resíduos

3.Transformar os dados

4.Aplicar estatística não paramétrica (???)

Análise de resíduos

Análise de resíduos

TRATAM_

RE

SP

OS

TA

2

4

6

8

10

12

14

16

1 2 3 4

Uso de transformações

1. Raiz quadrada

1. Raiz quadrada

Dados de contagemEx: número de insetos

2. Logarítmica

Log (x)Log (X + 1)Log (X + 0,5)

2. Logarítmica

ContagemEx: número de insetos

Porcentagem(Valores contínuos)

Ex: % de dano na planta

3. Arco Seno Raiz

Arc.Sen

Arc.Sen

Arc.Sen

X = % / 100

3. Arco Seno

% originadas em contagens

(Valores contínuos)

Ex: % de insetos mortos

Análise de Variância

• Testes de significância

ou teste de hipóteses

nível de significância: α = 0.05, α = 0.01

Interpretaçãonível de significância: α = 0.05

Há uma confiança de 95% que existe diferença entre tratamentos.

Teste F para ANOVA

• Experimento: Captura Mosca das frutas:

1. Suco de Uva 25%

2. Proteina Hiroliz (5%)

3. Melaço de cana (5%)

4. Vinagre (25%)

5. Suco de laranja (20%)

Teste F para ANOVA

Fontes de Variação G.L. S.Q. Q.M. F--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Blocos 3 126,60 42,2 1,48ns

Tratamentos 4 453,81 113,4 3,97*

Resíduo 12 343,36 18,6-------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Total 19 923,7

Valores de F da Tabela.

Para Tratamentos (4 x 12 g.l) 5% = 3.26

1% = 5.41

Para Blocos (3 x 12 g.l) 5% = 3.49

1% = 5.95

Fontes de Variação G.L. S.Q. Q.M. F--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Blocos 3 126,60 42,2 1,48ns

Tratamentos 4 453,81 113,4 3,97*

Resíduo 12 343,36 18,6-------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Total 19 923,7

Tratamentos: o teste foi significativo ao nível de

significância de 5%. Assim, regeitamos Ho.

Blocos: Teste não significativo a 5%. Não regeitamos Ho.

O teste F mostrou que existe diferença significativa entre

tratamentos mas não diz entre quais tratamentos a diferença

se manifesta

Testes para comparação de médias

Como comparar tratamentos?

Artigo revendo testes na revista Crop Science concluiu:

40% totalmente inapropriados

30% poderiam utilizar método mais eficiente

30% uso apropriado

• Testes de Comparação múltipla

(teste de Tukey, Duncan, etc)

• Ajuste de modelos (regressão)

• Teste de Contrastes

Comparação entre tratamentos

Testes de Comparação múltipla(teste de Tukey, Duncan, etc)

• Níveis qualitativos, trat. independentes

Teste de Tukey• Tratamentos médias

1. Suco de Uva 25%........ 356,0 a

2. Proteina Hiroliz. (5%)... 94,5 b

3. Melaço de cana (5%).... 89,0 b

4. Vinagre (25%)................ 84,5 b

5. Suco de laranja (20%)... 23.2 c

Médias seguidas pela mesma letra não diferem pelo teste de Tukey ao nível de significância de 5%

Análise de regressão

• Níveis quantitativos, trat. dependentes

Ex: 5 dosagens do ingrediente ativo A

Tratamentos: 1. 0%

2. 5%

3. 10%

4. 15%

5. 20%

Análise de regressão

50 10 15 20

Y = 5 + 0,7X

X (%)

Y

Análise de regressão

50 10 15 20

Y = 5 + 0,7X – 0,06X2

X

Y

X (%)

Teste de Contrastes

• Níveis qualitativos, trat. dependentesEx: 2 variedades da Espécie A (A1 e A2)

2 variedades da Espécie B (B1 e B2)

Testemunha

Contrastes OrtagonaisC1. Teste vs (A1,A2,B1,B2)

C2. (A1,A2) vs (B1,B2)

C3. A1 vs A2

C4. B1 vs B2

a) Fazer pré-amostragem

Ex: 20 feijões

b) Calcular média e variância

Ex: cada feijão pesa em média 100 miligramas com desvio padrão de 10 miligramas

d) Definir a margem de erro para o resultado final

Ex: 3 mg de erro tolerável, com 95% de confiança

Média +- 3 mg com 95% de confiança

3 mgé o intervalo com 95% de confiança

3 mg = t * s

n

Valor de tabela de t

t (19 gl a 95%) = 2,09

3 mg = 2,09 * 10

n

Tamanho da amostra

n = 49 feijões

Apresentação de resultados em trabalhos científicos

Média ± Desvio padrão

_X ± S

Média ± Erro padrão

_X ± S

n

Média ± Intervalo de confiança

X ± t. S

n

Conhecimentos e protocolos

confiabilidade dos resultados

Análise de resíduos

O

O

O

OO

O

O

O

O

O

O

OO

O

O

O

Gráficos

com margens de confiança

Obrigado pela atenção

Edilson Batista de [email protected]