4. Experimentos em Blocos aleatorizados, quadra- · fontes de varia˘c~ao devido a ru dos, isto e, \blo-car" em tr^es dire˘c~oes. O plano permite a investiga˘c~ao de 4 fatores (linha,

$Page 1: 4. Experimentos em Blocos aleatorizados, quadra- · fontes de varia˘c~ao devido a ru dos, isto e, \blo-car" em tr^es dire˘c~oes. O plano permite a investiga˘c~ao de 4 fatores (linha,$
4. Experimentos em Blocos aleatorizados, quadra-

dos latinos e experimentos relacionados

4.2 Quadrados Latinos (QL)

Suponha que um experimentador esteja estu-

dando o efeito de 5 formulacoes diferentes de

um propulsor de foguetes usado em sistemas

de escape da tripulacao, observando a taxa de

combustao.

Cada formulacao e misturada a partir de um

lote de materia-prima que e grande o suficiente

para realizar cinco testes. Alem disso as for-

mulacoes sao preparadas por varios operadores

e, podem existir diferencas substanciais nas ha-

bilidades e experiencias dos operadores.

1

→ Existem dois fatores de ruıdo a serem e-

liminados: lotes e operadores.

O plano apropriado para este problema con-

siste em testar cada formulacao exatamente

uma vez em cada lote de materia prima e para

cada operador considerando cinco operadores.

O plano resultante e mostrado na tabela a

seguir.

2

3

O planejamento em Quadrado Latino e usado

para eliminar duas fontes de ruıdo.

→ permite a blocagem em duas direcoes (linha

e coluna).

Linha e coluna representam duas restricoes em

aleatorizacao no QL.

O QL de ordem p ou um QL p × p e um

quadrado com p linhas e p colunas.

Cada uma das p2 celas do quadrado contem

uma de p letras que correspondem aos nıveis

do fator (tratamentos),

cada letra ocorre uma unica vez em cada linha

e cada coluna do quadrado tal que

cada linha e cada coluna contem uma sequencia

completa das p letras.

4

5

QL’s podem ser associados ao passatempo po-pular SUDOKU, originado no Japao (sudokusignifica numero unico). Nesse passatempo,ha uma restricao adicional nos quadrados 3×3contidos no quadrado 9×9. Com essa restricaopode-se mostrar que existem cerca de 6×1021

configuracoes diferentes para o SUDOKU, quee menor, mas ainda muito grande, do que onumero de QL’s 9×9 possıveis.

Dependendo do numero de pistas pode ser bemdifıcil resolver um sudoku. Resolver sudoku’sn×n pertence a uma classe de problemas com-putacionais chamada NP-completo(NP refere-se a tempo computacional nao-polinomial).

Um problema NP-completo e um problema parao qual e relativamente facil verificar se umaparticular resposta esta correta, mas pode exi-gir um tempo impossivelmente longo para re-solver usando-se qualquer algoritmo simples amedida que n cresce.

6

Modelo estatıstico para o QL

Yijk = µ+linha︷︸︸︷αi + τj︸︷︷︸

tratamento

+coluna︷︸︸︷βk +εijk

i = 1,2, ..., pj = 1,2, ..., pk = 1,2, ..., p

Observe que ha somente N = p2 observacoes

devido as restricoes de linhas e colunas.

Trata-se de um modelo de efeitos: α’s efeito

de linha, β’s efeito de coluna e τ ’s efeito de

tratamento.

O modelo e completamente aditivo, isto e, nao

ha interacao entre linhas, colunas e tratamen-

tos.

7

Como ha somente uma observacao em cada

cela, somente dois dos tres sub-ındices i, j e k

sao necessarios para denotar uma observacao

particular.

Neste exemplo, observe que se i = 2 e k = 3,

vemos pela tabela dos dados que j = 4 (for-

mulacao D);

se i = 3 e j = 2, segue que k = 5 (operador

5),

se j = 3 e k = 4, segue que i = 5 (lote 5).

Isto e consequencia do fato de que cada trata-

mento ocorre somente uma vez para cada linha

e coluna.

8

A ANOVA consiste no particionamento da so-

ma de quadrados total das N = p2 observacoes

em componentes para linhas, colunas, trata-

mentos e resıduos,

SQTot︸︷︷︸N−1

= SQLin︸︷︷︸p−1

+SQCol︸︷︷︸p−1

+SQTrat︸︷︷︸p−1

+ SQRes︸︷︷︸(p−2)(p−1)

Sob a suposicao usual de que εijk ∼ NID(0, σ2),

as somas de quadrados do lado direto da equa-

cao acima, divididas por σ2 sao independente-

mente distribuıdas.

A estatıstica para testar a hipotese de que nao

ha efeito de tratamento e dada por

F0 = QMTratQMRes

9

Sob H0,

F0 ∼ Fp−1,(p−2)(p−1).

Podemos tambem testar a presenca de efeito

de linha ou efeito de coluna formando as razoes

com os quadrados medios correspondentes.

Porem, como linhas e colunas representam uma

restricao sobre aleatorizacao, estes testes po-

dem nao ser apropriados.

10

11

Exemplo 4.3: ANOVA do exemplo do experi-

mento de propulsao de foguetes.

Os dados estao no arquivo foguete.txt.

dados=read.table(“c://flavia//dox//foguete.txt”,header=T)

fit=aov(y∼lin+col+trat,data=dados)

summary(fit)

FV gl SQ QM F Pr(> F )linha 4 68 17.00 1.594 0.23906coluna 4 150 37.50 3.516 0.04037 *tratamento 4 330 82.50 7.734 0.00254 **Residuals 12 128 10.67Total 24 676

Vemos entao que existe efeito de formulacao.

model.tables(fit) Tables of effects

linhaI II III IV V

-3.2 1.4 0.6 0.2 1.0

colunai ii iii iv v

-4.0 3.2 -1.2 0.6 1.4

tratamentoA B C D E

3.2 -5.2 -3.0 4.4 0.6

12

13

Um QL no qual a primeira linha e a primeira

coluna contem a sequencia de letras em ordem

e chamado um QL padrao.

Como em qualquer experimento, as observacoes

no QL devem ser tomadas de forma aleatoria.

Um procedimento proprio de aleatorizacao e

selecionar o quadrado particular empregado ao

acaso.

Como ha um numero muito grande de possi-

bilidades quando n cresce fica impossıvel enu-

merar todas as possibilidades para depois sor-

tear.

O procedimento usual e selecionar um QL de

uma tabela contendo tais planos, como em

Fisher e Yates (1953), e entao arrumar a or-

dem das linhas, colunas e tratamentos ao acaso.

14

Pode ocorrer ausencia de dados no QL. Para

uma quadrado latino p × p, o valor ausente e

estimado por

yijk =p(y′i.. + y′.j. + y′..k)− 2y′...

(p− 1)(p− 1)

em que o apostrofo indica totais da linha, co-

luna e tratamento correspondentes ao valor

ausente e, y′... o total geral.

15

Replicacao em QL’s

Uma desvantagem de QL’s de ordem pequena

e que eles fornecem um numero de graus de

liberdade do erro relativamente pequeno.

Por exemplo se o QL for de ordem 3 tem-se

somente 2 gl’s para os erros. Se p = 4 este

numero cresce para 6.

Assim, quando um QL de ordem pequena e

usado, frequentemente e desejavel replica-los

para aumentar o numero de graus de liberdade

do erro.

Um QL pode ser replicado de diversas formas.

Para ilustrar, vamos supor que o QL 5×5 usado

no exemplo anterior seja replicado n vezes.

16

Isto pode ser feito de formas diferentes.

1) Mesmos lotes e operadores em cada replicacao.

2) Mesmos lotes, mas operadores diferentes

em cada replicacao (ou, similarmente, use os

mesmos operadores, mas lotes diferentes).

3) Lotes diferentes e operadores diferentes.

A ANOVA dependera do metodo de replicacao

usado.

Considere o caso 1, no qual os mesmos nıveis

dos fatores de blocagem (linha e coluna) sao

usados em cada replicacao. Seja Yijkl a l-esima

replicacao da observacao correspondente a i-

esima linha, j-esima coluna e k-esimo trata-

mento.

17

18

Caso 2: Suponha o uso de novos lotes de

materia-prima, mas os mesmos operadores.

Assim, existem agora 5 linhas novas (em geral

p linhas novas.)

19

20

Caso 3: Novos operadores e novos lotes sao

usados.

21

22

Existem outras abordagens para analisar QL’s

replicados que permitem alguma interacao en-

tre tratamentos e quadrados. (Problema 4.25).

Experimentos cruzados e balanceados para

efeitos residuais

Algumas vezes deparamo-nos com um problema

no qual perıodos de tempo representam um fa-

tor. Em geral, existem p tratamentos a serem

testados em p perıodos de tempo, usando np

unidades experimentais.

Por exemplo, um analista do comportamento

humano esta estudando o efeito da substituicao

de fluidos na desidratacao em 20 indivıduos.

No primeiro perıodo (escolhido ao acaso) foi

usado o fluido A para metade do grupo e, o B

para a outra metade.

23

No final do perıodo, a resposta foi medida para

cada indivıduo e, depois, espera-se passar um

perıodo de tempo de modo a eliminar qualquer

efeito psicologico quanto aos fluidos ingeridos

no primeiro perıodo.

Entao, o experimento prossegue usando o flui-

do A para a metade que recebeu B no primeiro

perıodo e, o B para a metade que recebeu A

no primeiro perıodo.

Este plano e chamado “plano cruzado” (crossover

design).

De fato, este plano pode ser analisado como

10 QL’s 2×2 como mostra a tabela a seguir.

24

25

As linhas dos QL’s representando os perıodos

de tempo e, as colunas, os sujeitos.

Os 10 sujeitos que receberam A no primeiro

perıodo: 1, 4, 6, 7, 9, 12, 13, 15, 17 e 19

foram aleatoriamente selecionados.

A seguir, apresenta-se um resumo da tabela

ANOVA para este plano

fonte de variacao graus de liberdadesujeito 19perıodo 1fluido 1erro 18Total 39

26

A soma de quadrados dos sujeitos e calculada

como a soma de quadrados corrigida entre os

totais dos 20 sujeitos (colunas).

A soma de quadrados de perıodo e calculada


totais de cada linha (tempo).

A soma de quadrados de fluido e calculada


totais de fluido (letras).

A soma de quadrados dos erros e obtida pela

diferenca entre a soma de quadrados total e as

demais.

Maiores detalhes sobre este plano podem ser

encontrados em Cocrhan e Cox (1957), John

(1971) e Anderson e MacLean (1974).

27

Tambem e possıvel empregar planejamentos

do tipo QL em experimentos nos quais os trata-

mentos tem um efeito residual. Por exem-

plo, se os dados para fluido B no perıodo 2

ainda refletem algum efeito do fluido A re-

cebido no tempo 1. Experimentos balancea-

dos para efeitos residuais sao discutidos em

Cochran e Cox (1957) e John (1971).

4.3 O Quadrado Greco-Latino

Considere um QL p× p e sobreponha nele um

segundo QL no qual os tratamentos sao deno-

tados por letras gregas.

Se os dois QL’s quando sobrepostos apresen-

tam a propriedade de que cada letra grega apa-

rece uma e somente uma vez com cada letra

latina, os QL’s sao ditos ser ortogonais e o

plano resultante e chamado Quadrado Greco-

Latino (QGL).

A tabela a seguir ilustra um QGL 4× 4.

28

29

O QGL pode ser usado para controlar tres

fontes de variacao devido a ruıdos, isto e, “blo-

car” em tres direcoes.

O plano permite a investigacao de 4 fatores

(linha, coluna, letra grega, letra latina) cada

uma com p nıveis com somente p2 realizacoes.

O QGL existe para p ≥ 3 exceto para p = 6.

Observe que para fins de analise estatıstica um

QGL 3×3 so fara sentido se houver replicacao,

pois com apenas um QGL 3×3 nao sobram

graus de liberdade para o erro.

30

Modelo Estatıstico para o QGL:

Yijkl = µ+θi+τj+ωk+φl+εijkl,

i = 1,2, ..., pj = 1,2, ..., pk = 1,2, ..., pl = 1,2, ..., p

em que Yijkl e a observacao na linha i e coluna

l para letra latina j e letra grega k.

θi e o efeito de linha,

τj e o efeito da letra latina,

ωk e o efeito da letra grega,

φl e o efeito coluna, e

εijkl ∼ NID(0, σ2) e o componente de erro

aleatorio.

31

Somente dois dos quatro sub-ındices sao necessarios

para identificar uma observacao.

A ANOVA do QGL e bem parecida com a

ANOVA do QL.

Como as letras gregas aparecem apenas uma

vez em cada linha e cada coluna e exatamente

uma vez com cada letra latina, o fator repre-

sentado pela letra grega e ortogonal as linhas,

colunas e tratamentos caracterizados pelas le-

tras latinas.

Portanto, a soma de quadrados devido ao fator

letra grega pode ser calculada a partir dos to-

tais de cada letra grega e o erro experimental

e reduzido por esta quantidade.

A tabela ANOVA para o QGL e apresentada a

seguir.

32

33

Exemplo 4.4: Suponha que no experimento

de propulsao de foguetes um fator adicional

sera testado: conjuntos de testes. Suponha

que sao 5 conjuntos de testes denotados pelas

letras gregas α, β, γ, δ e ε. O QGL resultante

e mostrado na tabela a seguir.

Os dados estao no arquivo foguete.txt.

34

35

dados=read.table(“c:/flavia/dox/foguete.txt”,header=T)

names(dados) ”y” ”lin” ”col” ”trat” ”grega”

fit=aov(y∼lin+col+trat+grega,data=dados)

summary(fit)

FV Df Sum Sq Mean Sq F value Pr(> F )lin 4 68 17.00 2.061 0.17831col 4 150 37.50 4.545 0.03293 *trat 4 330 82.50 10.000 0.00334 **grega 4 62 15.50 1.879 0.20764Residuals 8 66 8.25

efeitos formulacao estimadosA B C D E

3.2 -5.2 -3.0 4.4 0.6

36

O conceito de pares ortogonais de QL’s for-

mando um QGL pode ser estendido de algum

modo.

Um hiperquadrado p× p e um plano no qual 3

ou mais QL’s p×p ortogonais sao sobrepostos.

Em geral, ate p+ 1 fatores poderiam ser estu-

dados se um conjunto completo de p− 1 QL’s

ortogonais esta disponıvel. Tal plano usara

(p + 1)(p− 1) = p2 − 1 graus de liberdade, tal

que uma estimativa independente da variancia

do erro e necessaria.

E claro nao deve existir interacao entre os fa-

tores quando usamos hiperquadrados.

37

Exercıcio 4.30: Construa um hiperquadrado

5 × 5 para estudar o efeito de 5 fatores. Des-creva a tabela de analise de variancia desteplano.

Tres QL’s 2 a 2 ortogonais 5 por 5, para obterum hiperquadrado, com linha=fator 1,

coluna=fator 2, letra latina=fator 3, letra grega= fator 4 e numero=fator 5 sao dados por:

A B C D EB C D E AC D E A BD E A B CE A B C D

α β γ δ εγ δ ε α βε α β γ δβ γ δ ε αδ ε α β γ

1 2 3 4 54 5 1 2 32 3 4 5 15 1 2 3 43 4 5 1 2

Um resumo da tabela ANOVA considerando o primeiro ındice delinha, o segundo de coluna, o terceiro de letra latina, o quarto deletra grega e o quinto de numero ijklm e

fv g.l. SQ

Linhas 4 15

∑5

i=1y2i.... −

y2.....

25

Colunas 4 15

∑5

j=1y2.j... −

y2.....

25

Letra latina 4 15

∑5

k=1y2..k.. −

y2.....

25

Letra grega 4 15

∑5

l=1y2...l. −

y2.....

25

Numero romano 4 15

∑5

m=1y2....m −

y2.....

25Erro 4 Diferenca

Total 24∑

i

∑j

∑k

∑l

∑my2ijklm −

y2.....

25

38

Documents

4. Experimentos em Blocos aleatorizados, quadra- · fontes de varia˘c~ao devido a ru dos, isto e, \blo-car" em tr^es dire˘c~oes. O plano permite a investiga˘c~ao de 4 fatores (linha,