Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
4. Experimentos em Blocos aleatorizados, quadra-
dos latinos e experimentos relacionados
4.2 Quadrados Latinos (QL)
Suponha que um experimentador esteja estu-
dando o efeito de 5 formulacoes diferentes de
um propulsor de foguetes usado em sistemas
de escape da tripulacao, observando a taxa de
combustao.
Cada formulacao e misturada a partir de um
lote de materia-prima que e grande o suficiente
para realizar cinco testes. Alem disso as for-
mulacoes sao preparadas por varios operadores
e, podem existir diferencas substanciais nas ha-
bilidades e experiencias dos operadores.
1
→ Existem dois fatores de ruıdo a serem e-
liminados: lotes e operadores.
O plano apropriado para este problema con-
siste em testar cada formulacao exatamente
uma vez em cada lote de materia prima e para
cada operador considerando cinco operadores.
O plano resultante e mostrado na tabela a
seguir.
2
3
O planejamento em Quadrado Latino e usado
para eliminar duas fontes de ruıdo.
→ permite a blocagem em duas direcoes (linha
e coluna).
Linha e coluna representam duas restricoes em
aleatorizacao no QL.
O QL de ordem p ou um QL p × p e um
quadrado com p linhas e p colunas.
Cada uma das p2 celas do quadrado contem
uma de p letras que correspondem aos nıveis
do fator (tratamentos),
cada letra ocorre uma unica vez em cada linha
e cada coluna do quadrado tal que
cada linha e cada coluna contem uma sequencia
completa das p letras.
4
5
QL’s podem ser associados ao passatempo po-pular SUDOKU, originado no Japao (sudokusignifica numero unico). Nesse passatempo,ha uma restricao adicional nos quadrados 3×3contidos no quadrado 9×9. Com essa restricaopode-se mostrar que existem cerca de 6×1021
configuracoes diferentes para o SUDOKU, quee menor, mas ainda muito grande, do que onumero de QL’s 9×9 possıveis.
Dependendo do numero de pistas pode ser bemdifıcil resolver um sudoku. Resolver sudoku’sn×n pertence a uma classe de problemas com-putacionais chamada NP-completo(NP refere-se a tempo computacional nao-polinomial).
Um problema NP-completo e um problema parao qual e relativamente facil verificar se umaparticular resposta esta correta, mas pode exi-gir um tempo impossivelmente longo para re-solver usando-se qualquer algoritmo simples amedida que n cresce.
6
Modelo estatıstico para o QL
Yijk = µ+linha︷︸︸︷αi + τj︸︷︷︸
tratamento
+coluna︷︸︸︷βk +εijk
i = 1,2, ..., pj = 1,2, ..., pk = 1,2, ..., p
Observe que ha somente N = p2 observacoes
devido as restricoes de linhas e colunas.
Trata-se de um modelo de efeitos: α’s efeito
de linha, β’s efeito de coluna e τ ’s efeito de
tratamento.
O modelo e completamente aditivo, isto e, nao
ha interacao entre linhas, colunas e tratamen-
tos.
7
Como ha somente uma observacao em cada
cela, somente dois dos tres sub-ındices i, j e k
sao necessarios para denotar uma observacao
particular.
Neste exemplo, observe que se i = 2 e k = 3,
vemos pela tabela dos dados que j = 4 (for-
mulacao D);
se i = 3 e j = 2, segue que k = 5 (operador
5),
se j = 3 e k = 4, segue que i = 5 (lote 5).
Isto e consequencia do fato de que cada trata-
mento ocorre somente uma vez para cada linha
e coluna.
8
A ANOVA consiste no particionamento da so-
ma de quadrados total das N = p2 observacoes
em componentes para linhas, colunas, trata-
mentos e resıduos,
SQTot︸ ︷︷ ︸N−1
= SQLin︸ ︷︷ ︸p−1
+SQCol︸ ︷︷ ︸p−1
+SQTrat︸ ︷︷ ︸p−1
+ SQRes︸ ︷︷ ︸(p−2)(p−1)
Sob a suposicao usual de que εijk ∼ NID(0, σ2),
as somas de quadrados do lado direto da equa-
cao acima, divididas por σ2 sao independente-
mente distribuıdas.
A estatıstica para testar a hipotese de que nao
ha efeito de tratamento e dada por
F0 = QMTratQMRes
9
Sob H0,
F0 ∼ Fp−1,(p−2)(p−1).
Podemos tambem testar a presenca de efeito
de linha ou efeito de coluna formando as razoes
com os quadrados medios correspondentes.
Porem, como linhas e colunas representam uma
restricao sobre aleatorizacao, estes testes po-
dem nao ser apropriados.
10
11
Exemplo 4.3: ANOVA do exemplo do experi-
mento de propulsao de foguetes.
Os dados estao no arquivo foguete.txt.
dados=read.table(“c://flavia//dox//foguete.txt”,header=T)
fit=aov(y∼lin+col+trat,data=dados)
summary(fit)
FV gl SQ QM F Pr(> F )linha 4 68 17.00 1.594 0.23906coluna 4 150 37.50 3.516 0.04037 *tratamento 4 330 82.50 7.734 0.00254 **Residuals 12 128 10.67Total 24 676
Vemos entao que existe efeito de formulacao.
model.tables(fit) Tables of effects
linhaI II III IV V
-3.2 1.4 0.6 0.2 1.0
colunai ii iii iv v
-4.0 3.2 -1.2 0.6 1.4
tratamentoA B C D E
3.2 -5.2 -3.0 4.4 0.6
12
13
Um QL no qual a primeira linha e a primeira
coluna contem a sequencia de letras em ordem
e chamado um QL padrao.
Como em qualquer experimento, as observacoes
no QL devem ser tomadas de forma aleatoria.
Um procedimento proprio de aleatorizacao e
selecionar o quadrado particular empregado ao
acaso.
Como ha um numero muito grande de possi-
bilidades quando n cresce fica impossıvel enu-
merar todas as possibilidades para depois sor-
tear.
O procedimento usual e selecionar um QL de
uma tabela contendo tais planos, como em
Fisher e Yates (1953), e entao arrumar a or-
dem das linhas, colunas e tratamentos ao acaso.
14
Pode ocorrer ausencia de dados no QL. Para
uma quadrado latino p × p, o valor ausente e
estimado por
yijk =p(y′i.. + y′.j. + y′..k)− 2y′...
(p− 1)(p− 1)
em que o apostrofo indica totais da linha, co-
luna e tratamento correspondentes ao valor
ausente e, y′... o total geral.
15
Replicacao em QL’s
Uma desvantagem de QL’s de ordem pequena
e que eles fornecem um numero de graus de
liberdade do erro relativamente pequeno.
Por exemplo se o QL for de ordem 3 tem-se
somente 2 gl’s para os erros. Se p = 4 este
numero cresce para 6.
Assim, quando um QL de ordem pequena e
usado, frequentemente e desejavel replica-los
para aumentar o numero de graus de liberdade
do erro.
Um QL pode ser replicado de diversas formas.
Para ilustrar, vamos supor que o QL 5×5 usado
no exemplo anterior seja replicado n vezes.
16
Isto pode ser feito de formas diferentes.
1) Mesmos lotes e operadores em cada replicacao.
2) Mesmos lotes, mas operadores diferentes
em cada replicacao (ou, similarmente, use os
mesmos operadores, mas lotes diferentes).
3) Lotes diferentes e operadores diferentes.
A ANOVA dependera do metodo de replicacao
usado.
Considere o caso 1, no qual os mesmos nıveis
dos fatores de blocagem (linha e coluna) sao
usados em cada replicacao. Seja Yijkl a l-esima
replicacao da observacao correspondente a i-
esima linha, j-esima coluna e k-esimo trata-
mento.
17
18
Caso 2: Suponha o uso de novos lotes de
materia-prima, mas os mesmos operadores.
Assim, existem agora 5 linhas novas (em geral
p linhas novas.)
19
20
Caso 3: Novos operadores e novos lotes sao
usados.
21
22
Existem outras abordagens para analisar QL’s
replicados que permitem alguma interacao en-
tre tratamentos e quadrados. (Problema 4.25).
Experimentos cruzados e balanceados para
efeitos residuais
Algumas vezes deparamo-nos com um problema
no qual perıodos de tempo representam um fa-
tor. Em geral, existem p tratamentos a serem
testados em p perıodos de tempo, usando np
unidades experimentais.
Por exemplo, um analista do comportamento
humano esta estudando o efeito da substituicao
de fluidos na desidratacao em 20 indivıduos.
No primeiro perıodo (escolhido ao acaso) foi
usado o fluido A para metade do grupo e, o B
para a outra metade.
23
No final do perıodo, a resposta foi medida para
cada indivıduo e, depois, espera-se passar um
perıodo de tempo de modo a eliminar qualquer
efeito psicologico quanto aos fluidos ingeridos
no primeiro perıodo.
Entao, o experimento prossegue usando o flui-
do A para a metade que recebeu B no primeiro
perıodo e, o B para a metade que recebeu A
no primeiro perıodo.
Este plano e chamado “plano cruzado” (crossover
design).
De fato, este plano pode ser analisado como
10 QL’s 2×2 como mostra a tabela a seguir.
24
25
As linhas dos QL’s representando os perıodos
de tempo e, as colunas, os sujeitos.
Os 10 sujeitos que receberam A no primeiro
perıodo: 1, 4, 6, 7, 9, 12, 13, 15, 17 e 19
foram aleatoriamente selecionados.
A seguir, apresenta-se um resumo da tabela
ANOVA para este plano
fonte de variacao graus de liberdadesujeito 19perıodo 1fluido 1erro 18Total 39
26
A soma de quadrados dos sujeitos e calculada
como a soma de quadrados corrigida entre os
totais dos 20 sujeitos (colunas).
A soma de quadrados de perıodo e calculada
como a soma de quadrados corrigida entre os
totais de cada linha (tempo).
A soma de quadrados de fluido e calculada
como a soma de quadrados corrigida entre os
totais de fluido (letras).
A soma de quadrados dos erros e obtida pela
diferenca entre a soma de quadrados total e as
demais.
Maiores detalhes sobre este plano podem ser
encontrados em Cocrhan e Cox (1957), John
(1971) e Anderson e MacLean (1974).
27
Tambem e possıvel empregar planejamentos
do tipo QL em experimentos nos quais os trata-
mentos tem um efeito residual. Por exem-
plo, se os dados para fluido B no perıodo 2
ainda refletem algum efeito do fluido A re-
cebido no tempo 1. Experimentos balancea-
dos para efeitos residuais sao discutidos em
Cochran e Cox (1957) e John (1971).
4.3 O Quadrado Greco-Latino
Considere um QL p× p e sobreponha nele um
segundo QL no qual os tratamentos sao deno-
tados por letras gregas.
Se os dois QL’s quando sobrepostos apresen-
tam a propriedade de que cada letra grega apa-
rece uma e somente uma vez com cada letra
latina, os QL’s sao ditos ser ortogonais e o
plano resultante e chamado Quadrado Greco-
Latino (QGL).
A tabela a seguir ilustra um QGL 4× 4.
28
29
O QGL pode ser usado para controlar tres
fontes de variacao devido a ruıdos, isto e, “blo-
car” em tres direcoes.
O plano permite a investigacao de 4 fatores
(linha, coluna, letra grega, letra latina) cada
uma com p nıveis com somente p2 realizacoes.
O QGL existe para p ≥ 3 exceto para p = 6.
Observe que para fins de analise estatıstica um
QGL 3×3 so fara sentido se houver replicacao,
pois com apenas um QGL 3×3 nao sobram
graus de liberdade para o erro.
30
Modelo Estatıstico para o QGL:
Yijkl = µ+θi+τj+ωk+φl+εijkl,
i = 1,2, ..., pj = 1,2, ..., pk = 1,2, ..., pl = 1,2, ..., p
em que Yijkl e a observacao na linha i e coluna
l para letra latina j e letra grega k.
θi e o efeito de linha,
τj e o efeito da letra latina,
ωk e o efeito da letra grega,
φl e o efeito coluna, e
εijkl ∼ NID(0, σ2) e o componente de erro
aleatorio.
31
Somente dois dos quatro sub-ındices sao necessarios
para identificar uma observacao.
A ANOVA do QGL e bem parecida com a
ANOVA do QL.
Como as letras gregas aparecem apenas uma
vez em cada linha e cada coluna e exatamente
uma vez com cada letra latina, o fator repre-
sentado pela letra grega e ortogonal as linhas,
colunas e tratamentos caracterizados pelas le-
tras latinas.
Portanto, a soma de quadrados devido ao fator
letra grega pode ser calculada a partir dos to-
tais de cada letra grega e o erro experimental
e reduzido por esta quantidade.
A tabela ANOVA para o QGL e apresentada a
seguir.
32
33
Exemplo 4.4: Suponha que no experimento
de propulsao de foguetes um fator adicional
sera testado: conjuntos de testes. Suponha
que sao 5 conjuntos de testes denotados pelas
letras gregas α, β, γ, δ e ε. O QGL resultante
e mostrado na tabela a seguir.
Os dados estao no arquivo foguete.txt.
34
35
dados=read.table(“c:/flavia/dox/foguete.txt”,header=T)
names(dados) ”y” ”lin” ”col” ”trat” ”grega”
fit=aov(y∼lin+col+trat+grega,data=dados)
summary(fit)
FV Df Sum Sq Mean Sq F value Pr(> F )lin 4 68 17.00 2.061 0.17831col 4 150 37.50 4.545 0.03293 *trat 4 330 82.50 10.000 0.00334 **grega 4 62 15.50 1.879 0.20764Residuals 8 66 8.25
efeitos formulacao estimadosA B C D E
3.2 -5.2 -3.0 4.4 0.6
36
O conceito de pares ortogonais de QL’s for-
mando um QGL pode ser estendido de algum
modo.
Um hiperquadrado p× p e um plano no qual 3
ou mais QL’s p×p ortogonais sao sobrepostos.
Em geral, ate p+ 1 fatores poderiam ser estu-
dados se um conjunto completo de p− 1 QL’s
ortogonais esta disponıvel. Tal plano usara
(p + 1)(p− 1) = p2 − 1 graus de liberdade, tal
que uma estimativa independente da variancia
do erro e necessaria.
E claro nao deve existir interacao entre os fa-
tores quando usamos hiperquadrados.
37
Exercıcio 4.30: Construa um hiperquadrado
5 × 5 para estudar o efeito de 5 fatores. Des-creva a tabela de analise de variancia desteplano.
Tres QL’s 2 a 2 ortogonais 5 por 5, para obterum hiperquadrado, com linha=fator 1,
coluna=fator 2, letra latina=fator 3, letra grega= fator 4 e numero=fator 5 sao dados por:
A B C D EB C D E AC D E A BD E A B CE A B C D
α β γ δ εγ δ ε α βε α β γ δβ γ δ ε αδ ε α β γ
1 2 3 4 54 5 1 2 32 3 4 5 15 1 2 3 43 4 5 1 2
Um resumo da tabela ANOVA considerando o primeiro ındice delinha, o segundo de coluna, o terceiro de letra latina, o quarto deletra grega e o quinto de numero ijklm e
fv g.l. SQ
Linhas 4 15
∑5
i=1y2i.... −
y2.....
25
Colunas 4 15
∑5
j=1y2.j... −
y2.....
25
Letra latina 4 15
∑5
k=1y2..k.. −
y2.....
25
Letra grega 4 15
∑5
l=1y2...l. −
y2.....
25
Numero romano 4 15
∑5
m=1y2....m −
y2.....
25Erro 4 Diferenca
Total 24∑
i
∑j
∑k
∑l
∑my2ijklm −
y2.....
25
38