Upload
buingoc
View
220
Download
2
Embed Size (px)
Citation preview
1Documentos, 47
ANÁLISE ESTATÍSTICA DE MODELOS MISTOSVIA REML/BLUP NA EXPERIMENTAÇÃO EMMELHORAMENTO DE PLANTAS PERENES
Colombo2000
DOCUMENTOS, 47 ISSN 1517-536X
Marcos Deon Vilela de Resende
2 Documentos, 47
Embrapa Florestas. Documentos 47. ISSN 1517-536-X
Exemplares desta publicação podem ser solicitados à:Embrapa FlorestasEstrada da Ribeira km 111 - Caixa Postal 31983411-000 - Colombo, PR BrasilFone: (0**41) 666-1313Fax: (0**41) 666-1276E-mail: [email protected]
Tiragem: 300 exemplares
Comitê de Publicações:Américo Pereira de Carvalho, Antônio Carlos de S. Medeiros, Edilson Batista deOliveira, Erich Gomes Schaitza, Guiomar Moreira de Souza Braguinia (SecretariaExecutiva), Honorino Roque Rodigheri, Jarbas Yukio Shimizu, José Alfredo Sturion,Moacir José Sales Medrado (Presidente), Patrícia Póvoa de Mattos, Rivail SalvadorLourenço, Sérgio Ahrens, Susete do Rocio C. Penteado.Revisão gramatical: Elly Claire Jansson LopesNormalização: Lidia Woronkoff
Produção:ÁREA DE COMUNICAÇÕES E NEGÓCIOS
Supervisor: Miguel Haliski
LAYOUT DA CAPA:Cleide da S.N.F. de Oliveira
DIAGRAMAÇÃOMarta de Fátima Vencato
IMPRESSÃOGráfica Radial - Fone: 333-9593
Dezembro/2000
©Embrapa, 2000
RESENDE, M.D.V. de. Análise estatística de modelos mistosvia REML/BLUP na experimentação em melhoramento deplantas perenes. Colombo: Embrapa Florestas, 2000.101p. (Embrapa Florestas. Documentos, 47).
ISSN 1517-536X
1. Estatística. 2. Modelos mistos. 3. Planta perene. I. Título.II. Série.
CDD 519.5
3Documentos, 47
Sumário
1 INTRODUÇÃO ................................................................................ 7
2 MODELOS LINEARES MISTOS, BLUP E REML............................................ 8
3 PROGRAMAS COMPUTACIONAIS ............................................................12
4 PREDIÇÃO DE VALORES GENÉTICOS INTRAPOPULACIONAIS (INTRAESPECÍFICOS) ............144.1 DELINEAMENTO EM BLOCOS AO ACASO, PROGÊNIES DE POLINIZAÇÃO ABERTA, UMA
SÓ POPULAÇÃO..............................................................................144.1.1 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM
BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR
INDIVÍDUO, UM SÓ CARÁTER E UMA SÓ POPULAÇÃO ..................................144.1.2 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM
BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES POR
INDIVÍDUO, UM SÓ CARÁTER E UMA SÓ POPULAÇÃO ..................................174.1.3 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM
BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR
INDIVÍDUO E UM SÓ CARÁTER, AVALIADO EM VÁRIOS LOCAIS (EXPERIMENTOS) COM
ALGUMAS PROGÊNIES OU TRATAMENTOS COMUNS ....................................204.1.4 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM
BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES POR
INDIVÍDUO E UM SÓ CARÁTER, AVALIADO EM VÁRIOS EXPERIMENTOS COM ALGUMAS
PROGÊNIES OU TRATAMENTOS COMUNS ...............................................254.2 DELINEAMENTO EM BLOCOS AO ACASO, PROGÊNIES DE POLINIZAÇÃO CONTROLADA,UMA SÓ POPULAÇÃO ........................................................................27
4.2.1 AVALIAÇÃO DE PROGÊNIES DE IRMÃOS GERMANOS OBTIDAS SOB
CRUZAMENTOS DIALÉLICOS, FATORIAIS OU HIERÁRQUICOS, NO DELINEAMENTO EM
BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR
INDIVÍDUO, UM SÓ CARÁTER E UMA SÓ POPULAÇÃO ..................................274.2.2 AVALIAÇÃO DE PROGÊNIES DE IRMÃOS GERMANOS OBTIDAS SOB
CRUZAMENTOS DIALÉLICOS, FATORIAIS OU HIERÁRQUICOS, NO DELINEAMENTO EM
BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES
POR INDIVÍDUO, UM SÓ CARÁTER E UMA SÓ POPULAÇÃO ...........................304.2.3 AVALIAÇÃO DE PROGÊNIES DE IRMÃOS GERMANOS OBTIDAS SOB
CRUZAMENTOS DIALÉLICOS, FATORIAIS OU HIERÁRQUICOS, NO DELINEAMENTO EM
BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR
INDIVÍDUO E UM SÓ CARÁTER AVALIADO EM VÁRIOS EXPERIMENTOS, COM
TRATAMENTOS COMUNS ...............................................................32
4 Documentos, 47
4.2.4 AVALIAÇÃO DE PROGÊNIES DE IRMÃOS GERMANOS OBTIDAS SOB
CRUZAMENTOS DIALÉLICOS, FATORIAIS OU HIERÁRQUICOS, NO DELINEAMENTO EM
BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES
POR INDIVÍDUO, UM SÓ CARÁTER, UMA SÓ POPULAÇÃO, AVALIADA EM VÁRIOS
EXPERIMENTOS COM PROGÊNIES OU TRATAMENTOS COMUNS ....................... 344.3 DELINEAMENTO EM BLOCOS AO ACASO, PROGÊNIES DE POLINIZAÇÃO ABERTA,VÁRIAS POPULAÇÕES ........................................................................35
4.3.1 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS (POLINIZAÇÃO ABERTA) DE
VÁRIAS POPULAÇÕES (PROCEDÊNCIAS), NO DELINEAMENTO EM BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR INDIVÍDUO E UM SÓ
CARÁTER ............................................................................... 354.3.2 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS (POLINIZAÇÃO ABERTA) DE
VÁRIAS POPULAÇÕES (PROCEDÊNCIAS), NO DELINEAMENTO EM BLOCOS AO ACASO,COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES POR INDIVÍDUO E UM SÓ
CARÁTER ............................................................................... 394.3.3 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS (POLINIZAÇÃO ABERTA) DE
VÁRIAS POPULAÇÕES (PROCEDÊNCIAS), NO DELINEAMENTO EM BLOCOS AO ACASO,COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR INDIVÍDUO E UM SÓ
CARÁTER, AVALIADO EM VÁRIOS EXPERIMENTOS COM ALGUMAS PROGÊNIES OU
TRATAMENTOS COMUNS ............................................................... 434.3.4 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS (POLINIZAÇÃO ABERTA) DE
VÁRIAS POPULAÇÕES (PROCEDÊNCIAS), NO DELINEAMENTO EM BLOCOS AO ACASO,COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES POR INDIVÍDUO E UM SÓ
CARÁTER, AVALIADO EM VÁRIOS EXPERIMENTOS COM ALGUMAS PROGÊNIES OU
TRATAMENTOS COMUNS ............................................................... 464.4 DELINEAMENTO EM LÁTICE, PROGÊNIES DE POLINIZAÇÃO ABERTA, UMA POPULAÇÃO 50
4.4.1 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM
LÁTICE, COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR INDIVÍDUO, UM SÓ
CARÁTER E UMA SÓ POPULAÇÃO ..................................................... 504.4.2 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM
LÁTICE, COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES POR INDIVÍDUO, UM
SÓ CARÁTER E UMA SÓ POPULAÇÃO ..................................................524.4.3 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM
LÁTICE, COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR INDIVÍDUO E UM
SÓ CARÁTER, AVALIADO EM VÁRIOS EXPERIMENTOS COM ALGUMAS PROGÊNIES OU
TRATAMENTOS COMUNS ............................................................... 554.4.4 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM
LÁTICE, COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES POR INDIVÍDUO EUM SÓ CARÁTER, AVALIADO EM VÁRIOS EXPERIMENTOS COM ALGUMAS
PROGÊNIES OU TRATAMENTOS COMUNS ............................................. 57
5Documentos, 47
4.5 DELINEAMENTO EM LÁTICE, PROGÊNIES DE POLINIZAÇÃO ABERTA, VÁRIAS
POPULAÇÕES ................................................................................594.5.1 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS (POLINIZAÇÃO ABERTA) DE
VÁRIAS POPULAÇÕES (PROCEDÊNCIAS), NO DELINEAMENTO EM LÁTICE, COM VÁRIAS
PLANTAS POR PARCELA, UMA MEDIÇÃO POR INDIVÍDUO E UM SÓ CARÁTER ........... 594.5.2 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS (POLINIZAÇÃO ABERTA) DE
VÁRIAS POPULAÇÕES (PROCEDÊNCIAS), NO DELINEAMENTO EM LÁTICE, COM VÁRIAS
PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES POR INDIVÍDUO E UM SÓ CARÁTER ....... 624.6 AVALIAÇÃO APENAS DE POPULAÇÕES ................................................. 65
4.6.1 AVALIAÇÃO DE VÁRIAS POPULAÇÕES (PROCEDÊNCIAS), NO DELINEAMENTO
EM BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR
INDIVÍDUO E UM SÓ CARÁTER ..........................................................654.7 AVALIAÇÃO SIMULTÂNEA DE CARACTERES ........................................... 68
4.7.1 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM
BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR
INDIVÍDUO E VÁRIOS CARACTERES, EM UM SÓ LOCAL ............................... 68
5 PREDIÇÃO DE VALORES GENÉTICOS E GENOTÍPICOS INTERPOPULACIONAIS
(INTERESPECÍFICOS) ..........................................................................715.1 HÍBRIDOS ENVOLVENDO DUAS ESPÉCIES OU POPULAÇÕES ............................. 715.2 HÍBRIDOS ENVOLVENDO TRÊS OU MAIS ESPÉCIES ......................................84
6 TESTES CLONAIS ............................................................................. 856.1 AVALIAÇÃO DE CLONES NÃO APARENTADOS NO DELINEAMENTO EM BLOCOS AO
ACASO COM VÁRIAS PLANTAS POR PARCELA (VÁLIDO TAMBÉM PARA LINHAGENS NÃO
APARENTADAS DE ESPÉCIES AUTÓGAMAS) ................................................. 856.2 AVALIAÇÃO DE CLONES APARENTADOS NO DELINEAMENTO EM BLOCOS AO ACASO,COM VÁRIAS PLANTAS POR PARCELA ....................................................... 87
7 MODELOS NÃO LINEARES PARA VARIÁVEIS BINOMIAIS E CATEGÓRICAS....................89
8 AJUSTE DE COVARIÁVEL E ANÁLISE DE COVARIÂNCIA ......................................96
9 ESPÉCIES COM SISTEMA REPRODUTIVO MISTO ..............................................97
10 REFERÊNCIAS BIBLIOGRÁFICAS ..............................................................98
6 Documentos, 47
7Documentos, 47
ANÁLISE ESTATÍSTICA DE MODELOS MISTOS VIAREML/BLUP NA EXPERIMENTAÇÃO EM MELHORAMENTO
DE PLANTAS PERENES
Marcos Deon Vilela de Resende
1. Introdução
No melhoramento de plantas perenes, as técnicas de avaliação genéticadesempenham papel fundamental, pois permitem a predição dos valoresgenéticos aditivos e genotípicos dos candidatos a seleção, propiciando umaseleção mais acurada. Tais técnicas são relevantes tanto para o melhoramentointrapopulacional quanto interpopulacional visando à utilização de híbridosheteróticos.
As técnicas ótimas de avaliação genética envolvem, simultaneamente,a predição de valores genéticos e a estimação de componentes de variância.De maneira genérica, o procedimento ótimo de predição de valores genéticos éo BLUP (melhor predição linear não viciada) ao nível individual (Henderson &Quaas, 1976). Para o caso balanceado, os preditores BLUP ao nível individualeqüivalem aos índices de seleção multi-efeitos (Resende & Higa, 1994a), osquais envolvem todos os efeitos aleatórios do modelo estatístico associado àsobservações fenotípicas. A predição usando BLUP ou os índices multi-efeitosassume que os componentes de variância são conhecidos. Entretanto, na práticasão necessárias estimativas fidedignas dos componentes de variância(parâmetros genéticos) de forma a se obter o que se denomina BLUP empírico(Harville & Carriquiry, 1992). Atualmente, o procedimento padrão de estimaçãode componentes de variância é o da máxima verossimilhança restrita (REML),desenvolvido por Patterson & Thompson (1971).
A estimação de parâmetros genéticos associados à seleção no contextodo melhoramento de plantas anuais é bem descrito em várias obras publicadasno Brasil (Vencovsky, 1987; Vencovsky & Barriga, 1992; Ramalho et al. ,1993; Cruz & Regazzi, 1994; Cruz, 1997; Ramalho et al., 2000). Por outrolado, a estimação e predição no contexto do melhoramento de plantas perenesdemanda o uso da metodologia de modelos mistos (REML/BLUP) ao nívelindividual, a qual vem sendo aplicada ao melhoramento de espécies florestaiscomo o eucalipto, o pinus, a acácia-negra e a seringueira (Resende et al., 1993;1996; Bueno Filho, 1997; Resende & Fernandes, 1999; Resende et al., 1998;Costa et al., 1999; Kalil et al., 2000), de espécies produtoras de alimentosestimulantes (contendo alcalóides como a cafeína e a teobromina) tais quais aerva-mate, o cacau e o café (Resende et al., 2000a; Resende & Dias, 2000;
8 Documentos, 47
Resende et al., 2000b), de fruteiras como a acerola (Paiva et al., 2000, Resende,2000) e de palmáceas como a pupunha (Farias Neto & Resende, 2000), masnecessita ser difundida e disseminada. As técnicas de estimação baseadas nométodo de quadrados mínimos tais como a análise de variância não são as maisrecomendadas para aplicação ao melhoramento de plantas perenes.
Este artigo tem como objetivo descrever, em termos práticos, os modelosmistos e suas estruturas de médias e variâncias, estimadores e preditoresassociados aos principais delineamentos experimentais e de cruzamentosempregados no melhoramento de plantas perenes. São contemplados osdelineamentos experimentais de blocos ao acaso e látice, delineamentos decruzamento em polinização aberta e controlada, medidas simples e repetidas,modelos univariados e multivariados, avaliação de progênies intrapopulacionaise híbridas, avaliação de clones, uma e várias populações, avaliação emexperimentos simples e repetidos através dos locais (contemplando a interaçãogenótipo x ambiente), avaliação simultânea de caracteres. Todas estas situaçõessão sobrepostas gerando em torno de 30 modelos diferentes. São consideradasvariáveis contínuas (modelos lineares) e variáveis discretas (modelos não linearesassociados à técnica de modelos lineares generalizados). São também abordadoscom detalhes, aspectos referentes ao uso dos softwares ASREML (Gilmour etal., 2000) e DFREML (Meyer, 1998).
Todos os aspectos considerados neste trabalho são essenciais na práticado melhoramento de plantas perenes. Adicionalmente, são fundamentais aostrabalhos acadêmicos e técnico-científicos, referindo-se ao conteúdo dametodologia dos trabalhos científicos que forem desenvolvidos através do usoda abordagem de modelos lineares e não lineares mistos.
Acredita-se que este trabalho sirva de referência ao melhoramento deplantas perenes no Brasil tais quais: (i) espécies florestais: eucalipto, pinus,acácia-negra, grevílea, seringueira, leucena, etc; (ii) espécies produtoras dealimentos estimulantes: erva-mate, cacau, café, guaraná, chá-da-índia, etc;(iii) fruteiras: caju, acerola, cupuaçu, maçã, graviola, etc; (iv) palmáceas: coco,dendê, açaí, pupunha, juçara, tamareira, palmeira real, etc.
2. Modelos lineares mistos, BLUP e REML
Um modelo linear misto geral é da forma (Henderson, 1984):
eZaXby ++= (1),
9Documentos, 47
com as seguintes distribuições e estruturas de médias e variâncias:
RZGZVyVarRNe
XbyEGNa
+==
=
')(),0(~
)(),0(~
em que:
y: vetor de observações;
b: vetor paramétrico dos efeitos fixos, com matriz de incidência X;
a: vetor paramétrico dos efeitos aleatórios, com matriz de incidência Z;
e: vetor de erros aleatórios;
G: matriz de variância � covariância dos efeitos aleatórios;
R: matriz de variância � covariância dos erros aleatórios;
0: vetor nulo.
Assumindo como conhecidos G e R, a simultânea estimação dos efeitosfixos e predição dos efeitos aleatórios pode ser obtida pelas equações de modelomisto dadas por:
=
+ −
−
−−−
−−
yRZ
yRX
a
b
GZRZXRZ
ZRXXRZ1
1
111
11
'
'
ˆ
ˆ
''
''
A solução deste sistema para b e a conduz a resultados idênticos aosobtidos por:
yVXXVXb 11 ')'(ˆ −−−= : estimador de quadrados mínimos generalizados (GLS)ou melhor estimador linear não viciado (BLUE) de b;
)ˆ()ˆ('ˆ 11 bXyCVbXyVGZa −=−= −− : melhor preditor linear não viciado (BLUP)de a; em que C = GZ� = matriz de covariância entrea e y.
Quando G e R não são conhecidas, os componentes de variância a elesassociados podem ser estimados eficientemente empregando-se o procedimentoREML (Patterson & Thompson, 1971; Searle et al., 1992). Exceto por umaconstante, a função de verossimilhança restrita a ser maximizada, é dada por:
10 Documentos, 47
)/'logloglog(log2
1
)/'loglog(log2
1
22
221
ee
ee
PyyvGRC
PyyvHXXHL
σσ
σσ
++++−=
+++−= −
em que:
11111 ')'(;' −−−−− −=+= HXXHXXHHPZGZRH ;
v = N-r(x) = graus de liberdade, em que N é o número total de dados e r(x) éo posto da matriz X;
C = matriz dos coeficientes das equações de modelo misto.
A função (L) de verossimilhança restrita expressa em termos do logaritmo,pode ser maximizada (visando obter as estimativas REML dos componentes devariância) empregando-se diferentes algoritmos tais quais: (i) �Expectation �Maximization� (EM) de Dempster et al. (1977); (ii) �Derivative Free� (DF) deGraser et al. (1987); (iii) �Average Information� (AI) de Gilmour et al. (1995).Estes algoritmos geraram as denominações EM-REML, DF-REML e AI-REML.Dentre estes, o algoritmo EM é o mais acurado, mas também o mais lento. Oalgoritmo DF é rápido e acurado quando o número de componentes de variâncianão é muito grande. Para modelos complexos, o algoritmo AI é mais rápido eacurado do que o DF (Johnson & Thompson, 1995).
Sendo geral, o modelo (1) contempla vários modelos inerentes àsdiferentes situações, tais quais:
(a) Modelo univariado, ajustando apenas o vetor de efeitos aditivos (a)
a : vetor de efeitos genéticos aditivos;
22; ea IRAG σσ == , em que:
2aσ : variância genética aditiva;
A : matriz de correlação genética aditiva entre os indivíduos em avaliação;
2eσ : variância residual.
11Documentos, 47
(b) Modelo univariado com medidas repetidas, ajustando os efeitos aditivos(a*) e de ambiente permanente (p) (Modelo de Repetibilidade)
:,
;)(;)(
2*
1
222*
queemepZaZXb
IRIpVarAaVareZaXby epa
+++=
===++= σσσ
2pσ = variância dos efeitos permanentes.
(c) Modelo multivariado, ajustando os efeitos aditivos
No caso bivariado tem-se:
:,0
0;
;;
;;0
0
2
2
2
2
2
2
2
1
2
1
2
1
221
121
221
121 queemRouRG
RIRGAG
a
aa
Z
ZZ
e
eO
ee
eeO
aa
aaO
OO
=
=
=
⊗=⊗=
=
=
σσ
σσσσ
σσσσ
12aσ = covariância genética aditiva entre os caracteres 1 e 2;
12eσ = covariância ambiental entre os caracteres 1 e 2.
(d) Modelo geoestatístico para análise espacial
R = S : matriz não diagonal que considera a correlação entre resíduos,por exemplo, linhas auto-regressivas e colunas auto-regressivas, para contemplara autocorrelação espacial entre as observações.
Os modelos geoestatísticos permitem estudar a variabilidade espacialdo solo nas áreas experimentais, através do uso de procedimentos que permitemum melhor critério de estratificação ambiental (para seleção massal ou paramelhor definição dos efeitos fixos no procedimento BLUP). Neste contexto, aanálise espacial é realizada simultaneamente (Cullis et al., 1998) à prediçãoBLUP. Conhecimentos e modelos de séries temporais são muito úteis nestaárea de pesquisa. Também, muitas técnicas empregadas na área de geologiatais quais a construção de semivariogramas e a realização de krigagens sãoempregados na análise espacial.
12 Documentos, 47
De maneira genérica, as variância dos erros de estimação e predição
dos efeitos fixos e aleatórios são dadas por
−−
aa
bbVar
ˆ
ˆ= C-1 , para um
modelo incluindo os efeitos fixos (b) e aleatórios (a), em que C-1 é a inversa damatriz dos coeficientes das equações de modelo misto.
A partir da variância do erro de predição (PEV) dos valores genéticos a
acurácia é dada por [ ] 2/12ˆ /1 aiaa PEVr
iσ−= .
3. Programas computacionais
A implementação computacional da metodologia de modelos mistosbaseia-se fortemente em métodos numéricos, notadamente em álgebra linearnumérica visando a obtenção da solução iterativa das equações de modelomisto (obtenção do BLUP) e no cálculo numérico para a maximização/minimização de funções de várias variáveis visando a obtenção das estimativasREML.
Os algoritmos para obtenção de estimativas REML podem ser agrupadosde acordo com a ordem das derivadas usadas. Assim, tem-se (i) não derivativo(DF-REML), baseado em procura direta; (ii) baseado em derivadas parciais deprimeira ordem (EM-REML); (iii) basedo em derivadas parciais de primeira esegunda ordens (AI-REML). O algoritmo AI é um procedimento derivativomelhorado, o qual fundamenta-se no uso dos métodos de Newton, que usam asderivadas primeira e segunda da função de verossimilhança. Tal algoritmofundamenta-se na utilização da informação advinda da média das derivadassegundas observadas e esperadas da função de verossimilhança, de forma queo termo que contém os traços dos produtos da matriz inversa é cancelado,restando uma expressão mais simples para computação. Técnicas de matrizesesparsas são empregadas no cálculo dos elementos da inversa da matriz doscoeficientes, os quais são necessários para as derivadas primeiras da funçãode verossimilhança. Este algoritmo é também denominado Quasi-Newton(Gilmour et al., 1995), o qual aproxima a matriz Hessiano (matriz de derivadassegundas) pela média das informações observadas e esperadas. A informaçãoobservada é uma medida da curvatura da função (ou do seu log) deverossimilhança e a informação esperada é a própria informação de Fisher.
Os algoritmos DF ganharam popularidade devido as suas flexibilidadesquanto aos modelos (Meyer, 1989; 1991) e vários softwares foramdesenvolvidos, tais quais o DFREML (Meyer, 1988; 1998) e o MTDFREML(Boldman et al., 1995). Entretanto, as dificuldades de convergência em modelosmais complexos geraram um novo interesse em métodos baseados em primeira
13Documentos, 47
e segunda derivadas da função de verossimilhança. Assim, o algoritmo AI foiincorporado ao DFREML (Meyer, 1998) e desenvolveu-se o software ASREML(Gilmour et al., 2000). Quando o número de parâmetros a serem estimados épequeno, os algoritmos DF são vantajosos computacionalmente. Por outro lado,quando o número de parâmetros é grande os algoritmos EM são mais eficientesque o DF. Nesta mesma situação, o algoritmo AI supera o DF e o EM.
Os três softwares mencionados (ASREML, DFREML e MTDFREML) sãoos mais utilizados no melhoramento de plantas no Brasil e permitem a análisede arquivos com número de dados superior a 100.000. Por incorporarem oalgoritmo AI e também a técnica de regressão aleatória, os softwares DFREMLe ASREML têm sido os mais utilizados e eficientes. O software ASREMLcontempla, adicionalmente, a técnica de análise espacial associada ao BLUP epermite também a análise de modelos não lineares para variáveis binomiais,empregando a técnica de modelos lineares generalizados. Este software permite,praticamente, a análise de qualquer modelo, mesmo os mais complexos, edificilmente será superado.
Neste artigo, são apresentados aspectos da utilização do softwareDFREML (Meyer, 1998). Os programas do DFREML (Versão 3.0b) foramescritos em Fortran 90 (as linguagens de programação mais recomendadaspara o desenvolvimento de softwares na área de componentes de variânciasão Fortran 90 e C++) e possuem duas versões específicas: Unix e PC (DOS).Quatro programas constituem o DFREML: DFPREP que se destina àrecodificação dos efeitos fixos e aleatórios na ordem de processamento e àconstrução da matriz de parentesco; DFUNI destinado a análises univariadaspermitindo o ajuste de vários efeitos aleatórios não correlacionados, adicionaisaos efeitos aditivos; DXMUX destinado a análise multivariada, mas permitindotambém o ajuste de diferentes modelos para os caracteres individuais, os quaispodem diferir tanto nos efeitos fixos quanto aleatórios. Este programa permiteo ajuste de, no máximo, dois efeitos aleatórios adicionais não correlacionados;DXMRR: destinado a análise de medidas repetidas (dados longitudinais),estimando funções de covariância e regressões aleatórias.
Os arquivos de dados ou de pedigree devem possuir a extensão .PRN ou.DAT ou .TXT. O arquivo de resultados mais importantes do DFREML é oDF66#DAT, o qual apresenta as estimativas dos componentes de variância eseus desvios padrões, o Log L e as soluções para os efeitos fixos e aleatórios(valores genéticos preditos).
Nos tópicos seguintes são apresentadas as formas (seqüências de colunasnos arquivos de dados) dos arquivos para vários modelos empregados nomelhoramento de plantas perenes.
14 Documentos, 47
4. Predição de valores genéticos intrapopulacionais(intraespecíficos)
Os valores genéticos aditivos intrapopulacionais preditos são úteis tantopara o melhoramento intrapopulacional (intraespecífico) quanto para omelhoramento interpopulacional (interespecífico). Para o melhoramentointrapopulacional, norteia a seleção visando ao melhoramento progressivo daespécie. Para o melhoramento interpopulacional, permite a escolha criteriosados indivíduos a serem empregados nos cruzamentos, bem como conduz aopróprio melhoramento do híbrido, em função dos melhoramentos realizadosnas espécies puras. A seguir, são apresentados alguns modelos de avaliaçãogenética (estimação de componentes de variância e predição de valoresgenéticos) em espécies perenes. São apresentadas, também, as formas deorganização das colunas de dados visando à utilização do software DFREML(Meyer, 1998).
4.1 Delineamento em blocos ao acaso, progênies de polinizaçãoaberta, uma só população
4.1.1 Avaliação de progênies de meios irmãos, no delineamentoem blocos ao acaso, com várias plantas por parcela, umamedição por indivíduo, um só caráter e uma só população
Modelo linear misto (modelo aditivo univariado)
y = Xb + Za + Wc + e, em que
y, b, a, c e e: vetores de dados, dos efeitos de blocos (fixos), dos efeitosgenéticos aditivos (aleatórios), de efeitos de parcela (aleatórios)e dos erros aleatórios, respectivamente.
X, Z e W: matrizes de incidência para b, a e c, respectivamente.
Distribuições e estruturas de médias e variâncias
0)',(;0)',(;0)',(
),0(~
),0(~
),0(~,
),(~,
22
22
22
=== ecCoveaCovcaCov
INe
INc
ANAa
VXbNVby
ee
cc
aa
σσ
σσ
σσ
15Documentos, 47
ou seja:
=
=
RR
CCW
GGZ
RWCZGV
e
c
a
y
Vare
Xb
e
c
a
y
E
00
00'
00'
0
0
0
, em que:
.'''' 222
2
2
2
RWCWZGZIWWIZZAV
IC
IR
AG
eca
e
c
a
++=++=
=
=
=
σσσσσσ
Equações de modelo misto
=
++ −
yW
yZ
yX
c
a
b
IWWZWXW
WZAZZXZ
WXZXXX
'
'
'
ˆ
ˆ
ˆ
'''
'''
'''
2
11
λλ
, em que:
2
22
2
2
22
22
2
2
1
1;
1
c
ch
h
ch
c
e
a
e −−==−−==σσλ
σσλ
222
22
eca
ahσσσ
σ++
= : herdabilidade individual no sentido restrito no bloco;
)/( 22222ecacc σσσσ ++= : correlação devida ao ambiente comum da parcela;
2aσ : variância genética aditiva;2cσ : variância entre parcelas;2eσ : variância residual (ambiental dentro de parcelas + não aditiva);
A : matriz de correlação genética aditiva entre os indivíduos em avaliação.
As soluções para as equações de modelo misto devem ser obtidas pormétodos iterativos de resolução de sistemas de equações lineares, tais como ométodo de Gauss Seidel. A solução direta via inversão da matriz dos coeficientesé impossível na prática.
16 Documentos, 47
Para o caso balanceado, as soluções obtidas para â, a partir das equaçõesde modelo misto, eqüivalem às predições obtidas pelo índice multi-efeitos(Resende & Higa, 1994a), dado por:
)()()( ........3.....2.1 YYYYbYYbYYbI jiijiijijK +−−+−+−= , em que:
[ ]22
2
3222
2
22
2
1 /
)1(
;//
))1(1
;)1(
cdp
aa
dpcfa
aa
dp
aa
nnb
nbbnb
nb
bbσσ
σρ
σσσ
σρ
σσρ
+
−
=++
−+
=−=
aρ : correlação genética aditiva intraclasse ( aρ = 0,25 para famílias de meiosirmãos);
222 , dpcfa e σσσ : variância entre famílias, entre parcelas e dentro de parcelas,
respectivamente.
........ ,,, YeYYYY jiijijk : valor fenotípico individual, média da parcela, média da
progênie, média do bloco e média geral, respectivamente.
Assim, para o caso balanceado, este índice é BLUP, ao passo que asformas de seleção combinada usando o valor individual como desvio da médiada parcela (Bueno Filho, 1992; Resende & Higa, 1994b) ou como desvio damédia do bloco (Pires et al., 1996) não são BLUP (Resende & Fernandes, 1999).
Estimadores iterativos dos componentes de variância por REML viaalgoritmo EM
)](/[]''ˆ''ˆ''ˆ'[ˆ 2 xrNyWcyZayXbyye −−−−=σ
qCAtraAa ea /)](ˆˆ'ˆ[ˆ 221212 −− += σσ
sCtrcc ec /]ˆ'ˆ[ˆ 3322 σσ += , em que:
C22 e C33 advém de:
17Documentos, 47
=
=
−
−
333231
232221
1312111
333231
232221
131211
1
CCC
CCC
CCC
CCC
CCC
CCC
C
C: matriz dos coeficientes das equações de modelo misto;tr: operador traço matricial;r(x): posto da matriz X;N, q, s: número total de dados, número de indivíduos e número de parcelas,
respectivamente.
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Indivíduo Pai Mãe Bloco Parcela Variável 1 . . . Variável n
Neste caso, é necessário apenas um arquivo, o qual funciona ao mesmotempo como arquivo de pedigree e como arquivo de dados. Deve ser executadoos subprograma DFPREP e em seguida o DFUNI.
Os estimadores e preditores apresentados podem ser utilizados comeficiência em testes de progênies de irmãos germanos (obtidas sob odelineamento de cruzamento em pares simples) desde que a dominância docaráter seja baixa.
4.1.2 Avaliação de progênies de meios irmãos, no delineamentoem blocos ao acaso, com várias plantas por parcela, váriasmedições por indivíduo, um só caráter e uma só população
Modelo linear misto (modelo aditivo univariado, de repetibilidade)
y = Xb + Za + Wc + Tp + e, em que
p: vetor de efeitos permanentes (ambiente permanente dentro de parcela +efeitos genéticos não aditivos);
T: matriz de incidência para p.
Neste modelo, os efeitos fixos de blocos (b-1 graus de liberdade), medições(m-1 graus de liberdade) e interação medição x bloco [(b-1) (m-1) graus deliberdade], podem ser ajustados em um único efeito (denominado combinaçãobloco-medição com mb elementos ou níveis e mb-1 graus de liberdade),procedimento este que é estatisticamente correto e computacionalmente
18 Documentos, 47
desejável e necessário. Os efeitos temporários da interação progênies x mediçõese progênies x medições x blocos são incorporados ao vetor e, em conjunto como efeito de ambiente temporário propriamente dito. Os efeitos c de parcela,neste modelo, referem-se ao ambiente permanente entre parcelas.
Distribuições e estruturas de médias e variâncias
0)',(;0)',(;0)',(
;0)',(;0)',(;0)',(
),0(~
),0(~
),0(~
),0(~,
),(~,
22
22
22
22
===
===
ecCovepCovcpCov
eaCovpaCovcaCov
INe
INp
INc
NAa
VXbNVby
ee
pp
cc
aA
σσ
σσ
σσ
σσ
ou seja:
=
=
RR
PPT
CCW
GGZ
RTPWCZGV
e
p
c
a
y
Var
Xb
e
p
c
a
y
E
000
000'
000'
000'
;
0
0
0
0
, em que:
.''' 2222
2
epca
p
ITTIWWIZZAV
IP
σσσσ
σ
+++=
=
19Documentos, 47
Equações de modelo misto
=
++
+ −
yT
yW
yZ
yX
p
c
a
b
ITTWTZTXT
TWIWWZWXW
TZWZAZZXZ
TXWXZXXX
'
'
'
'
ˆ
ˆ
ˆ
ˆ
''''
''''
''''
''''
3
2
11
λλ
λ, em que:
.1
;1
;1
2
2
232
2
222
2
21p
e
c
e
a
e
pch σσρλ
σσρλ
σσρλ =−==−==−=
2222
22
epca
ahσσσσ
σ+++
= : herdabilidade individual no sentido restrito no bloco,
em uma dada medição;
2222
222
epca
pca
σσσσσσσ
ρ+++
++= : repetibilidade individual no bloco;
2222
22
epca
ppσσσσ
σ+++
= : coeficiente de determinação dos efeitos permanentes
dentro da parcela;
2222
22
epca
ccσσσσ
σ+++
= : correlação devida ao ambiente comum da parcela.
Estimadores iterativos dos componentes de variância por REML viaalgoritmo EM
)](/[]''ˆ''ˆ''ˆ''ˆ'[ˆ 2 xrNyTpyWcyZayXbyye −−−−−=σ
qCAtraAa ea /)](ˆˆ'ˆ[ˆ 221212 −− += σσ
sCtrcc ec /]ˆ'ˆ[ˆ 3322 σσ +=
qCtrpp ep /]ˆˆ'ˆ[ˆ 4422 σσ += , em que:
C22, C33 e C44 advém de:
20 Documentos, 47
=
=
−
−
44434241
34333231
24232221
141312111
44434241
34333231
24232221
14131211
1
CCCC
CCCC
CCCC
CCCC
CCCC
CCCC
CCCC
CCCC
C
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Indivíduo Pai Mãe Bloco-Medição Parcela Permanente Variável 1 . . . Variável n
É necessário apenas um arquivo, o qual funciona simultaneamente comoarquivo de dados e como arquivo de pedigree. Devem ser executadossequencialmente os subprogramas DFPREP e DFUNI.
4.1.3 Avaliação de progênies de meios irmãos, no delineamentoem blocos ao acaso, com várias plantas por parcela, umamedição por indivíduo e um só caráter, avaliado em várioslocais (experimentos) com algumas progênies outratamentos comuns
Modelo linear misto (modelo aditivo multivariado)
y = Xb + Za + Wc + e, em que:
+
+
+
=
llllllll
MM
L
MOMM
L
L
M
L
MOMM
L
L
M
L
MOMM
L
L
M
e
e
e
c
c
c
W
W
W
a
a
a
Z
Z
Z
b
b
b
X
X
X
y
y
y
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
00
00
0
00
00
0
00
00
0
Este modelo multivariado trata um mesmo caráter em diferentes locaiscomo sendo diferentes caracteres (Resende et al., 1999).
21Documentos, 47
Estruturas de médias e variâncias
;
0
0
0
0
0
022
11
2
1
2
1
2
1
2
1
=
bX
bX
e
e
c
c
a
a
y
y
E
=
2
2
2
2
2
2
2
1
2
1
2
1
2
1
2
1
212
121
0
0
0
0
0
00000
0000
0000
0000
000
000
e
e
c
c
aa
aa
II
I
I
AA
AA
e
e
c
c
a
a
Var
σσ
σσ
σσσσ
22
222
2222
21
211
2111
222
111
'')(
'')(
eca
eca
IWIWZAZVyVar
IWIWZAZVyVar
σσσ
σσσ
++==
++==
Para o caso envolvendo três experimentos, tem-se:
=
2
2
2
2
2
2
2
2
2
3
2
1
3
2
1
3
2
1
3
2
1
3
2
1
32313
23212
13121
00000000
00000000
00000000
00000000
00000000
00000000
000000
000000
000000
e
e
e
c
c
c
aaa
aaa
aaa
I
I
I
I
I
I
AAA
AAA
AAA
e
e
e
c
c
c
a
a
a
Var
σσ
σσ
σσ
σσσσσσσσσ
em que:
22 Documentos, 47
222
321, aaa e σσσ : variâncias genéticas aditivas, nos locais (ou experimentos) 1, 2
e 3, respectivamente;
231312, aaa e σσσ : covariâncias genéticas aditivas, envolvendo as combinações
de locais 1-2, 1-3 e 2-3, respectivamente, ou variânciasgenéticas aditivas livres das interações genótipos x ambientes;
222
321, ccc e σσσ : variâncias entre parcelas, nos locais 1, 2 e 3, respectivamente;
222
321, eee e σσσ : variâncias residuais, nos locais 1, 2 e 3, respectivamente.
Equações de modelo misto
=
++
−
−
−
−−−−
−−−−
−−−
yRW
yRZ
yRX
c
a
b
CWRWZRWXRW
WRZGZRZXRZ
WRXZRXXRX
1
1
1
1111
1111
111
'
'
'
ˆ
ˆ
ˆ
'''
'''
'''
, em que:
=
=
=
3
2
1
3
2
1
3
2
1
00
00
00
;
00
00
00
;
00
00
00
W
W
W
W
Z
Z
Z
Z
X
X
X
X
=
=
=
=
3
2
1
3
2
1
3
2
1
3
2
1
ˆ
ˆ
ˆ
ˆ;
ˆ
ˆ
ˆ
ˆ;ˆ
ˆ
ˆ
ˆ;
c
c
c
c
a
a
a
a
b
b
b
b
y
y
y
y
=
=
=
⊗=⊗=⊗= −−−−−−−
2
2
2
2
2
2
2
2
2
1111111
3
2
1
32313
23212
13121
3
2
1
00
00
00
;;
00
00
00
;;
c
c
c
O
aaa
aaa
aaa
O
e
e
e
O
OOO
CGR
ICCAGGIRR
σσ
σ
σσσσσσσσσ
σσ
σ
23Documentos, 47
Os componentes de variância estão associados aos parâmetros h2, c2 er a, da seguinte maneira:
jiijijiiiiii aaaayiieyicyia chch σσρσσσσσσσ =−−=== ;)1(;; 2222222222, em
que:
ji
ij
ij
aa
a
aσσ
σρ = = correlação genética entre o desempenho nos locais i e j;
2yiσ =variância fenotípica ao nível de indivíduo no local i.
A variância da interação genótipo x ambiente, para o caso balanceado,
é dada por .)1()(2
1 22
jiijji aaaaaae σσρσσσ −+−=
Modelos multivariados e equações de modelo misto deste tipo podemtambém ser usados na seguintes situações: (i) avaliação de indivíduos dediferentes gerações, em diferentes locais (para indivíduos de diferentes geraçõesavaliados em um mesmo local, basta ajustar adequadamente os efeitos fixosde blocos - anos e usar o modelo univariado); (ii) avaliação de indivíduos emdiferentes estágios (juvenil e adulto), cada estágio em diferentes experimentos.
Estimadores dos componentes de variância por REML
Nesta situação, devido à complexidade do modelo e ao elevado númerode componentes de variância a serem estimados, os algoritmos recomendadossão o DF e o AI (preferencialmente este). Neste caso, a função geral a sermaximizada é aquela descrita no item 2.
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Experimento Indivíduo Pai Mãe Bloco Parcela Variável 1 . . . Variável n
Neste caso, são necessários dois arquivos: um de dados, conformeestrutura apresentada acima e outro de pedigree formado pelas colunasIndivíduo Pai Mãe. Deve ser executado o subprograma DFPREP e emseguida o DXMUX.
24 Documentos, 47
Análises alternativas
A metodologia de análise apresentada anteriormente permite a seleçãode indivíduos para cada ambiente específico, porém, usando também ainformação de suas famílias em outros ambientes. Uma outra alternativa é aseleção de indivíduos visando ao plantio dos mesmos nos vários ambientes.Nesta situação, a seleção deve ser baseada no comportamento médio aolongo dos ambientes, inferido pelos valores genéticos médios dados por:a1*= (a11+a12)/2 e a2*= (a22+a21)/2 para os indivíduos avaliados nos locais1 e 2, respectivamente. Neste caso, a variância genética aditiva estimadaeqüivale a Var [(a11 + a12 + a22 + a21)/2] = (1/4)
)2()4/1()(1221122121
2222aaaaaaa σσσσσσσ ++=+++ . Neste caso, o modelo é dado
y* =Xb +Za* +Wc* + e*, e os estimadores e preditores eqüivalem àquelesapresentados no item 4.1.1, sendo que os arquivos devem ser montadosconforme uma estrutura univariada.
Outra situação refere-se à avaliação da eficiência da seleçãoindireta ou mesmo à prática da seleção de indivíduos mais estáveis. Nestecaso, a seleção deve ser baseada no valor genético indireto predito e avariância genética aditiva estimada eqüivale à variância livre da interaçãogenótipo x ambiente. Nesta situação, o modelo é dado por y** = Xb +Za** + Wc** + Sf** + e**, e os estimadores e preditores equivalem àqueles
apresentados no item 4.1.2, porém substituindo-se Tp por Sf** e 2pσ por 2
**fσ .
Neste caso, 2**fσ estima (1/4) de 2
aeσ ao passo que 2**aσ eqüivale a 2
aσ ou seja,
a variância genética aditiva livre da interação genótipo x ambiente.Considerando os três modelos alternativos apresentados neste tópico,
tem-se as seguintes eqüivalências, para o caso balanceado:
(i) 2**
2aa σσ = ;
(ii) 2**
2 4)1()(2
1211221 faaaaaae σσσρσσσ =−+−= ;
(iii) 2/)( 2222
21 aaaea σσσσ +=+ ;
(iv) 22**
22222
2* )2/1()2/1(
4
221
aeaaeaaaa
a σσσσσσσ
σ +=+=++
= ;
(v) 2/)( 222** 21 ccc σσσ += ;
(vi) 2/)( 222** 21 eee σσσ += ;
(vii) ;)2/1( 2**
2**
2* fcc σσσ +=
(viii) 2**
2* ee σσ = .
25Documentos, 47
Em resumo, tem-se as seguintes opções de modelo de acordo com osrespectivos objetivos:
(i) seleção de diferentes materiais genéticos para plantios em ambientesespecíficos: modelo y;
(ii) seleção de materiais genéticos para plantio em locais em que não foramtestados: modelo y**;
(iii) seleção de um mesmo material genético para plantio nos vários locaisem que foram conduzidos os experimentos: modelo y*.
Em termos computacionais, é mais indicado ajustar inicialmente o modeloy** e verificar a significância da interação genótipo x ambiente. Caso a interaçãonão seja significativa, pode-se adotar o modelo y*, o qual conduzirá praticamenteao mesmo resultado. Também, neste caso, se a interação for não significativa,
12aρ tenderá a 1 e, portanto, os modelos y* e y também conduzirão praticamenteao mesmo resultado.
4.1.4 Avaliação de progênies de meios irmãos, no delineamentoem blocos ao acaso, com várias plantas por parcela, váriasmedições por indivíduo e um só caráter, avaliado em váriosexperimentos com algumas progênies ou tratamentoscomuns
Modelo linear misto (modelo aditivo multivariado, de repetibilidade)
Considerando o caso bivariado, tem-se:
+
+
+
+
=
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
0
0
0
0
0
0
0
0
e
e
p
p
T
T
c
c
W
W
a
a
Z
Z
b
b
X
X
y
y
26 Documentos, 47
Estruturas de médias e variâncias
;
0
0
0
0
0
0
0
022
11
2
1
2
1
2
1
2
1
2
1
=
bX
bX
e
e
p
p
c
c
a
a
y
y
E
=
2
2
2
2
2
2
2
2
2
1
2
1
2
1
2
1
2
1
2
1
2
1
212
121
0000000
0000000
0000000
0000000
0000000
0000000
000000
000000
e
e
p
p
c
c
aa
aa
I
I
I
I
I
I
AA
AA
e
e
p
p
c
c
a
a
Var
σσ
σσ
σσ
σσσσ
, em
que:
.22
21 pp e σσ : variância permanente dentro de parcelas (ambiental + genética
não aditiva) nos locais 1 e 2, respectivamente.
Equações de modelo misto
=
++
+
−
−
−
−
−−−−−
−−−−−
−−−−−
−−−−
yRT
yRW
yRZ
yRX
p
c
a
b
PTRTWRTZRTXRT
TRWCWRWZRWXRW
TRZWRZGZRZXRZ
TRXWRXZRXXRX
1
1
1
1
11111
11111
11111
1111
'
'
'
'
ˆ
ˆ
ˆ
ˆ
''''
''''
''''
''''
, em
que:
=
=
=
=
2
1
2
1
2
1
2
1
ˆ
ˆˆ;
ˆ
ˆˆ;
ˆ
ˆˆ;
p
pp
c
cc
b
bb
y
yy
=
=
=
=
⊗=⊗=⊗=⊗= −−−−−−−−−
2
2
2
2
2
2
2
2
111111111
2
1
2
1
212
121
2
1
0
0;
0
0;;
0
0
;;;
p
pO
c
cO
aa
aaO
e
eO
OOOO
PCGR
IPPICCAGGIRR
σσ
σσ
σσσσ
σσ
27Documentos, 47
Os componentes de variância estão associados aos parâmetros h2, c2, re r a, da seguinte maneira:
jiijijiiiiiiii aaaayiiipyicyieyia chch σσρσσρσσσσρσσσ =−−==−== ;)(;;)1(; 222222222222 , em
que r i é a repetibilidade no local i.
Estimadores dos componentes de variância por REML
Nesta situação, são recomendados os algoritmos AI (preferencialmenteeste) e DF. A função geral a ser maximizada é aquela descrita no item 2.
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Experimento Indivíduo Pai Mãe Bloco-Medição Parcela Permanente Variável 1 . . . Variável n
São necessários dois arquivos, o de dados e um de pedigree, formadopelas colunas Indivíduo Pai Mãe. Devem ser executados os subprogramasDFPREP e DXMUX.
4.2 Delineamento em blocos ao acaso, progênies de polinizaçãocontrolada, uma só população
4.2.1 Avaliação de progênies de irmãos germanos obtidas sobcruzamentos dialélicos, fatoriais ou hierárquicos, nodelineamento em blocos ao acaso, com várias plantas porparcela, uma medição por indivíduo, um só caráter e umasó população
Modelo linear misto (modelo aditivo-dominante univariado)
y = Xb + Za + Zd + Wc + e, em que
d: vetor aleatório dos efeitos de dominância.
28 Documentos, 47
Estruturas de médias e variâncias
=
=
22
22
22
22
2222
000
000'
000'
000'
;
0
0
0
0
ee
cc
dd
aa
ecda
II
IWI
DZD
AZA
IWIZDZAV
e
c
d
a
y
Var
Xb
e
c
d
a
y
E
σσσσ
σσσσ
σσσσ
, em que:
.''' 2222ecda IWWIZZDZZAV σσσσ +++=
Equações de modelo misto
=
++
+−
−
yW
yZ
yZ
yX
c
d
a
b
IWWZWZWXW
WZDZZZZXZ
WZZZAZZXZ
WXZXZXXX
'
'
'
'
ˆ
ˆˆ
ˆ
''''
''''
''''
''''
3
21
11
λλ
λ, em que:
.1
;1
;1
2
22
2
2
322
22
2
2
22
22
2
2
1 c
ch
hh
ch
h
ch a
c
e
a
a
d
ea
a
e −−==−
−−==−−==σσλ
σσλ
σσλ
22ad heσ : variância genética de dominância e herdabilidade individual no sentido
amplo, respectivamente;D : matriz de correlação genética de dominância entre os indivíduos em avaliação.
O sistema apresentado prediz isoladamente os efeitos aditivos (â) e de
dominância ( d ). Os valores genotípicos totais, dados por dâg ˆˆ += , podem serpreditos diretamente pelas equações de modelo misto:
=
++ −
yW
yZ
yX
c
g
b
IWWZWXW
WZGZZXZ
WXZXXX
e
'
'
'
ˆ
ˆ
ˆ
'''
'''
'''
3
21
λσ , em que:
22da DAG σσ +=
29Documentos, 47
Estimadores iterativos dos componentes de variância por REML viaalgoritmo EM
)](/[]''ˆ''ˆ''ˆ'ˆ'[ˆ '2 xrNyWcyZdyZayXbyye −−−−−=σ ;
sCtrcc ec /]ˆ'ˆ[ˆ 4422 σσ += ;
qCAtraAa ea /)](ˆˆ'ˆ[ˆ 221212 −− += σσ ;
qCDtrdDd ed /](ˆˆ'ˆ[ˆ 331212 −− += σσ .
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Indivíduo Pai Mãe Bloco Parcela Variável 1 . . . Variável n
Para ajuste dos efeitos de dominância, os mesmos devem ser consideradoscomo �segundo efeito aleatório por indivíduo�. Neste caso, além dos arquivosde dados e de pedigree, deve ser fornecido um arquivo adicional com nomepadrão DF45#DAT, referente à inversa da matriz de parentesco de dominância.Este arquivo não formatado deve fornecer todos os elementos não zero dotriângulo inferior da matriz inversa e deve conter três colunas: um código inteiro(de 1 ao número de indivíduos na análise) referente ao número da coluna namatriz; um código inteiro referente ao número da linha (maior ou igual ao númeroda coluna) na matriz (de 1 ao número de indivíduos na análise); uma variávelverdadeira (real) fornecendo o elemento da inversa da matriz de parentesco dedominância.
Para a estimação da variância genética de dominância, outra alternativapode ser empregada, a qual não requer o fornecimento dos elementos da inversada matriz de parentesco de dominância. Isto pode ser feito ajustando o efeitode família de irmãos germanos como um efeito aleatório adicional nãocorrelacionado que pode ser designado efeito de dominância comum a umafamília de irmãos germanos. O vetor de soluções para este efeito de dominânciacomum apresenta dimensão eqüivalente ao número de famílias de irmãosgermanos e a variância deste vetor contempla ¼ da variância de dominância,ignorando a epistasia. Assim, a variância devida ao efeito de dominância comumdeve ser multiplicada por quatro para obtenção da variância de dominância.Este procedimento, entretanto, não permite a predição dos efeitos de dominânciapara cada indivíduo, mas, prediz os efeitos aditivos livres das influências dosefeitos de dominância. O arquivo de dados deve estar organizado conformeespecificado a seguir:
30 Documentos, 47
Indivíduo Pai Mãe Bloco Parcela Família de Irmãos Germanos Variável 1 . . . Variável n
O modelo linear misto passa a ser dado por y = Xb + Za +Wc + Sf + e, em que f é o efeito de dominância da família de irmãos germanos
e S a matriz de incidência deste efeito. A variância de f contempla (1/4) 2dσ .
Os subprogramas a serem utilizados pelo DFREML são o DFPREP e oDFUNI.
4.2.2 Avaliação de progênies de irmãos germanos obtidas sobcruzamentos dialélicos, fatoriais ou hierárquicos, nodelineamento em blocos ao acaso, com várias plantas porparcela, várias medições por indivíduo, um só caráter euma só população
Modelo linear misto (modelo aditivo-dominante univariado, derepetibilidade)
y = Xb + Za + Wc + Sf +Tp + e
Estruturas de médias e variâncias
;
0
0
0
0
0
=
Xb
e
p
f
c
a
y
E
=
2
2
2
22
22
22
22
2222
0
0
0
0
0000
000'
000'
000'
000'
e
c
e
pp
ff
cc
aa
pfca
I
I
I
ITI
ISI
IWI
AZA
TISIWIZAV
e
p
f
c
a
y
Var
σ
σ
σσσ
σσσσ
σσσσσσ
31Documentos, 47
Equações de modelo misto
=
++
++ −
yT
yS
yW
yZ
yX
p
f
c
a
b
ITTSTWTZTXT
TSISSWSZSXS
TWSWIWWZWXW
TZSZWZAZZXZ
TXSXWXZXXX
'
'
'
'
'
ˆ
ˆˆ
ˆ
ˆ
'''''
'''''
'''''
'''''
'''''
4
3
2
11
λλ
λλ
, em que:
22
2
4222
2
322
2
222
2
1
1;
)(25,0
1;
1;
1phhch p
e
af
e
c
e
a
e ρσσλρ
σσλρ
σσλρ
σσλ −==
−−==−==−==
Estimadores iterativos de componentes de variância por REML viaalgoritmo EM
)](/[]''ˆ''ˆ''ˆ''ˆ''ˆ'[ˆ 2 xrNyTpySfyWcyZayXbyye −−−−−−=σ
qCAtraAa ea /)](ˆˆ'ˆ[ˆ 221212 −− += σσ
sCtrcc ec /]ˆ'ˆ[ˆ 3322 σσ +=
vCtrff ef /]ˆˆ'ˆ[ˆ 4422 σσ +=
sCtrpp ep /]ˆˆ'ˆ[ˆ 5522 σσ += , em que v é o número de famílias de irmãos
germanos.
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Indivíduo Pai Mãe Bloco-Medição Parcela Família Permanente Variável 1 . . . Variável n
Devem ser utilizados os subprogramas DFPREP e DFUNI.
32 Documentos, 47
4.2.3 Avaliação de progênies de irmãos germanos obtidas sobcruzamentos dialélicos, fatoriais ou hierárquicos, nodelineamento em blocos ao acaso, com várias plantas porparcela, uma medição por indivíduo e um só caráter, avaliadoem vários experimentos, com tratamentos comuns
Modelo linear misto (modelo aditivo-dominante multivariado)
Considerando o caso bivariado, tem-se:
+
+
+
+
=
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
0
0
0
0
0
0
0
0
e
e
f
f
S
S
c
c
W
W
a
a
Z
Z
b
b
X
X
y
y
Distribuições e estruturas de médias e variâncias
;
0
0
0
0
0
0
0
022
11
2
1
2
1
2
1
2
1
2
1
=
bX
bX
e
e
f
f
c
c
a
a
y
y
E
=
2
2
2
2
2
2
2
2
2
1
1
2
1
2
1
2
1
212
121
2
1
212
121
0000000
0000000
000000
000000
0000000
0000000
000000
000000
e
e
ff
ff
c
c
aa
aa
I
I
II
II
I
I
AA
AA
e
e
f
f
c
c
a
a
Var
σσ
σσσσ
σσ
σσσσ
, em
que:
12fσ : covariância entre os efeitos de dominância associado às famílias de irmãos
germanos nos ambientes 1 e 2 (eqüivale a ¼ 2dσ , livre da interação).
33Documentos, 47
Equações de modelo misto
=
++
+
−
−
−
−
−−−−−
−−−−−
−−−−−
−−−−
yRS
yRW
yRZ
yRX
f
c
a
b
FSRSWRSZRSXRS
SRWCWRWZRWXRW
SRZWRZGZRZXRZ
SRXWRXZRXXRX
1
1
1
1
11111
11111
11111
1111
'
'
'
'
ˆˆ
ˆ
ˆ
''''
''''
''''
''''
, em
que:
=
=
=
=
2
1
2
1
2
1
2
1
ˆ
ˆˆ;
ˆ
ˆˆ;
ˆ
ˆˆ;
f
ff
c
cc
b
bb
y
yy ;
=
=
=
=
⊗=⊗=⊗=⊗= −−−−−−−−−
2
2
2
2
2
2
2
2
111111111
212
121
2
1
212
121
2
1 ;0
0;;
0
0
;;;
ff
ffO
c
cO
aa
aaO
e
eO
OOOO
FCGR
IFFICCAGGIRR
σσσσ
σσ
σσσσ
σσ
Estimadores dos componentes de variância por REML
São recomendados os algoritmos AI (preferencialmente este) e DF. Afunção geral a ser maximizada é aquela descrita no item 2.
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Experimento Indivíduo Pai Mãe Bloco Parcela Família Variável 1 . . . Variável n
São necessários dois arquivos, o de dados, conforme estruturaapresentada acima e um de pedigree formado pelas colunas Indivíduo PaiMãe. Devem ser executados os subprogramas DFPREP e DXMUX.
34 Documentos, 47
4.2.4 Avaliação de progênies de irmãos germanos obtidas sobcruzamentos dialélicos, fatoriais ou hierárquicos, nodelineamento em blocos ao acaso, com várias plantas porparcela, várias medições por indivíduo, um só caráter, umasó população, avaliada em vários experimentos comprogênies ou tratamentos comuns
Modelo linear misto (modelo aditivo-dominante multivariado, derepetibilidade)
y = Xb + Za + Wc + Sf + Tp + e, que para o caso bivariado eqüivale a:
+
+
+
+
+
=
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
0
0
0
0
0
0
0
0
0
0
e
e
p
p
T
T
f
f
S
S
c
c
W
W
a
a
Z
Z
b
b
X
X
y
y
Estruturas de médias e variâncias
=
=
2
2
2
2
2
2
2
2
2
2
2
1
2
1
2
1
2
1
2
122
11
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
212
121
2
1
212
121
000000000
000000000
000000000
000000000
00000000
00000000
000000000
000000000
00000000
00000000
;
0
0
0
0
0
0
0
0
0
0
e
e
p
p
ff
ff
c
c
aa
aa
I
I
I
I
II
II
I
I
AA
AA
e
e
p
p
f
f
c
c
a
a
Var
bX
bX
e
e
p
p
f
f
c
c
a
a
y
y
E
σσ
σσ
σσσσ
σσ
σσσσ
Equações de modelo misto
=
++
++
−
−
−
−
−
−−−−−−
−−−−−−
−−−−−−
−−−−−−
−−−−−
yRT
yRS
yRW
yRZ
yRX
p
f
c
a
b
PTRTSRTWRTZRTXRT
TRSFSRSWRSZRSXRS
TRWSRWCWRWZRWXRW
TRZSRZWRZGZRZXRZ
TRXSRXWRXZRXXRX
1
1
1
1
1
111111
111111
111111
111111
11111
'
'
'
'
'
ˆ
ˆˆ
ˆ
ˆ
'''''
'''''
'''''
'''''
'''''
,
em que:
35Documentos, 47
=
=
=
=
=
⊗=⊗=⊗=⊗=⊗= −−−−−−−−−−−
2
2
2
2
2
2
2
2
2
2
11111111111
2
1
212
121
2
1
212
121
2
1
0
0;;
0
0;;
0
0
;;;;
p
pO
ff
ffO
c
cO
aa
aaO
e
eO
OOOOO
CFCGR
IPPIFFICCAGGIRR
σσ
σσσσ
σσ
σσσσ
σσ
Estimadores dos componentes de variância por REML
Neste caso, é recomendado o algoritmo AI. A função geral a sermaximizada é aquela descrita no item 2.
Software
Para esta situação recomenda-se o uso do software ASREML, o qualexige um arquivo de programa específico com extensão. as.
4.3 Delineamento em blocos ao acaso, progênies de polinizaçãoaberta, várias populações
4.3.1 Avaliação de progênies de meios irmãos (polinização aberta)de várias populações (procedências), no delineamento emblocos ao acaso, com várias plantas por parcela, umamedição por indivíduo e um só caráter
Nesta situação, duas formas de experimentação existem: (i) progêniesalocadas hierarquicamente dentro de procedências (arranjo de famíliascompactas); (ii) progênies de várias procedências alocadas aleatoriamentedentro de cada bloco.
Adicionalmente, existem duas opções para se tratar o efeito depopulações: (a) efeito fixo; (b) efeito aleatório. Na situação (ii) (a), ou seja,famílias aleatorizadas dentro de blocos e procedência como efeito fixo, bastaajustar no vetor de efeitos fixos, os efeitos de blocos e de procedências, sendoque a interação de efeito fixo, procedência x bloco, tende a ser desprezível.Procedendo desta forma, as observações individuais são ajustadas paraestimativas BLUE dos efeitos de bloco e procedências e basta adotar o modelo,estimadores e preditores descritos no tópico 4.1.1.
Na situação (i) (a), pode-se, vantajosamente, no procedimento BLUP,ajustar as observações individuais para as estimativas BLUE dos efeitos dasprocedências nos blocos, ou seja, considerar o ambiente homogêneo da grandeparcela de procedência como o efeito fixo para o qual as observações de campodevam ser ajustadas. Neste caso, deve-se ajustar a combinação bloco-procedência como efeito fixo (com bp níveis, em que b é o número de blocos e
36 Documentos, 47
p o número de procedências) e também empregar o modelo, estimadores epreditores descritos no tópico 4.1.1.
Quando se consideram as procedências tanto como efeitos genéticosfixos ou aleatórios, deve-se, para efeito da seleção de indivíduos, somar osvalores genéticos individuais preditos aos efeitos de procedências. Procedendodesta forma, os indivíduos de diferentes procedências podem ser comparadosdiretamente por seus novos valores genéticos preditos.
Na situação (i) (b) tem-se os modelos, estimadores e preditores descritosa seguir.
Modelo linear misto (modelo aditivo univariado, multi-populações)
y = Xb + Za + Wc1 + Qr + Uc2 + e, em que:
y, b, a, c1, r, c2 e e: vetores de dados, dos efeitos fixos (blocos), dos efeitosaleatórios genéticos aditivos, dos efeitos aleatórios deparcelas referentes a progênies (subparcelas), depopulações (ou raça), dos efeitos aleatórios de parcelasreferentes a procedências e erros aleatórios,respectivamente.
X, Z, W, Q e U: matrizes de incidência para b, a, c1, r, c2 e e, respectivamente.
Distribuições e estruturas de médias e variâncias
:,0)',(;0)',(
0)',(;0)',(;0)',(;0)',(
0)',(;0)',(;0)',(;0)',(
),0(~
),0(~
),0(~
),0(~
),0(~,
),(~,
2
21211
21
22
22
222
221
22
22
11
sejaouecCoverCov
crCovecCovccCovrcCov
eaCovcaCovraCovcaCov
INe
INr
INc
INc
ANAa
VXbNVby
ee
rr
cc
cc
aa
==
====
====
σσ
σσ
σσ
σσ
σσ
37Documentos, 47
=
=
2
2
2
2
2
2
1
2
1
0000
000
0000
0000
0000
0
0
0
0
0
2
1
e
c
r
c
a
I
I
I
I
A
e
c
r
c
a
Vare
Xb
e
c
r
c
a
y
E
σσ
σσ
σ
.'''')( 22222
21 ecrca IUUIQQIWWIZZAyVar σσσσσ ++++=
Equações de modelo misto
=
++
++ −
yU
yQ
yW
yZ
yX
c
r
c
a
b
IUUQUWUZUXU
UQIQQWQZQXQ
UWQWIWWZWXW
UZQZWZAZZXZ
UXQXWXZXXX
'
'
'
'
'
ˆ
ˆ
ˆ
ˆ
ˆ
'''''
'''''
'''''
'''''
'''''
2
1
4
3
2
11
λλ
λλ
, em
que:
.1
;1
;1
;1
2
22
221
2
2
2
4
2
22
221
2
2
2
3
21
22
221
2
2
2
2
2
22
221
2
2
2
1
2
1
c
crch
r
crch
c
crch
h
crch
c
e
r
e
c
e
a
e
−−−−==
−−−−==
−−−−==
−−−−==
σσλ
σσλ
σσλ
σσλ
22222
22
21 ecrca
ahσσσσσ
σ++++
= : herdabilidade individual no sentido restrito;
22222
221
21
1
ecrca
ccσσσσσ
σ++++
= : correlação entre indivíduos devida ao ambientecomum da parcela referente a progênies (subparcelas);
38 Documentos, 47
22222
22
21 ecrca
rrσσσσσ
σ++++
= : correlação fenotípica intraclasse entre
22222
222
21
2
ecrca
ccσσσσσ
σ++++
= : correlação devida ao ambiente comum da
Estimadores iterativos dos componentes de variância por REML viaalgoritmo EM
)](/[]''ˆ''ˆ''ˆ''ˆ''ˆ'[ˆ 212 xrNyUcyQryWcyZayXbyye −−−−−−=σ
qCAtraAa ea /)](ˆˆ'ˆ[ˆ 221212 −− += σσ
1332
112 /]ˆˆ'ˆ[ˆ1
sCtrcc ec σσ +=
tCtrrr er /]ˆˆ'ˆ[ˆ 4422 σσ +=
2552
222 /]ˆˆ'ˆ[ˆ2
sCtrcc ec σσ += , em que:
s1, t e s2:= número de parcelas referentes a progênies, número de procedênciase número de parcelas referentes a procedência, respectivamente.
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Indivíduo Pai Mãe Bloco Parcela1 Procedência Parcela2 Variável 1 . . . Variável n
Neste caso, é necessário apenas um arquivo o qual funciona ao mesmotempo como arquivo de pedigree e como arquivo de dados. Deve ser executadoo subprograma DFPREP e em seguida o DFUNI.
A significância da inclusão do efeito (c2) da parcela de procedência podeser avaliada através do teste da razão de verossimilhança. Se este efeito nãofor significativo, deve-se retirá-lo do modelo e dos preditores e estimadoresapresentados anteriormente. Estas mesmas considerações são válidas para asituação (ii) (b), em que a interação bloco x procedência, de efeito aleatóriotende a ser não significativa, podendo ser retirada do modelo.
indivíduos de uma mesma procedência, emdiferentes blocos;
parcela de procedência.
39Documentos, 47
É importante relatar que os modelos apresentados estimam umaherdabilidade média dentro das populações. Para se estudar comparativamenteas herdabilidades e coeficientes de variação genética das várias populaçõesdeve-se ajustar um modelo do tipo apresentado em 4.1.1. para cada população.
4.3.2 Avaliação de progênies de meios irmãos (polinização aberta)de várias populações (procedências), no delineamento emblocos ao acaso, com várias plantas por parcela, váriasmedições por indivíduo e um só caráter
Considerando-se as situações (i) (a), (i) (b), (ii) (a) e (ii) (b) descritas notópico 4.3.1, tem-se que:
- na situação (ii) (a), basta ajustar no vetor de efeitos fixos, os efeitos deprocedência e da combinação bloco-medição e adotar o modelo, estimadorese preditores apresentados no tópico 4.1.2.
- na situação (i) (a), deve-se ajustar no vetor de efeitos fixos, o efeito dacombinação bloco-procedência-medição (com bpm níveis, em que p, b e msão os números de procedências, blocos e medições, respectivamente).Neste caso, as observações individuais em uma dada medição são ajustadaspara a média da procedência no bloco, em uma dada medição. O modelo,estimadores e preditores apresentados no tópico 4.1.2. devem serempregados.
Na situação (i) (b) tem-se os modelos, estimadores e preditores descritosa seguir:
Modelo linear misto (modelo aditivo univariado, multi-populações, derepetibilidade)
y = Xb + Za + Wc1 + Tp + Qr + Uc2 + e, em que:
b : vetor de efeitos fixos (no caso, combinações bloco-medição, significandoque os valores individuais em uma dada medição serão ajustados para amédia do bloco na medição);
p : vetor de efeitos permanentes (ambiente permanente dentro de parcela +efeitos genéticos não aditivos);
T : matriz de incidência para p.
40 Documentos, 47
Distribuições e estruturas de médias e variâncias
),0(~
),0(~
),0(~
),0(~
),0(~
),0(~,
),(~,
22
22
22
222
221
22
22
11
ee
pp
rr
cc
cc
aa
INe
INp
INr
INc
INc
ANAa
VXbNVby
σσ
σσ
σσ
σσ
σσ
σσ
As covariâncias entre todos os efeitos aleatórios do modelo são assumidascomo nulas.
Assim:
=
=
2
2
2
2
2
2
2
1
2
1
0
0
0
0
0
00000
0000
0000
0000
0000
0000
0
0
0
0
0
0
2
1
e
c
r
p
c
a
I
I
I
I
I
A
e
c
r
p
c
a
Vare
Xb
e
c
r
p
c
a
y
E
σσ
σσ
σσ
.''''')( 222222
21 ecrpca IUUIQQITTIWWIZZAyVar σσσσσσ +++++=
41Documentos, 47
Equações de modelo misto
=
++
++
+ −
yU
yQ
yT
yW
yZ
yX
c
r
p
c
a
b
IUUQUTUWUZUXU
UQIQQTQWQZQXQ
UTQTITTWTZTXT
UWQWTWIWWZWXW
UZQZTZWZAZZXZ
UXQXTXWXZXXX
'
'
'
'
'
'
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
''''''
''''''
''''''
''''''
''''''
''''''
2
1
5
4
3
2
11
λλ
λλ
λ
,
em que:
.1
;1
;1
;1
;1
2
222
221
2
2
2
5
2
222
221
2
2
2
4
2
222
221
2
2
2
3
21
222
221
2
2
2
2
2
222
221
2
2
2
1
2
1
c
pcrch
r
pcrch
p
pcrch
c
pcrch
h
pcrch
c
e
r
e
p
e
c
e
a
e
−−−−−==
−−−−−==
−−−−−==
−−−−−==
−−−−−==
σσλ
σσλ
σσλ
σσλ
σσλ
222222
22
21 epcrca
ahσσσσσσ
σ+++++
= ;
222222
221
21
1
epcrca
ccσσσσσσ
σ+++++
= ;
222222
22
21 epcrca
rrσσσσσσ
σ+++++
= ;
222222
222
21
2
epcrca
ccσσσσσσ
σ+++++
= .
222222
22
21 epcrca
ppσσσσσσ
σ+++++
= : correlação entre medidas repetidas devidas aos
efeitos permanentes (ambiental + genéticonão aditivo).
42 Documentos, 47
Neste modelo, a repetibilidade é dada por 222222
22222
21
21
epcrca
pcrca
σσσσσσσσσσσ
ρ+++++
++++= .
Estimadores iterativos dos componentes de variância por REML viaalgoritmo EM
)](/[]''ˆ''ˆ''ˆ''ˆ''ˆ''ˆ'[ˆ 212 xrNyUcyQryTpyWcyZayXbyye −−−−−−−=σ
qCAtraAa ea /)](ˆˆ'ˆ[ˆ 221212 −− += σσ
1332
112 /]ˆˆ'ˆ[ˆ1
sCtrcc ec σσ += ;
qCtrpp ep /]ˆˆ'ˆ[ˆ 4422 σσ +=
tCtrrr er /]ˆˆ'ˆ[ˆ 5522 σσ += ;
2662
222 /]ˆˆ'ˆ[ˆ2
sCtrcc ec σσ += .
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Indivíduo Pai Mãe Bloco Parcela1 Permanente Procedência Parcela2 Variável 1 . . . Variável n
É necessário apenas um arquivo, o qual funciona ao mesmo tempo comoarquivo de pedigree e de dados. Deve ser executado o subprograma DFPREP e,em seguida, o DFUNI.
Na situação (ii) (b), a interação aleatória procedência x bloco tende a sernão significativa, sendo que o modelo, preditores e estimadores apresentadospara o caso (i) (b) podem ser utilizados, porém eliminando-se o componente c2e suas variâncias. A significância ou não de c2 pode ser verificada pelo teste darazão de verossimilhança.
Tanto na situação (i) (b) quanto (ii) (b), as interações procedência xmedição, progênie/procedência x medição, procedência x medição x bloco eprogênie/procedência x medição x bloco são incluídas no vetor residual e, oqual contempla o efeito total de ambiente temporário. É importante relatartambém que o próprio modelo de repetibilidade assume que a interação commedições seja aproximadamente nula (ou seja, assume correlação genéticaigual tendendo a 1, através das medições).
43Documentos, 47
Em todas as situações apresentadas neste tópico, o mérito genéticototal de cada indivíduo é dado pelo somatório do efeito genético aditivo preditocom o efeito da procedência a que pertence tal indivíduo.
4.3.3 Avaliação de progênies de meios irmãos (polinização aberta)de várias populações (procedências), no delineamento emblocos ao acaso, com várias plantas por parcela, umamedição por indivíduo e um só caráter, avaliado em váriosexperimentos com algumas progênies ou tratamentoscomuns
Para as situações descritas em (i) (a) e (ii) (a) do tópico 4.3.1, bastaadotar o modelo, estimadores e preditores descritos no tópico 4.1.3. Para assituações (i)(b) ou (ii) (b) incluindo a interação procedência x bloco (efeito c2),tem-se os modelos, estimadores e preditores descritos a seguir.
Modelo linear misto (modelo aditivo bivariado, multi-populações)
y = Xb + Za + Wc1 + Qr +Uc2 + e, que para o caso bivariado eqüivale a:
+
+
+
+
+
=
2
1
22
21
2
1
2
1
2
1
12
11
2
1
2
1
2
1
2
1
2
1
2
1
0
0
0
0
0
0
0
0
0
0
e
e
c
c
U
U
r
r
Q
Q
c
c
W
W
a
a
Z
Z
b
b
X
X
y
y
y, b, a, c1, r, c2 e e: vetores de dados, dos efeitos fixos (blocos), dos efeitosaleatórios genéticos aditivos, dos efeitos aleatórios deparcelas referentes a progênies, dos efeitos aleatórios depopulações, dos efeitos aleatórios de parcelas referentesa procedências e de erros aleatórios, respectivamente,os quais são desdobrados para os experimentos (locais) 1e 2.
X, Z, W, Q e U: matrizes de incidência para b, a, c1, r, c2 e e, respectivamente.
44 Documentos, 47
Estruturas de médias e variâncias
=
=
2
2
2
2
2
2
2
2
2
2
2
1
22
21
2
1
12
11
2
122
11
2
1
22
21
2
1
12
11
2
1
2
1
2
1
22
21
212
121
12
11
212
121
000000000
000000000
000000000
000000000
00000000
00000000
000000000
000000000
00000000
00000000
;
0
0
0
0
0
0
0
0
0
0
e
e
c
c
rr
rr
c
c
aa
aa
I
I
I
I
II
II
I
I
AA
AA
e
e
c
c
r
r
c
c
a
a
Var
bX
bX
e
e
c
c
r
r
c
c
a
a
y
y
E
σσ
σσ
σσσσ
σσ
σσσσ
22
222
222
222
2222
21
211
211
211
2111
2222122
1211111
'''')(
'''')(
ecrca
ecrca
IUIUQIQWIWZAZVyVar
IUIUQIQWIWZAZVyVar
σσσσσ
σσσσσ
++++==
++++==
em que:
22
21 aa e σσ : variâncias genéticas aditivas nos locais 1 e 2, respectivamente;
12aσ : covariância genética aditiva entre os locais 1 e 2 ou variância aditiva
livre da interação genótipo x ambiente;
22
1211 cc e σσ : variâncias entre parcelas (referentes a progênies) nos locais 1 e 2,
respectivamente;
22
21 rr e σσ : variâncias entre procedências nos locais 1 e 2, respectivamente;
12rσ : covariância genética entre os locais 1 e 2, ao nível do efeito de
procedências;
22
2221 cc e σσ :variâncias entre parcelas (referentes a procedências) nos locais 1 e
2, respectivamente;
22
21 ee e σσ : variâncias residuais nos locais 1 e 2, respectivamente;
45Documentos, 47
Equações de modelo misto
=
+ℜ+
++
−
−
−
−
−
−−−−−−
−−−−−−
−−−−−−
−−−−−−
−−−−−
yRU
yRQ
yRW
yRZ
yRX
c
r
c
a
b
CURUQRUWRUZRUXRU
URQQRQWRQZRQXRQ
URWQRWCWRWZRWXRW
URZQRZWRZGZRZXRZ
URXQRXWRXZRXXRX
1
1
1
1
1
2
1
12
11111
111111
111111
111111
11111
'
'
'
'
'
ˆ
ˆ
ˆ
ˆ
ˆ
'''''
'''''
'''''
'''''
'''''
1
,
em que:
=
=
=
=ℜ
=
⊗=⊗=⊗ℜ=ℜ⊗=⊗= −−−−−−−−−−−
2
2
2
2
202
2
102
2
2
2
11120
12
11110
11
111
2
1
22
21
12
11
212
121
212
121
0
0;
0
0;
0
0;;
;;;;
e
eO
c
c
c
c
rr
rrO
aa
aaO
OOO
RCCG
IRRICCIICCAGG
σσ
σσ
σσ
σσσσ
σσσσ
Os componentes de variância estão associados aos parâmetros
ijij ra ecch ρρ,,, 22
21
2 , da seguinte maneira:
:,;;
;)1(;;;
222
2222
21
22222
2221
2222
21
queemr
rcchcch
jiijijjiijijii
iiiiiiii
rrrraaaayir
yiiiieyicyicyia
σσρσσσρσσσ
σσσσσσσσ
===
−−−−====
ji
ij
ij
aa
a
a σσσ
ρ = : correlação genética entre o desempenho dos indivíduos nos
locais i e j;
ji
ij
ij
rr
r
r σσσ
ρ = : correlação genética entre o desempenho das procedências
nos locais i e j;
2
iyσ : variância fenotípica ao nível de indivíduo no local i.
46 Documentos, 47
A variância da interação indivíduo x local, para o caso balanceado, édada por:
.)1()(2
1 22
jiijji aaaaaae σσρσσσ −+−=
A variância da interação procedência x local, para o caso balanceado, édada por:
.)1()(2
1 22
jiijji rrrrrre σσρσσσ −+−=
Estimadores dos componentes de variância por REML
Nesta situação, devido à complexidade do modelo e ao elevado númerode componentes de variância a serem estimados, os algoritmos recomendadossão o DF e o AI (preferencialmente este). Neste caso, a função geral a sermaximizada é aquela descrita no item 2.
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Experimento Indivíduo Pai Mãe Bloco Parcela1 Procedência Parcela2 Variável 1 . . . Variável n
4.3.4 Avaliação de progênies de meios irmãos (polinização aberta)de várias populações (procedências), no delineamento emblocos ao acaso, com várias plantas por parcela, váriasmedições por indivíduo e um só caráter, avaliado em váriosexperimentos com algumas progênies ou tratamentoscomuns
Para as situações descritas em (i) (a) e (ii) (a) do tópico 4.3.1, bastaadotar o modelo, estimadores e preditores descritos no tópico 4.1.4. Para assituações (i)(b) ou (ii) (b) incluindo a interação procedência x bloco (efeito c2),tem-se os modelos, estimadores e preditores descritos a seguir.
47Documentos, 47
Modelo linear misto (modelo aditivo bivariado, multi-populações, derepetibilidade)
y = Xb + Za + Wc1 + Qr +Tp + e, que para o caso bivariado eqüivale a:
+
+
+
+
+
=
2
1
2
1
2
1
2
1
2
1
12
11
2
1
2
1
2
1
2
1
2
1
2
1
0
0
0
0
0
0
0
0
0
0
e
e
p
p
T
T
r
r
Q
Q
c
c
W
W
a
a
Z
Z
b
b
X
X
y
y
y, b, a, c1, r, p e e: vetores de dados, dos efeitos fixos (blocos), dos efeitos
aleatórios genéticos aditivos, dos efeitos aleatórios deparcelas referentes a progênies, dos efeitos aleatórios depopulações, dos efeitos aleatórios permanentes e de errosaleatórios, respectivamente, os quais são desdobrados paraos experimentos (locais) 1 e 2.
X, Z, W, Q e T: matrizes de incidência para b, a, c1, r, p e e, respectivamente.
Estruturas de médias e variâncias
=
=
2
2
2
2
2
2
2
2
2
2
2
1
2
1
2
1
12
11
2
122
11
2
1
2
1
2
1
12
11
2
1
2
1
2
1
2
1
212
121
12
11
212
121
000000000
000000000
000000000
000000000
00000000
00000000
000000000
000000000
00000000
00000000
;
0
0
0
0
0
0
0
0
0
0
e
e
p
p
rr
rr
c
c
aa
aa
I
I
I
I
II
II
I
I
AA
AA
e
e
p
p
r
r
c
c
a
a
Var
bX
bX
e
e
p
p
r
r
c
c
a
a
y
y
E
σσ
σσ
σσσσ
σσ
σσσσ
22
222
222
222
2222
21
211
211
211
2111
222122
111111
'''')(
'''')(
eprca
eprca
ITITQIQWIWZAZVyVar
ITITQIQWIWZAZVyVar
σσσσσ
σσσσσ
++++==
++++==, em que:
22
21 aa e σσ : variâncias genéticas aditivas nos locais 1 e 2, respectivamente;
12aσ : covariância genética aditiva entre os locais 1 e 2 ou variância aditiva
livre da interação;
48 Documentos, 47
22
1211 cc e σσ : variâncias entre parcelas (referentes a progênies) nos locais 1 e 2,
respectivamente;
22
21 rr e σσ : variâncias entre procedências nos locais 1 e 2, respectivamente;
12rσ : covariância genética entre os locais 1 e 2, ao nível do efeito de
procedências;
22
21 pp e σσ : variâncias permanentes nos locais 1 e 2, respectivamente;
22
21 ee e σσ : variâncias residuais nos locais 1 e 2, respectivamente;
Equações de modelo misto
=
+ℜ+
++
−
−
−
−
−
−−−−−−
−−−−−−
−−−−−−
−−−−−−
−−−−−
yRT
yRQ
yRW
yRZ
yRX
p
r
c
a
b
CTRTQRTWRTZRTXRT
TRQQRQWRQZRQXRQ
TRWQRWCWRWZRWXRW
TRZQRZWRZGZRZXRZ
TRXQRXWRXZRXXRX
1
1
1
1
1
1
12
11111
111111
111111
111111
11111
'
'
'
'
'
ˆ
ˆ
ˆ
ˆ
ˆ
'''''
'''''
'''''
'''''
'''''
1
,
em que:
=
=
=
=ℜ
=
⊗=⊗=⊗ℜ=ℜ⊗=⊗= −−−−−−−−−−−
2
2
2
2
02
2
102
2
2
2
1110
111110
11
111
2
1
2
1
12
11
212
121
212
121
0
0;
0
0;
0
0;;
;;;;
e
eO
p
p
c
c
rr
rrO
aa
aaO
OOO
RPCG
IRRIPPIICCAGG
σσ
σσ
σσ
σσσσ
σσσσ
Os componentes de variância estão associados aos parâmetros
ijij ra epch ρρ,,, 221
2 , da seguinte maneira:
:,;;
;)1(;;;
222
22221
22222221
2222
1
queemr
rpchpch
jiijijjiijijii
iiiiiiii
rrrraaaayir
yiiiieyipyicyia
σσρσσσρσσσ
σσσσσσσσ
===
−−−−====
49Documentos, 47
ji
ij
ij
aa
a
a σσσ
ρ = : correlação genética entre o desempenho dos indivíduos nos locais
i e j;
ji
ij
ij
rr
r
r σσσ
ρ = : correlação genética entre o desempenho das procedências nos
locais i e j;
2
iyσ : variância fenotípica individual no local i.
A variância da interação indivíduo x local, para o caso balanceado, édada por:
.)1()(2
1 22
jiijji aaaaaae σσρσσσ −+−=
A variância da interação procedência x local, para o caso balanceado, édada por:
.)1()(2
1 22
jiijji rrrrrre σσρσσσ −+−=
Estimadores dos componentes de variância por REML
Nesta situação, devido à complexidade do modelo e ao elevado númerode componentes de variância a serem estimados, os algoritmos recomendadossão o DF e o AI (preferencialmente este). Neste caso, a função geral a sermaximizada é aquela descrita no item 2.
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Experimento Indivíduo Pai Mãe Bloco Parcela1 Procedência Parcela2 Variável 1 . . . Variável n
50 Documentos, 47
4.4 Delineamento em látice, progênies de polinização aberta, umapopulação
4.4.1 Avaliação de progênies de meios irmãos, no delineamentoem látice, com várias plantas por parcela, uma mediçãopor indivíduo, um só caráter e uma só população
Modelo linear misto (modelo aditivo univariado, em látice)
y = Xb + Za + Wc + H¶ + e, em que
y, b, a, c, ¶ e e: vetores de dados, dos efeitos de repetições (fixos), de efeitosgenéticos aditivos (aleatórios), dos efeitos de parcela (aleatório), dos efeitosaleatórios de blocos dentro de repetições e de erros aleatórios, respectivamente.
X, Z, W e H: matrizes de incidência para b, a, c e ¶, respectivamente.
Distribuições e estruturas de médias e variâncias
),0(~
),0(~
),0(~
),0(~,
),(~,
22
22
22
22
ee
cc
aa
INe
IN
INc
ANAa
VXbNVby
σσ
σσ
σσ
σσ
∂∂∂
As covariâncias entre todos os efeitos aleatórios do modelo são assumidascomo nulas.
Assim:
=
∂
=
∂RR
BBH
CCW
GGZ
RHBWCZGV
e
c
a
y
Vare
Xb
e
c
a
y
E
000
000'
000'
000'
0
0
0
0
, em que:
51Documentos, 47
.'''''' 2222
2
2
2
2
RHBHWCWZGZIHIHWWIZZAV
IR
IB
IC
AG
eca
e
c
A
+++=+++=
=
=
=
=
∂
∂
σσσσσσσσ
Equações de modelo misto
=
∂
++
+ −
yH
yW
yZ
yX
c
a
b
IHHWHZHXH
HWIWWZWXW
HZWZAZZXZ
HXWXZXXX
'
'
'
'
ˆˆ
ˆ
ˆ
''''
''''
''''
''''
3
2
11
λλ
λ, em que:
2
222
2
2
32
222
2
2
22
222
2
2
1
11;
1∂
∂−−−==∂−−−==∂−−−==∂
ch
c
ch
h
ch e
c
e
a
e
σσλ
σσλ
σσλ
2222
22
∂+++=
σσσσσ
eca
ah : herdabilidade individual no sentido restrito, na
repetição;
)/( 222222∂+++= σσσσσ ecacc : correlação devida ao ambiente comum da parcela;
)/( 222222∂∂ +++=∂ σσσσσ eca : correlação devida ao ambiente comum do bloco
dentro de repetição;
2aσ : variância genética aditiva;
2cσ : variância entre parcelas;
2∂σ : variância entre blocos dentro de repetições;
2eσ : variância residual (ambiental dentro de parcelas + não aditiva);
A: matriz de correlação genética aditiva entre os indivíduos em avaliação.
52 Documentos, 47
Estimadores iterativos dos componentes de variância por REML viaalgoritmo EM
)](/[]''ˆ''ˆ''ˆ''ˆ'[ˆ 2 xrNyHyWcyZayXbyye −∂−−−−=σ ;
qCAtraAa ea /)](ˆˆ'ˆ[ˆ 221212 −− += σσ ;
sCtrcc ec /]ˆ'ˆ[ˆ 3322 σσ += ;
ησσ /]ˆˆ'ˆ[ˆ 4422 Ctre+∂∂=∂ , em que:
C22 , C33 e C44 advém da inversa da matriz dos coeficientes das equaçõesde modelo misto.
tr : operador traço matricial;
r(x) : posto da matriz X;
N, q, s, h : número total de dados, número de indivíduos, número deparcelas e número de blocos, respectivamente.
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Indivíduo Pai Mãe Repetição Parcela Bloco Variável 1 . . . Variável n
Neste caso, é necessário apenas um arquivo o qual funciona ao mesmotempo como arquivo de pedigree e como arquivo de dados. Deve ser executadoo subprograma DFPREP e, em seguida, o DFUNI.
4.4.2 Avaliação de progênies de meios irmãos, no delineamentoem látice, com várias plantas por parcela, várias mediçõespor indivíduo, um só caráter e uma só população
Modelo linear misto (modelo aditivo univariado, de repetibilidade, emlátice)
y = Xb + Za + Wc + Tp + H¶ + e, em que:
p: vetor de efeitos permanentes (ambiente permanente dentro de parcela +efeitos genéticos não aditivos);
T: matriz de incidência para p.
53Documentos, 47
Neste modelo, pode ser ajustado um único efeito (denominado combinaçãorepetição-medição), procedimento este que é estatisticamente correto ecomputacionalmente desejável e necessário.
Distribuições e estruturas de médias e variâncias
),0(~
),0(~
),0(~
),0(~
),0(~,
),(~,
22
22
22
22
22
ee
pp
cc
aa
INe
IN
INp
INc
NAa
VXbNVby
σσ
σσ
σσ
σσ
σσ
∂∂∂
As covariâncias entre todos os efeitos aleatórios dos modelos sãoassumidas como nulas.
Assim:
=
∂
=
∂RR
BBH
PPT
CCW
GGZ
RHBTPWCZGV
e
p
c
a
y
Var
Xb
e
p
c
a
y
E
0000
0000'
0000'
0000'
0000'
;
0
0
0
0
0
, em que:
.'''' 22222
2
epca
p
IHHITTIWWIZZAV
IP
σσσσσ
σ
++++=
=
∂
54 Documentos, 47
Equações de modelo misto
=
∂
++
++ −
yH
yT
yW
yZ
yX
p
c
a
b
IHHTHWHZHXH
HTITTWTZTXT
HWTWIWWZWXW
HZTZWZAZZXZ
HXTXWXZXXX
'
'
'
'
'
ˆˆ
ˆ
ˆ
ˆ
'''''
'''''
'''''
'''''
'''''
4
3
2
11
λλ
λλ
, em
que:
.11
;1
;1
2
2
242
2
232
2
222
2
21∂
=∂−==−==−==−=
σσρλ
σσρλ
σσρλ
σσρλ e
p
e
c
e
a
e
pch
22222
22
∂++++=
σσσσσσ
epca
ah : herdabilidade individual no sentido restrito, na
repetição, em uma dada medição;
22222
2222
∂
∂
+++++++
=σσσσσ
σσσσρ
epca
pca: repetibilidade individual na repetição;
22222
22
∂++++=
σσσσσσ
epca
pp : coeficiente de determinação dos efeitos
permanentes dentro de parcela;
22222
22
∂++++=
σσσσσσ
epca
cc : correlação devida ao ambiente comum de parcela;
22222
22
∂
∂
++++=∂
σσσσσσ
epca: correlação devida ao ambiente comum do bloco.
55Documentos, 47
Estimadores iterativos dos componentes de variância por REML viaalgoritmo EM
)](/[]''ˆ''ˆ''ˆ''ˆ''ˆ'[ˆ 2 xrNyHyTpyWcyZayXbyye −∂−−−−−=σ
qCAtraAa ea /)](ˆˆ'ˆ[ˆ 221212 −− += σσ
sCtrcc ec /]ˆ'ˆ[ˆ 3322 σσ +=
qCtrpp ep /]ˆˆ'ˆ[ˆ 4422 σσ +=
ησσ /]ˆˆ'ˆ[ˆ 5522 Ctre+∂∂=∂ , em que:
C22, C33, C44 e C55 advém da inversa da matriz dos coeficientes dasequações de modelo misto.
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Indivíduo Pai Mãe Repetição-Medição Parcela Permanente Bloco Variável 1 . . . Variável n
É necessário apenas um arquivo, o qual funciona simultaneamente comoarquivo de dados e como arquivo de pedigree. Devem ser executadosseqüencialmente os subprogramas DFPREP e DFUNI.
4.4.3 Avaliação de progênies de meios irmãos, no delineamentoem látice, com várias plantas por parcela, uma mediçãopor indivíduo e um só caráter, avaliado em váriosexperimentos com algumas progênies ou tratamentoscomuns
Modelo linear misto (modelo aditivo multivariado, em látice)
Considerando o caso bivariado, tem-se:
+
∂∂
+
+
+
=
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
0
0
0
0
0
0
0
0
e
e
H
H
c
c
W
W
a
a
Z
Z
b
b
X
X
y
y
56 Documentos, 47
Estruturas de médias e variâncias
;
0
0
0
0
0
0
0
022
11
2
1
2
1
2
1
2
1
2
1
=
∂∂
bX
bX
e
e
c
c
a
a
y
y
E
=
∂∂
∂
∂
2
2
2
2
2
2
2
2
2
1
2
1
2
1
2
1
2
1
2
1
2
1
212
121
0000000
0000000
0000000
0000000
0000000
0000000
000000
000000
e
e
c
c
aa
aa
I
I
I
I
I
I
AA
AA
e
e
c
c
a
a
Var
σσ
σσ
σσ
σσσσ
,
em que:
.22
21 ∂∂ σσ e = variância permanente entre blocos dentro de repetições nos locais
1 e 2, respectivamente.
Equações de modelo misto
=
∂
++
+
−
−
−
−
−−−−−
−−−−−
−−−−−
−−−−
yRH
yRW
yRZ
yRX
c
a
b
BHRHWRHZRHXRH
HRWCWRWZRWXRW
HRZWRZGZRZXRZ
HRXWRXZRXXRX
1
1
1
1
11111
11111
11111
1111
'
'
'
'
ˆˆ
ˆ
ˆ
''''
''''
''''
''''
, em
que:
∂∂=∂=
=
=
=
=
2
1
2
1
2
1
2
1
2
1
ˆ
ˆˆ;
ˆ
ˆˆ;
ˆ
ˆˆ;
ˆ
ˆˆ;
c
cc
a
aa
b
bb
y
yy
=
=
=
=
⊗=⊗=⊗=⊗=
∂
∂
−−−−−−−−−
2
2
2
2
2
2
2
2
111111111
2
1
2
1
212
121
2
1
0
0;
0
0;;
0
0
;;;
σσ
σσ
σσσσ
σσ
Oc
cO
aa
aaO
e
eO
OOOO
BCGR
IBBICCAGGIRR
57Documentos, 47
Os componentes de variância estão associados aos parâmetros h2, c2,¶2 e r a, da seguinte maneira:
jiijijiiiiiiii aaaayiiiyicyieyia chch σσρσσσσσσρσσσ =−−∂==−== ∂ ;)(;;)1(; 2222222222222
Estimadores dos componentes de variância por REML
Nesta situação são recomendados os algoritmos AI (preferencialmenteeste) e DF. A função geral a ser maximizada é aquela descrita no item 2.
Seqüência de colunas de dados para análise no software DFREML
Experimento Indivíduo Pai Mãe Repetição Parcela Bloco Variável 1 . . . Variável n
São necessários dois arquivos, o de dados e um de pedigree formadopelas colunas Indivíduo Pai Mãe. Devem ser executados os subprogramasDFPREP e DXMUX.
4.4.4 Avaliação de progênies de meios irmãos, no delineamentoem látice, com várias plantas por parcela, várias mediçõespor indivíduo e um só caráter, avaliado em váriosexperimentos com algumas progênies ou tratamentoscomuns
Modelo linear misto (modelo aditivo multivariado, de repetibilidade, emlátice)
y = Xb + Za + Wc + Tp +H¶ + e que, para o caso bivariado eqüivale a:
+
∂∂
+
+
+
+
=
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
0
0
0
0
0
0
0
0
0
0
e
e
H
H
p
p
T
T
c
c
W
W
a
a
Z
Z
b
b
X
X
y
y
58 Documentos, 47
Estruturas de médias e variâncias
=
∂∂
=
∂∂ ∂
∂
2
2
2
2
2
2
2
2
2
2
2
1
2
1
2
1
2
1
2
122
11
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
212
121
000000000
000000000
000000000
000000000
000000000
000000000
000000000
000000000
00000000
00000000
;
0
0
0
0
0
0
0
0
0
0
e
e
p
p
c
c
aa
aa
I
I
I
I
I
I
I
I
AA
AA
e
e
p
p
c
c
a
a
Var
bX
bX
e
e
p
p
c
c
a
a
y
y
E
σσ
σσ
σσ
σσ
σσσσ
Equações de modelo misto
=
∂
++
++
−
−
−
−
−
−−−−−−
−−−−−−
−−−−−−
−−−−−−
−−−−−
yRH
yRT
yRW
yRZ
yRX
p
c
a
b
PHRHTRHWRHZRHXRH
HRTPTRTWRTZRTXRT
HRWTRWCWRWZRWXRW
HRZTRZWRZGZRZXRZ
HRXTRXWRXZRXXRX
1
1
1
1
1
111111
111111
111111
111111
11111
'
'
'
'
'
ˆˆ
ˆ
ˆ
ˆ
'''''
'''''
'''''
'''''
'''''
,
em que:
=
=
=
=
=
⊗=⊗=⊗=⊗=⊗=
∂
∂
−−−−−−−−−−−
2
2
2
2
2
2
2
2
2
2
11111111111
2
1
2
1
2
1
212
121
2
1
0
0;
0
0;
0
0;;
0
0
;;;;
σσ
σσ
σσ
σσσσ
σσ
Op
pO
c
cO
aa
aaO
e
eO
OOOOO
BPCGR
IBBIPPICCAGGIRR
Estimadores dos componentes de variância por REML
Neste caso, é recomendado o algoritmo AI. A função geral a sermaximizada é aquela descrita no item 2.
Software
Para esta situação recomenda-se o uso do software ASREML, o qualexige um arquivo de programa específico com extensão. as.
59Documentos, 47
4.5. Delineamento em látice, progênies de polinização aberta,várias populações
4.5.1 Avaliação de progênies de meios irmãos (polinização aberta)de várias populações (procedências), no delineamento emlátice, com várias plantas por parcela, uma medição porindivíduo e um só caráter
Para as situações descritas em (i) (a) e (ii) (a) do tópico 4.3.1, bastaadotar o modelo, estimadores e preditores descritos no tópico 4.4.1. Para assituações (i)(b) ou (ii) (b) incluindo a interação procedência x bloco (efeito c2),tem-se os modelos, estimadores e preditores descritos a seguir.
Modelo linear misto (modelo aditivo univariado, multi-populações, emlátice)
y = Xb + Za + Wc1 + H¶ + Qr + Uc2 + e, em que:
b = vetor de efeitos fixos (repetições, significando que os valores individuaisserão ajustados para a média da repetição);
¶ = vetor de efeitos aleatórios dos blocos dentro de repetições;
H = matriz de incidência para ¶.
Distribuições e estruturas de médias e variâncias
),0(~
),0(~
),0(~
),0(~
),0(~
),0(~,
),(~,
22
22
22
222
221
22
22
11
ee
rr
cc
cc
aa
INe
IN
INr
INc
INc
ANAa
VXbNVby
σσ
σσ
σσ
σσ
σσ
σσ
∂∂∂
As covariâncias entre todos os efeitos aleatórios do modelo são assumidascomo nulas.
60 Documentos, 47
Assim:
=
∂
=
∂ ∂
2
2
2
2
2
2
2
1
2
1
0
0
0
0
0
00000
0000
0000
0000
0000
0000
0
0
0
0
0
0
2
1
e
c
r
c
a
I
I
I
I
I
A
e
c
r
c
a
Vare
Xb
e
c
r
c
a
y
E
σσ
σσ
σσ
.''''')( 222222
21 ecrca IUUIQQIHHIWWIZZAyVar σσσσσσ +++++= ∂
Equações de modelo misto
=
∂
++
++
+ −
yU
yQ
yH
yW
yZ
yX
c
r
c
a
b
IUUQUHUWUZUXU
UQIQQHQWQZQXQ
UHQHIHHWHZHXH
UWQWHWIWWZWXW
UZQZHZWZAZZXZ
UXQXHXWXZXXX
'
'
'
'
'
'
ˆ
ˆ
ˆˆ
ˆ
ˆ
''''''
''''''
''''''
''''''
''''''
''''''
2
1
5
4
3
2
11
λλ
λλ
λ
,
em que:
.1
;1
;1
;1
;1
22
222
221
2
2
2
5
2
222
221
2
2
2
4
2
222
221
2
2
2
3
21
222
221
2
2
2
2
2
222
221
2
2
2
1
2
1
c
crch
r
crch
crch
c
crch
h
crch
c
e
r
e
e
c
e
a
e
∂−−−−−==
∂−−−−−==
∂∂−−−−−==
∂−−−−−==
∂−−−−−==
∂
σσλ
σσλ
σσλ
σσλ
σσλ
61Documentos, 47
222222
22
21 ecrca
ahσσσσσσ
σ+++++
=∂
;
222222
221
21
1
ecrca
ccσσσσσσ
σ+++++
=∂
;
222222
22
21 ecrca
rrσσσσσσ
σ+++++
=∂
;
222222
222
21
2
ecrca
ccσσσσσσ
σ+++++
=∂
;
222222
22
21 ecrca σσσσσσσ
+++++=∂
∂
∂
Estimadores iterativos dos componentes de variância por REML viaalgoritmo EM
)](/[]''ˆ''ˆ''ˆ''ˆ''ˆ''ˆ'[ˆ 212 xrNyUcyQryHyWcyZayXbyye −−−∂−−−−=σ
qCAtraAa ea /)](ˆˆ'ˆ[ˆ 221212 −− += σσ
1332
112 /]ˆˆ'ˆ[ˆ1
sCtrcc ec σσ += ;
ησσ /]ˆˆ'ˆ[ˆ 4422 Ctre+∂∂=∂
tCtrrr er /]ˆˆ'ˆ[ˆ 5522 σσ += ;
2662
222 /]ˆˆ'ˆ[ˆ2
sCtrcc ec σσ += .
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Indivíduo Pai Mãe Repetição Parcela1 Bloco Procedência Parcela2 Variável 1 . . . Variável n
É necessário apenas um arquivo, o qual funciona ao mesmo tempo como
62 Documentos, 47
arquivo de pedigree e de dados. Deve ser executado o subprograma DFPREP eem seguida o DFUNI.
O mérito genético total de cada indivíduo é dado pelo somatório do efeitogenético aditivo predito com o efeito da procedência a que pertence tal indivíduo.
4.5.2 Avaliação de progênies de meios irmãos (polinização aberta)de várias populações (procedências), no delineamento emlátice, com várias plantas por parcela, várias medições porindivíduo e um só caráter
Considerando-se as situações (i) (a), (i) (b), (ii) (a) e (ii) (b) descritas notópico 4.3.1, tem-se que:
- na situação (ii) (a), basta ajustar no vetor de efeitos fixos, os efeitos deprocedência e da combinação repetição-medição e adotar o modelo,estimadores e preditores apresentados no tópico 4.4.2.
- na situação (i) (a), basta ajustar no vetor de efeitos fixos, o efeito da combinaçãorepetição-procedência-medição (com bpm níveis, em que p, b e m são osnúmeros de procedências, repetições e medições, respectivamente). Nestecaso, as observações individuais na medição são ajustadas para a média daprocedência na repetição, em uma dada medição. O modelo, estimadores epreditores apresentados no tópico 4.4.2. devem ser empregados.
Para as situações (i)(b) e (ii) (b), excluindo (em caso de não significância)o efeito c2 em ambas, tem-se os modelos, estimadores e preditores descritos aseguir.
Modelo linear misto (modelo aditivo univariado, multi-populações, derepetibilidade, em látice)
y = Xb + Za + Wc1 + Tp + Qr + H¶ + e, em que:
b : vetor de efeitos fixos (no caso, combinações repetição-medição, significandoque os valores individuais na medição serão ajustados para a média darepetição na medição);
p : vetor de efeitos permanentes (ambiente permanente dentro de parcela +efeitos genéticos não aditivos);
T : matriz de incidência para p.
63Documentos, 47
Distribuições e estruturas de médias e variâncias
),0(~
),0(~
),0(~
),0(~
),0(~
),0(~,
),(~,
22
22
22
22
221
22
11
ee
pp
rr
cc
aa
INe
INp
INr
IN
INc
ANAa
VXbNVby
σσ
σσ
σσ
σσ
σσ
σσ
∂∂∂
As covariâncias entre todos os efeitos aleatórios do modelo são assumidascomo nulas.
Assim:
=
∂
=
∂ ∂2
2
2
2
2
2
11
0
0
0
0
0
00000
0000
0000
0000
0000
0000
0
0
0
0
0
01
e
r
p
c
a
I
I
I
I
I
A
e
r
p
c
a
Vare
Xb
e
r
p
c
a
y
E
σσ
σσ
σσ
.''''')( 222222
1 erpca IHHIQQITTIWWIZZAyVar σσσσσσ +++++= ∂
Equações de modelo misto
=
∂
++
++
+ −
yH
yQ
yT
yW
yZ
yX
r
p
c
a
b
IHHQHTHWHZHXH
HQIQQTQWQZQXQ
HTQTITTWTZTXT
HWQWTWIWWZWXW
HZQZTZWZAZZXZ
HXQXTXWXZXXX
'
'
'
'
'
'
ˆˆ
ˆ
ˆ
ˆ
ˆ
''''''
''''''
''''''
''''''
''''''
''''''
1
5
4
3
2
11
λλ
λλ
λ
, em que:
64 Documentos, 47
.1
;1
;1
;1
;1
2
22221
2
2
2
5
2
22221
2
2
2
4
2
22221
2
2
2
3
21
22221
2
2
2
2
2
22221
2
2
2
1
1
∂−∂−−−−
==
−∂−−−−==
−∂−−−−==
−∂−−−−==
−∂−−−−==
∂
prch
r
prch
p
prch
c
prch
h
prch
e
r
e
p
e
c
e
a
e
σσλ
σσλ
σσλ
σσλ
σσλ
222222
22
1 eprca
ahσσσσσσ
σ+++++
=∂
;
222222
221
1
1
eprca
ccσσσσσσ
σ+++++
=∂
;
222222
22
1 eprca
rrσσσσσσ
σ+++++
=∂
;
222222
22
1 eprca σσσσσσσ
+++++=∂
∂
∂;
222222
22
1 eprca
ppσσσσσσ
σ+++++
=∂
.
Neste modelo, a repetibilidade é dada por
222222
22222
1
1
eprca
prca
σσσσσσσσσσσ
ρ+++++
++++=
∂
∂.
65Documentos, 47
Estimadores iterativos dos componentes de variância por REML viaalgoritmo EM
)](/[]''ˆ''ˆ''ˆ''ˆ''ˆ''ˆ'[ˆ 12 xrNyHyQryTpyWcyZayXbyye −∂−−−−−−=σ
qCAtraAa ea /)](ˆˆ'ˆ[ˆ 221212 −− += σσ
1332
112 /]ˆˆ'ˆ[ˆ1
sCtrcc ec σσ += ;
qCtrpp ep /]ˆˆ'ˆ[ˆ 4422 σσ +=
tCtrrr er /]ˆˆ'ˆ[ˆ 5522 σσ += ;
ησσ /]ˆˆ'ˆ[ˆ 6622 Ctre+∂∂=∂ .
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Indivíduo Pai Mãe Repetição Parcela1 Permanente Procedência Bloco Variável 1. . . Variável n
É necessário apenas um arquivo, o qual funciona ao mesmo tempo comode pedigree e de dados. Deve ser executado o subprograma DFPREP e emseguida o DFUNI.
O mérito genético total de cada indivíduo é dado pelo somatório do efeitogenético aditivo predito com o efeito da procedência a que pertence tal indivíduo.
4.6 Avaliação apenas de populações
4.6.1 Avaliação de várias populações (procedências), nodelineamento em blocos ao acaso, com várias plantas porparcela, uma medição por indivíduo e um só caráter
Modelo linear misto (modelo aditivo univariado, multi-populações, semparentesco)
y = Xb + Za + Wc + Qr + e, em que:
66 Documentos, 47
y, b, a, c, r e e: vetores de dados, dos efeitos de blocos (fixos), de efeitosgenéticos aditivos dos indivíduos (aleatórios), de efeitos deparcela (aleatórios), de efeitos de procedências (aleatórios)e de erros aleatórios, respectivamente.
X, Z, W e Q: matrizes de incidência para b, a, c, r e e, respectivamente.
Distribuições e estruturas de médias e variâncias
0)',(;0)',(;0)',(
;0)',(;0)',(;0)',(
),0(~
),0(~
),0(~
),0(~,
),(~,
22
22
22
22
===
===
ecCoverCovcrCov
eaCovraCovcaCov
INe
INr
INc
NAa
VXbNVby
ee
rr
cc
aa
σσ
σσ
σσ
σσ
ou seja:
ℜℜ
ℜ
=
=
RR
Q
CCW
GGZ
RQWCZGV
e
r
c
a
y
Var
Xb
e
r
c
a
y
E
000
000'
000'
000'
;
0
0
0
0
, em que:
2
2
2
e
c
A
IC
IR
AG
σσσ
=
=
=
.''' 2222
2
epca
r
IQQIWWIZZAV
I
σσσσσ
+++=
=ℜ
67Documentos, 47
Equações de modelo misto
=
++
+ −
yQ
yW
yZ
yX
r
c
a
b
IQQWQZQXQ
QWIWWZWXW
QZWZAZZXZ
QXWXZXXX
'
'
'
'
ˆ
ˆ
ˆ
ˆ
''''
''''
''''
''''
3
2
11
λλ
λ, em que:
.1
;1
;1
2
2
2
222
32
2
2
222
22
2
2
222
1r
e
c
e
a
e
r
rch
c
rch
h
rch
σσλ
σσλ
σσλ =−−−==−−−==−−−=
2222
22
erca
ahσσσσ
σ+++
= : herdabilidade individual no sentido restrito no
bloco, em uma dada medição;
2222
22
erca
rrσσσσ
σ+++
= : coeficiente de determinação dos efeitos de
procedência;
2222
22
erca
ccσσσσ
σ+++
= : correlação devida ao ambiente comum de
parcela.
Estimadores dos componentes de variância por REML via algoritmo EM
)](/[]''ˆ''ˆ''ˆ''ˆ'[ˆ 2 xrNyQryWcyZayXbyye −−−−−=σ
qCAtraAa ea /)](ˆˆ'ˆ[ˆ 221212 −− += σσ
sCtrcc ec /]ˆ'ˆ[ˆ 3322 σσ +=
tCtrrr er /]ˆˆ'ˆ[ˆ 4422 σσ += , em que:
C22, C33 e C44 advém de:
68 Documentos, 47
=
=
−
−
44434241
34333231
24232221
141312111
44434241
34333231
24232221
14131211
1
CCCC
CCCC
CCCC
CCCC
CCCC
CCCC
CCCC
CCCC
C
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Indivíduo Pai Mãe Bloco Parcela Procedência Variável 1 . . . Variável n
É necessário apenas um arquivo, o qual funciona simultaneamente comoarquivo de dados e como arquivo de pedigree. Devem ser executadosseqüencialmente os subprogramas DFPREP e DFUNI. As colunas referentes aPai e Mãe devem ser preenchidas com zero, a herdabilidade deve ser conhecidaa priori e seu valor fixado no DFREML.
O mérito genético total dos indivíduos é dado pela soma .ˆ* râa +=
4.7. Avaliação simultânea de caracteres
4.7.1 Avaliação de progênies de meios irmãos, no delineamentoem blocos ao acaso, com várias plantas por parcela, umamedição por indivíduo e vários caracteres, em um só local
Considerando o caso bivariado, tem-se:
+
+
+
=
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
0
0
0
0
0
0
e
e
c
c
W
W
a
a
Z
Z
b
b
X
X
y
y
69Documentos, 47
Distribuições e estruturas de médias e variâncias
;
0
0
0
0
0
022
11
2
1
2
1
2
1
2
1
=
bX
bX
e
e
c
c
a
a
y
y
E
=
2
2
2
2
2
2
2
1
2
1
2
1
2
12
12
1
212
121
212
121
0
0
0
0
0000
0000
000
000
000
000
e
e
e
e
cc
cc
aa
aa
I
I
I
I
II
II
AA
AA
e
e
c
c
a
a
Var
σσ
σσ
σσσσ
σσσσ
22
222
2222
21
211
2111
222
111
'')(
'')(
eca
eca
IWIWZAZVyVar
IWIWZAZVyVar
σσσ
σσσ
++==
++==
em que:
22
21 aa e σσ : variâncias genéticas aditivas dos caracteres 1 e 2, respectivamente;
12aσ : covariância genética aditiva envolvendo os caracteres 1 e 2,
respectivamente;
1221
22 , ccc e σσσ : variâncias entre parcelas, para os caracteres 1 e 2 e
covariância entre os 2 caracteres ao nível do efeito deparcela, respectivamente;
1221
22 , eee e σσσ : variâncias residuais, para os caracteres 1 e 2 e covariância
entre os 2 caracteres ao nível do efeito residual,respectivamente.
70 Documentos, 47
Equações de modelo misto
=
++
−
−
−
−−−−
−−−−
−−−
yRW
yRZ
yRX
c
a
b
CWRWZRWXRW
WRZGZRZXRZ
WRXZRXXRX
1
1
1
1111
1111
111
'
'
'
ˆ
ˆ
ˆ
'''
'''
'''
, em que:
;ˆ
ˆˆ;
ˆ
ˆˆ;
2
1
2
1
2
1
=
=
=
c
cc
b
bb
y
yy
;;;
;;;
2
2
2
2
2
2
1111111
212
121
212
111
212
121
=
=
=
⊗=⊗=⊗= −−−−−−−
cc
ccO
aa
aaO
ee
eeO
OOO
CGR
ICCAGGIRR
σσσσ
σσσσ
σσσσ
Os componentes de variância estão associados aos parâmetros h2, c2 er a, da seguinte maneira:
jiijijiiiiii aaaayiieyicyia chch σσρσσσσσσσ =−−=== ;)1(;; 2222222222, em
que:
ji
ij
ij
aa
a
aσσ
σρ = = correlação genética aditiva entre os caracteres i e j;
Estimadores dos componentes de variância por REML
Nesta situação são recomendados os algoritmos AI (preferencialmenteeste) e DF. A função geral a ser maximizada é aquela descrita no item 2.
Seqüência de colunas de dados para análise no software DFREML
Experimento Indivíduo Pai Mãe Bloco Parcela Variável 1 . . . Variável n
São necessários dois arquivos, o de dados e um de pedigree, formadopelas colunas Indivíduo Pai Mãe. Devem ser executados os subprogramasDFPREP e DXMUX.
A estimação e predição simultânea de caracteres utiliza os mesmosmodelos apresentados nos itens 4.1.3, 4.1.4, 4.2.3, 4.2.4, 4.3.3, 4.3.4, 4.4.3
71Documentos, 47
e 4.4.4, diferindo apenas nas estruturas de variâncias, as quais devem assumiras covariâncias entre caracteres referentes aos efeitos de parcela e residuais,como diferentes de zero.
Outras situações podem ocorrer, como a avaliação simultânea de várioscaracteres, em vários locais. Neste caso, as estruturas de variâncias devemassumir as covariâncias referentes aos efeitos de parcela como zero, nascombinações envolvendo caracteres em diferentes locais e, como diferentesde zero nas combinações envolvendo os vários caracteres em um só local. Omesmo comentário aplica-se ao efeito residual.
5. Predição de Valores Genéticos e Genotípicos Interpopulacionais(Interespecíficos)
5.1. Híbridos envolvendo duas espécies ou populações
Neste caso, o valor genotípico de um híbrido é dado por:
)12()12()12()12( daG ++= µ
)12()12(2112)12(21 )(2
1)(
2
1maah ++++++= δµµ , em que:
)12(µ : média geral da população híbrida;
)12(a : efeito genético aditivo de um indivíduo híbrido;
)12(d : efeito de dominância de um indivíduo híbrido;
21 µµ e : média geral das populações 1 e 2, respectivamente;
)12(h : heterose no cruzamento entre as populações 1 e 2;
2112 aea : efeitos genéticos aditivos dos genitores das populações 1 e 2,respectivamente, em cruzamento com a população recíproca;
)12(δ : efeito de dominância associado à família de irmãos germanos (capacidadeespecífica de combinação entre os genitores das populações 1 e 2);
)12(m : efeito da segregação mendeliana, contemplando uma fração aditiva eoutra dominante.
72 Documentos, 47
Verificam-se assim, as igualdades:
)12(21)12( )(2
1h++= µµµ
)12()12(2112)12()12( )(2
1maada +++=+ δ
A partir deste modelo geral, quatro situações práticas podem serconsideradas:
(i) Predição do comportamento da progênie híbrida com base eminformações prévias de m1, m2, a12, a21 e h(12)
Neste caso, )ˆˆ(2
1ˆ)ˆˆ(2
1ˆ2112)12(21)12( aahG ++++= µµ , ou seja, tendo-se
informações sobre as médias das populações, da heterose entre as mesmas edos efeitos genéticos aditivos interpopulacionais dos genitores a serem cruzados,pode-se predizer a descendência híbrida. Se a correlação entre os efeitosgenéticos aditivos interpopulacionais (a12 e a21) e intrapopulacionais (a11 e a22)for alta, os últimos podem ser utilizados em lugar dos primeiros.
(ii) Seleção e recombinação de genitores em programas de seleçãorecorrente recíproca ou seleção recorrente intrapopulacional nas duaspopulações
Neste caso, a seleção dos genitores a serem recombinados deve basear-se no valor genético aditivo interpopulacional dado por:
12)12(12)12(21)12( ˆˆˆˆ)ˆˆ(2
1ˆ aaha +=+++=∗ µµµ na população 1 e
21)12(21)12(21)21( ˆˆˆˆ)ˆˆ(2
1ˆ aaha +=+++=∗ µµµ na população 2.
No caso de alta correlação genética entre os efeitos aditivos
interpopulacionais e intrapopulacionais, os últimos )ˆˆ( 2211 aea podem ser usados
em lugar da )ˆ( 2112 âea e programas de seleção recorrente intrapopulacionalpodem ser adotados, com eficiência.
(iii) Capitalização da capacidade específica de combinação via plantioscomerciais por sementes
Neste caso, torna-se necessária a avaliação de progênies de irmãosgermanos interpopulacionais (híbridos) obtidos sob cruzamentos dialélicos,
73Documentos, 47
fatoriais ou hierárquicos e o valor genotípico predito da descendência no plantiocomercial é dado por
)12(2112)12(
)12(2112)12(21)12(
ˆ)ˆˆ(2
1ˆ
ˆ)ˆˆ(2
1ˆ)ˆˆ(2
1ˆ
δµ
δµµ
+++=
+++++=
aa
aahG
(iv) Seleção de híbridos superiores para a clonagem
Neste caso, torna-se necessária a avalição de progênies de irmãosgermanos interpopulacionais, obtidos sob cruzamentos fatoriais, dialélicos ouhierárquicos ou a realização de testes clonais com indivíduos híbridos. Nestasituação, os valores genotípicos totais dos indivíduos são dados por
)12()12()12()12(ˆˆˆˆ daG ++= µ .
Em geral, dois esquemas de avaliação de progênies são utilizados:
(a) Apenas avaliação de progênies interpopulacionais
Nesta situação, dois modelos de análise podem ser adotados:
(a.1.) Avaliação integral de a(12) e d(12) a partir de cruzamentos dialélicos,fatoriais ou hierárquicos
Neste caso, tem-se o seguinte modelo linear misto (modelo univariadoaditivo-dominante).
y = Xb + Za(12) + Zd(12) + Wc + e, em que:
y, b, a(12), d(12), c, e: vetores de dados, de efeitos de blocos (fixos), de efeitosgenéticos aditivos (aleatórios), de efeitos de dominância(aleatórios), de efeitos de parcela (aleatórios) e de errosaleatórios, respectivamente.
X, Z e W: matrizes de incidência para b, a(d) e c, respectivamente.
Estrutura de médias de variâncias
=
=
2
2
2
2
)12(
)12(
)12(
)12(
000
000
000
000
0
0
0
0)12(
)12(
e
c
d
a
I
I
D
A
e
c
d
a
Vare
Xb
e
c
d
a
y
E
σσ
σσ
74 Documentos, 47
2222 ''')()12()12( eeda IWIWZDZZAZyVar σσσσ +++= , em que:
2
)12(aσ : variância genética aditiva interpopulacional;
2
)12(dσ : variância de dominância interpopulacional;
2cσ : variância entre parcelas;
2eσ : variância ambiental dentro de parcelas;
A e D: matrizes de correlação genética aditiva e de dominância entre os indivíduosem avaliação, respectivamente.
Equações de modelo misto
=
++
+−
−
yW
yZ
yZ
yX
c
d
a
b
IWWZWZWXW
WZDZZZZXZ
WZZZAZZXZ
WXZXZXXX
'
'
'
'
ˆ
ˆˆ
ˆ
''''
''''
''''
''''
)12(
)12(
3
21
11
λλ
λ, em que:
.1
;1
;1
2
22
2
2
32)12(
2
22
2
2
22)12(
22
2
2
1)12(
)12(
)12(
)12(
)12(
)12(c
ch
hh
ch
h
ch a
c
e
a
a
d
ea
a
e−−
==−
−−==
−−==
σσλ
σσλ
σσλ
22)12( )12(aheh : herdabilidades individuais interpopulacionais no sentido restrito e
amplo, respectivamente.c2 : correlação intraclasse devida ao ambiente comum da parcela.
Estimadores iterativos de máxima verossimilhança restrita (REML) peloalgoritmo EM
)](/[]''ˆ''ˆ''ˆ''ˆ'[ˆ )12()12(2 xrNyWcyZdyZayXbyye −−−−−=σ
qCAtraAa ea /)](ˆˆ'ˆ[ˆ 2212)12(
1)12(
2)12(
−− += σσ
qCDtrdDd ed /](ˆˆ'ˆ[ˆ 3312)12(
1)12(
2)12(
−− += σσ
sCtrcc ec /]ˆ'ˆ[ˆ 4422 σσ +=
75Documentos, 47
Seqüência de colunas no arquivo de dados para análise pelo softwareDFREML
Indivíduo Pai Mãe Bloco Parcela Variável 1 . . . Variável n
Este arquivo funciona ao mesmo tempo como arquivo de pedigree e dedados. Devem ser executados seqüencialmente os subprogramas DFPREP eDFUNI.
Exemplo:
Considere a avaliação dos seguintes indivíduos híbridos de Eucalyptusurophylla x E. grandis, para o caráter altura de plantas aos quatro anos deidade.
Indivíduo Bloco Pai Mãe Altura(E. grandis) (E. urophylla) (metros)
7 1 1 2 25,38 2 1 2 22,79 1 3 4 14,610 2 3 4 17,711 1 5 6 19,7
Como existe uma só planta por parcela o modelo passa a ser:
y = Xb + Za + Zd + e
As matrizes de incidência são:
=
01010
10101'X
=
10000000000
01000000000
00100000000
00010000000
00001000000
'Z
76 Documentos, 47
As matrizes de parentesco A e D são da forma:
100000000
01000000
01000000
00010000
00010000
0000100000
0000010000
000001000
000000100
000000010
000000001
11
211
211
211
211
1
1
11
11
11
11
rr
rrr
rrr
rrr
rrr
r
r
rr
rr
rr
rr
em que r2 = ½ em A e r2 = ¼ em D e r1 = ½ em A e r1 = 0 em D.
As equações de modelo misto sem os efeitos de parcela eqüivalem a:
=
++
−
−
yZ
yZ
yX
d
a
b
DZZZZXZ
ZZAZZXZ
ZXZXXX
'
'
'
ˆˆ
ˆ
'''
'''
'''
12
12
21
11
λλ
Assumindo 125,300,1,75,2 222
)12()12(=== eda e σσσ , tem-se
.125,31364,1,55,0,4,0 2122
)12( )12(==== λλ ehh a Resolvendo-se as
equações de modelo misto, tem-se:
77Documentos, 47
Efeitos Soluções
Blocos
1b 19,8667
2b 20,1803
Efeitos genéticos aditivosâ
11,2865
â2
1,2865â
3-1,2532
â4
-1,2532â
5-0,0333
â6
-0,0333â
72,3113
â8
1,5482â
9-2,2446
â10
-1,5149â
11-0,0667
Efeitos de dominância
1d 0
2d 0
3d 0
4d 0
5d 0
6d 0
7d 0,7929
8d 0,3767
9d -0,7687
10d -0,3706
11d -0,0242
78 Documentos, 47
Verifica-se que somente os efeitos de dominância associados aosindivíduos com observações puderam ser preditos. Para os genitores, somenteos efeitos aditivos foram preditos.
De posse das predições, as quatro situações práticas podem serconsideradas:
(i) Predição do comportamento da progênie híbrida
A média do cruzamento entre os genitores 1 e 6 pode ser predita por:
metros
aa
aahG
6501,20
6266,00235,20
)0333,02865,1(2
1
2
1803,208667,19
)ˆˆ(2
1ˆ
)ˆˆ(2
1ˆ)ˆˆ(2
1ˆ
61)12(
61)12(2116
=
+=
−++=
++=
++++=
µ
µµ
(ii) Seleção de genitores para seleção recorrente recíproca
O valor genético aditivo dos dois melhores genitores de E. urophylla
eqüivalem a =+==+=+= ∗∗6)12(62)12(2 ˆ3100,212865,10235,20ˆˆˆ ââeaa µµ 20,02351
� 0,0333 = 19,9902. Assim, recombinando esses indivíduos na população deE. urophylla, a contribuição desta população para o ganho no híbrido é dada por[(21,3100 + 19,9902)/2]/(20,0235)-1, que eqüivale a 3,13%.
(iii) Exploração da capacidade específica de combinação através de plantiospor sementes
O valor genotípico predito da descendência do cruzamento entre os
genitores 1 e 2 é dado por .ˆ)ˆˆ(2
1ˆˆ
)12(21)12()12( δµ +++= aaG No caso, d(12) eqüivale
à média de 87ˆˆ ded , ou seja à média dos efeitos de dominância dos indivíduos
que compõem a família 1 x 2. Assim, tem-se:
79Documentos, 47
metros
ddaaG
5214,22
)3767,07929,0(2
1)2865,12865,1(
2
16501,20
)ˆˆ(2
1)ˆˆ(
2
1ˆˆ
8721)12()12(
=
++++=
++++= µ
(iv) Seleção de indivíduos híbridos superiores para a clonagem
O valor genotípico do melhor indivíduo para clonagem é dado por:
metros
daG
7543,23
7929,03113,26501,20
ˆˆˆˆ77)12(7
=
++=
++= µ
(a.2.) Avaliação de a(12) e d(12) a partir de cruzamentos dialélicos, fatoriaisou hierárquicos
A construção e inversão da matriz de parentesco de dominância é umalimitação dos programas computacionais disponíveis. Assim, uma forma decontornar este problema é o ajuste do efeito da capacidade específica decombinação ou efeito de dominância comum a uma família de irmãos germanos.Este ajuste não requer o uso da matriz de parentesco de dominância e fornece
de maneira mais fácil a predição de d(12) e a estimação de 2
)12(dσ Entretanto, não
fornece o valor genotípico de cada indivíduo híbrido.
Modelo linear misto (modelo univariado de capacidade específica decombinação)
y = Xb + Za(12) + Wc + Sd(12) + e, em que:
d(12) é o efeito aleatório de dominância associado à família de irmãosgermanos;
S é a matriz de incidência para d (12).
A variância de d(12) contempla (1/4) 2
)12(dσ . Assim, 2
)12(dσ = 4 2
)12(δσ .
80 Documentos, 47
Estrutura de médias de variâncias
=
=
2
2
2
2
)12(
)12(
)12(
)12(
000
0)4/1(00
000
000
0
0
0
0
)12(
)12(
e
d
c
a
I
I
I
A
e
c
a
Vare
Xb
e
c
a
y
E
σσ
σσ
δδ
2222
)12()12()4/1(''')( edca ISISWIWZAZyVar σσσσ +++= , em que:
Equações de modelo misto
=
++
+ −
yS
yW
yZ
yX
c
a
b
ISSWSZSXS
SWIWWZWXW
SZWZAZZXZ
SXWXZXXX
'
'
'
'
ˆˆ
ˆ
ˆ
''''
''''
''''
''''
)12(
)12(
3
2
11
δλλ
λ, em que:
.;;2
2
32
2
22
2
1
)12()12( δσσλ
σσλ
σσλ e
c
e
a
e ===
Estimadores iterativos REML pelo algoritmo EM
)](/[]''ˆ''ˆ''ˆ''ˆ'[ˆ )12()12(2 xrNySyWcyZayXbyye −−−−−= δσ
qCAtraAa ea /)](ˆˆ'ˆ[ˆ 2212)12(
1)12()12(
2 −− += σσ
sCtrcc ec /]ˆ'ˆ[ˆ 3322 σσ +=
fCtre /]ˆˆ'ˆ[ˆ 442)12()12(
2
)12(σδδσ δ += , em que f é o número de famílias de irmãos
germanos.
81Documentos, 47
Seqüência de colunas no arquivo de dados para análise pelo softwareDFREML
Indivíduo Pai Mãe Bloco Parcela Família Variável 1 . . . Variável n
Este arquivo funciona ao mesmo tempo como arquivo de pedigree e dedados. Devem ser executados seqüencialmente os subprogramas DFPREP eDFUNI.
(b) Avaliação simultânea de progênies interpopulacionais e intrapopulacionais
Muitas vezes são geradas, simultaneamente, progênies intrapopulacionaise interpopulacionais de cada matriz. Este esquema é vantajoso, pois permite,adicionalmente, a obtenção de informações sobre a correlação genética (r a)entre os efeitos aditivos intrapopulacionais e interpopulacionais e sobre amagnitude da média e variação intrapopulacionais associados a cada população.
Nesta situação, deve-se considerar um modelo multivariado tratando osmateriais genéticos intrapopulacionais e interpopulacionais como caracteresdistintos. Isto é justificável quando r a não eqüivale a 1.
Quando cruzamentos dialélicos, fatoriais ou hierárquicos são realizados,tem-se a modelagem descrita a seguir.
Modelo linear misto (modelo multivariado de capacidade específica decombinação)
y = Xb + Za + Wc + Sd + e
+
+
+
+
=
22
12
11
22
12
11
22
22
11
22
12
11
22
12
11
22
12
11
22
12
11
22
12
11
22
12
11
22
12
11
00
00
00
00
00
00
00
00
00
00
00
00
e
e
e
S
S
S
c
c
c
W
W
W
a
a
a
Z
Z
Z
b
b
b
X
X
X
y
y
y
δδδ
y11, y12, y22 : vetores de dados correspondentes às progênies intrapopulacionaisda população 1, interpopulacionais do cruzamento 1 x 2 eintrapopulacionais da população 2, respectivamente;
b11, b12, b22 : vetores de efeitos fixos (médias dos materiais genéticos nosblocos) associadas aos experimentos avaliando os três conjuntosde materiais genéticos, respectivamente. (De preferência, os trêstipos de materiais genéticos devem ser alocados em um mesmobloco);
a11, a12, a22 : vetores aleatórios referentes aos valores genéticos aditivos dosindivíduos na população 1, interpopulacão 1 x 2 e população 2,respectivamente;
82 Documentos, 47
c11, c12, c22: vetores aleatórios referentes aos efeitos de parcela associados àavaliação dos três materiais genéticos, respectivamente;
d11, d12, d22: vetores aleatórios das capacidades específicas de combinaçãointrapopulacional da população 1, interpopulacional eintrapopulacional da população 2, respectivamente;
e11, e12, e22: vetores de erros aleatórios associados à avaliação dos três materiaisgenéticos, respectivamente.
Estrutura de variâncias
=
2
211
222
212
211
2
2
2
2
2
2
2
22
12
11
22
12
11
22
12
11
22
12
11
22
12
22
12
11
2212221122
1222121112
1122111211
00000000000
00000000000
00000000000
00000000000
00000000000
00000000000
00000000000
00000000000
00000000000
000000000
000000000
000000000
e
e
e
c
c
c
aaa
aaa
aaa
I
I
I
I
I
I
I
I
I
AAA
AAA
AAA
e
e
e
c
c
c
a
a
a
Var
σσ
σσ
σσ
σσ
σσσσσσσσσσ
δδδ
δ
δ
δ
,
em que:
222
221211, aaa e σσσ : variâncias genéticas aditivas intrapopulacional 1,
interpopulacional 1 x 2 e intrapopulacional 2, respectivamente;
1112aσ : covariância genética aditiva entre os efeitos intrapopulacional 1 e
interpopulacionais 1 x 2;
1122aσ = 0 : covariância entre os efeitos aditivos intrapopulacionais 1 e 2;
1222aσ : covariância genética aditiva entre os efeitos interpopulacionais 1 x 2 e
os efeitos intrapopulacionais 2;
222
221211, δδδ σσσ e : variâncias dos efeitos da capacidade específica de combinação
intrapopulacional 1, interpopulacional 1 x 2 e intrapopulacional2, respectivamente.
83Documentos, 47
Sendo 01122
=aσ , pode-se optar também pelo ajuste de dois modelos
bivariados (um envolvendo y11 e y12 e outro envolvendo y12 e y22) ao invés domodelo trivariado.
A partir do modelo apresentado, pode-se obter informações sobre acorrelação entre os efeitos aditivos intrapopulacionais (capacidade geral decombinação) e efeitos aditivos interpopulacionais (capacidade geral de
hibridação) pelas relações )./()/(221212221222121111121112 aaaaaaaa e σσσρσσσρ ==
Equações de modelo misto
=
∆++
+
−
−
−
−
−−−−−
−−−−−
−−−−−
−−−−
yRS
yRW
yRZ
yRX
c
a
b
SRSWRSZRSXRS
SRWCWRWZRWXRW
WRZWRZGZRZXRZ
SRXWRXZRXXRX
1
1
1
1
11111
11111
11111
1111
'
'
'
'
ˆˆ
ˆ
ˆ
''''
''''
''''
''''
δ, em
que:
=∆
=
=
=
⊗∆=∆⊗=⊗=⊗= −−−−−−−−−
2
2
2
2
2
2
22
222
22
2
2
2
111111111
22
12
11
22
12
11
221222
1222121112
111211
22
12
11
00
00
00
;
00
00
00
;
0
0
;
00
00
00
;;;
δ
δ
δ
σσ
σ
σσ
σ
σσσσσ
σσ
σσ
σ
O
c
c
c
O
aa
aaa
aa
O
e
e
e
O
OOOO
CGR
IICCAGGIRR
Estimadores dos componentes de variância por REML
Nesta situação, devido à complexidade do modelo e ao elevado númerode componentes de variância a serem estimados, são recomendados osalgoritmos DF e AI (preferencialmente este). Neste caso, a função geral a sermaximizada é aquela descrita no item 2.
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
População Indivíduo Pai Mãe Bloco Parcela Família Variável 1 . . . Variável n
São necessários dois arquivos: um de dados conforme a estruturaapresentada e outro de pedigree contendo apenas as colunas Indivíduo PaiMãe. Devem ser executados, seqüencialmente, os subprogramas DFPREP eDXMUX.
84 Documentos, 47
5.2. Híbridos envolvendo três ou mais espécies
Híbridos envolvendo três ou mais espécies têm sido comuns nomelhoramento do Eucalyptus no Brasil (Assis, 2000). Nesta situação, sãoenvolvidos na análise vários tipos de híbridos. Por exemplo, um híbrido triploenvolvendo E. urophylla, E. dunnii e E. grandis envolve em sua genealogia oshíbridos E. urophylla x E. grandis, E. dunnii x E. grandis e E. urophylla x E. dunnii.Também cada indivíduo de uma espécie é envolvido em vários cruzamentosinterpopulacionais, de forma que uma avaliação completa deve envolver todaesta mistura de híbridos, procurando identificar os melhores.
Um modelo para esta situação deve contemplar os efeitos fixos daheterose associada a cada tipo de híbrido, por exemplo, efeito de heteroseenvolvendo as várias combinações de híbridos entre duas espécies e ascombinações envolvendo três espécies.
Modelo linear misto (modelo univariado de heterose fixa)
y = Xb + Th + Za + Wc + Sd + e, em que:
b : vetor de efeitos fixos (médias de blocos);
h : vetor de efeitos fixos da heterose associada a cada tipo de híbrido;
a : vetor de efeitos aditivos interpopulacionais aleatórios, expressos como desviosda média do tipo de híbrido em questão;
c : vetor dos efeitos aleatórios de parcela;
d : vetor aleatório dos efeitos da capacidade específica de combinação entreos dois genitores envolvidos no cruzamento, expressos como desvios damédia do tipo de híbrido em questão.
e : vetor de erros aleatórios;
X, T, Z, W e S : matrizes de incidência para b, h, a, c e d, respectivamente.
Neste caso, os valores genotípicos preditos de cada cruzamento visandoexplorar a capacidade específica de combinação é dado por
δSaZThXbg +++=ˆ , em que a refere-se à média dos efeitos aditivosinterpopulacionais dos genitores envolvidos no cruzamento. Indivíduos superioresdentro dos melhores cruzamentos devem ser submetidos a teste clonal.
As equações de modelo misto são similares àquelas descritas no tópico(a.2), bastando incluir o efeito fixo da heterose, fato que requer uma coluna amais no arquivo de dados, codificando os vários tipos de híbridos.
85Documentos, 47
6. Testes Clonais
6.1 Avaliação de clones não aparentados no delineamento emblocos ao acaso com várias plantas por parcela (válidotambém para linhagens não aparentadas de espéciesautógamas)
Modelo linear misto (modelo univariado de clones repetidos)
y = Xb + Zg + Wc + e, em que
y, b, g, c e e : vetores de dados, de efeitos fixos (blocos), de efeitos genotípicosde clones (aleatórios), de efeitos de parcela (aleatórios) e de errosaleatórios, respectivamente.
X, Z e W : matrizes de incidência para b, g e c, respectivamente.
Distribuições e estruturas de médias e variâncias
=
=
2
2
2
00
00
00
;
0
0
0
e
c
g
I
I
I
e
c
g
Var
Xb
e
c
g
y
E
σσ
σ
Equações de modelo misto
=
++
yW
yZ
yX
c
g
b
IWWZWXW
WZIZZXZ
WXZXXX
'
'
'
ˆ
ˆ
ˆ
'''
'''
'''
2
1
λλ , em que:
.1
;1
2
22
2
2
22
22
2
2
1 c
ch
h
ch a
c
e
a
a
g
e −−==−−==σσλ
σσλ
222
22
ecg
gah
σσσσ
++= : herdabilidade individual no sentido amplo no bloco;
2gσ : variância genotípica entre clones;.
86 Documentos, 47
2cσ : variância entre parcelas;2eσ : variância residual ou ambiental dentro de parcelas.
Estimadores iterativos de componentes de variância por REML viaalgoritmo EM
)](/[]''ˆ''ˆ''ˆ'[ˆ 2 xrNyWcyZgyXbyye −−−−=σ
qCtrgg eg /)]ˆˆ'ˆ[ˆ 2222 σσ +=
sCtrcc ec /]ˆ'ˆ[ˆ 3322 σσ +=
Estimação e predição pelo software DFREML
O modelo de estimação e predição apresentado é similar a um modelode genitor (�sire model�) e não a um modelo individual (�animal model�). Comoo software DFREML trabalha com um modelo individual, para análises de testesclonais, tal programa pode ser utilizado ajustando um modelo de repetibilidade.Neste caso, a variância de �ambiente permanente� contemplará a variâncianão aditiva total livre do componente de ambiente permanente (já que as medidasrepetidas em um mesmo clone são realizadas em diferentes rametes), e oefeito de �ambiente permanente� contemplará os efeitos não aditivos. Assim,para obtenção dos efeitos genotípicos totais (aditivo + não aditivo) de cadaclone basta somar os efeitos aditivos e de �ambiente permanente� ajustadospelo programa. Este procedimento é válido quando os clones não sãoaparentados. A forma do arquivo para este tipo de análise é apresentada aseguir:
Indivíduo Pai Mãe Bloco Permanente Parcela Vetor de Dados
Neste caso, o programa ajustará os efeitos aditivos, permanente dedominância (aleatório adicional), de parcela (aleatório adicional) e fixo de bloco.
No caso de testes clonais instalados no delineamento em látice, bastasubstituir o efeito fixo de bloco pelo efeito de repetições e incluir no modelo, oefeito aleatório de blocos dentro de repetições.
87Documentos, 47
6.2 Avaliação de clones aparentados no delineamento em blocosao acaso, com várias plantas por parcela
Modelo linear misto (modelo univariado aditivo-dominante)
y = Xb + Za + Zd + Wc + e, em que
d: vetor aleatório dos efeitos de dominância.
Distribuições e estruturas de médias e variâncias
=
=
22
22
22
22
2222
000
000'
000'
000'
;
0
0
0
0
ee
cc
dd
aa
ecda
II
IWI
DZD
AZA
IWIZDZAV
e
c
d
a
y
Var
Xb
e
c
d
a
y
E
σσσσ
σσσσ
σσσσ
, em que:
.''' 2222ecda IWWIZZDZZAV σσσσ +++=
Equações de modelo misto
=
++
+−
−
yW
yZ
yZ
yX
c
d
a
b
IWWZWZWXW
WZDZZZZXZ
WZZZAZZXZ
WXZXZXXX
'
'
'
'
ˆ
ˆˆ
ˆ
''''
''''
''''
''''
3
21
11
λλ
λ, em que:
.1
;1
;1
2
22
2
2
322
22
2
2
22
22
2
2
1 c
ch
hh
ch
h
ch a
c
e
a
a
d
ea
a
e −−==−
−−==−−==σσλ
σσλ
σσλ
22ad heσ : variância genética de dominância e herdabilidade no sentido amplo,
respectivamente;
D : matriz de correlação genética de dominância entre os indivíduos em avaliação.
O sistema apresentado prediz isoladamente os efeitos aditivos (â) e de
dominância ( d ). Os valores genotípicos totais, dados por dâg ˆˆ += , podem ser
preditos diretamente pelas equações de modelo misto:
88 Documentos, 47
=
++ −
yW
yZ
yX
c
g
b
IWWZWXW
WZGZZXZ
WXZXXX
e
'
'
'
ˆ
ˆ
ˆ
'''
'''
'''
3
21
λσ , em que:
22da DAG σσ +=
Estimadores iterativos dos componentes de variância por REML viaalgoritmo EM
)](/[]''ˆ''ˆ''ˆ''ˆ'[ˆ 2 xrNyWcyZdyZayXbyye −−−−−=σ
sCtrcc ec /]ˆˆ'ˆ[ˆ 4422 σσ += ;
qCAtraAa ea /)](ˆˆ'ˆ[ˆ 221212 −− += σσ ;
qCDtrâDd ed /](ˆ'ˆ[ˆ 331212 −− += σσ .
Seqüência de colunas no arquivo de dados para análise no softwareDFREML
Indivíduo Pai Mãe Bloco Parcela Variável 1 . . . Variável n
Para ajuste dos efeitos de dominância, os mesmos devem ser consideradoscomo �segundo efeito aleatório por indivíduo�. Neste caso, além dos arquivosde dados e de pedigree, deve ser fornecido um arquivo adicional com nomepadrão DF45#DAT, referente à inversa da matriz de parentesco de dominância.Este arquivo não formatado deve fornecer todos os elementos não zero dotriângulo inferior da matriz inversa e deve conter três colunas: um código inteiro(de 1 ao número de indivíduos na análise) referente ao número da coluna namatriz; um código inteiro referente ao número da linha (maior ou igual ao númeroda coluna) na matriz (de 1 ao número de indivíduos na análise); uma variávelverdadeira (real) fornecendo o elemento da inversa da matriz de parentesco dedominância.
89Documentos, 47
7. Modelos não Lineares para Variáveis Binomiais e Categóricas
Em teoria, variáveis categóricas e binomiais (tais como a presença ouausência de determinados atributos nos indivíduos) não são bem descritas pormodelos estatísticos lineares. Para estas variáveis, os modelos não linearespodem ser mais apropriados.
A técnica de modelos lineares generalizados (GLM), desenvolvida porNelder & Wederburn (1972), permite a generalização ou flexibilização dosmodelos lineares clássicos de variáveis contínuas, de forma que toda a estruturapara a estimação e predição em modelos lineares normais, pode ser estendidapara os modelos não lineares. Os modelos lineares clássicos são, em verdade,casos especiais de modelos lineares generalizados.
Neste caso, a variável observacional pode ser definida pelo modeloey += µ , em que m refere-se à esperança de y e e refere-se ao vetor de erros
aleatórios.
No caso especial em que y segue uma distribuição normal e g(m) é umaligação identidade, obtém-se o tradicional modelo linear misto eZaXby ++= ,
em que 2)(,)(,)( eIReCovGaCovXbyE σ==== e, consequentemente,
2'')( eIZGZRZGZyCov σ+=+= .
Para o caso em que y segue uma distribuição binomial, tem-se o caso daestimação e predição em modelos lineares generalizados com efeitos fixos ealeatórios, conforme Schall (1991).
A função de ligação logito, g(m), aplicada aos dados y é linearizada,conforme a expansão em série de Taylor de primeira ordem fornecendo y*, daseguinte forma:
)(')()()(* µµµ gygygy −+==
Assim tem-se:
)1(*
ii
iiii
yy
µµµη
−−+=
)1(1log
ii
ii
i
i y
µµµ
µµ
−−+
−
= .
De posse da variável observacional (ou dependente) ajustada y*, tem-seque o modelo linear misto eqüivale a )('* µegZaXby ++= , em que:
90 Documentos, 47
2121 '*)()]('[,)(,*)( ee WZGZyCoveWegCovGaCovXbyE σσµ −− +==== .
O modelo eZaXby ++=* tem a mesma estrutura de primeira e segunda
ordem que o modelo eZaXby ++= de forma que os algoritmos de estimaçãoe predição para o caso normal podem ser adaptados, apenas substituindo y por
y* e ReCov =)( por .)]('[ 21eWegCov σµ −=
Assim, tem-se a seguintes equações de modelo misto:
=
+ −
−
−−−
−−
*'
*'
ˆ
ˆ
''
''1
1
111
11
ySZ
ySX
a
b
GZSZXSZ
ZSXXSX
L
L, em que:
1−S = matriz com termos diagonais dados por ;1
)1(2
Leii σ
µµ −
2
Leσ = variância residual na escala contínua de tolerância (�liability�);
LL aeb = efeitos fixos e aleatórios na escala de tolerância.
No caso em que a refere-se a um vetor de valores genéticos aditivos,
tem-se que 2)(LaAGaCov σ== , em que A é a matriz de correlação genética
aditiva entre os indivíduos e 2
Laσ é a variância de La Neste caso, os estimadores
REML são dados por:
2
2221
12
2221
12
/)()(
)ˆˆ()'ˆˆ(ˆ;
/)(
ˆ'ˆˆ
L
L
L
L
L e
a
LLLLe
a
LLa
CAtrqxrN
aZbXySaZbXy
CAtrq
aAa σσ
σσ
σ−
−
−
−
+−−−−−−=
−=
Em resumo, o processo de estimação envolve:
(a) estimação de Nn /1=µ , em que 1n é o número de indivíduos querecebem o escore 1, dentre N indivíduos avaliados;
(b) obtenção de y*, a partir de y e m (neste passo, a variável passa dointervalo (0,1) para a reta real, ou seja, a função é linearizada);
(c) estimação de LL aeb ˆ , dados os valores atuais ou correntes de
22,LL ae e σσµ ;
91Documentos, 47
(d) obtenção de 22 ˆˆLL ae e σσ iterativamente e, após a convergência,
proceder à obtenção atualizada de LL aeb ˆˆ ;
(e) obtenção de LL aZbX ˆˆˆˆ +== θη ;
(f) obtenção de novo valor predito de m, usando a função de ligação, através
de θ
θ
µ ˆ
ˆ
1ˆ
e
eL +
= (neste passo, a variável volta ao intervalo (0,1));
(g) atualização de S-1 via 2111
1ˆ1
)ˆ1(ˆeL
Sσ
µµ −=− e de y* via
)ˆ1(ˆ
ˆˆ)ˆ1(ˆ
ˆ
ˆ1
ˆlog*
11
1
11
1
1
1
µµµθ
µµµ
µµ
−−+=
−−+
−
= yyy ;
(h) voltar ao passo (c), enquanto não se atingir a convergência.
É interessante notar que este algoritmo é essencialmente hierárquico,havendo, a cada iteração compreendendo os passos de (a) a (h), a necessidadede convergência no passo (d).
Software
Dentre os softwares mencionados neste artigo, o ASREML é o únicoadequado para a análise de variáveis binomiais. Para a versão �Windows�, oarquivo executável necessário é o ASRWIN.EXE. Para utilização do referidoaplicativo na análise de modelos mistos ao nível de plantas individuais, sãonecessários 3 arquivos: um arquivo de dados, um arquivo de pedigree (com osnúmeros de identificação dos genitores precedendo os números de identificaçãodos descendentes) e um arquivo de comandos (este contendo o modelo deanálise, o qual deve ser escrito pelo usuário). Os arquivos devem ser preparadosem formato ASCII, sendo que os arquivos de dados e de pedigree podem sersalvos usando o programa Notepad (ou bloco de notas, usando documentotexto, ou seja extensão .txt) ou mesmo o EXCEL usando a opção de salvarcomo �Texto (OS/2 ou MS-DOS), o que produz uma extensão .txt.
O arquivo de comandos deve conter a extensão .as e deve ser escritocom base em 5 seções: (i) linha de título; (ii) definição das colunas do arquivo
92 Documentos, 47
de dados; (iii) definição dos arquivos de pedigree e de dados; (iv) definição domodelo estatístico; (v) definição do modelo de variância (esta seção não énecessária em alguns casos). Este arquivo com extensão .as pode ser compostoe salvo facilmente dentro do próprio ASREML, através da modificação dearquivos pré-existentes. Os arquivos de resultados mais importantes doprograma são aqueles com extensão .sln (o qual apresenta a solução paratodos os efeitos do modelo com seus respectivos desvios padrões) e .asr (oqual sumariza os dados e a seqüencia das iterações, apresenta as estimativasdos componentes de variância, a análise de variância para os efeitos fixos esuas soluções).
Para a análise de variáveis binomiais, considere como exemplo umexperimento instalado no delineamento em blocos ao acaso, com 33 progêniesde meios irmãos (polinização aberta) e 6 blocos, em que foi avaliada a variávelsobrevivência (Sob). Tendo-se salvos os arquivos de dados e de pedigree comos nomes Dados.txt e Pedigree.txt, tem-se o seguinte arquivo com extensão.as :
Titulo Individuo !P Pai Mae 33 Bloco 6 SobPedigree.txt !SKIP 1 !MAKEDados.txt !SKIP 1 Sob !BIN !LOGIT ~ Bloco !r Individuo
Este arquivo de comando possui a seguinte interpretação:
(i) Linha 1 : Título qualquer;
(ii) Linhas 2 a 6 : Identificação de colunas no arquivo de dados, contendoos respectivos números de níveis;
(iii) Linhas 7 e 8 : Identificação dos arquivos de pedigree e de dados;
(iv) Linha 9 : Especificação do modelo de análise para a variável Sob;
Ainda no arquivo com extensão .as, tem-se que os comandos advêmapós o símbolo ! . Assim, tem-se:
93Documentos, 47
P: indica que o número de indivíduos deve ser lido no arquivo de pedigree;
SKIP: indica que deve ser ignorada a primeira linha dos arquivos, pois refere-se apenas às identificações;
MAKE: indica que deve ser feita a matriz de parentesco;
BIN: indica que a variável apresenta distribuição binomial;
LOGIT: indica que deverá ser usada a função de ligação logito;
r Individuo: indica que os efeitos de indivíduos são aleatórios;
~ Bloco: indica que os efeitos de blocos são fixos.
No caso, a seção (v) não foi necessária. Outra opção de análise refere-se à adoção de um modelo de genitor, sendo preditos (1/2) dos efeitos genéticosdos genitores e estimado (1/4) da variação genética aditiva. Neste caso, não énecessário o arquivo de pedigree e o arquivo .as apresenta como conteúdo:
Titulo Individuo 1188 Mae 33 Bloco 6 SobDados.txt !SKIP 1 Sob !BIN !LOGIT ~ Bloco !r Mae
O número 1188 refere-se ao número total de indivíduos, considerandoque havia 6 plantas por parcela.
A seguir será ilustrada a aplicação do software para a análise de umavariável contínua, como o peso de frutos em cacau. Considerando a situaçãodescrita no item 4.6 (cruzamentos dialélicos com medidas repetidas em cadaindivíduo), tem-se o seguinte arquivo .as, considerando cruzamentos envolvendo5 mães e 5 pais, experimentação em 4 blocos, 4 medições por indivíduo, 10famílias de irmãos germanos, 80 parcelas e 1200 indivíduos no total:
94 Documentos, 47
Título Individuo !P Pai 5 Mae 5 Bloco 4 Medicao 4 Familia 10 Permanente 1200 Parcela 80 PesoPedigree.txt !SKIP 1 !MAKE !REPEATDados.txt !SKIP 1 Peso ~ Bloco Medicao !r Individuo Familia Permanente Parcela
No caso, os efeitos de bloco e medição foram ajustados como fixos. Ocomando REPEAT indica que se trata de um caso de medidas repetidas.
Após compostos os arquivos de dados, de pedigree e de comandos, bastaexecutar este último e, então, abrir os arquivos de resultados.
As variáveis categóricas são, provavelmente, uma aproximação davariável real de interesse, sendo que, muitas vezes, as categorias surgem porquenão é possível medir a variável real de interesse. Tomar as variáveis categóricascomo normais é tanto mais apropriada quanto mais normais forem os escores.Assim, quanto maior o número de categorias, menor é a relevância datransformação das variáveis ou dos modelos para se adequarem as variáveis.
Considere a avaliação da variável número de frutos (denominada Frutos)de cacaueiros em dois locais, no delineamento em blocos ao acaso com 18progênies de meios irmãos e cinco blocos em cada local. Assumindo normalidade,tem-se que a composição do arquivo de comandos .as para a análise do modelobivariado, eqüivale a:
95Documentos, 47
Titulo Individuo !P Pai Mae 18 Bloco 10 Parcela 180 Frutos1 !M 0 Frutos2 !M 0Pedigree.txt !SKIP 1 !MAKEDados.txt !SKIP 1!ASUV Frutos1 Frutos2 ~ Trait Tr.Bloco !r Tr.Individuo Tr.Parcela !f mv 2 1 2 0 !s2=ve1 0 !s2=ve2
Tr.Individuo 2 Tr 0 US va1 va12 va2 Individuo
Tr.Parcela 2 Tr 0 US vc1 vc2 Parcela
!end
O comando !M0 deve ser incluído visando converter os valores zero doarquivo em valores inexistentes ou perdidos. No arquivo, os dados referentes acada local devem ser colocados em duas colunas distintas, prenchendo-se osdados inexistentes com zero (neste caso).
Por outro lado, o comando !ASUV é usado quando os dados sãoapresentados em uma forma multivariada mas a análise requerida refere-se aum único caráter. Com esta opção, se existem valores perdidos no arquivo dedados, deve-se incluir o comando !f mv no final da linha do modelo linear. Ocomando !ASUV deve ser colocado em uma linha logo após a linha dedenominação do arquivo de dados e antes da linha referente ao modelo linear.
As linhas após o modelo linear referem-se à definição do modelo (estrutura)de variância. No caso, ve1 e ve2 referem-se aos valores iniciais para as variânciasresiduais nos locais 1 e 2, respectivamente, e vc1 e vc2 referem-se aos valores
96 Documentos, 47
iniciais para as variâncias entre parcelas nos locais 1 e 2, respectivamente.Por outro lado, va1, va2 e va12, referem-se aos valores iniciais para as variânciasgenéticas aditivas nos locais 1 e 2 e covariância genética aditiva entre oslocais 1 e 2, respectivamente.
8. Ajuste de Covariável e Análise de Covariância
O ajuste de covariáveis é importante como forma de reduzir o erroexperimental, através da eliminação de certas diferenças ambientais aleatóriasentre parcelas dentro de blocos, como por exemplo, a sobrevivência diferenciadaentre parcelas, não devidas a causas genéticas. Nesta situação, o número deplantas na parcela deve ser ajustado como uma covariável. Outro exemplo, emque o ajuste de uma covariável pode ser necessário, refere-se à situação emque os indivíduos são avaliados em diferentes idades, para uma determinadacaracterística. Neste caso, a idade deve ser ajustada ao modelo, como umacovariável.
Considerando um modelo estatístico tradicional e incluindo como umacovariável x, o número de plantas na parcela, tem-se (Ramalho et al., 2000):
Yij = m + pi + rj + b )( xxij − + eij, em que:
Yij: observação da variável dependente de interesse, referente à progêniei no bloco j.;
m, pi, rj, ej: efeitos da média geral, da progênie i, do bloco j e do erro experimental,respectivamente;
xij: número de plantas na parcela ij (variável dependente), com média x ;b: coeficiente de regressão linear entre x e y;
Verifica-se que o componente b )( xxij − estaria inflacionando o erroexperimental, caso não fosse realizado o ajuste da covariável.
Dentre os requisitos para uso da análise de covariância ou ajuste de umacovariável, citam-se, conforme Steel e Torrie (1980) e Ramalho et al. (2000):
(i) As covariáveis x são efeitos fixos, medidos sem erros e independentesdos efeitos de tratamentos (progênies). Isto implica que não pode haverdiferenças significativas entre progênies para a covariável x;
(ii) A regressão de x em y, após a remoção das diferenças entre blocos etratamentos, é linear e independente dos tratamentos e blocos. Istosignifica que o efeito de x é no sentido de aumentar ou diminuir y por
uma constante (b) multiplicada por )( xxij − ;(iii) O erro experimental possui distribuição normal com média zero e
variância 2eIσ .
97Documentos, 47
Dessa forma, o ajuste do número de plantas por parcela como covariávelna metodologia de modelos mistos somente é recomendável quando asobrevivência no experimento não apresentar controle genético, ou seja, quandoa mesma ocorrer de forma aleatória. Para verificar esta suposição, recomenda-se a análise de variância e a verificação da significância da fonte de variaçãoprogênies. A significância desta fonte de variação indica que existem diferençasgenéticas entre progênies para o caráter e, portanto, o ajuste do número deplantas como covariável não é recomendado. Neste caso, é melhor realizar apredição de valores genéticos para a sobrevivência e posteriormente utilizá-latambém na seleção, conforme Resende (1999).
No contexto dos modelos mistos, a verificação do controle genético dasobrevivência pode ser realizada utilizando-se os próprios valores estimados daherdabilidade e de seu desvio padrão. Embora a não significância das diferençasde sobrevivência entre progênies, signifique que tal variável não está afetandoa comparação das mesmas para o outro caráter de interesse (variáveldependente), o ajuste da covariável pode ser relevante por permitir um melhorajuste dos dados de plantas individuais e, por conseguinte, aumentar a acuráciada predição dos valores genéticos individuais. Logicamente, o efeito benéfico étanto maior quanto maior for a variação na covariável e maior for a associaçãoentre x e y.
Na metodologia de modelos mistos, o ajuste de covariáveis é realizadopreviamente à estimação e predição. Assim, os modelos, estimadores epreditores apresentados independem do ajuste ou não de covariáveis e sãoválidos em geral. Para análise pelo software DFREML, basta acrescentar, noarquivo de dados, antes da primeira coluna de dados (primeiro caráter), umacoluna referente à covariável. No caso da sobrevivência, esta colunacontemplaria o número de plantas na parcela.
Finalmente, é importante ressaltar que o ajuste da covariável não étotalmente suficiente para considerar o efeito da competição diferenciada devidaàs falhas. Isto, porque o estande da parcela não considera as posições dasfalhas.
9. Espécies com Sistema Reprodutivo Misto
Os modelos, estimadores e preditores apresentados nos itens 4.1.1,4.1.2, 4.1.3, 4.1.4, 4.3.1, 4.3.2, 4.3.3, 4.3.4, 4.4.1, 4.4.2, 4.4.3, 4.4.4,4.51 e 4.5.2 são adequados também para populações com sistema reprodutivomisto. Neste caso, as herdabilidades estimadas devem ser corrigidas levando-se em consideração a taxa de autofecundação e os coeficientes de parentescocorrigidos apresentados por Resende et al. (1995). Posteriormente, asherdabilidades (ou variâncias e covariâncias genéticas) corrigidas devem ser
98 Documentos, 47
fixadas nos programas computacionais, visando à predição dos valoresgenéticos.
10. Referências Bibliográficas
ASSIS, T.F. Production and use of Eucalyptus hybrids for industrial purposes.In: DUNGEY, H.S.; DIETERS, M.J.; NIKLES, D.G., ed. Hybrid breeding andgenetics of forest trees: QFRI/CRC-SPF Symposium Noosa, Queensland,Australia, 9-14 April 2000. Brisbane: Department of Primary Industries,2000. p.63-74.
BOLDMAN, K.G.; KRIESE, L.A.; VLECK, L.D. van.; KACHMAN, S.D. A manualfor use of MTDFREML: a set of programs to obtain estimates of variancesand covariances. Washington: ARS / USDA, 1995. 120p.
BUENO FILHO, J.S.S. Seleção combinada versus seleção sequencial nomelhoramento de populações florestais. Piracicaba: ESALQ/USP, 1992,96p. Tese Mestrado.
BUENO FILHO, J.S.S. Uso de modelos mistos no melhoramento de populaçõesflorestais. Piracicaba: ESALQ/USP, 1997, 160p. Tese Doutorado.
COSTA, R.B.; RESENDE, M.D.V. de; ARAÚJO, A J.; GONÇALVES, P. S. BLUPindividual e índice multi-efeitos aplicados ao melhoramento da seringueira.In: SIMPÓSIO SOBRE RECURSOS GENÉTICOS PARA A AMÉRICALATINA E CARIBE, 2., 1999, Brasília. Brasília, Anais. Brasília: EmbrapaRecursos Genéticos e Biotecnologia, 1999. 1 CD ROM.
CRUZ, C.D. Programa Genes: aplicativo computacional em Genética eEstatística. Viçosa: Universidade Federal de Viçosa, 1997. 422p.
CRUZ, C.D.; REGAZZI, O.J. Modelos biométricos aplicados ao melhoramentogenético. Viçosa: Universidade Federal de Viçosa, 1994. 390p.
CULLIS, B.R.; GOGEL, B.; VERBYLA, A.P.; THOMPSON, R. Spacial analysisof multi-environment early generation variety trials. Biometrics, v.54, p.1-18, 1998.
DEMPSTER, A.P.; LAIRD, N.M.; RUBIN, D.B. Maximum likelihood fromincomplete data via the EM algorithm. Journal of the Royal Statistic Society,London, v.39, p.1-38, 1977.
FARIAS NETO, J.T.; RESENDE, M.D.V. de. Predição de valores genéticos eestimação de componentes de variância em pupunheira (Bactris gasipaes)pela metodologia BLUP/REML com ênfase na produtividade de palmito.Genetics and Molecular Biology , v.23, n.3, Suppl., p.533, 2000.
99Documentos, 47
GILMOUR, A.R.; CULLIS, B.R.; WELHAM, S.J. THOMPSON, R. ASREMLreference manual. Orange: NSW Agriculture, 2000. 218p.
GILMOUR, A.R.; THOMPSON, R.; CULLIS, B.R. Average information REML:An efficient algorithm for parameter estimation in linear mixed models.Biometrics, v.51, p.1440-1450, 1995.
GRASER, H.U.; SMITH, S.P.; TIER, B. A derivative free approach for estimatingvariance components in animal models by restricted maximum likelihood.Journal of Animal Science, Champaign, v.64, n.5, p.1362-1370, 1987.
HARVILLE, D.A.; CARRIQUIRY, A.L. Classical and Bayesian prediction asapplied to unbalanced mixed linear models. Biometrics, v.48, p.987-1003,1992.
HENDERSON, C.R. Aplications of linear models in animal breeding. Guelph:University of Guelph, 1984. 462p.
HENDERSON, C.R.; QUAAS, R.L. Multiple trait evaluation usingrelatives�records. Journal of Animal Science, v.43, p.1188-1197, 1976.
JOHNSON, D.L.; THOMPSON, R. Restricted maximum likelihood estimationof variance components for univariate animal models using sparse matrixtechniques and average information. Journal of Dairy Science, v.78, p.449-456, 1995.
KALIL, A N.; RESENDE, M.D.V.; KALIL, G.P.C. Componentes de variância epredição de valores genéticos em seringueira pela metodologia de modelosmistos (REML/BLUP). Pesquisa Agropecuária Brasileira, v.35, n.9, p.1883-1887, 2000.
MEYER, K. DFREML � a set of programs to estimate variance componentsunder an individual animal model. Journal of Dairy Science, v.2, Suppl,p.33-34, 1988.
MEYER, K. DFREML: version 3.0b user notes. Edinburgh: Institute of AnimalGenetics of Edinburgh / Armidale: University of New England, AnimalGenetics and Breeding Unit, 1998. 31p.
MEYER, K. Estimating variances and covariances for multivariate animal modelsby restricted maximum likelihood. Genetique, Selection, Evolution, Paris,v.23, p.67-83, 1991.
MEYER, K. Restricted maximum likelihood to estimate variance componentsfor animal models with several random effects using a derivative-freealgorithm. Genetics, Selection, Evolution, v.21, p.317-340, 1989.
NELDER, J.A.; WEDDERBURN, R.W.M. Generalized linear models. Journal ofthe Royal Statistic Society, Series A, v.135, p.370-384, 1972.
100 Documentos, 47
PAIVA, J.R.; RESENDE, M.D.V. de; CORDEIRO, E.R. Índice multi-efeitos (BLUP)e estimativas de parâmetros genéticos aplicados ao melhoramento daacerola. Pesquisa Agropecuária Brasileira, 2000. no prelo.
PATTERSON, H.D.; THOMPSON, R. Recovery of inter-block information whenblock sizes are unequal. Biometrika, v.58, p.545-554, 1971.
PIRES, I.E.; CRUZ, C.D.; BORGES, R.C.G.; REGAZZI. A.J. Índice de seleçãocombinada aplicada ao melhoramento de Eucalyptus spp. Revista Árvore,v.20, n.2, p.191-198, 1996.
RAMALHO, M.A.P.; SANTOS, J.B.; ZIMMERMANN, M.J.O. Genéticaquantitativa no melhoramento de plantas autógamas. Goiânia: UniversidadeFederal de Goiás, 1993.
RAMALHO, M.A P.; FERREIRA, D. F.; OLIVEIRA, A C. Experimentação emgenética e melhoramento de plantas. Lavras: UFLA, 2000. 303p.
RESENDE, M.D.V. de. Genética biométrica no melhoramento de fruteiras. In:ENCONTRO DE GENÉTICA DO NORDESTE, 15., 2000. Anais on line...Fortaleza, 2000. Fortaleza: Sociedade Brasileira de Genética, Regional doCeará, 2000. 11p. Site a ser disponibilizado.
RESENDE, M.D.V. de. Predição de valores genéticos, componentes de variância,delineamentos de cruzamento e estrutura de populações no melhoramentoflorestal. Curitiba: Universidade Federal do Paraná, 1999. 434p. TeseDoutorado.
RESENDE, M.D.V. de; DIAS, L.A.S. Aplicação da metodologia de modelos mistos(REML/BLUP) na estimação de parâmetros genéticos e predição de valoresgenéticos aditivos e genotípicos em espécies frutíferas. Revista Brasileirade Fruticultura, v.22, n.1, p.44-52, 2000.
RESENDE, M.D.V. de; STURION, J.A.; CARVALHO, A P. de ; SIMEÃO, R.M.;FERNANDES, J.S.C. Programa de melhoramento da erva-mate coordenadopela Embrapa- Resultados da avaliação genética de populações, progênies,indivíduos e clones. Colombo: Embrapa Florestas, 2000a. 45p. (EmbrapaFlorestas. Circular Técnica, 43). no prelo.
RESENDE, M.D.V. de; FURLANI JÚNIOR, E.; MORAES, M.L.T.; FAZUOLI, L.C.Estimação de parâmetros genéticos e predição de valores genotípicos nomelhoramento do cafeeiro pelo procedimento REML/BLUP. Bragantia,2000b. no prelo.
RESENDE, M.D.V. de; FERNANDES, J.S.C. Procedimento BLUP individual paradelineamentos experimentais aplicados ao melhoramento florestal. Revistade Matemática e Estatística. São Paulo, v.17. p.89-107, 1999.
101Documentos, 47
RESENDE, M.D.V. de; FERNANDES, J.S.C.; SIMEÃO, R.M. BLUP individualmultivariado em presença de interação genótipo x ambiente paradelineamentos experimentais repetidos em vários ambientes. Revista deMatemática e Estatística, São Paulo, v.17. p.209-228, 1999.
RESENDE, M.D.V. de; MORA, A.L.; HIGA, A.R.; PALUDZYSZYN FILHO, E.Efeito do tamanho amostral na estimativa da herdabilidade em espéciesperenes. Floresta, v.28, n.1/2, 1998.
RESENDE, M.D.V.; PRATES, D.F.; JESUS, A.; YAMADA, C.K. Estimação decomponentes de variância e predição de valores genéticos pelo método damáxima verossimilhança restrita (REML) e melhor predição linear nãoviciada (BLUP) em Pinus. Boletim de Pesquisa Florestal, Colombo, v.32/33, p.18-45, 1996.
RESENDE, M.D.V. de.; VENCOVSKY, R.; FERNANDES, J.S.C. Selection andgenetic gains in populations of Eucalyptus with a mixed mating system.In: IUFRO CONFERENCE, 1995, Hobart. Proceedings ... Hobart: IUFRO,1995. p.191-193.
RESENDE, M.D.V. de; HIGA, A.R. Estimação de valores genéticos nomelhoramento de Eucalyptus: seleção em um caráter com base eminformações do indivíduo e seus parentes. Boletim de Pesquisa Florestal,Colombo, n.28/29, p.11-36, 1994b.
RESENDE, M.D.V. de; HIGA, A.R. Maximização da eficiência da seleção emtestes de progênies de Eucalyptus através da utilização de todos os efeitosdo modelo matemático. Boletim de Pesquisa Florestal, Colombo, n.28/29,p.37-55, 1994a.
RESENDE, M.D.V. de; HIGA, A.R.; LAVORANTI, O.J. Predição de valoresgenéticos no melhoramento de Eucalyptus � Melhor Predição Linear. In:CONGRESSO FLORESTAL BRASILEIRO, 7., 1993, Curitiba. Anais. SãoPaulo: Sociedade Brasileira de Silvicultura, 1993. v.1, p.144-147.
SCHALL, R. Estimation in generalized linear models with random effects.Biometrika, London, v.78, p.719-727, 1991.
SEARLE, S.R.; CASELLA, G.; McCULLOCH, C.E. Variance components. NewYork. J. Wiley, 1992. 528p.
STEEL, R.G.D.; TORRIE, J.H. Principles and procedures of statistics. 2.ed.New York: Mc Graw-Hill, 1980. 633p.
VENCOVSKY, R. Herança quantitativa. In: PATERNIANI, E.; VIEGA, G.P., eds.Melhoramento e Produção do Milho. Campinas: Fundação Cargill, 1987.p.137-214.
VENCOVSKY, R.; BARRIGA, P. Genética biométrica no fitomelhoramento.Ribeirão Preto: Sociedade Brasileira de Genética, 1992. 486p.