análise estatística de modelos mistos via reml/blup na

1Documentos, 47

ANÁLISE ESTATÍSTICA DE MODELOS MISTOSVIA REML/BLUP NA EXPERIMENTAÇÃO EMMELHORAMENTO DE PLANTAS PERENES

Colombo2000

DOCUMENTOS, 47 ISSN 1517-536X

Marcos Deon Vilela de Resende

2 Documentos, 47

Embrapa Florestas. Documentos 47. ISSN 1517-536-X

Exemplares desta publicação podem ser solicitados à:Embrapa FlorestasEstrada da Ribeira km 111 - Caixa Postal 31983411-000 - Colombo, PR BrasilFone: (0**41) 666-1313Fax: (0**41) 666-1276E-mail: [email protected]

Tiragem: 300 exemplares

Comitê de Publicações:Américo Pereira de Carvalho, Antônio Carlos de S. Medeiros, Edilson Batista deOliveira, Erich Gomes Schaitza, Guiomar Moreira de Souza Braguinia (SecretariaExecutiva), Honorino Roque Rodigheri, Jarbas Yukio Shimizu, José Alfredo Sturion,Moacir José Sales Medrado (Presidente), Patrícia Póvoa de Mattos, Rivail SalvadorLourenço, Sérgio Ahrens, Susete do Rocio C. Penteado.Revisão gramatical: Elly Claire Jansson LopesNormalização: Lidia Woronkoff

Produção:ÁREA DE COMUNICAÇÕES E NEGÓCIOS

Supervisor: Miguel Haliski

LAYOUT DA CAPA:Cleide da S.N.F. de Oliveira

DIAGRAMAÇÃOMarta de Fátima Vencato

IMPRESSÃOGráfica Radial - Fone: 333-9593

Dezembro/2000

©Embrapa, 2000

RESENDE, M.D.V. de. Análise estatística de modelos mistosvia REML/BLUP na experimentação em melhoramento deplantas perenes. Colombo: Embrapa Florestas, 2000.101p. (Embrapa Florestas. Documentos, 47).

ISSN 1517-536X

1. Estatística. 2. Modelos mistos. 3. Planta perene. I. Título.II. Série.

CDD 519.5

3Documentos, 47

Sumário

1 INTRODUÇÃO ................................................................................ 7

2 MODELOS LINEARES MISTOS, BLUP E REML............................................ 8

3 PROGRAMAS COMPUTACIONAIS ............................................................12

4 PREDIÇÃO DE VALORES GENÉTICOS INTRAPOPULACIONAIS (INTRAESPECÍFICOS) ............144.1 DELINEAMENTO EM BLOCOS AO ACASO, PROGÊNIES DE POLINIZAÇÃO ABERTA, UMA

SÓ POPULAÇÃO..............................................................................144.1.1 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM

BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR

INDIVÍDUO, UM SÓ CARÁTER E UMA SÓ POPULAÇÃO ..................................144.1.2 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM

BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES POR

INDIVÍDUO, UM SÓ CARÁTER E UMA SÓ POPULAÇÃO ..................................174.1.3 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM


INDIVÍDUO E UM SÓ CARÁTER, AVALIADO EM VÁRIOS LOCAIS (EXPERIMENTOS) COM

ALGUMAS PROGÊNIES OU TRATAMENTOS COMUNS ....................................204.1.4 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM

BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES POR

INDIVÍDUO E UM SÓ CARÁTER, AVALIADO EM VÁRIOS EXPERIMENTOS COM ALGUMAS

PROGÊNIES OU TRATAMENTOS COMUNS ...............................................254.2 DELINEAMENTO EM BLOCOS AO ACASO, PROGÊNIES DE POLINIZAÇÃO CONTROLADA,UMA SÓ POPULAÇÃO ........................................................................27

4.2.1 AVALIAÇÃO DE PROGÊNIES DE IRMÃOS GERMANOS OBTIDAS SOB

CRUZAMENTOS DIALÉLICOS, FATORIAIS OU HIERÁRQUICOS, NO DELINEAMENTO EM


INDIVÍDUO, UM SÓ CARÁTER E UMA SÓ POPULAÇÃO ..................................274.2.2 AVALIAÇÃO DE PROGÊNIES DE IRMÃOS GERMANOS OBTIDAS SOB


BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES

POR INDIVÍDUO, UM SÓ CARÁTER E UMA SÓ POPULAÇÃO ...........................304.2.3 AVALIAÇÃO DE PROGÊNIES DE IRMÃOS GERMANOS OBTIDAS SOB



INDIVÍDUO E UM SÓ CARÁTER AVALIADO EM VÁRIOS EXPERIMENTOS, COM

TRATAMENTOS COMUNS ...............................................................32

4 Documentos, 47

4.2.4 AVALIAÇÃO DE PROGÊNIES DE IRMÃOS GERMANOS OBTIDAS SOB


BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES

POR INDIVÍDUO, UM SÓ CARÁTER, UMA SÓ POPULAÇÃO, AVALIADA EM VÁRIOS

EXPERIMENTOS COM PROGÊNIES OU TRATAMENTOS COMUNS ....................... 344.3 DELINEAMENTO EM BLOCOS AO ACASO, PROGÊNIES DE POLINIZAÇÃO ABERTA,VÁRIAS POPULAÇÕES ........................................................................35

4.3.1 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS (POLINIZAÇÃO ABERTA) DE

VÁRIAS POPULAÇÕES (PROCEDÊNCIAS), NO DELINEAMENTO EM BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR INDIVÍDUO E UM SÓ

CARÁTER ............................................................................... 354.3.2 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS (POLINIZAÇÃO ABERTA) DE

VÁRIAS POPULAÇÕES (PROCEDÊNCIAS), NO DELINEAMENTO EM BLOCOS AO ACASO,COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES POR INDIVÍDUO E UM SÓ

CARÁTER ............................................................................... 394.3.3 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS (POLINIZAÇÃO ABERTA) DE

VÁRIAS POPULAÇÕES (PROCEDÊNCIAS), NO DELINEAMENTO EM BLOCOS AO ACASO,COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR INDIVÍDUO E UM SÓ

CARÁTER, AVALIADO EM VÁRIOS EXPERIMENTOS COM ALGUMAS PROGÊNIES OU

TRATAMENTOS COMUNS ............................................................... 434.3.4 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS (POLINIZAÇÃO ABERTA) DE

VÁRIAS POPULAÇÕES (PROCEDÊNCIAS), NO DELINEAMENTO EM BLOCOS AO ACASO,COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES POR INDIVÍDUO E UM SÓ

CARÁTER, AVALIADO EM VÁRIOS EXPERIMENTOS COM ALGUMAS PROGÊNIES OU

TRATAMENTOS COMUNS ............................................................... 464.4 DELINEAMENTO EM LÁTICE, PROGÊNIES DE POLINIZAÇÃO ABERTA, UMA POPULAÇÃO 50

4.4.1 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM

LÁTICE, COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR INDIVÍDUO, UM SÓ

CARÁTER E UMA SÓ POPULAÇÃO ..................................................... 504.4.2 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM

LÁTICE, COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES POR INDIVÍDUO, UM

SÓ CARÁTER E UMA SÓ POPULAÇÃO ..................................................524.4.3 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM

LÁTICE, COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR INDIVÍDUO E UM

SÓ CARÁTER, AVALIADO EM VÁRIOS EXPERIMENTOS COM ALGUMAS PROGÊNIES OU

TRATAMENTOS COMUNS ............................................................... 554.4.4 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM

LÁTICE, COM VÁRIAS PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES POR INDIVÍDUO EUM SÓ CARÁTER, AVALIADO EM VÁRIOS EXPERIMENTOS COM ALGUMAS

PROGÊNIES OU TRATAMENTOS COMUNS ............................................. 57

5Documentos, 47

4.5 DELINEAMENTO EM LÁTICE, PROGÊNIES DE POLINIZAÇÃO ABERTA, VÁRIAS

POPULAÇÕES ................................................................................594.5.1 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS (POLINIZAÇÃO ABERTA) DE

VÁRIAS POPULAÇÕES (PROCEDÊNCIAS), NO DELINEAMENTO EM LÁTICE, COM VÁRIAS

PLANTAS POR PARCELA, UMA MEDIÇÃO POR INDIVÍDUO E UM SÓ CARÁTER ........... 594.5.2 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS (POLINIZAÇÃO ABERTA) DE

VÁRIAS POPULAÇÕES (PROCEDÊNCIAS), NO DELINEAMENTO EM LÁTICE, COM VÁRIAS

PLANTAS POR PARCELA, VÁRIAS MEDIÇÕES POR INDIVÍDUO E UM SÓ CARÁTER ....... 624.6 AVALIAÇÃO APENAS DE POPULAÇÕES ................................................. 65

4.6.1 AVALIAÇÃO DE VÁRIAS POPULAÇÕES (PROCEDÊNCIAS), NO DELINEAMENTO

EM BLOCOS AO ACASO, COM VÁRIAS PLANTAS POR PARCELA, UMA MEDIÇÃO POR

INDIVÍDUO E UM SÓ CARÁTER ..........................................................654.7 AVALIAÇÃO SIMULTÂNEA DE CARACTERES ........................................... 68

4.7.1 AVALIAÇÃO DE PROGÊNIES DE MEIOS IRMÃOS, NO DELINEAMENTO EM


INDIVÍDUO E VÁRIOS CARACTERES, EM UM SÓ LOCAL ............................... 68

5 PREDIÇÃO DE VALORES GENÉTICOS E GENOTÍPICOS INTERPOPULACIONAIS

(INTERESPECÍFICOS) ..........................................................................715.1 HÍBRIDOS ENVOLVENDO DUAS ESPÉCIES OU POPULAÇÕES ............................. 715.2 HÍBRIDOS ENVOLVENDO TRÊS OU MAIS ESPÉCIES ......................................84

6 TESTES CLONAIS ............................................................................. 856.1 AVALIAÇÃO DE CLONES NÃO APARENTADOS NO DELINEAMENTO EM BLOCOS AO

ACASO COM VÁRIAS PLANTAS POR PARCELA (VÁLIDO TAMBÉM PARA LINHAGENS NÃO

APARENTADAS DE ESPÉCIES AUTÓGAMAS) ................................................. 856.2 AVALIAÇÃO DE CLONES APARENTADOS NO DELINEAMENTO EM BLOCOS AO ACASO,COM VÁRIAS PLANTAS POR PARCELA ....................................................... 87

7 MODELOS NÃO LINEARES PARA VARIÁVEIS BINOMIAIS E CATEGÓRICAS....................89

8 AJUSTE DE COVARIÁVEL E ANÁLISE DE COVARIÂNCIA ......................................96

9 ESPÉCIES COM SISTEMA REPRODUTIVO MISTO ..............................................97

10 REFERÊNCIAS BIBLIOGRÁFICAS ..............................................................98

6 Documentos, 47

7Documentos, 47

ANÁLISE ESTATÍSTICA DE MODELOS MISTOS VIAREML/BLUP NA EXPERIMENTAÇÃO EM MELHORAMENTO

DE PLANTAS PERENES

Marcos Deon Vilela de Resende

1. Introdução

No melhoramento de plantas perenes, as técnicas de avaliação genéticadesempenham papel fundamental, pois permitem a predição dos valoresgenéticos aditivos e genotípicos dos candidatos a seleção, propiciando umaseleção mais acurada. Tais técnicas são relevantes tanto para o melhoramentointrapopulacional quanto interpopulacional visando à utilização de híbridosheteróticos.

As técnicas ótimas de avaliação genética envolvem, simultaneamente,a predição de valores genéticos e a estimação de componentes de variância.De maneira genérica, o procedimento ótimo de predição de valores genéticos éo BLUP (melhor predição linear não viciada) ao nível individual (Henderson &Quaas, 1976). Para o caso balanceado, os preditores BLUP ao nível individualeqüivalem aos índices de seleção multi-efeitos (Resende & Higa, 1994a), osquais envolvem todos os efeitos aleatórios do modelo estatístico associado àsobservações fenotípicas. A predição usando BLUP ou os índices multi-efeitosassume que os componentes de variância são conhecidos. Entretanto, na práticasão necessárias estimativas fidedignas dos componentes de variância(parâmetros genéticos) de forma a se obter o que se denomina BLUP empírico(Harville & Carriquiry, 1992). Atualmente, o procedimento padrão de estimaçãode componentes de variância é o da máxima verossimilhança restrita (REML),desenvolvido por Patterson & Thompson (1971).

A estimação de parâmetros genéticos associados à seleção no contextodo melhoramento de plantas anuais é bem descrito em várias obras publicadasno Brasil (Vencovsky, 1987; Vencovsky & Barriga, 1992; Ramalho et al. ,1993; Cruz & Regazzi, 1994; Cruz, 1997; Ramalho et al., 2000). Por outrolado, a estimação e predição no contexto do melhoramento de plantas perenesdemanda o uso da metodologia de modelos mistos (REML/BLUP) ao nívelindividual, a qual vem sendo aplicada ao melhoramento de espécies florestaiscomo o eucalipto, o pinus, a acácia-negra e a seringueira (Resende et al., 1993;1996; Bueno Filho, 1997; Resende & Fernandes, 1999; Resende et al., 1998;Costa et al., 1999; Kalil et al., 2000), de espécies produtoras de alimentosestimulantes (contendo alcalóides como a cafeína e a teobromina) tais quais aerva-mate, o cacau e o café (Resende et al., 2000a; Resende & Dias, 2000;

8 Documentos, 47

Resende et al., 2000b), de fruteiras como a acerola (Paiva et al., 2000, Resende,2000) e de palmáceas como a pupunha (Farias Neto & Resende, 2000), masnecessita ser difundida e disseminada. As técnicas de estimação baseadas nométodo de quadrados mínimos tais como a análise de variância não são as maisrecomendadas para aplicação ao melhoramento de plantas perenes.

Este artigo tem como objetivo descrever, em termos práticos, os modelosmistos e suas estruturas de médias e variâncias, estimadores e preditoresassociados aos principais delineamentos experimentais e de cruzamentosempregados no melhoramento de plantas perenes. São contemplados osdelineamentos experimentais de blocos ao acaso e látice, delineamentos decruzamento em polinização aberta e controlada, medidas simples e repetidas,modelos univariados e multivariados, avaliação de progênies intrapopulacionaise híbridas, avaliação de clones, uma e várias populações, avaliação emexperimentos simples e repetidos através dos locais (contemplando a interaçãogenótipo x ambiente), avaliação simultânea de caracteres. Todas estas situaçõessão sobrepostas gerando em torno de 30 modelos diferentes. São consideradasvariáveis contínuas (modelos lineares) e variáveis discretas (modelos não linearesassociados à técnica de modelos lineares generalizados). São também abordadoscom detalhes, aspectos referentes ao uso dos softwares ASREML (Gilmour etal., 2000) e DFREML (Meyer, 1998).

Todos os aspectos considerados neste trabalho são essenciais na práticado melhoramento de plantas perenes. Adicionalmente, são fundamentais aostrabalhos acadêmicos e técnico-científicos, referindo-se ao conteúdo dametodologia dos trabalhos científicos que forem desenvolvidos através do usoda abordagem de modelos lineares e não lineares mistos.

Acredita-se que este trabalho sirva de referência ao melhoramento deplantas perenes no Brasil tais quais: (i) espécies florestais: eucalipto, pinus,acácia-negra, grevílea, seringueira, leucena, etc; (ii) espécies produtoras dealimentos estimulantes: erva-mate, cacau, café, guaraná, chá-da-índia, etc;(iii) fruteiras: caju, acerola, cupuaçu, maçã, graviola, etc; (iv) palmáceas: coco,dendê, açaí, pupunha, juçara, tamareira, palmeira real, etc.

2. Modelos lineares mistos, BLUP e REML

Um modelo linear misto geral é da forma (Henderson, 1984):

eZaXby ++= (1),

9Documentos, 47

com as seguintes distribuições e estruturas de médias e variâncias:

RZGZVyVarRNe

XbyEGNa

+==

=

')(),0(~

)(),0(~

em que:

y: vetor de observações;

b: vetor paramétrico dos efeitos fixos, com matriz de incidência X;

a: vetor paramétrico dos efeitos aleatórios, com matriz de incidência Z;

e: vetor de erros aleatórios;

G: matriz de variância � covariância dos efeitos aleatórios;

R: matriz de variância � covariância dos erros aleatórios;

0: vetor nulo.

Assumindo como conhecidos G e R, a simultânea estimação dos efeitosfixos e predição dos efeitos aleatórios pode ser obtida pelas equações de modelomisto dadas por:

=

+ −

−

−−−

−−

yRZ

yRX

a

b

GZRZXRZ

ZRXXRZ1

1

111

11

'

'

ˆ

ˆ

''

''

A solução deste sistema para b e a conduz a resultados idênticos aosobtidos por:

yVXXVXb 11 ')'(ˆ −−−= : estimador de quadrados mínimos generalizados (GLS)ou melhor estimador linear não viciado (BLUE) de b;

)ˆ()ˆ('ˆ 11 bXyCVbXyVGZa −=−= −− : melhor preditor linear não viciado (BLUP)de a; em que C = GZ� = matriz de covariância entrea e y.

Quando G e R não são conhecidas, os componentes de variância a elesassociados podem ser estimados eficientemente empregando-se o procedimentoREML (Patterson & Thompson, 1971; Searle et al., 1992). Exceto por umaconstante, a função de verossimilhança restrita a ser maximizada, é dada por:

10 Documentos, 47

)/'logloglog(log2

1

)/'loglog(log2

1

22

221

ee

ee

PyyvGRC

PyyvHXXHL

σσ

σσ

++++−=

+++−= −

em que:

11111 ')'(;' −−−−− −=+= HXXHXXHHPZGZRH ;

v = N-r(x) = graus de liberdade, em que N é o número total de dados e r(x) éo posto da matriz X;

C = matriz dos coeficientes das equações de modelo misto.

A função (L) de verossimilhança restrita expressa em termos do logaritmo,pode ser maximizada (visando obter as estimativas REML dos componentes devariância) empregando-se diferentes algoritmos tais quais: (i) �Expectation �Maximization� (EM) de Dempster et al. (1977); (ii) �Derivative Free� (DF) deGraser et al. (1987); (iii) �Average Information� (AI) de Gilmour et al. (1995).Estes algoritmos geraram as denominações EM-REML, DF-REML e AI-REML.Dentre estes, o algoritmo EM é o mais acurado, mas também o mais lento. Oalgoritmo DF é rápido e acurado quando o número de componentes de variâncianão é muito grande. Para modelos complexos, o algoritmo AI é mais rápido eacurado do que o DF (Johnson & Thompson, 1995).

Sendo geral, o modelo (1) contempla vários modelos inerentes àsdiferentes situações, tais quais:

(a) Modelo univariado, ajustando apenas o vetor de efeitos aditivos (a)

a : vetor de efeitos genéticos aditivos;

22; ea IRAG σσ == , em que:

2aσ : variância genética aditiva;

A : matriz de correlação genética aditiva entre os indivíduos em avaliação;

2eσ : variância residual.

11Documentos, 47

(b) Modelo univariado com medidas repetidas, ajustando os efeitos aditivos(a*) e de ambiente permanente (p) (Modelo de Repetibilidade)

:,

;)(;)(

2*

1

222*

queemepZaZXb

IRIpVarAaVareZaXby epa

+++=

===++= σσσ

2pσ = variância dos efeitos permanentes.

(c) Modelo multivariado, ajustando os efeitos aditivos

No caso bivariado tem-se:

:,0

0;

;;

;;0

0

2

2

2

2

2

2

2

1

2

1

2

1

221

121

221

121 queemRouRG

RIRGAG

a

aa

Z

ZZ

e

eO

ee

eeO

aa

aaO

OO

=

=

=

⊗=⊗=

=

=

σσ

σσσσ

σσσσ

12aσ = covariância genética aditiva entre os caracteres 1 e 2;

12eσ = covariância ambiental entre os caracteres 1 e 2.

(d) Modelo geoestatístico para análise espacial

R = S : matriz não diagonal que considera a correlação entre resíduos,por exemplo, linhas auto-regressivas e colunas auto-regressivas, para contemplara autocorrelação espacial entre as observações.

Os modelos geoestatísticos permitem estudar a variabilidade espacialdo solo nas áreas experimentais, através do uso de procedimentos que permitemum melhor critério de estratificação ambiental (para seleção massal ou paramelhor definição dos efeitos fixos no procedimento BLUP). Neste contexto, aanálise espacial é realizada simultaneamente (Cullis et al., 1998) à prediçãoBLUP. Conhecimentos e modelos de séries temporais são muito úteis nestaárea de pesquisa. Também, muitas técnicas empregadas na área de geologiatais quais a construção de semivariogramas e a realização de krigagens sãoempregados na análise espacial.

12 Documentos, 47

De maneira genérica, as variância dos erros de estimação e predição

dos efeitos fixos e aleatórios são dadas por

−−

aa

bbVar

ˆ

ˆ= C-1 , para um

modelo incluindo os efeitos fixos (b) e aleatórios (a), em que C-1 é a inversa damatriz dos coeficientes das equações de modelo misto.

A partir da variância do erro de predição (PEV) dos valores genéticos a

acurácia é dada por [ ] 2/12ˆ /1 aiaa PEVr

iσ−= .

3. Programas computacionais

A implementação computacional da metodologia de modelos mistosbaseia-se fortemente em métodos numéricos, notadamente em álgebra linearnumérica visando a obtenção da solução iterativa das equações de modelomisto (obtenção do BLUP) e no cálculo numérico para a maximização/minimização de funções de várias variáveis visando a obtenção das estimativasREML.

Os algoritmos para obtenção de estimativas REML podem ser agrupadosde acordo com a ordem das derivadas usadas. Assim, tem-se (i) não derivativo(DF-REML), baseado em procura direta; (ii) baseado em derivadas parciais deprimeira ordem (EM-REML); (iii) basedo em derivadas parciais de primeira esegunda ordens (AI-REML). O algoritmo AI é um procedimento derivativomelhorado, o qual fundamenta-se no uso dos métodos de Newton, que usam asderivadas primeira e segunda da função de verossimilhança. Tal algoritmofundamenta-se na utilização da informação advinda da média das derivadassegundas observadas e esperadas da função de verossimilhança, de forma queo termo que contém os traços dos produtos da matriz inversa é cancelado,restando uma expressão mais simples para computação. Técnicas de matrizesesparsas são empregadas no cálculo dos elementos da inversa da matriz doscoeficientes, os quais são necessários para as derivadas primeiras da funçãode verossimilhança. Este algoritmo é também denominado Quasi-Newton(Gilmour et al., 1995), o qual aproxima a matriz Hessiano (matriz de derivadassegundas) pela média das informações observadas e esperadas. A informaçãoobservada é uma medida da curvatura da função (ou do seu log) deverossimilhança e a informação esperada é a própria informação de Fisher.

Os algoritmos DF ganharam popularidade devido as suas flexibilidadesquanto aos modelos (Meyer, 1989; 1991) e vários softwares foramdesenvolvidos, tais quais o DFREML (Meyer, 1988; 1998) e o MTDFREML(Boldman et al., 1995). Entretanto, as dificuldades de convergência em modelosmais complexos geraram um novo interesse em métodos baseados em primeira

13Documentos, 47

e segunda derivadas da função de verossimilhança. Assim, o algoritmo AI foiincorporado ao DFREML (Meyer, 1998) e desenvolveu-se o software ASREML(Gilmour et al., 2000). Quando o número de parâmetros a serem estimados épequeno, os algoritmos DF são vantajosos computacionalmente. Por outro lado,quando o número de parâmetros é grande os algoritmos EM são mais eficientesque o DF. Nesta mesma situação, o algoritmo AI supera o DF e o EM.

Os três softwares mencionados (ASREML, DFREML e MTDFREML) sãoos mais utilizados no melhoramento de plantas no Brasil e permitem a análisede arquivos com número de dados superior a 100.000. Por incorporarem oalgoritmo AI e também a técnica de regressão aleatória, os softwares DFREMLe ASREML têm sido os mais utilizados e eficientes. O software ASREMLcontempla, adicionalmente, a técnica de análise espacial associada ao BLUP epermite também a análise de modelos não lineares para variáveis binomiais,empregando a técnica de modelos lineares generalizados. Este software permite,praticamente, a análise de qualquer modelo, mesmo os mais complexos, edificilmente será superado.

Neste artigo, são apresentados aspectos da utilização do softwareDFREML (Meyer, 1998). Os programas do DFREML (Versão 3.0b) foramescritos em Fortran 90 (as linguagens de programação mais recomendadaspara o desenvolvimento de softwares na área de componentes de variânciasão Fortran 90 e C++) e possuem duas versões específicas: Unix e PC (DOS).Quatro programas constituem o DFREML: DFPREP que se destina àrecodificação dos efeitos fixos e aleatórios na ordem de processamento e àconstrução da matriz de parentesco; DFUNI destinado a análises univariadaspermitindo o ajuste de vários efeitos aleatórios não correlacionados, adicionaisaos efeitos aditivos; DXMUX destinado a análise multivariada, mas permitindotambém o ajuste de diferentes modelos para os caracteres individuais, os quaispodem diferir tanto nos efeitos fixos quanto aleatórios. Este programa permiteo ajuste de, no máximo, dois efeitos aleatórios adicionais não correlacionados;DXMRR: destinado a análise de medidas repetidas (dados longitudinais),estimando funções de covariância e regressões aleatórias.

Os arquivos de dados ou de pedigree devem possuir a extensão .PRN ou.DAT ou .TXT. O arquivo de resultados mais importantes do DFREML é oDF66#DAT, o qual apresenta as estimativas dos componentes de variância eseus desvios padrões, o Log L e as soluções para os efeitos fixos e aleatórios(valores genéticos preditos).

Nos tópicos seguintes são apresentadas as formas (seqüências de colunasnos arquivos de dados) dos arquivos para vários modelos empregados nomelhoramento de plantas perenes.

14 Documentos, 47

4. Predição de valores genéticos intrapopulacionais(intraespecíficos)

Os valores genéticos aditivos intrapopulacionais preditos são úteis tantopara o melhoramento intrapopulacional (intraespecífico) quanto para omelhoramento interpopulacional (interespecífico). Para o melhoramentointrapopulacional, norteia a seleção visando ao melhoramento progressivo daespécie. Para o melhoramento interpopulacional, permite a escolha criteriosados indivíduos a serem empregados nos cruzamentos, bem como conduz aopróprio melhoramento do híbrido, em função dos melhoramentos realizadosnas espécies puras. A seguir, são apresentados alguns modelos de avaliaçãogenética (estimação de componentes de variância e predição de valoresgenéticos) em espécies perenes. São apresentadas, também, as formas deorganização das colunas de dados visando à utilização do software DFREML(Meyer, 1998).

4.1 Delineamento em blocos ao acaso, progênies de polinizaçãoaberta, uma só população

4.1.1 Avaliação de progênies de meios irmãos, no delineamentoem blocos ao acaso, com várias plantas por parcela, umamedição por indivíduo, um só caráter e uma só população

Modelo linear misto (modelo aditivo univariado)

y = Xb + Za + Wc + e, em que

y, b, a, c e e: vetores de dados, dos efeitos de blocos (fixos), dos efeitosgenéticos aditivos (aleatórios), de efeitos de parcela (aleatórios)e dos erros aleatórios, respectivamente.

X, Z e W: matrizes de incidência para b, a e c, respectivamente.

Distribuições e estruturas de médias e variâncias

0)',(;0)',(;0)',(

),0(~

),0(~

),0(~,

),(~,

22

22

22

=== ecCoveaCovcaCov

INe

INc

ANAa

VXbNVby

ee

cc

aa

σσ

σσ

σσ

15Documentos, 47

ou seja:

=

=

RR

CCW

GGZ

RWCZGV

e

c

a

y

Vare

Xb

e

c

a

y

E

00

00'

00'

0

0

0

, em que:

.'''' 222

2

2

2

RWCWZGZIWWIZZAV

IC

IR

AG

eca

e

c

a

++=++=

=

=

=

σσσσσσ

Equações de modelo misto

=

++ −

yW

yZ

yX

c

a

b

IWWZWXW

WZAZZXZ

WXZXXX

'

'

'

ˆ

ˆ

ˆ

'''

'''

'''

2

11

λλ

, em que:

2

22

2

2

22

22

2

2

1

1;

1

c

ch

h

ch

c

e

a

e −−==−−==σσλ

σσλ

222

22

eca

ahσσσ

σ++

= : herdabilidade individual no sentido restrito no bloco;

)/( 22222ecacc σσσσ ++= : correlação devida ao ambiente comum da parcela;

2aσ : variância genética aditiva;2cσ : variância entre parcelas;2eσ : variância residual (ambiental dentro de parcelas + não aditiva);

A : matriz de correlação genética aditiva entre os indivíduos em avaliação.

As soluções para as equações de modelo misto devem ser obtidas pormétodos iterativos de resolução de sistemas de equações lineares, tais como ométodo de Gauss Seidel. A solução direta via inversão da matriz dos coeficientesé impossível na prática.

16 Documentos, 47

Para o caso balanceado, as soluções obtidas para â, a partir das equaçõesde modelo misto, eqüivalem às predições obtidas pelo índice multi-efeitos(Resende & Higa, 1994a), dado por:

)()()( ........3.....2.1 YYYYbYYbYYbI jiijiijijK +−−+−+−= , em que:

[ ]22

2

3222

2

22

2

1 /

)1(

;//

))1(1

;)1(

cdp

aa

dpcfa

aa

dp

aa

nnb

nbbnb

nb

bbσσ

σρ

σσσ

σρ

σσρ

+

−

=++

−+

=−=

aρ : correlação genética aditiva intraclasse ( aρ = 0,25 para famílias de meiosirmãos);

222 , dpcfa e σσσ : variância entre famílias, entre parcelas e dentro de parcelas,

respectivamente.

........ ,,, YeYYYY jiijijk : valor fenotípico individual, média da parcela, média da

progênie, média do bloco e média geral, respectivamente.

Assim, para o caso balanceado, este índice é BLUP, ao passo que asformas de seleção combinada usando o valor individual como desvio da médiada parcela (Bueno Filho, 1992; Resende & Higa, 1994b) ou como desvio damédia do bloco (Pires et al., 1996) não são BLUP (Resende & Fernandes, 1999).

Estimadores iterativos dos componentes de variância por REML viaalgoritmo EM

)](/[]''ˆ''ˆ''ˆ'[ˆ 2 xrNyWcyZayXbyye −−−−=σ

qCAtraAa ea /)](ˆˆ'ˆ[ˆ 221212 −− += σσ

sCtrcc ec /]ˆ'ˆ[ˆ 3322 σσ += , em que:

C22 e C33 advém de:

17Documentos, 47

=

=

−

−

333231

232221

1312111

333231

232221

131211

1

CCC

CCC

CCC

CCC

CCC

CCC

C

C: matriz dos coeficientes das equações de modelo misto;tr: operador traço matricial;r(x): posto da matriz X;N, q, s: número total de dados, número de indivíduos e número de parcelas,

respectivamente.

Seqüência de colunas no arquivo de dados para análise no softwareDFREML

Indivíduo Pai Mãe Bloco Parcela Variável 1 . . . Variável n

Neste caso, é necessário apenas um arquivo, o qual funciona ao mesmotempo como arquivo de pedigree e como arquivo de dados. Deve ser executadoos subprograma DFPREP e em seguida o DFUNI.

Os estimadores e preditores apresentados podem ser utilizados comeficiência em testes de progênies de irmãos germanos (obtidas sob odelineamento de cruzamento em pares simples) desde que a dominância docaráter seja baixa.

4.1.2 Avaliação de progênies de meios irmãos, no delineamentoem blocos ao acaso, com várias plantas por parcela, váriasmedições por indivíduo, um só caráter e uma só população

Modelo linear misto (modelo aditivo univariado, de repetibilidade)

y = Xb + Za + Wc + Tp + e, em que

p: vetor de efeitos permanentes (ambiente permanente dentro de parcela +efeitos genéticos não aditivos);

T: matriz de incidência para p.

Neste modelo, os efeitos fixos de blocos (b-1 graus de liberdade), medições(m-1 graus de liberdade) e interação medição x bloco [(b-1) (m-1) graus deliberdade], podem ser ajustados em um único efeito (denominado combinaçãobloco-medição com mb elementos ou níveis e mb-1 graus de liberdade),procedimento este que é estatisticamente correto e computacionalmente

18 Documentos, 47

desejável e necessário. Os efeitos temporários da interação progênies x mediçõese progênies x medições x blocos são incorporados ao vetor e, em conjunto como efeito de ambiente temporário propriamente dito. Os efeitos c de parcela,neste modelo, referem-se ao ambiente permanente entre parcelas.


0)',(;0)',(;0)',(

;0)',(;0)',(;0)',(

),0(~

),0(~

),0(~

),0(~,

),(~,

22

22

22

22

===

===

ecCovepCovcpCov

eaCovpaCovcaCov

INe

INp

INc

NAa

VXbNVby

ee

pp

cc

aA

σσ

σσ

σσ

σσ

ou seja:

=

=

RR

PPT

CCW

GGZ

RTPWCZGV

e

p

c

a

y

Var

Xb

e

p

c

a

y

E

000

000'

000'

000'

;

0

0

0

0

, em que:

.''' 2222

2

epca

p

ITTIWWIZZAV

IP

σσσσ

σ

+++=

=

19Documentos, 47


=

++

+ −

yT

yW

yZ

yX

p

c

a

b

ITTWTZTXT

TWIWWZWXW

TZWZAZZXZ

TXWXZXXX

'

'

'

'

ˆ

ˆ

ˆ

ˆ

''''

''''

''''

''''

3

2

11

λλ

λ, em que:

.1

;1

;1

2

2

232

2

222

2

21p

e

c

e

a

e

pch σσρλ

σσρλ

σσρλ =−==−==−=

2222

22

epca

ahσσσσ

σ+++

= : herdabilidade individual no sentido restrito no bloco,

em uma dada medição;

2222

222

epca

pca

σσσσσσσ

ρ+++

++= : repetibilidade individual no bloco;

2222

22

epca

ppσσσσ

σ+++

= : coeficiente de determinação dos efeitos permanentes

dentro da parcela;

2222

22

epca

ccσσσσ

σ+++

= : correlação devida ao ambiente comum da parcela.


)](/[]''ˆ''ˆ''ˆ''ˆ'[ˆ 2 xrNyTpyWcyZayXbyye −−−−−=σ


sCtrcc ec /]ˆ'ˆ[ˆ 3322 σσ +=

qCtrpp ep /]ˆˆ'ˆ[ˆ 4422 σσ += , em que:

C22, C33 e C44 advém de:

20 Documentos, 47

=

=

−

−

44434241

34333231

24232221

141312111

44434241

34333231

24232221

14131211

1

CCCC

CCCC

CCCC

CCCC

CCCC

CCCC

CCCC

CCCC

C


Indivíduo Pai Mãe Bloco-Medição Parcela Permanente Variável 1 . . . Variável n

É necessário apenas um arquivo, o qual funciona simultaneamente comoarquivo de dados e como arquivo de pedigree. Devem ser executadossequencialmente os subprogramas DFPREP e DFUNI.

4.1.3 Avaliação de progênies de meios irmãos, no delineamentoem blocos ao acaso, com várias plantas por parcela, umamedição por indivíduo e um só caráter, avaliado em várioslocais (experimentos) com algumas progênies outratamentos comuns

Modelo linear misto (modelo aditivo multivariado)

y = Xb + Za + Wc + e, em que:

+

+

+

=

llllllll

MM

L

MOMM

L

L

M

L

MOMM

L

L

M

L

MOMM

L

L

M

e

e

e

c

c

c

W

W

W

a

a

a

Z

Z

Z

b

b

b

X

X

X

y

y

y

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

00

00

0

00

00

0

00

00

0

Este modelo multivariado trata um mesmo caráter em diferentes locaiscomo sendo diferentes caracteres (Resende et al., 1999).

21Documentos, 47

Estruturas de médias e variâncias

;

0

0

0

0

0

022

11

2

1

2

1

2

1

2

1

=

bX

bX

e

e

c

c

a

a

y

y

E

=

2

2

2

2

2

2

2

1

2

1

2

1

2

1

2

1

212

121

0

0

0

0

0

00000

0000

0000

0000

000

000

e

e

c

c

aa

aa

II

I

I

AA

AA

e

e

c

c

a

a

Var

σσ

σσ

σσσσ

22

222

2222

21

211

2111

222

111

'')(

'')(

eca

eca

IWIWZAZVyVar

IWIWZAZVyVar

σσσ

σσσ

++==

++==

Para o caso envolvendo três experimentos, tem-se:

=

2

2

2

2

2

2

2

2

2

3

2

1

3

2

1

3

2

1

3

2

1

3

2

1

32313

23212

13121

00000000

00000000

00000000

00000000

00000000

00000000

000000

000000

000000

e

e

e

c

c

c

aaa

aaa

aaa

I

I

I

I

I

I

AAA

AAA

AAA

e

e

e

c

c

c

a

a

a

Var

σσ

σσ

σσ

σσσσσσσσσ

em que:

22 Documentos, 47

222

321, aaa e σσσ : variâncias genéticas aditivas, nos locais (ou experimentos) 1, 2

e 3, respectivamente;

231312, aaa e σσσ : covariâncias genéticas aditivas, envolvendo as combinações

de locais 1-2, 1-3 e 2-3, respectivamente, ou variânciasgenéticas aditivas livres das interações genótipos x ambientes;

222

321, ccc e σσσ : variâncias entre parcelas, nos locais 1, 2 e 3, respectivamente;

222

321, eee e σσσ : variâncias residuais, nos locais 1, 2 e 3, respectivamente.


=

++

−

−

−

−−−−

−−−−

−−−

yRW

yRZ

yRX

c

a

b

CWRWZRWXRW

WRZGZRZXRZ

WRXZRXXRX

1

1

1

1111

1111

111

'

'

'

ˆ

ˆ

ˆ

'''

'''

'''

, em que:

=

=

=

3

2

1

3

2

1

3

2

1

00

00

00

;

00

00

00

;

00

00

00

W

W

W

W

Z

Z

Z

Z

X

X

X

X

=

=

=

=

3

2

1

3

2

1

3

2

1

3

2

1

ˆ

ˆ

ˆ

ˆ;

ˆ

ˆ

ˆ

ˆ;ˆ

ˆ

ˆ

ˆ;

c

c

c

c

a

a

a

a

b

b

b

b

y

y

y

y

=

=

=

⊗=⊗=⊗= −−−−−−−

2

2

2

2

2

2

2

2

2

1111111

3

2

1

32313

23212

13121

3

2

1

00

00

00

;;

00

00

00

;;

c

c

c

O

aaa

aaa

aaa

O

e

e

e

O

OOO

CGR

ICCAGGIRR

σσ

σ

σσσσσσσσσ

σσ

σ

23Documentos, 47

Os componentes de variância estão associados aos parâmetros h2, c2 er a, da seguinte maneira:

jiijijiiiiii aaaayiieyicyia chch σσρσσσσσσσ =−−=== ;)1(;; 2222222222, em

que:

ji

ij

ij

aa

a

aσσ

σρ = = correlação genética entre o desempenho nos locais i e j;

2yiσ =variância fenotípica ao nível de indivíduo no local i.

A variância da interação genótipo x ambiente, para o caso balanceado,

é dada por .)1()(2

1 22

jiijji aaaaaae σσρσσσ −+−=

Modelos multivariados e equações de modelo misto deste tipo podemtambém ser usados na seguintes situações: (i) avaliação de indivíduos dediferentes gerações, em diferentes locais (para indivíduos de diferentes geraçõesavaliados em um mesmo local, basta ajustar adequadamente os efeitos fixosde blocos - anos e usar o modelo univariado); (ii) avaliação de indivíduos emdiferentes estágios (juvenil e adulto), cada estágio em diferentes experimentos.

Estimadores dos componentes de variância por REML

Nesta situação, devido à complexidade do modelo e ao elevado númerode componentes de variância a serem estimados, os algoritmos recomendadossão o DF e o AI (preferencialmente este). Neste caso, a função geral a sermaximizada é aquela descrita no item 2.


Experimento Indivíduo Pai Mãe Bloco Parcela Variável 1 . . . Variável n

Neste caso, são necessários dois arquivos: um de dados, conformeestrutura apresentada acima e outro de pedigree formado pelas colunasIndivíduo Pai Mãe. Deve ser executado o subprograma DFPREP e emseguida o DXMUX.

24 Documentos, 47

Análises alternativas

A metodologia de análise apresentada anteriormente permite a seleçãode indivíduos para cada ambiente específico, porém, usando também ainformação de suas famílias em outros ambientes. Uma outra alternativa é aseleção de indivíduos visando ao plantio dos mesmos nos vários ambientes.Nesta situação, a seleção deve ser baseada no comportamento médio aolongo dos ambientes, inferido pelos valores genéticos médios dados por:a1*= (a11+a12)/2 e a2*= (a22+a21)/2 para os indivíduos avaliados nos locais1 e 2, respectivamente. Neste caso, a variância genética aditiva estimadaeqüivale a Var [(a11 + a12 + a22 + a21)/2] = (1/4)

)2()4/1()(1221122121

2222aaaaaaa σσσσσσσ ++=+++ . Neste caso, o modelo é dado

y* =Xb +Za* +Wc* + e*, e os estimadores e preditores eqüivalem àquelesapresentados no item 4.1.1, sendo que os arquivos devem ser montadosconforme uma estrutura univariada.

Outra situação refere-se à avaliação da eficiência da seleçãoindireta ou mesmo à prática da seleção de indivíduos mais estáveis. Nestecaso, a seleção deve ser baseada no valor genético indireto predito e avariância genética aditiva estimada eqüivale à variância livre da interaçãogenótipo x ambiente. Nesta situação, o modelo é dado por y** = Xb +Za** + Wc** + Sf** + e**, e os estimadores e preditores equivalem àqueles

apresentados no item 4.1.2, porém substituindo-se Tp por Sf** e 2pσ por 2

**fσ .

Neste caso, 2**fσ estima (1/4) de 2

aeσ ao passo que 2**aσ eqüivale a 2

aσ ou seja,

a variância genética aditiva livre da interação genótipo x ambiente.Considerando os três modelos alternativos apresentados neste tópico,

tem-se as seguintes eqüivalências, para o caso balanceado:

(i) 2**

2aa σσ = ;

(ii) 2**

2 4)1()(2

1211221 faaaaaae σσσρσσσ =−+−= ;

(iii) 2/)( 2222

21 aaaea σσσσ +=+ ;

(iv) 22**

22222

2* )2/1()2/1(

4

221

aeaaeaaaa

a σσσσσσσ

σ +=+=++

= ;

(v) 2/)( 222** 21 ccc σσσ += ;

(vi) 2/)( 222** 21 eee σσσ += ;

(vii) ;)2/1( 2**

2**

2* fcc σσσ +=

(viii) 2**

2* ee σσ = .

25Documentos, 47

Em resumo, tem-se as seguintes opções de modelo de acordo com osrespectivos objetivos:

(i) seleção de diferentes materiais genéticos para plantios em ambientesespecíficos: modelo y;

(ii) seleção de materiais genéticos para plantio em locais em que não foramtestados: modelo y**;

(iii) seleção de um mesmo material genético para plantio nos vários locaisem que foram conduzidos os experimentos: modelo y*.

Em termos computacionais, é mais indicado ajustar inicialmente o modeloy** e verificar a significância da interação genótipo x ambiente. Caso a interaçãonão seja significativa, pode-se adotar o modelo y*, o qual conduzirá praticamenteao mesmo resultado. Também, neste caso, se a interação for não significativa,

12aρ tenderá a 1 e, portanto, os modelos y* e y também conduzirão praticamenteao mesmo resultado.

4.1.4 Avaliação de progênies de meios irmãos, no delineamentoem blocos ao acaso, com várias plantas por parcela, váriasmedições por indivíduo e um só caráter, avaliado em váriosexperimentos com algumas progênies ou tratamentoscomuns

Modelo linear misto (modelo aditivo multivariado, de repetibilidade)

Considerando o caso bivariado, tem-se:

+

+

+

+

=

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

0

0

0

0

0

0

0

0

e

e

p

p

T

T

c

c

W

W

a

a

Z

Z

b

b

X

X

y

y

26 Documentos, 47


;

0

0

0

0

0

0

0

022

11

2

1

2

1

2

1

2

1

2

1

=

bX

bX

e

e

p

p

c

c

a

a

y

y

E

=

2

2

2

2

2

2

2

2

2

1

2

1

2

1

2

1

2

1

2

1

2

1

212

121

0000000

0000000

0000000

0000000

0000000

0000000

000000

000000

e

e

p

p

c

c

aa

aa

I

I

I

I

I

I

AA

AA

e

e

p

p

c

c

a

a

Var

σσ

σσ

σσ

σσσσ

, em

que:

.22

21 pp e σσ : variância permanente dentro de parcelas (ambiental + genética

não aditiva) nos locais 1 e 2, respectivamente.


=

++

+

−

−

−

−

−−−−−

−−−−−

−−−−−

−−−−

yRT

yRW

yRZ

yRX

p

c

a

b

PTRTWRTZRTXRT

TRWCWRWZRWXRW

TRZWRZGZRZXRZ

TRXWRXZRXXRX

1

1

1

1

11111

11111

11111

1111

'

'

'

'

ˆ

ˆ

ˆ

ˆ

''''

''''

''''

''''

, em

que:

=

=

=

=

2

1

2

1

2

1

2

1

ˆ

ˆˆ;

ˆ

ˆˆ;

ˆ

ˆˆ;

p

pp

c

cc

b

bb

y

yy

=

=

=

=

⊗=⊗=⊗=⊗= −−−−−−−−−

2

2

2

2

2

2

2

2

111111111

2

1

2

1

212

121

2

1

0

0;

0

0;;

0

0

;;;

p

pO

c

cO

aa

aaO

e

eO

OOOO

PCGR

IPPICCAGGIRR

σσ

σσ

σσσσ

σσ

27Documentos, 47

Os componentes de variância estão associados aos parâmetros h2, c2, re r a, da seguinte maneira:

jiijijiiiiiiii aaaayiiipyicyieyia chch σσρσσρσσσσρσσσ =−−==−== ;)(;;)1(; 222222222222 , em

que r i é a repetibilidade no local i.


Nesta situação, são recomendados os algoritmos AI (preferencialmenteeste) e DF. A função geral a ser maximizada é aquela descrita no item 2.


Experimento Indivíduo Pai Mãe Bloco-Medição Parcela Permanente Variável 1 . . . Variável n

São necessários dois arquivos, o de dados e um de pedigree, formadopelas colunas Indivíduo Pai Mãe. Devem ser executados os subprogramasDFPREP e DXMUX.

4.2 Delineamento em blocos ao acaso, progênies de polinizaçãocontrolada, uma só população

4.2.1 Avaliação de progênies de irmãos germanos obtidas sobcruzamentos dialélicos, fatoriais ou hierárquicos, nodelineamento em blocos ao acaso, com várias plantas porparcela, uma medição por indivíduo, um só caráter e umasó população

Modelo linear misto (modelo aditivo-dominante univariado)

y = Xb + Za + Zd + Wc + e, em que

d: vetor aleatório dos efeitos de dominância.

28 Documentos, 47


=

=

22

22

22

22

2222

000

000'

000'

000'

;

0

0

0

0

ee

cc

dd

aa

ecda

II

IWI

DZD

AZA

IWIZDZAV

e

c

d

a

y

Var

Xb

e

c

d

a

y

E

σσσσ

σσσσ

σσσσ

, em que:

.''' 2222ecda IWWIZZDZZAV σσσσ +++=


=

++

+−

−

yW

yZ

yZ

yX

c

d

a

b

IWWZWZWXW

WZDZZZZXZ

WZZZAZZXZ

WXZXZXXX

'

'

'

'

ˆ

ˆˆ

ˆ

''''

''''

''''

''''

3

21

11

λλ

λ, em que:

.1

;1

;1

2

22

2

2

322

22

2

2

22

22

2

2

1 c

ch

hh

ch

h

ch a

c

e

a

a

d

ea

a

e −−==−

−−==−−==σσλ

σσλ

σσλ

22ad heσ : variância genética de dominância e herdabilidade individual no sentido

amplo, respectivamente;D : matriz de correlação genética de dominância entre os indivíduos em avaliação.

O sistema apresentado prediz isoladamente os efeitos aditivos (â) e de

dominância ( d ). Os valores genotípicos totais, dados por dâg ˆˆ += , podem serpreditos diretamente pelas equações de modelo misto:

=

++ −

yW

yZ

yX

c

g

b

IWWZWXW

WZGZZXZ

WXZXXX

e

'

'

'

ˆ

ˆ

ˆ

'''

'''

'''

3

21

λσ , em que:

22da DAG σσ +=

29Documentos, 47


)](/[]''ˆ''ˆ''ˆ'ˆ'[ˆ '2 xrNyWcyZdyZayXbyye −−−−−=σ ;

sCtrcc ec /]ˆ'ˆ[ˆ 4422 σσ += ;

qCAtraAa ea /)](ˆˆ'ˆ[ˆ 221212 −− += σσ ;

qCDtrdDd ed /](ˆˆ'ˆ[ˆ 331212 −− += σσ .



Para ajuste dos efeitos de dominância, os mesmos devem ser consideradoscomo �segundo efeito aleatório por indivíduo�. Neste caso, além dos arquivosde dados e de pedigree, deve ser fornecido um arquivo adicional com nomepadrão DF45#DAT, referente à inversa da matriz de parentesco de dominância.Este arquivo não formatado deve fornecer todos os elementos não zero dotriângulo inferior da matriz inversa e deve conter três colunas: um código inteiro(de 1 ao número de indivíduos na análise) referente ao número da coluna namatriz; um código inteiro referente ao número da linha (maior ou igual ao númeroda coluna) na matriz (de 1 ao número de indivíduos na análise); uma variávelverdadeira (real) fornecendo o elemento da inversa da matriz de parentesco dedominância.

Para a estimação da variância genética de dominância, outra alternativapode ser empregada, a qual não requer o fornecimento dos elementos da inversada matriz de parentesco de dominância. Isto pode ser feito ajustando o efeitode família de irmãos germanos como um efeito aleatório adicional nãocorrelacionado que pode ser designado efeito de dominância comum a umafamília de irmãos germanos. O vetor de soluções para este efeito de dominânciacomum apresenta dimensão eqüivalente ao número de famílias de irmãosgermanos e a variância deste vetor contempla ¼ da variância de dominância,ignorando a epistasia. Assim, a variância devida ao efeito de dominância comumdeve ser multiplicada por quatro para obtenção da variância de dominância.Este procedimento, entretanto, não permite a predição dos efeitos de dominânciapara cada indivíduo, mas, prediz os efeitos aditivos livres das influências dosefeitos de dominância. O arquivo de dados deve estar organizado conformeespecificado a seguir:

30 Documentos, 47

Indivíduo Pai Mãe Bloco Parcela Família de Irmãos Germanos Variável 1 . . . Variável n

O modelo linear misto passa a ser dado por y = Xb + Za +Wc + Sf + e, em que f é o efeito de dominância da família de irmãos germanos

e S a matriz de incidência deste efeito. A variância de f contempla (1/4) 2dσ .

Os subprogramas a serem utilizados pelo DFREML são o DFPREP e oDFUNI.

4.2.2 Avaliação de progênies de irmãos germanos obtidas sobcruzamentos dialélicos, fatoriais ou hierárquicos, nodelineamento em blocos ao acaso, com várias plantas porparcela, várias medições por indivíduo, um só caráter euma só população

Modelo linear misto (modelo aditivo-dominante univariado, derepetibilidade)

y = Xb + Za + Wc + Sf +Tp + e


;

0

0

0

0

0

=

Xb

e

p

f

c

a

y

E

=

2

2

2

22

22

22

22

2222

0

0

0

0

0000

000'

000'

000'

000'

e

c

e

pp

ff

cc

aa

pfca

I

I

I

ITI

ISI

IWI

AZA

TISIWIZAV

e

p

f

c

a

y

Var

σ

σ

σσσ

σσσσ

σσσσσσ

31Documentos, 47


=

++

++ −

yT

yS

yW

yZ

yX

p

f

c

a

b

ITTSTWTZTXT

TSISSWSZSXS

TWSWIWWZWXW

TZSZWZAZZXZ

TXSXWXZXXX

'

'

'

'

'

ˆ

ˆˆ

ˆ

ˆ

'''''

'''''

'''''

'''''

'''''

4

3

2

11

λλ

λλ

, em que:

22

2

4222

2

322

2

222

2

1

1;

)(25,0

1;

1;

1phhch p

e

af

e

c

e

a

e ρσσλρ

σσλρ

σσλρ

σσλ −==

−−==−==−==

Estimadores iterativos de componentes de variância por REML viaalgoritmo EM

)](/[]''ˆ''ˆ''ˆ''ˆ''ˆ'[ˆ 2 xrNyTpySfyWcyZayXbyye −−−−−−=σ



vCtrff ef /]ˆˆ'ˆ[ˆ 4422 σσ +=

sCtrpp ep /]ˆˆ'ˆ[ˆ 5522 σσ += , em que v é o número de famílias de irmãos

germanos.


Indivíduo Pai Mãe Bloco-Medição Parcela Família Permanente Variável 1 . . . Variável n

Devem ser utilizados os subprogramas DFPREP e DFUNI.

32 Documentos, 47

4.2.3 Avaliação de progênies de irmãos germanos obtidas sobcruzamentos dialélicos, fatoriais ou hierárquicos, nodelineamento em blocos ao acaso, com várias plantas porparcela, uma medição por indivíduo e um só caráter, avaliadoem vários experimentos, com tratamentos comuns

Modelo linear misto (modelo aditivo-dominante multivariado)


+

+

+

+

=

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

0

0

0

0

0

0

0

0

e

e

f

f

S

S

c

c

W

W

a

a

Z

Z

b

b

X

X

y

y


;

0

0

0

0

0

0

0

022

11

2

1

2

1

2

1

2

1

2

1

=

bX

bX

e

e

f

f

c

c

a

a

y

y

E

=

2

2

2

2

2

2

2

2

2

1

1

2

1

2

1

2

1

212

121

2

1

212

121

0000000

0000000

000000

000000

0000000

0000000

000000

000000

e

e

ff

ff

c

c

aa

aa

I

I

II

II

I

I

AA

AA

e

e

f

f

c

c

a

a

Var

σσ

σσσσ

σσ

σσσσ

, em

que:

12fσ : covariância entre os efeitos de dominância associado às famílias de irmãos

germanos nos ambientes 1 e 2 (eqüivale a ¼ 2dσ , livre da interação).

33Documentos, 47


=

++

+

−

−

−

−

−−−−−

−−−−−

−−−−−

−−−−

yRS

yRW

yRZ

yRX

f

c

a

b

FSRSWRSZRSXRS

SRWCWRWZRWXRW

SRZWRZGZRZXRZ

SRXWRXZRXXRX

1

1

1

1

11111

11111

11111

1111

'

'

'

'

ˆˆ

ˆ

ˆ

''''

''''

''''

''''

, em

que:

=

=

=

=

2

1

2

1

2

1

2

1

ˆ

ˆˆ;

ˆ

ˆˆ;

ˆ

ˆˆ;

f

ff

c

cc

b

bb

y

yy ;

=

=

=

=

⊗=⊗=⊗=⊗= −−−−−−−−−

2

2

2

2

2

2

2

2

111111111

212

121

2

1

212

121

2

1 ;0

0;;

0

0

;;;

ff

ffO

c

cO

aa

aaO

e

eO

OOOO

FCGR

IFFICCAGGIRR

σσσσ

σσ

σσσσ

σσ


São recomendados os algoritmos AI (preferencialmente este) e DF. Afunção geral a ser maximizada é aquela descrita no item 2.


Experimento Indivíduo Pai Mãe Bloco Parcela Família Variável 1 . . . Variável n

São necessários dois arquivos, o de dados, conforme estruturaapresentada acima e um de pedigree formado pelas colunas Indivíduo PaiMãe. Devem ser executados os subprogramas DFPREP e DXMUX.

34 Documentos, 47

4.2.4 Avaliação de progênies de irmãos germanos obtidas sobcruzamentos dialélicos, fatoriais ou hierárquicos, nodelineamento em blocos ao acaso, com várias plantas porparcela, várias medições por indivíduo, um só caráter, umasó população, avaliada em vários experimentos comprogênies ou tratamentos comuns

Modelo linear misto (modelo aditivo-dominante multivariado, derepetibilidade)

y = Xb + Za + Wc + Sf + Tp + e, que para o caso bivariado eqüivale a:

+

+

+

+

+

=

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

0

0

0

0

0

0

0

0

0

0

e

e

p

p

T

T

f

f

S

S

c

c

W

W

a

a

Z

Z

b

b

X

X

y

y


=

=

2

2

2

2

2

2

2

2

2

2

2

1

2

1

2

1

2

1

2

122

11

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

212

121

2

1

212

121

000000000

000000000

000000000

000000000

00000000

00000000

000000000

000000000

00000000

00000000

;

0

0

0

0

0

0

0

0

0

0

e

e

p

p

ff

ff

c

c

aa

aa

I

I

I

I

II

II

I

I

AA

AA

e

e

p

p

f

f

c

c

a

a

Var

bX

bX

e

e

p

p

f

f

c

c

a

a

y

y

E

σσ

σσ

σσσσ

σσ

σσσσ


=

++

++

−

−

−

−

−

−−−−−−

−−−−−−

−−−−−−

−−−−−−

−−−−−

yRT

yRS

yRW

yRZ

yRX

p

f

c

a

b

PTRTSRTWRTZRTXRT

TRSFSRSWRSZRSXRS

TRWSRWCWRWZRWXRW

TRZSRZWRZGZRZXRZ

TRXSRXWRXZRXXRX

1

1

1

1

1

111111

111111

111111

111111

11111

'

'

'

'

'

ˆ

ˆˆ

ˆ

ˆ

'''''

'''''

'''''

'''''

'''''

,

em que:

35Documentos, 47

=

=

=

=

=

⊗=⊗=⊗=⊗=⊗= −−−−−−−−−−−

2

2

2

2

2

2

2

2

2

2

11111111111

2

1

212

121

2

1

212

121

2

1

0

0;;

0

0;;

0

0

;;;;

p

pO

ff

ffO

c

cO

aa

aaO

e

eO

OOOOO

CFCGR

IPPIFFICCAGGIRR

σσ

σσσσ

σσ

σσσσ

σσ


Neste caso, é recomendado o algoritmo AI. A função geral a sermaximizada é aquela descrita no item 2.

Software

Para esta situação recomenda-se o uso do software ASREML, o qualexige um arquivo de programa específico com extensão. as.

4.3 Delineamento em blocos ao acaso, progênies de polinizaçãoaberta, várias populações

4.3.1 Avaliação de progênies de meios irmãos (polinização aberta)de várias populações (procedências), no delineamento emblocos ao acaso, com várias plantas por parcela, umamedição por indivíduo e um só caráter

Nesta situação, duas formas de experimentação existem: (i) progêniesalocadas hierarquicamente dentro de procedências (arranjo de famíliascompactas); (ii) progênies de várias procedências alocadas aleatoriamentedentro de cada bloco.

Adicionalmente, existem duas opções para se tratar o efeito depopulações: (a) efeito fixo; (b) efeito aleatório. Na situação (ii) (a), ou seja,famílias aleatorizadas dentro de blocos e procedência como efeito fixo, bastaajustar no vetor de efeitos fixos, os efeitos de blocos e de procedências, sendoque a interação de efeito fixo, procedência x bloco, tende a ser desprezível.Procedendo desta forma, as observações individuais são ajustadas paraestimativas BLUE dos efeitos de bloco e procedências e basta adotar o modelo,estimadores e preditores descritos no tópico 4.1.1.

Na situação (i) (a), pode-se, vantajosamente, no procedimento BLUP,ajustar as observações individuais para as estimativas BLUE dos efeitos dasprocedências nos blocos, ou seja, considerar o ambiente homogêneo da grandeparcela de procedência como o efeito fixo para o qual as observações de campodevam ser ajustadas. Neste caso, deve-se ajustar a combinação bloco-procedência como efeito fixo (com bp níveis, em que b é o número de blocos e

36 Documentos, 47

p o número de procedências) e também empregar o modelo, estimadores epreditores descritos no tópico 4.1.1.

Quando se consideram as procedências tanto como efeitos genéticosfixos ou aleatórios, deve-se, para efeito da seleção de indivíduos, somar osvalores genéticos individuais preditos aos efeitos de procedências. Procedendodesta forma, os indivíduos de diferentes procedências podem ser comparadosdiretamente por seus novos valores genéticos preditos.

Na situação (i) (b) tem-se os modelos, estimadores e preditores descritosa seguir.

Modelo linear misto (modelo aditivo univariado, multi-populações)

y = Xb + Za + Wc1 + Qr + Uc2 + e, em que:

y, b, a, c1, r, c2 e e: vetores de dados, dos efeitos fixos (blocos), dos efeitosaleatórios genéticos aditivos, dos efeitos aleatórios deparcelas referentes a progênies (subparcelas), depopulações (ou raça), dos efeitos aleatórios de parcelasreferentes a procedências e erros aleatórios,respectivamente.

X, Z, W, Q e U: matrizes de incidência para b, a, c1, r, c2 e e, respectivamente.


:,0)',(;0)',(

0)',(;0)',(;0)',(;0)',(

0)',(;0)',(;0)',(;0)',(

),0(~

),0(~

),0(~

),0(~

),0(~,

),(~,

2

21211

21

22

22

222

221

22

22

11

sejaouecCoverCov

crCovecCovccCovrcCov

eaCovcaCovraCovcaCov

INe

INr

INc

INc

ANAa

VXbNVby

ee

rr

cc

cc

aa

==

====

====

σσ

σσ

σσ

σσ

σσ

37Documentos, 47

=

=

2

2

2

2

2

2

1

2

1

0000

000

0000

0000

0000

0

0

0

0

0

2

1

e

c

r

c

a

I

I

I

I

A

e

c

r

c

a

Vare

Xb

e

c

r

c

a

y

E

σσ

σσ

σ

.'''')( 22222

21 ecrca IUUIQQIWWIZZAyVar σσσσσ ++++=


=

++

++ −

yU

yQ

yW

yZ

yX

c

r

c

a

b

IUUQUWUZUXU

UQIQQWQZQXQ

UWQWIWWZWXW

UZQZWZAZZXZ

UXQXWXZXXX

'

'

'

'

'

ˆ

ˆ

ˆ

ˆ

ˆ

'''''

'''''

'''''

'''''

'''''

2

1

4

3

2

11

λλ

λλ

, em

que:

.1

;1

;1

;1

2

22

221

2

2

2

4

2

22

221

2

2

2

3

21

22

221

2

2

2

2

2

22

221

2

2

2

1

2

1

c

crch

r

crch

c

crch

h

crch

c

e

r

e

c

e

a

e

−−−−==

−−−−==

−−−−==

−−−−==

σσλ

σσλ

σσλ

σσλ

22222

22

21 ecrca

ahσσσσσ

σ++++

= : herdabilidade individual no sentido restrito;

22222

221

21

1

ecrca

ccσσσσσ

σ++++

= : correlação entre indivíduos devida ao ambientecomum da parcela referente a progênies (subparcelas);

38 Documentos, 47

22222

22

21 ecrca

rrσσσσσ

σ++++

= : correlação fenotípica intraclasse entre

22222

222

21

2

ecrca

ccσσσσσ

σ++++

= : correlação devida ao ambiente comum da


)](/[]''ˆ''ˆ''ˆ''ˆ''ˆ'[ˆ 212 xrNyUcyQryWcyZayXbyye −−−−−−=σ


1332

112 /]ˆˆ'ˆ[ˆ1

sCtrcc ec σσ +=

tCtrrr er /]ˆˆ'ˆ[ˆ 4422 σσ +=

2552

222 /]ˆˆ'ˆ[ˆ2

sCtrcc ec σσ += , em que:

s1, t e s2:= número de parcelas referentes a progênies, número de procedênciase número de parcelas referentes a procedência, respectivamente.


Indivíduo Pai Mãe Bloco Parcela1 Procedência Parcela2 Variável 1 . . . Variável n

Neste caso, é necessário apenas um arquivo o qual funciona ao mesmotempo como arquivo de pedigree e como arquivo de dados. Deve ser executadoo subprograma DFPREP e em seguida o DFUNI.

A significância da inclusão do efeito (c2) da parcela de procedência podeser avaliada através do teste da razão de verossimilhança. Se este efeito nãofor significativo, deve-se retirá-lo do modelo e dos preditores e estimadoresapresentados anteriormente. Estas mesmas considerações são válidas para asituação (ii) (b), em que a interação bloco x procedência, de efeito aleatóriotende a ser não significativa, podendo ser retirada do modelo.

indivíduos de uma mesma procedência, emdiferentes blocos;

parcela de procedência.

39Documentos, 47

É importante relatar que os modelos apresentados estimam umaherdabilidade média dentro das populações. Para se estudar comparativamenteas herdabilidades e coeficientes de variação genética das várias populaçõesdeve-se ajustar um modelo do tipo apresentado em 4.1.1. para cada população.

4.3.2 Avaliação de progênies de meios irmãos (polinização aberta)de várias populações (procedências), no delineamento emblocos ao acaso, com várias plantas por parcela, váriasmedições por indivíduo e um só caráter

Considerando-se as situações (i) (a), (i) (b), (ii) (a) e (ii) (b) descritas notópico 4.3.1, tem-se que:

- na situação (ii) (a), basta ajustar no vetor de efeitos fixos, os efeitos deprocedência e da combinação bloco-medição e adotar o modelo, estimadorese preditores apresentados no tópico 4.1.2.

- na situação (i) (a), deve-se ajustar no vetor de efeitos fixos, o efeito dacombinação bloco-procedência-medição (com bpm níveis, em que p, b e msão os números de procedências, blocos e medições, respectivamente).Neste caso, as observações individuais em uma dada medição são ajustadaspara a média da procedência no bloco, em uma dada medição. O modelo,estimadores e preditores apresentados no tópico 4.1.2. devem serempregados.

Na situação (i) (b) tem-se os modelos, estimadores e preditores descritosa seguir:

Modelo linear misto (modelo aditivo univariado, multi-populações, derepetibilidade)

y = Xb + Za + Wc1 + Tp + Qr + Uc2 + e, em que:

b : vetor de efeitos fixos (no caso, combinações bloco-medição, significandoque os valores individuais em uma dada medição serão ajustados para amédia do bloco na medição);

p : vetor de efeitos permanentes (ambiente permanente dentro de parcela +efeitos genéticos não aditivos);

T : matriz de incidência para p.

40 Documentos, 47


),0(~

),0(~

),0(~

),0(~

),0(~

),0(~,

),(~,

22

22

22

222

221

22

22

11

ee

pp

rr

cc

cc

aa

INe

INp

INr

INc

INc

ANAa

VXbNVby

σσ

σσ

σσ

σσ

σσ

σσ

As covariâncias entre todos os efeitos aleatórios do modelo são assumidascomo nulas.

Assim:

=

=

2

2

2

2

2

2

2

1

2

1

0

0

0

0

0

00000

0000

0000

0000

0000

0000

0

0

0

0

0

0

2

1

e

c

r

p

c

a

I

I

I

I

I

A

e

c

r

p

c

a

Vare

Xb

e

c

r

p

c

a

y

E

σσ

σσ

σσ

.''''')( 222222

21 ecrpca IUUIQQITTIWWIZZAyVar σσσσσσ +++++=

41Documentos, 47


=

++

++

+ −

yU

yQ

yT

yW

yZ

yX

c

r

p

c

a

b

IUUQUTUWUZUXU

UQIQQTQWQZQXQ

UTQTITTWTZTXT

UWQWTWIWWZWXW

UZQZTZWZAZZXZ

UXQXTXWXZXXX

'

'

'

'

'

'

ˆ

ˆ

ˆ

ˆ

ˆ

ˆ

''''''

''''''

''''''

''''''

''''''

''''''

2

1

5

4

3

2

11

λλ

λλ

λ

,

em que:

.1

;1

;1

;1

;1

2

222

221

2

2

2

5

2

222

221

2

2

2

4

2

222

221

2

2

2

3

21

222

221

2

2

2

2

2

222

221

2

2

2

1

2

1

c

pcrch

r

pcrch

p

pcrch

c

pcrch

h

pcrch

c

e

r

e

p

e

c

e

a

e

−−−−−==

−−−−−==

−−−−−==

−−−−−==

−−−−−==

σσλ

σσλ

σσλ

σσλ

σσλ

222222

22

21 epcrca

ahσσσσσσ

σ+++++

= ;

222222

221

21

1

epcrca

ccσσσσσσ

σ+++++

= ;

222222

22

21 epcrca

rrσσσσσσ

σ+++++

= ;

222222

222

21

2

epcrca

ccσσσσσσ

σ+++++

= .

222222

22

21 epcrca

ppσσσσσσ

σ+++++

= : correlação entre medidas repetidas devidas aos

efeitos permanentes (ambiental + genéticonão aditivo).

42 Documentos, 47

Neste modelo, a repetibilidade é dada por 222222

22222

21

21

epcrca

pcrca

σσσσσσσσσσσ

ρ+++++

++++= .


)](/[]''ˆ''ˆ''ˆ''ˆ''ˆ''ˆ'[ˆ 212 xrNyUcyQryTpyWcyZayXbyye −−−−−−−=σ


1332

112 /]ˆˆ'ˆ[ˆ1

sCtrcc ec σσ += ;

qCtrpp ep /]ˆˆ'ˆ[ˆ 4422 σσ +=

tCtrrr er /]ˆˆ'ˆ[ˆ 5522 σσ += ;

2662

222 /]ˆˆ'ˆ[ˆ2

sCtrcc ec σσ += .


Indivíduo Pai Mãe Bloco Parcela1 Permanente Procedência Parcela2 Variável 1 . . . Variável n

É necessário apenas um arquivo, o qual funciona ao mesmo tempo comoarquivo de pedigree e de dados. Deve ser executado o subprograma DFPREP e,em seguida, o DFUNI.

Na situação (ii) (b), a interação aleatória procedência x bloco tende a sernão significativa, sendo que o modelo, preditores e estimadores apresentadospara o caso (i) (b) podem ser utilizados, porém eliminando-se o componente c2e suas variâncias. A significância ou não de c2 pode ser verificada pelo teste darazão de verossimilhança.

Tanto na situação (i) (b) quanto (ii) (b), as interações procedência xmedição, progênie/procedência x medição, procedência x medição x bloco eprogênie/procedência x medição x bloco são incluídas no vetor residual e, oqual contempla o efeito total de ambiente temporário. É importante relatartambém que o próprio modelo de repetibilidade assume que a interação commedições seja aproximadamente nula (ou seja, assume correlação genéticaigual tendendo a 1, através das medições).

43Documentos, 47

Em todas as situações apresentadas neste tópico, o mérito genéticototal de cada indivíduo é dado pelo somatório do efeito genético aditivo preditocom o efeito da procedência a que pertence tal indivíduo.

4.3.3 Avaliação de progênies de meios irmãos (polinização aberta)de várias populações (procedências), no delineamento emblocos ao acaso, com várias plantas por parcela, umamedição por indivíduo e um só caráter, avaliado em váriosexperimentos com algumas progênies ou tratamentoscomuns

Para as situações descritas em (i) (a) e (ii) (a) do tópico 4.3.1, bastaadotar o modelo, estimadores e preditores descritos no tópico 4.1.3. Para assituações (i)(b) ou (ii) (b) incluindo a interação procedência x bloco (efeito c2),tem-se os modelos, estimadores e preditores descritos a seguir.

Modelo linear misto (modelo aditivo bivariado, multi-populações)

y = Xb + Za + Wc1 + Qr +Uc2 + e, que para o caso bivariado eqüivale a:

+

+

+

+

+

=

2

1

22

21

2

1

2

1

2

1

12

11

2

1

2

1

2

1

2

1

2

1

2

1

0

0

0

0

0

0

0

0

0

0

e

e

c

c

U

U

r

r

Q

Q

c

c

W

W

a

a

Z

Z

b

b

X

X

y

y

y, b, a, c1, r, c2 e e: vetores de dados, dos efeitos fixos (blocos), dos efeitosaleatórios genéticos aditivos, dos efeitos aleatórios deparcelas referentes a progênies, dos efeitos aleatórios depopulações, dos efeitos aleatórios de parcelas referentesa procedências e de erros aleatórios, respectivamente,os quais são desdobrados para os experimentos (locais) 1e 2.

X, Z, W, Q e U: matrizes de incidência para b, a, c1, r, c2 e e, respectivamente.

44 Documentos, 47


=

=

2

2

2

2

2

2

2

2

2

2

2

1

22

21

2

1

12

11

2

122

11

2

1

22

21

2

1

12

11

2

1

2

1

2

1

22

21

212

121

12

11

212

121

000000000

000000000

000000000

000000000

00000000

00000000

000000000

000000000

00000000

00000000

;

0

0

0

0

0

0

0

0

0

0

e

e

c

c

rr

rr

c

c

aa

aa

I

I

I

I

II

II

I

I

AA

AA

e

e

c

c

r

r

c

c

a

a

Var

bX

bX

e

e

c

c

r

r

c

c

a

a

y

y

E

σσ

σσ

σσσσ

σσ

σσσσ

22

222

222

222

2222

21

211

211

211

2111

2222122

1211111

'''')(

'''')(

ecrca

ecrca

IUIUQIQWIWZAZVyVar

IUIUQIQWIWZAZVyVar

σσσσσ

σσσσσ

++++==

++++==

em que:

22

21 aa e σσ : variâncias genéticas aditivas nos locais 1 e 2, respectivamente;

12aσ : covariância genética aditiva entre os locais 1 e 2 ou variância aditiva

livre da interação genótipo x ambiente;

22

1211 cc e σσ : variâncias entre parcelas (referentes a progênies) nos locais 1 e 2,

respectivamente;

22

21 rr e σσ : variâncias entre procedências nos locais 1 e 2, respectivamente;

12rσ : covariância genética entre os locais 1 e 2, ao nível do efeito de

procedências;

22

2221 cc e σσ :variâncias entre parcelas (referentes a procedências) nos locais 1 e

2, respectivamente;

22

21 ee e σσ : variâncias residuais nos locais 1 e 2, respectivamente;

45Documentos, 47


=

+ℜ+

++

−

−

−

−

−

−−−−−−

−−−−−−

−−−−−−

−−−−−−

−−−−−

yRU

yRQ

yRW

yRZ

yRX

c

r

c

a

b

CURUQRUWRUZRUXRU

URQQRQWRQZRQXRQ

URWQRWCWRWZRWXRW

URZQRZWRZGZRZXRZ

URXQRXWRXZRXXRX

1

1

1

1

1

2

1

12

11111

111111

111111

111111

11111

'

'

'

'

'

ˆ

ˆ

ˆ

ˆ

ˆ

'''''

'''''

'''''

'''''

'''''

1

,

em que:

=

=

=

=ℜ

=

⊗=⊗=⊗ℜ=ℜ⊗=⊗= −−−−−−−−−−−

2

2

2

2

202

2

102

2

2

2

11120

12

11110

11

111

2

1

22

21

12

11

212

121

212

121

0

0;

0

0;

0

0;;

;;;;

e

eO

c

c

c

c

rr

rrO

aa

aaO

OOO

RCCG

IRRICCIICCAGG

σσ

σσ

σσ

σσσσ

σσσσ

Os componentes de variância estão associados aos parâmetros

ijij ra ecch ρρ,,, 22

21

2 , da seguinte maneira:

:,;;

;)1(;;;

222

2222

21

22222

2221

2222

21

queemr

rcchcch

jiijijjiijijii

iiiiiiii

rrrraaaayir

yiiiieyicyicyia

σσρσσσρσσσ

σσσσσσσσ

===

−−−−====

ji

ij

ij

aa

a

a σσσ

ρ = : correlação genética entre o desempenho dos indivíduos nos

locais i e j;

ji

ij

ij

rr

r

r σσσ

ρ = : correlação genética entre o desempenho das procedências

nos locais i e j;

2

iyσ : variância fenotípica ao nível de indivíduo no local i.

46 Documentos, 47

A variância da interação indivíduo x local, para o caso balanceado, édada por:

.)1()(2

1 22


A variância da interação procedência x local, para o caso balanceado, édada por:

.)1()(2

1 22

jiijji rrrrrre σσρσσσ −+−=




Experimento Indivíduo Pai Mãe Bloco Parcela1 Procedência Parcela2 Variável 1 . . . Variável n

4.3.4 Avaliação de progênies de meios irmãos (polinização aberta)de várias populações (procedências), no delineamento emblocos ao acaso, com várias plantas por parcela, váriasmedições por indivíduo e um só caráter, avaliado em váriosexperimentos com algumas progênies ou tratamentoscomuns


47Documentos, 47

Modelo linear misto (modelo aditivo bivariado, multi-populações, derepetibilidade)

y = Xb + Za + Wc1 + Qr +Tp + e, que para o caso bivariado eqüivale a:

+

+

+

+

+

=

2

1

2

1

2

1

2

1

2

1

12

11

2

1

2

1

2

1

2

1

2

1

2

1

0

0

0

0

0

0

0

0

0

0

e

e

p

p

T

T

r

r

Q

Q

c

c

W

W

a

a

Z

Z

b

b

X

X

y

y

y, b, a, c1, r, p e e: vetores de dados, dos efeitos fixos (blocos), dos efeitos

aleatórios genéticos aditivos, dos efeitos aleatórios deparcelas referentes a progênies, dos efeitos aleatórios depopulações, dos efeitos aleatórios permanentes e de errosaleatórios, respectivamente, os quais são desdobrados paraos experimentos (locais) 1 e 2.

X, Z, W, Q e T: matrizes de incidência para b, a, c1, r, p e e, respectivamente.


=

=

2

2

2

2

2

2

2

2

2

2

2

1

2

1

2

1

12

11

2

122

11

2

1

2

1

2

1

12

11

2

1

2

1

2

1

2

1

212

121

12

11

212

121

000000000

000000000

000000000

000000000

00000000

00000000

000000000

000000000

00000000

00000000

;

0

0

0

0

0

0

0

0

0

0

e

e

p

p

rr

rr

c

c

aa

aa

I

I

I

I

II

II

I

I

AA

AA

e

e

p

p

r

r

c

c

a

a

Var

bX

bX

e

e

p

p

r

r

c

c

a

a

y

y

E

σσ

σσ

σσσσ

σσ

σσσσ

22

222

222

222

2222

21

211

211

211

2111

222122

111111

'''')(

'''')(

eprca

eprca

ITITQIQWIWZAZVyVar

ITITQIQWIWZAZVyVar

σσσσσ

σσσσσ

++++==

++++==, em que:

22

21 aa e σσ : variâncias genéticas aditivas nos locais 1 e 2, respectivamente;

12aσ : covariância genética aditiva entre os locais 1 e 2 ou variância aditiva

livre da interação;

48 Documentos, 47

22

1211 cc e σσ : variâncias entre parcelas (referentes a progênies) nos locais 1 e 2,

respectivamente;

22

21 rr e σσ : variâncias entre procedências nos locais 1 e 2, respectivamente;

12rσ : covariância genética entre os locais 1 e 2, ao nível do efeito de

procedências;

22

21 pp e σσ : variâncias permanentes nos locais 1 e 2, respectivamente;

22

21 ee e σσ : variâncias residuais nos locais 1 e 2, respectivamente;


=

+ℜ+

++

−

−

−

−

−

−−−−−−

−−−−−−

−−−−−−

−−−−−−

−−−−−

yRT

yRQ

yRW

yRZ

yRX

p

r

c

a

b

CTRTQRTWRTZRTXRT

TRQQRQWRQZRQXRQ

TRWQRWCWRWZRWXRW

TRZQRZWRZGZRZXRZ

TRXQRXWRXZRXXRX

1

1

1

1

1

1

12

11111

111111

111111

111111

11111

'

'

'

'

'

ˆ

ˆ

ˆ

ˆ

ˆ

'''''

'''''

'''''

'''''

'''''

1

,

em que:

=

=

=

=ℜ

=

⊗=⊗=⊗ℜ=ℜ⊗=⊗= −−−−−−−−−−−

2

2

2

2

02

2

102

2

2

2

1110

111110

11

111

2

1

2

1

12

11

212

121

212

121

0

0;

0

0;

0

0;;

;;;;

e

eO

p

p

c

c

rr

rrO

aa

aaO

OOO

RPCG

IRRIPPIICCAGG

σσ

σσ

σσ

σσσσ

σσσσ

Os componentes de variância estão associados aos parâmetros

ijij ra epch ρρ,,, 221

2 , da seguinte maneira:

:,;;

;)1(;;;

222

22221

22222221

2222

1

queemr

rpchpch

jiijijjiijijii

iiiiiiii

rrrraaaayir

yiiiieyipyicyia

σσρσσσρσσσ

σσσσσσσσ

===

−−−−====

49Documentos, 47

ji

ij

ij

aa

a

a σσσ

ρ = : correlação genética entre o desempenho dos indivíduos nos locais

i e j;

ji

ij

ij

rr

r

r σσσ

ρ = : correlação genética entre o desempenho das procedências nos

locais i e j;

2

iyσ : variância fenotípica individual no local i.

A variância da interação indivíduo x local, para o caso balanceado, édada por:

.)1()(2

1 22


A variância da interação procedência x local, para o caso balanceado, édada por:

.)1()(2

1 22

jiijji rrrrrre σσρσσσ −+−=




Experimento Indivíduo Pai Mãe Bloco Parcela1 Procedência Parcela2 Variável 1 . . . Variável n

50 Documentos, 47

4.4 Delineamento em látice, progênies de polinização aberta, umapopulação

4.4.1 Avaliação de progênies de meios irmãos, no delineamentoem látice, com várias plantas por parcela, uma mediçãopor indivíduo, um só caráter e uma só população

Modelo linear misto (modelo aditivo univariado, em látice)

y = Xb + Za + Wc + H¶ + e, em que

y, b, a, c, ¶ e e: vetores de dados, dos efeitos de repetições (fixos), de efeitosgenéticos aditivos (aleatórios), dos efeitos de parcela (aleatório), dos efeitosaleatórios de blocos dentro de repetições e de erros aleatórios, respectivamente.

X, Z, W e H: matrizes de incidência para b, a, c e ¶, respectivamente.


),0(~

),0(~

),0(~

),0(~,

),(~,

22

22

22

22

ee

cc

aa

INe

IN

INc

ANAa

VXbNVby

σσ

σσ

σσ

σσ

∂∂∂


Assim:

=

∂

=

∂RR

BBH

CCW

GGZ

RHBWCZGV

e

c

a

y

Vare

Xb

e

c

a

y

E

000

000'

000'

000'

0

0

0

0

, em que:

51Documentos, 47

.'''''' 2222

2

2

2

2

RHBHWCWZGZIHIHWWIZZAV

IR

IB

IC

AG

eca

e

c

A

+++=+++=

=

=

=

=

∂

∂

σσσσσσσσ


=

∂

++

+ −

yH

yW

yZ

yX

c

a

b

IHHWHZHXH

HWIWWZWXW

HZWZAZZXZ

HXWXZXXX

'

'

'

'

ˆˆ

ˆ

ˆ

''''

''''

''''

''''

3

2

11

λλ

λ, em que:

2

222

2

2

32

222

2

2

22

222

2

2

1

11;

1∂

∂−−−==∂−−−==∂−−−==∂

ch

c

ch

h

ch e

c

e

a

e

σσλ

σσλ

σσλ

2222

22

∂+++=

σσσσσ

eca

ah : herdabilidade individual no sentido restrito, na

repetição;

)/( 222222∂+++= σσσσσ ecacc : correlação devida ao ambiente comum da parcela;

)/( 222222∂∂ +++=∂ σσσσσ eca : correlação devida ao ambiente comum do bloco

dentro de repetição;

2aσ : variância genética aditiva;

2cσ : variância entre parcelas;

2∂σ : variância entre blocos dentro de repetições;

2eσ : variância residual (ambiental dentro de parcelas + não aditiva);

A: matriz de correlação genética aditiva entre os indivíduos em avaliação.

52 Documentos, 47


)](/[]''ˆ''ˆ''ˆ''ˆ'[ˆ 2 xrNyHyWcyZayXbyye −∂−−−−=σ ;


sCtrcc ec /]ˆ'ˆ[ˆ 3322 σσ += ;

ησσ /]ˆˆ'ˆ[ˆ 4422 Ctre+∂∂=∂ , em que:

C22 , C33 e C44 advém da inversa da matriz dos coeficientes das equaçõesde modelo misto.

tr : operador traço matricial;

r(x) : posto da matriz X;

N, q, s, h : número total de dados, número de indivíduos, número deparcelas e número de blocos, respectivamente.


Indivíduo Pai Mãe Repetição Parcela Bloco Variável 1 . . . Variável n

Neste caso, é necessário apenas um arquivo o qual funciona ao mesmotempo como arquivo de pedigree e como arquivo de dados. Deve ser executadoo subprograma DFPREP e, em seguida, o DFUNI.

4.4.2 Avaliação de progênies de meios irmãos, no delineamentoem látice, com várias plantas por parcela, várias mediçõespor indivíduo, um só caráter e uma só população

Modelo linear misto (modelo aditivo univariado, de repetibilidade, emlátice)

y = Xb + Za + Wc + Tp + H¶ + e, em que:

p: vetor de efeitos permanentes (ambiente permanente dentro de parcela +efeitos genéticos não aditivos);

T: matriz de incidência para p.

53Documentos, 47

Neste modelo, pode ser ajustado um único efeito (denominado combinaçãorepetição-medição), procedimento este que é estatisticamente correto ecomputacionalmente desejável e necessário.


),0(~

),0(~

),0(~

),0(~

),0(~,

),(~,

22

22

22

22

22

ee

pp

cc

aa

INe

IN

INp

INc

NAa

VXbNVby

σσ

σσ

σσ

σσ

σσ

∂∂∂

As covariâncias entre todos os efeitos aleatórios dos modelos sãoassumidas como nulas.

Assim:

=

∂

=

∂RR

BBH

PPT

CCW

GGZ

RHBTPWCZGV

e

p

c

a

y

Var

Xb

e

p

c

a

y

E

0000

0000'

0000'

0000'

0000'

;

0

0

0

0

0

, em que:

.'''' 22222

2

epca

p

IHHITTIWWIZZAV

IP

σσσσσ

σ

++++=

=

∂

54 Documentos, 47


=

∂

++

++ −

yH

yT

yW

yZ

yX

p

c

a

b

IHHTHWHZHXH

HTITTWTZTXT

HWTWIWWZWXW

HZTZWZAZZXZ

HXTXWXZXXX

'

'

'

'

'

ˆˆ

ˆ

ˆ

ˆ

'''''

'''''

'''''

'''''

'''''

4

3

2

11

λλ

λλ

, em

que:

.11

;1

;1

2

2

242

2

232

2

222

2

21∂

=∂−==−==−==−=

σσρλ

σσρλ

σσρλ

σσρλ e

p

e

c

e

a

e

pch

22222

22

∂++++=

σσσσσσ

epca

ah : herdabilidade individual no sentido restrito, na

repetição, em uma dada medição;

22222

2222

∂

∂

+++++++

=σσσσσ

σσσσρ

epca

pca: repetibilidade individual na repetição;

22222

22

∂++++=

σσσσσσ

epca

pp : coeficiente de determinação dos efeitos

permanentes dentro de parcela;

22222

22

∂++++=

σσσσσσ

epca

cc : correlação devida ao ambiente comum de parcela;

22222

22

∂

∂

++++=∂

σσσσσσ

epca: correlação devida ao ambiente comum do bloco.

55Documentos, 47


)](/[]''ˆ''ˆ''ˆ''ˆ''ˆ'[ˆ 2 xrNyHyTpyWcyZayXbyye −∂−−−−−=σ




ησσ /]ˆˆ'ˆ[ˆ 5522 Ctre+∂∂=∂ , em que:

C22, C33, C44 e C55 advém da inversa da matriz dos coeficientes dasequações de modelo misto.


Indivíduo Pai Mãe Repetição-Medição Parcela Permanente Bloco Variável 1 . . . Variável n

É necessário apenas um arquivo, o qual funciona simultaneamente comoarquivo de dados e como arquivo de pedigree. Devem ser executadosseqüencialmente os subprogramas DFPREP e DFUNI.

4.4.3 Avaliação de progênies de meios irmãos, no delineamentoem látice, com várias plantas por parcela, uma mediçãopor indivíduo e um só caráter, avaliado em váriosexperimentos com algumas progênies ou tratamentoscomuns

Modelo linear misto (modelo aditivo multivariado, em látice)


+

∂∂

+

+

+

=

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

0

0

0

0

0

0

0

0

e

e

H

H

c

c

W

W

a

a

Z

Z

b

b

X

X

y

y

56 Documentos, 47


;

0

0

0

0

0

0

0

022

11

2

1

2

1

2

1

2

1

2

1

=

∂∂

bX

bX

e

e

c

c

a

a

y

y

E

=

∂∂

∂

∂

2

2

2

2

2

2

2

2

2

1

2

1

2

1

2

1

2

1

2

1

2

1

212

121

0000000

0000000

0000000

0000000

0000000

0000000

000000

000000

e

e

c

c

aa

aa

I

I

I

I

I

I

AA

AA

e

e

c

c

a

a

Var

σσ

σσ

σσ

σσσσ

,

em que:

.22

21 ∂∂ σσ e = variância permanente entre blocos dentro de repetições nos locais

1 e 2, respectivamente.


=

∂

++

+

−

−

−

−

−−−−−

−−−−−

−−−−−

−−−−

yRH

yRW

yRZ

yRX

c

a

b

BHRHWRHZRHXRH

HRWCWRWZRWXRW

HRZWRZGZRZXRZ

HRXWRXZRXXRX

1

1

1

1

11111

11111

11111

1111

'

'

'

'

ˆˆ

ˆ

ˆ

''''

''''

''''

''''

, em

que:

∂∂=∂=

=

=

=

=

2

1

2

1

2

1

2

1

2

1

ˆ

ˆˆ;

ˆ

ˆˆ;

ˆ

ˆˆ;

ˆ

ˆˆ;

c

cc

a

aa

b

bb

y

yy

=

=

=

=

⊗=⊗=⊗=⊗=

∂

∂

−−−−−−−−−

2

2

2

2

2

2

2

2

111111111

2

1

2

1

212

121

2

1

0

0;

0

0;;

0

0

;;;

σσ

σσ

σσσσ

σσ

Oc

cO

aa

aaO

e

eO

OOOO

BCGR

IBBICCAGGIRR

57Documentos, 47

Os componentes de variância estão associados aos parâmetros h2, c2,¶2 e r a, da seguinte maneira:

jiijijiiiiiiii aaaayiiiyicyieyia chch σσρσσσσσσρσσσ =−−∂==−== ∂ ;)(;;)1(; 2222222222222


Nesta situação são recomendados os algoritmos AI (preferencialmenteeste) e DF. A função geral a ser maximizada é aquela descrita no item 2.

Seqüência de colunas de dados para análise no software DFREML

Experimento Indivíduo Pai Mãe Repetição Parcela Bloco Variável 1 . . . Variável n

São necessários dois arquivos, o de dados e um de pedigree formadopelas colunas Indivíduo Pai Mãe. Devem ser executados os subprogramasDFPREP e DXMUX.

4.4.4 Avaliação de progênies de meios irmãos, no delineamentoem látice, com várias plantas por parcela, várias mediçõespor indivíduo e um só caráter, avaliado em váriosexperimentos com algumas progênies ou tratamentoscomuns

Modelo linear misto (modelo aditivo multivariado, de repetibilidade, emlátice)

y = Xb + Za + Wc + Tp +H¶ + e que, para o caso bivariado eqüivale a:

+

∂∂

+

+

+

+

=

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

0

0

0

0

0

0

0

0

0

0

e

e

H

H

p

p

T

T

c

c

W

W

a

a

Z

Z

b

b

X

X

y

y

58 Documentos, 47


=

∂∂

=

∂∂ ∂

∂

2

2

2

2

2

2

2

2

2

2

2

1

2

1

2

1

2

1

2

122

11

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

212

121

000000000

000000000

000000000

000000000

000000000

000000000

000000000

000000000

00000000

00000000

;

0

0

0

0

0

0

0

0

0

0

e

e

p

p

c

c

aa

aa

I

I

I

I

I

I

I

I

AA

AA

e

e

p

p

c

c

a

a

Var

bX

bX

e

e

p

p

c

c

a

a

y

y

E

σσ

σσ

σσ

σσ

σσσσ


=

∂

++

++

−

−

−

−

−

−−−−−−

−−−−−−

−−−−−−

−−−−−−

−−−−−

yRH

yRT

yRW

yRZ

yRX

p

c

a

b

PHRHTRHWRHZRHXRH

HRTPTRTWRTZRTXRT

HRWTRWCWRWZRWXRW

HRZTRZWRZGZRZXRZ

HRXTRXWRXZRXXRX

1

1

1

1

1

111111

111111

111111

111111

11111

'

'

'

'

'

ˆˆ

ˆ

ˆ

ˆ

'''''

'''''

'''''

'''''

'''''

,

em que:

=

=

=

=

=

⊗=⊗=⊗=⊗=⊗=

∂

∂

−−−−−−−−−−−

2

2

2

2

2

2

2

2

2

2

11111111111

2

1

2

1

2

1

212

121

2

1

0

0;

0

0;

0

0;;

0

0

;;;;

σσ

σσ

σσ

σσσσ

σσ

Op

pO

c

cO

aa

aaO

e

eO

OOOOO

BPCGR

IBBIPPICCAGGIRR


Neste caso, é recomendado o algoritmo AI. A função geral a sermaximizada é aquela descrita no item 2.

Software

Para esta situação recomenda-se o uso do software ASREML, o qualexige um arquivo de programa específico com extensão. as.

59Documentos, 47

4.5. Delineamento em látice, progênies de polinização aberta,várias populações

4.5.1 Avaliação de progênies de meios irmãos (polinização aberta)de várias populações (procedências), no delineamento emlátice, com várias plantas por parcela, uma medição porindivíduo e um só caráter


Modelo linear misto (modelo aditivo univariado, multi-populações, emlátice)

y = Xb + Za + Wc1 + H¶ + Qr + Uc2 + e, em que:

b = vetor de efeitos fixos (repetições, significando que os valores individuaisserão ajustados para a média da repetição);

¶ = vetor de efeitos aleatórios dos blocos dentro de repetições;

H = matriz de incidência para ¶.


),0(~

),0(~

),0(~

),0(~

),0(~

),0(~,

),(~,

22

22

22

222

221

22

22

11

ee

rr

cc

cc

aa

INe

IN

INr

INc

INc

ANAa

VXbNVby

σσ

σσ

σσ

σσ

σσ

σσ

∂∂∂


60 Documentos, 47

Assim:

=

∂

=

∂ ∂

2

2

2

2

2

2

2

1

2

1

0

0

0

0

0

00000

0000

0000

0000

0000

0000

0

0

0

0

0

0

2

1

e

c

r

c

a

I

I

I

I

I

A

e

c

r

c

a

Vare

Xb

e

c

r

c

a

y

E

σσ

σσ

σσ

.''''')( 222222

21 ecrca IUUIQQIHHIWWIZZAyVar σσσσσσ +++++= ∂


=

∂

++

++

+ −

yU

yQ

yH

yW

yZ

yX

c

r

c

a

b

IUUQUHUWUZUXU

UQIQQHQWQZQXQ

UHQHIHHWHZHXH

UWQWHWIWWZWXW

UZQZHZWZAZZXZ

UXQXHXWXZXXX

'

'

'

'

'

'

ˆ

ˆ

ˆˆ

ˆ

ˆ

''''''

''''''

''''''

''''''

''''''

''''''

2

1

5

4

3

2

11

λλ

λλ

λ

,

em que:

.1

;1

;1

;1

;1

22

222

221

2

2

2

5

2

222

221

2

2

2

4

2

222

221

2

2

2

3

21

222

221

2

2

2

2

2

222

221

2

2

2

1

2

1

c

crch

r

crch

crch

c

crch

h

crch

c

e

r

e

e

c

e

a

e

∂−−−−−==

∂−−−−−==

∂∂−−−−−==

∂−−−−−==

∂−−−−−==

∂

σσλ

σσλ

σσλ

σσλ

σσλ

61Documentos, 47

222222

22

21 ecrca

ahσσσσσσ

σ+++++

=∂

;

222222

221

21

1

ecrca

ccσσσσσσ

σ+++++

=∂

;

222222

22

21 ecrca

rrσσσσσσ

σ+++++

=∂

;

222222

222

21

2

ecrca

ccσσσσσσ

σ+++++

=∂

;

222222

22

21 ecrca σσσσσσσ

+++++=∂

∂

∂


)](/[]''ˆ''ˆ''ˆ''ˆ''ˆ''ˆ'[ˆ 212 xrNyUcyQryHyWcyZayXbyye −−−∂−−−−=σ


1332

112 /]ˆˆ'ˆ[ˆ1

sCtrcc ec σσ += ;

ησσ /]ˆˆ'ˆ[ˆ 4422 Ctre+∂∂=∂


2662

222 /]ˆˆ'ˆ[ˆ2

sCtrcc ec σσ += .


Indivíduo Pai Mãe Repetição Parcela1 Bloco Procedência Parcela2 Variável 1 . . . Variável n

É necessário apenas um arquivo, o qual funciona ao mesmo tempo como

62 Documentos, 47

arquivo de pedigree e de dados. Deve ser executado o subprograma DFPREP eem seguida o DFUNI.

O mérito genético total de cada indivíduo é dado pelo somatório do efeitogenético aditivo predito com o efeito da procedência a que pertence tal indivíduo.

4.5.2 Avaliação de progênies de meios irmãos (polinização aberta)de várias populações (procedências), no delineamento emlátice, com várias plantas por parcela, várias medições porindivíduo e um só caráter

Considerando-se as situações (i) (a), (i) (b), (ii) (a) e (ii) (b) descritas notópico 4.3.1, tem-se que:

- na situação (ii) (a), basta ajustar no vetor de efeitos fixos, os efeitos deprocedência e da combinação repetição-medição e adotar o modelo,estimadores e preditores apresentados no tópico 4.4.2.

- na situação (i) (a), basta ajustar no vetor de efeitos fixos, o efeito da combinaçãorepetição-procedência-medição (com bpm níveis, em que p, b e m são osnúmeros de procedências, repetições e medições, respectivamente). Nestecaso, as observações individuais na medição são ajustadas para a média daprocedência na repetição, em uma dada medição. O modelo, estimadores epreditores apresentados no tópico 4.4.2. devem ser empregados.

Para as situações (i)(b) e (ii) (b), excluindo (em caso de não significância)o efeito c2 em ambas, tem-se os modelos, estimadores e preditores descritos aseguir.

Modelo linear misto (modelo aditivo univariado, multi-populações, derepetibilidade, em látice)

y = Xb + Za + Wc1 + Tp + Qr + H¶ + e, em que:

b : vetor de efeitos fixos (no caso, combinações repetição-medição, significandoque os valores individuais na medição serão ajustados para a média darepetição na medição);

p : vetor de efeitos permanentes (ambiente permanente dentro de parcela +efeitos genéticos não aditivos);

T : matriz de incidência para p.

63Documentos, 47


),0(~

),0(~

),0(~

),0(~

),0(~

),0(~,

),(~,

22

22

22

22

221

22

11

ee

pp

rr

cc

aa

INe

INp

INr

IN

INc

ANAa

VXbNVby

σσ

σσ

σσ

σσ

σσ

σσ

∂∂∂


Assim:

=

∂

=

∂ ∂2

2

2

2

2

2

11

0

0

0

0

0

00000

0000

0000

0000

0000

0000

0

0

0

0

0

01

e

r

p

c

a

I

I

I

I

I

A

e

r

p

c

a

Vare

Xb

e

r

p

c

a

y

E

σσ

σσ

σσ

.''''')( 222222

1 erpca IHHIQQITTIWWIZZAyVar σσσσσσ +++++= ∂


=

∂

++

++

+ −

yH

yQ

yT

yW

yZ

yX

r

p

c

a

b

IHHQHTHWHZHXH

HQIQQTQWQZQXQ

HTQTITTWTZTXT

HWQWTWIWWZWXW

HZQZTZWZAZZXZ

HXQXTXWXZXXX

'

'

'

'

'

'

ˆˆ

ˆ

ˆ

ˆ

ˆ

''''''

''''''

''''''

''''''

''''''

''''''

1

5

4

3

2

11

λλ

λλ

λ

, em que:

64 Documentos, 47

.1

;1

;1

;1

;1

2

22221

2

2

2

5

2

22221

2

2

2

4

2

22221

2

2

2

3

21

22221

2

2

2

2

2

22221

2

2

2

1

1

∂−∂−−−−

==

−∂−−−−==

−∂−−−−==

−∂−−−−==

−∂−−−−==

∂

prch

r

prch

p

prch

c

prch

h

prch

e

r

e

p

e

c

e

a

e

σσλ

σσλ

σσλ

σσλ

σσλ

222222

22

1 eprca

ahσσσσσσ

σ+++++

=∂

;

222222

221

1

1

eprca

ccσσσσσσ

σ+++++

=∂

;

222222

22

1 eprca

rrσσσσσσ

σ+++++

=∂

;

222222

22

1 eprca σσσσσσσ

+++++=∂

∂

∂;

222222

22

1 eprca

ppσσσσσσ

σ+++++

=∂

.

Neste modelo, a repetibilidade é dada por

222222

22222

1

1

eprca

prca

σσσσσσσσσσσ

ρ+++++

++++=

∂

∂.

65Documentos, 47


)](/[]''ˆ''ˆ''ˆ''ˆ''ˆ''ˆ'[ˆ 12 xrNyHyQryTpyWcyZayXbyye −∂−−−−−−=σ


1332

112 /]ˆˆ'ˆ[ˆ1

sCtrcc ec σσ += ;



ησσ /]ˆˆ'ˆ[ˆ 6622 Ctre+∂∂=∂ .


Indivíduo Pai Mãe Repetição Parcela1 Permanente Procedência Bloco Variável 1. . . Variável n

É necessário apenas um arquivo, o qual funciona ao mesmo tempo comode pedigree e de dados. Deve ser executado o subprograma DFPREP e emseguida o DFUNI.

O mérito genético total de cada indivíduo é dado pelo somatório do efeitogenético aditivo predito com o efeito da procedência a que pertence tal indivíduo.

4.6 Avaliação apenas de populações

4.6.1 Avaliação de várias populações (procedências), nodelineamento em blocos ao acaso, com várias plantas porparcela, uma medição por indivíduo e um só caráter

Modelo linear misto (modelo aditivo univariado, multi-populações, semparentesco)

y = Xb + Za + Wc + Qr + e, em que:

66 Documentos, 47

y, b, a, c, r e e: vetores de dados, dos efeitos de blocos (fixos), de efeitosgenéticos aditivos dos indivíduos (aleatórios), de efeitos deparcela (aleatórios), de efeitos de procedências (aleatórios)e de erros aleatórios, respectivamente.

X, Z, W e Q: matrizes de incidência para b, a, c, r e e, respectivamente.


0)',(;0)',(;0)',(

;0)',(;0)',(;0)',(

),0(~

),0(~

),0(~

),0(~,

),(~,

22

22

22

22

===

===

ecCoverCovcrCov

eaCovraCovcaCov

INe

INr

INc

NAa

VXbNVby

ee

rr

cc

aa

σσ

σσ

σσ

σσ

ou seja:

ℜℜ

ℜ

=

=

RR

Q

CCW

GGZ

RQWCZGV

e

r

c

a

y

Var

Xb

e

r

c

a

y

E

000

000'

000'

000'

;

0

0

0

0

, em que:

2

2

2

e

c

A

IC

IR

AG

σσσ

=

=

=

.''' 2222

2

epca

r

IQQIWWIZZAV

I

σσσσσ

+++=

=ℜ

67Documentos, 47


=

++

+ −

yQ

yW

yZ

yX

r

c

a

b

IQQWQZQXQ

QWIWWZWXW

QZWZAZZXZ

QXWXZXXX

'

'

'

'

ˆ

ˆ

ˆ

ˆ

''''

''''

''''

''''

3

2

11

λλ

λ, em que:

.1

;1

;1

2

2

2

222

32

2

2

222

22

2

2

222

1r

e

c

e

a

e

r

rch

c

rch

h

rch

σσλ

σσλ

σσλ =−−−==−−−==−−−=

2222

22

erca

ahσσσσ

σ+++

= : herdabilidade individual no sentido restrito no

bloco, em uma dada medição;

2222

22

erca

rrσσσσ

σ+++

= : coeficiente de determinação dos efeitos de

procedência;

2222

22

erca

ccσσσσ

σ+++

= : correlação devida ao ambiente comum de

parcela.

Estimadores dos componentes de variância por REML via algoritmo EM

)](/[]''ˆ''ˆ''ˆ''ˆ'[ˆ 2 xrNyQryWcyZayXbyye −−−−−=σ



tCtrrr er /]ˆˆ'ˆ[ˆ 4422 σσ += , em que:

C22, C33 e C44 advém de:

68 Documentos, 47

=

=

−

−

44434241

34333231

24232221

141312111

44434241

34333231

24232221

14131211

1

CCCC

CCCC

CCCC

CCCC

CCCC

CCCC

CCCC

CCCC

C


Indivíduo Pai Mãe Bloco Parcela Procedência Variável 1 . . . Variável n

É necessário apenas um arquivo, o qual funciona simultaneamente comoarquivo de dados e como arquivo de pedigree. Devem ser executadosseqüencialmente os subprogramas DFPREP e DFUNI. As colunas referentes aPai e Mãe devem ser preenchidas com zero, a herdabilidade deve ser conhecidaa priori e seu valor fixado no DFREML.

O mérito genético total dos indivíduos é dado pela soma .ˆ* râa +=

4.7. Avaliação simultânea de caracteres

4.7.1 Avaliação de progênies de meios irmãos, no delineamentoem blocos ao acaso, com várias plantas por parcela, umamedição por indivíduo e vários caracteres, em um só local


+

+

+

=

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

0

0

0

0

0

0

e

e

c

c

W

W

a

a

Z

Z

b

b

X

X

y

y

69Documentos, 47


;

0

0

0

0

0

022

11

2

1

2

1

2

1

2

1

=

bX

bX

e

e

c

c

a

a

y

y

E

=

2

2

2

2

2

2

2

1

2

1

2

1

2

12

12

1

212

121

212

121

0

0

0

0

0000

0000

000

000

000

000

e

e

e

e

cc

cc

aa

aa

I

I

I

I

II

II

AA

AA

e

e

c

c

a

a

Var

σσ

σσ

σσσσ

σσσσ

22

222

2222

21

211

2111

222

111

'')(

'')(

eca

eca

IWIWZAZVyVar

IWIWZAZVyVar

σσσ

σσσ

++==

++==

em que:

22

21 aa e σσ : variâncias genéticas aditivas dos caracteres 1 e 2, respectivamente;

12aσ : covariância genética aditiva envolvendo os caracteres 1 e 2,

respectivamente;

1221

22 , ccc e σσσ : variâncias entre parcelas, para os caracteres 1 e 2 e

covariância entre os 2 caracteres ao nível do efeito deparcela, respectivamente;

1221

22 , eee e σσσ : variâncias residuais, para os caracteres 1 e 2 e covariância

entre os 2 caracteres ao nível do efeito residual,respectivamente.

70 Documentos, 47


=

++

−

−

−

−−−−

−−−−

−−−

yRW

yRZ

yRX

c

a

b

CWRWZRWXRW

WRZGZRZXRZ

WRXZRXXRX

1

1

1

1111

1111

111

'

'

'

ˆ

ˆ

ˆ

'''

'''

'''

, em que:

;ˆ

ˆˆ;

ˆ

ˆˆ;

2

1

2

1

2

1

=

=

=

c

cc

b

bb

y

yy

;;;

;;;

2

2

2

2

2

2

1111111

212

121

212

111

212

121

=

=

=

⊗=⊗=⊗= −−−−−−−

cc

ccO

aa

aaO

ee

eeO

OOO

CGR

ICCAGGIRR

σσσσ

σσσσ

σσσσ

Os componentes de variância estão associados aos parâmetros h2, c2 er a, da seguinte maneira:

jiijijiiiiii aaaayiieyicyia chch σσρσσσσσσσ =−−=== ;)1(;; 2222222222, em

que:

ji

ij

ij

aa

a

aσσ

σρ = = correlação genética aditiva entre os caracteres i e j;


Nesta situação são recomendados os algoritmos AI (preferencialmenteeste) e DF. A função geral a ser maximizada é aquela descrita no item 2.

Seqüência de colunas de dados para análise no software DFREML

Experimento Indivíduo Pai Mãe Bloco Parcela Variável 1 . . . Variável n

São necessários dois arquivos, o de dados e um de pedigree, formadopelas colunas Indivíduo Pai Mãe. Devem ser executados os subprogramasDFPREP e DXMUX.

A estimação e predição simultânea de caracteres utiliza os mesmosmodelos apresentados nos itens 4.1.3, 4.1.4, 4.2.3, 4.2.4, 4.3.3, 4.3.4, 4.4.3

71Documentos, 47

e 4.4.4, diferindo apenas nas estruturas de variâncias, as quais devem assumiras covariâncias entre caracteres referentes aos efeitos de parcela e residuais,como diferentes de zero.

Outras situações podem ocorrer, como a avaliação simultânea de várioscaracteres, em vários locais. Neste caso, as estruturas de variâncias devemassumir as covariâncias referentes aos efeitos de parcela como zero, nascombinações envolvendo caracteres em diferentes locais e, como diferentesde zero nas combinações envolvendo os vários caracteres em um só local. Omesmo comentário aplica-se ao efeito residual.

5. Predição de Valores Genéticos e Genotípicos Interpopulacionais(Interespecíficos)

5.1. Híbridos envolvendo duas espécies ou populações

Neste caso, o valor genotípico de um híbrido é dado por:

)12()12()12()12( daG ++= µ

)12()12(2112)12(21 )(2

1)(

2

1maah ++++++= δµµ , em que:

)12(µ : média geral da população híbrida;

)12(a : efeito genético aditivo de um indivíduo híbrido;

)12(d : efeito de dominância de um indivíduo híbrido;

21 µµ e : média geral das populações 1 e 2, respectivamente;

)12(h : heterose no cruzamento entre as populações 1 e 2;

2112 aea : efeitos genéticos aditivos dos genitores das populações 1 e 2,respectivamente, em cruzamento com a população recíproca;

)12(δ : efeito de dominância associado à família de irmãos germanos (capacidadeespecífica de combinação entre os genitores das populações 1 e 2);

)12(m : efeito da segregação mendeliana, contemplando uma fração aditiva eoutra dominante.

72 Documentos, 47

Verificam-se assim, as igualdades:

)12(21)12( )(2

1h++= µµµ

)12()12(2112)12()12( )(2

1maada +++=+ δ

A partir deste modelo geral, quatro situações práticas podem serconsideradas:

(i) Predição do comportamento da progênie híbrida com base eminformações prévias de m1, m2, a12, a21 e h(12)

Neste caso, )ˆˆ(2

1ˆ)ˆˆ(2

1ˆ2112)12(21)12( aahG ++++= µµ , ou seja, tendo-se

informações sobre as médias das populações, da heterose entre as mesmas edos efeitos genéticos aditivos interpopulacionais dos genitores a serem cruzados,pode-se predizer a descendência híbrida. Se a correlação entre os efeitosgenéticos aditivos interpopulacionais (a12 e a21) e intrapopulacionais (a11 e a22)for alta, os últimos podem ser utilizados em lugar dos primeiros.

(ii) Seleção e recombinação de genitores em programas de seleçãorecorrente recíproca ou seleção recorrente intrapopulacional nas duaspopulações

Neste caso, a seleção dos genitores a serem recombinados deve basear-se no valor genético aditivo interpopulacional dado por:

12)12(12)12(21)12( ˆˆˆˆ)ˆˆ(2

1ˆ aaha +=+++=∗ µµµ na população 1 e

21)12(21)12(21)21( ˆˆˆˆ)ˆˆ(2

1ˆ aaha +=+++=∗ µµµ na população 2.

No caso de alta correlação genética entre os efeitos aditivos

interpopulacionais e intrapopulacionais, os últimos )ˆˆ( 2211 aea podem ser usados

em lugar da )ˆ( 2112 âea e programas de seleção recorrente intrapopulacionalpodem ser adotados, com eficiência.

(iii) Capitalização da capacidade específica de combinação via plantioscomerciais por sementes

Neste caso, torna-se necessária a avaliação de progênies de irmãosgermanos interpopulacionais (híbridos) obtidos sob cruzamentos dialélicos,

73Documentos, 47

fatoriais ou hierárquicos e o valor genotípico predito da descendência no plantiocomercial é dado por

)12(2112)12(

)12(2112)12(21)12(

ˆ)ˆˆ(2

1ˆ

ˆ)ˆˆ(2

1ˆ)ˆˆ(2

1ˆ

δµ

δµµ

+++=

+++++=

aa

aahG

(iv) Seleção de híbridos superiores para a clonagem

Neste caso, torna-se necessária a avalição de progênies de irmãosgermanos interpopulacionais, obtidos sob cruzamentos fatoriais, dialélicos ouhierárquicos ou a realização de testes clonais com indivíduos híbridos. Nestasituação, os valores genotípicos totais dos indivíduos são dados por

)12()12()12()12(ˆˆˆˆ daG ++= µ .

Em geral, dois esquemas de avaliação de progênies são utilizados:

(a) Apenas avaliação de progênies interpopulacionais

Nesta situação, dois modelos de análise podem ser adotados:

(a.1.) Avaliação integral de a(12) e d(12) a partir de cruzamentos dialélicos,fatoriais ou hierárquicos

Neste caso, tem-se o seguinte modelo linear misto (modelo univariadoaditivo-dominante).

y = Xb + Za(12) + Zd(12) + Wc + e, em que:

y, b, a(12), d(12), c, e: vetores de dados, de efeitos de blocos (fixos), de efeitosgenéticos aditivos (aleatórios), de efeitos de dominância(aleatórios), de efeitos de parcela (aleatórios) e de errosaleatórios, respectivamente.

X, Z e W: matrizes de incidência para b, a(d) e c, respectivamente.

Estrutura de médias de variâncias

=

=

2

2

2

2

)12(

)12(

)12(

)12(

000

000

000

000

0

0

0

0)12(

)12(

e

c

d

a

I

I

D

A

e

c

d

a

Vare

Xb

e

c

d

a

y

E

σσ

σσ

74 Documentos, 47

2222 ''')()12()12( eeda IWIWZDZZAZyVar σσσσ +++= , em que:

2

)12(aσ : variância genética aditiva interpopulacional;

2

)12(dσ : variância de dominância interpopulacional;

2cσ : variância entre parcelas;

2eσ : variância ambiental dentro de parcelas;

A e D: matrizes de correlação genética aditiva e de dominância entre os indivíduosem avaliação, respectivamente.


=

++

+−

−

yW

yZ

yZ

yX

c

d

a

b

IWWZWZWXW

WZDZZZZXZ

WZZZAZZXZ

WXZXZXXX

'

'

'

'

ˆ

ˆˆ

ˆ

''''

''''

''''

''''

)12(

)12(

3

21

11

λλ

λ, em que:

.1

;1

;1

2

22

2

2

32)12(

2

22

2

2

22)12(

22

2

2

1)12(

)12(

)12(

)12(

)12(

)12(c

ch

hh

ch

h

ch a

c

e

a

a

d

ea

a

e−−

==−

−−==

−−==

σσλ

σσλ

σσλ

22)12( )12(aheh : herdabilidades individuais interpopulacionais no sentido restrito e

amplo, respectivamente.c2 : correlação intraclasse devida ao ambiente comum da parcela.

Estimadores iterativos de máxima verossimilhança restrita (REML) peloalgoritmo EM

)](/[]''ˆ''ˆ''ˆ''ˆ'[ˆ )12()12(2 xrNyWcyZdyZayXbyye −−−−−=σ

qCAtraAa ea /)](ˆˆ'ˆ[ˆ 2212)12(

1)12(

2)12(

−− += σσ

qCDtrdDd ed /](ˆˆ'ˆ[ˆ 3312)12(

1)12(

2)12(

−− += σσ


75Documentos, 47

Seqüência de colunas no arquivo de dados para análise pelo softwareDFREML


Este arquivo funciona ao mesmo tempo como arquivo de pedigree e dedados. Devem ser executados seqüencialmente os subprogramas DFPREP eDFUNI.

Exemplo:

Considere a avaliação dos seguintes indivíduos híbridos de Eucalyptusurophylla x E. grandis, para o caráter altura de plantas aos quatro anos deidade.

Indivíduo Bloco Pai Mãe Altura(E. grandis) (E. urophylla) (metros)

7 1 1 2 25,38 2 1 2 22,79 1 3 4 14,610 2 3 4 17,711 1 5 6 19,7

Como existe uma só planta por parcela o modelo passa a ser:

y = Xb + Za + Zd + e

As matrizes de incidência são:

=

01010

10101'X

=

10000000000

01000000000

00100000000

00010000000

00001000000

'Z

76 Documentos, 47

As matrizes de parentesco A e D são da forma:

100000000

01000000

01000000

00010000

00010000

0000100000

0000010000

000001000

000000100

000000010

000000001

11

211

211

211

211

1

1

11

11

11

11

rr

rrr

rrr

rrr

rrr

r

r

rr

rr

rr

rr

em que r2 = ½ em A e r2 = ¼ em D e r1 = ½ em A e r1 = 0 em D.

As equações de modelo misto sem os efeitos de parcela eqüivalem a:

=

++

−

−

yZ

yZ

yX

d

a

b

DZZZZXZ

ZZAZZXZ

ZXZXXX

'

'

'

ˆˆ

ˆ

'''

'''

'''

12

12

21

11

λλ

Assumindo 125,300,1,75,2 222

)12()12(=== eda e σσσ , tem-se

.125,31364,1,55,0,4,0 2122

)12( )12(==== λλ ehh a Resolvendo-se as

equações de modelo misto, tem-se:

77Documentos, 47

Efeitos Soluções

Blocos

1b 19,8667

2b 20,1803

Efeitos genéticos aditivosâ

11,2865

â2

1,2865â

3-1,2532

â4

-1,2532â

5-0,0333

â6

-0,0333â

72,3113

â8

1,5482â

9-2,2446

â10

-1,5149â

11-0,0667

Efeitos de dominância

1d 0

2d 0

3d 0

4d 0

5d 0

6d 0

7d 0,7929

8d 0,3767

9d -0,7687

10d -0,3706

11d -0,0242

78 Documentos, 47

Verifica-se que somente os efeitos de dominância associados aosindivíduos com observações puderam ser preditos. Para os genitores, somenteos efeitos aditivos foram preditos.

De posse das predições, as quatro situações práticas podem serconsideradas:

(i) Predição do comportamento da progênie híbrida

A média do cruzamento entre os genitores 1 e 6 pode ser predita por:

metros

aa

aahG

6501,20

6266,00235,20

)0333,02865,1(2

1

2

1803,208667,19

)ˆˆ(2

1ˆ

)ˆˆ(2

1ˆ)ˆˆ(2

1ˆ

61)12(

61)12(2116

=

+=

−++=

++=

++++=

µ

µµ

(ii) Seleção de genitores para seleção recorrente recíproca

O valor genético aditivo dos dois melhores genitores de E. urophylla

eqüivalem a =+==+=+= ∗∗6)12(62)12(2 ˆ3100,212865,10235,20ˆˆˆ ââeaa µµ 20,02351

� 0,0333 = 19,9902. Assim, recombinando esses indivíduos na população deE. urophylla, a contribuição desta população para o ganho no híbrido é dada por[(21,3100 + 19,9902)/2]/(20,0235)-1, que eqüivale a 3,13%.

(iii) Exploração da capacidade específica de combinação através de plantiospor sementes

O valor genotípico predito da descendência do cruzamento entre os

genitores 1 e 2 é dado por .ˆ)ˆˆ(2

1ˆˆ

)12(21)12()12( δµ +++= aaG No caso, d(12) eqüivale

à média de 87ˆˆ ded , ou seja à média dos efeitos de dominância dos indivíduos

que compõem a família 1 x 2. Assim, tem-se:

79Documentos, 47

metros

ddaaG

5214,22

)3767,07929,0(2

1)2865,12865,1(

2

16501,20

)ˆˆ(2

1)ˆˆ(

2

1ˆˆ

8721)12()12(

=

++++=

++++= µ

(iv) Seleção de indivíduos híbridos superiores para a clonagem

O valor genotípico do melhor indivíduo para clonagem é dado por:

metros

daG

7543,23

7929,03113,26501,20

ˆˆˆˆ77)12(7

=

++=

++= µ

(a.2.) Avaliação de a(12) e d(12) a partir de cruzamentos dialélicos, fatoriaisou hierárquicos

A construção e inversão da matriz de parentesco de dominância é umalimitação dos programas computacionais disponíveis. Assim, uma forma decontornar este problema é o ajuste do efeito da capacidade específica decombinação ou efeito de dominância comum a uma família de irmãos germanos.Este ajuste não requer o uso da matriz de parentesco de dominância e fornece

de maneira mais fácil a predição de d(12) e a estimação de 2

)12(dσ Entretanto, não

fornece o valor genotípico de cada indivíduo híbrido.

Modelo linear misto (modelo univariado de capacidade específica decombinação)

y = Xb + Za(12) + Wc + Sd(12) + e, em que:

d(12) é o efeito aleatório de dominância associado à família de irmãosgermanos;

S é a matriz de incidência para d (12).

A variância de d(12) contempla (1/4) 2

)12(dσ . Assim, 2

)12(dσ = 4 2

)12(δσ .

80 Documentos, 47

Estrutura de médias de variâncias

=

=

2

2

2

2

)12(

)12(

)12(

)12(

000

0)4/1(00

000

000

0

0

0

0

)12(

)12(

e

d

c

a

I

I

I

A

e

c

a

Vare

Xb

e

c

a

y

E

σσ

σσ

δδ

2222

)12()12()4/1(''')( edca ISISWIWZAZyVar σσσσ +++= , em que:


=

++

+ −

yS

yW

yZ

yX

c

a

b

ISSWSZSXS

SWIWWZWXW

SZWZAZZXZ

SXWXZXXX

'

'

'

'

ˆˆ

ˆ

ˆ

''''

''''

''''

''''

)12(

)12(

3

2

11

δλλ

λ, em que:

.;;2

2

32

2

22

2

1

)12()12( δσσλ

σσλ

σσλ e

c

e

a

e ===

Estimadores iterativos REML pelo algoritmo EM

)](/[]''ˆ''ˆ''ˆ''ˆ'[ˆ )12()12(2 xrNySyWcyZayXbyye −−−−−= δσ

qCAtraAa ea /)](ˆˆ'ˆ[ˆ 2212)12(

1)12()12(

2 −− += σσ


fCtre /]ˆˆ'ˆ[ˆ 442)12()12(

2

)12(σδδσ δ += , em que f é o número de famílias de irmãos

germanos.

81Documentos, 47

Seqüência de colunas no arquivo de dados para análise pelo softwareDFREML

Indivíduo Pai Mãe Bloco Parcela Família Variável 1 . . . Variável n

Este arquivo funciona ao mesmo tempo como arquivo de pedigree e dedados. Devem ser executados seqüencialmente os subprogramas DFPREP eDFUNI.

(b) Avaliação simultânea de progênies interpopulacionais e intrapopulacionais

Muitas vezes são geradas, simultaneamente, progênies intrapopulacionaise interpopulacionais de cada matriz. Este esquema é vantajoso, pois permite,adicionalmente, a obtenção de informações sobre a correlação genética (r a)entre os efeitos aditivos intrapopulacionais e interpopulacionais e sobre amagnitude da média e variação intrapopulacionais associados a cada população.

Nesta situação, deve-se considerar um modelo multivariado tratando osmateriais genéticos intrapopulacionais e interpopulacionais como caracteresdistintos. Isto é justificável quando r a não eqüivale a 1.

Quando cruzamentos dialélicos, fatoriais ou hierárquicos são realizados,tem-se a modelagem descrita a seguir.

Modelo linear misto (modelo multivariado de capacidade específica decombinação)

y = Xb + Za + Wc + Sd + e

+

+

+

+

=

22

12

11

22

12

11

22

22

11

22

12

11

22

12

11

22

12

11

22

12

11

22

12

11

22

12

11

22

12

11

00

00

00

00

00

00

00

00

00

00

00

00

e

e

e

S

S

S

c

c

c

W

W

W

a

a

a

Z

Z

Z

b

b

b

X

X

X

y

y

y

δδδ

y11, y12, y22 : vetores de dados correspondentes às progênies intrapopulacionaisda população 1, interpopulacionais do cruzamento 1 x 2 eintrapopulacionais da população 2, respectivamente;

b11, b12, b22 : vetores de efeitos fixos (médias dos materiais genéticos nosblocos) associadas aos experimentos avaliando os três conjuntosde materiais genéticos, respectivamente. (De preferência, os trêstipos de materiais genéticos devem ser alocados em um mesmobloco);

a11, a12, a22 : vetores aleatórios referentes aos valores genéticos aditivos dosindivíduos na população 1, interpopulacão 1 x 2 e população 2,respectivamente;

82 Documentos, 47

c11, c12, c22: vetores aleatórios referentes aos efeitos de parcela associados àavaliação dos três materiais genéticos, respectivamente;

d11, d12, d22: vetores aleatórios das capacidades específicas de combinaçãointrapopulacional da população 1, interpopulacional eintrapopulacional da população 2, respectivamente;

e11, e12, e22: vetores de erros aleatórios associados à avaliação dos três materiaisgenéticos, respectivamente.

Estrutura de variâncias

=

2

211

222

212

211

2

2

2

2

2

2

2

22

12

11

22

12

11

22

12

11

22

12

11

22

12

22

12

11

2212221122

1222121112

1122111211

00000000000

00000000000

00000000000

00000000000

00000000000

00000000000

00000000000

00000000000

00000000000

000000000

000000000

000000000

e

e

e

c

c

c

aaa

aaa

aaa

I

I

I

I

I

I

I

I

I

AAA

AAA

AAA

e

e

e

c

c

c

a

a

a

Var

σσ

σσ

σσ

σσ

σσσσσσσσσσ

δδδ

δ

δ

δ

,

em que:

222

221211, aaa e σσσ : variâncias genéticas aditivas intrapopulacional 1,

interpopulacional 1 x 2 e intrapopulacional 2, respectivamente;

1112aσ : covariância genética aditiva entre os efeitos intrapopulacional 1 e

interpopulacionais 1 x 2;

1122aσ = 0 : covariância entre os efeitos aditivos intrapopulacionais 1 e 2;

1222aσ : covariância genética aditiva entre os efeitos interpopulacionais 1 x 2 e

os efeitos intrapopulacionais 2;

222

221211, δδδ σσσ e : variâncias dos efeitos da capacidade específica de combinação

intrapopulacional 1, interpopulacional 1 x 2 e intrapopulacional2, respectivamente.

83Documentos, 47

Sendo 01122

=aσ , pode-se optar também pelo ajuste de dois modelos

bivariados (um envolvendo y11 e y12 e outro envolvendo y12 e y22) ao invés domodelo trivariado.

A partir do modelo apresentado, pode-se obter informações sobre acorrelação entre os efeitos aditivos intrapopulacionais (capacidade geral decombinação) e efeitos aditivos interpopulacionais (capacidade geral de

hibridação) pelas relações )./()/(221212221222121111121112 aaaaaaaa e σσσρσσσρ ==


=

∆++

+

−

−

−

−

−−−−−

−−−−−

−−−−−

−−−−

yRS

yRW

yRZ

yRX

c

a

b

SRSWRSZRSXRS

SRWCWRWZRWXRW

WRZWRZGZRZXRZ

SRXWRXZRXXRX

1

1

1

1

11111

11111

11111

1111

'

'

'

'

ˆˆ

ˆ

ˆ

''''

''''

''''

''''

δ, em

que:

=∆

=

=

=

⊗∆=∆⊗=⊗=⊗= −−−−−−−−−

2

2

2

2

2

2

22

222

22

2

2

2

111111111

22

12

11

22

12

11

221222

1222121112

111211

22

12

11

00

00

00

;

00

00

00

;

0

0

;

00

00

00

;;;

δ

δ

δ

σσ

σ

σσ

σ

σσσσσ

σσ

σσ

σ

O

c

c

c

O

aa

aaa

aa

O

e

e

e

O

OOOO

CGR

IICCAGGIRR


Nesta situação, devido à complexidade do modelo e ao elevado númerode componentes de variância a serem estimados, são recomendados osalgoritmos DF e AI (preferencialmente este). Neste caso, a função geral a sermaximizada é aquela descrita no item 2.


População Indivíduo Pai Mãe Bloco Parcela Família Variável 1 . . . Variável n

São necessários dois arquivos: um de dados conforme a estruturaapresentada e outro de pedigree contendo apenas as colunas Indivíduo PaiMãe. Devem ser executados, seqüencialmente, os subprogramas DFPREP eDXMUX.

84 Documentos, 47

5.2. Híbridos envolvendo três ou mais espécies

Híbridos envolvendo três ou mais espécies têm sido comuns nomelhoramento do Eucalyptus no Brasil (Assis, 2000). Nesta situação, sãoenvolvidos na análise vários tipos de híbridos. Por exemplo, um híbrido triploenvolvendo E. urophylla, E. dunnii e E. grandis envolve em sua genealogia oshíbridos E. urophylla x E. grandis, E. dunnii x E. grandis e E. urophylla x E. dunnii.Também cada indivíduo de uma espécie é envolvido em vários cruzamentosinterpopulacionais, de forma que uma avaliação completa deve envolver todaesta mistura de híbridos, procurando identificar os melhores.

Um modelo para esta situação deve contemplar os efeitos fixos daheterose associada a cada tipo de híbrido, por exemplo, efeito de heteroseenvolvendo as várias combinações de híbridos entre duas espécies e ascombinações envolvendo três espécies.

Modelo linear misto (modelo univariado de heterose fixa)

y = Xb + Th + Za + Wc + Sd + e, em que:

b : vetor de efeitos fixos (médias de blocos);

h : vetor de efeitos fixos da heterose associada a cada tipo de híbrido;

a : vetor de efeitos aditivos interpopulacionais aleatórios, expressos como desviosda média do tipo de híbrido em questão;

c : vetor dos efeitos aleatórios de parcela;

d : vetor aleatório dos efeitos da capacidade específica de combinação entreos dois genitores envolvidos no cruzamento, expressos como desvios damédia do tipo de híbrido em questão.

e : vetor de erros aleatórios;

X, T, Z, W e S : matrizes de incidência para b, h, a, c e d, respectivamente.

Neste caso, os valores genotípicos preditos de cada cruzamento visandoexplorar a capacidade específica de combinação é dado por

δSaZThXbg +++=ˆ , em que a refere-se à média dos efeitos aditivosinterpopulacionais dos genitores envolvidos no cruzamento. Indivíduos superioresdentro dos melhores cruzamentos devem ser submetidos a teste clonal.

As equações de modelo misto são similares àquelas descritas no tópico(a.2), bastando incluir o efeito fixo da heterose, fato que requer uma coluna amais no arquivo de dados, codificando os vários tipos de híbridos.

85Documentos, 47

6. Testes Clonais

6.1 Avaliação de clones não aparentados no delineamento emblocos ao acaso com várias plantas por parcela (válidotambém para linhagens não aparentadas de espéciesautógamas)

Modelo linear misto (modelo univariado de clones repetidos)

y = Xb + Zg + Wc + e, em que

y, b, g, c e e : vetores de dados, de efeitos fixos (blocos), de efeitos genotípicosde clones (aleatórios), de efeitos de parcela (aleatórios) e de errosaleatórios, respectivamente.

X, Z e W : matrizes de incidência para b, g e c, respectivamente.


=

=

2

2

2

00

00

00

;

0

0

0

e

c

g

I

I

I

e

c

g

Var

Xb

e

c

g

y

E

σσ

σ


=

++

yW

yZ

yX

c

g

b

IWWZWXW

WZIZZXZ

WXZXXX

'

'

'

ˆ

ˆ

ˆ

'''

'''

'''

2

1

λλ , em que:

.1

;1

2

22

2

2

22

22

2

2

1 c

ch

h

ch a

c

e

a

a

g

e −−==−−==σσλ

σσλ

222

22

ecg

gah

σσσσ

++= : herdabilidade individual no sentido amplo no bloco;

2gσ : variância genotípica entre clones;.

86 Documentos, 47

2cσ : variância entre parcelas;2eσ : variância residual ou ambiental dentro de parcelas.

Estimadores iterativos de componentes de variância por REML viaalgoritmo EM

)](/[]''ˆ''ˆ''ˆ'[ˆ 2 xrNyWcyZgyXbyye −−−−=σ

qCtrgg eg /)]ˆˆ'ˆ[ˆ 2222 σσ +=


Estimação e predição pelo software DFREML

O modelo de estimação e predição apresentado é similar a um modelode genitor (�sire model�) e não a um modelo individual (�animal model�). Comoo software DFREML trabalha com um modelo individual, para análises de testesclonais, tal programa pode ser utilizado ajustando um modelo de repetibilidade.Neste caso, a variância de �ambiente permanente� contemplará a variâncianão aditiva total livre do componente de ambiente permanente (já que as medidasrepetidas em um mesmo clone são realizadas em diferentes rametes), e oefeito de �ambiente permanente� contemplará os efeitos não aditivos. Assim,para obtenção dos efeitos genotípicos totais (aditivo + não aditivo) de cadaclone basta somar os efeitos aditivos e de �ambiente permanente� ajustadospelo programa. Este procedimento é válido quando os clones não sãoaparentados. A forma do arquivo para este tipo de análise é apresentada aseguir:

Indivíduo Pai Mãe Bloco Permanente Parcela Vetor de Dados

Neste caso, o programa ajustará os efeitos aditivos, permanente dedominância (aleatório adicional), de parcela (aleatório adicional) e fixo de bloco.

No caso de testes clonais instalados no delineamento em látice, bastasubstituir o efeito fixo de bloco pelo efeito de repetições e incluir no modelo, oefeito aleatório de blocos dentro de repetições.

87Documentos, 47

6.2 Avaliação de clones aparentados no delineamento em blocosao acaso, com várias plantas por parcela

Modelo linear misto (modelo univariado aditivo-dominante)

y = Xb + Za + Zd + Wc + e, em que

d: vetor aleatório dos efeitos de dominância.


=

=

22

22

22

22

2222

000

000'

000'

000'

;

0

0

0

0

ee

cc

dd

aa

ecda

II

IWI

DZD

AZA

IWIZDZAV

e

c

d

a

y

Var

Xb

e

c

d

a

y

E

σσσσ

σσσσ

σσσσ

, em que:

.''' 2222ecda IWWIZZDZZAV σσσσ +++=


=

++

+−

−

yW

yZ

yZ

yX

c

d

a

b

IWWZWZWXW

WZDZZZZXZ

WZZZAZZXZ

WXZXZXXX

'

'

'

'

ˆ

ˆˆ

ˆ

''''

''''

''''

''''

3

21

11

λλ

λ, em que:

.1

;1

;1

2

22

2

2

322

22

2

2

22

22

2

2

1 c

ch

hh

ch

h

ch a

c

e

a

a

d

ea

a

e −−==−

−−==−−==σσλ

σσλ

σσλ

22ad heσ : variância genética de dominância e herdabilidade no sentido amplo,

respectivamente;

D : matriz de correlação genética de dominância entre os indivíduos em avaliação.

O sistema apresentado prediz isoladamente os efeitos aditivos (â) e de

dominância ( d ). Os valores genotípicos totais, dados por dâg ˆˆ += , podem ser

preditos diretamente pelas equações de modelo misto:

88 Documentos, 47

=

++ −

yW

yZ

yX

c

g

b

IWWZWXW

WZGZZXZ

WXZXXX

e

'

'

'

ˆ

ˆ

ˆ

'''

'''

'''

3

21

λσ , em que:

22da DAG σσ +=


)](/[]''ˆ''ˆ''ˆ''ˆ'[ˆ 2 xrNyWcyZdyZayXbyye −−−−−=σ

sCtrcc ec /]ˆˆ'ˆ[ˆ 4422 σσ += ;


qCDtrâDd ed /](ˆ'ˆ[ˆ 331212 −− += σσ .



Para ajuste dos efeitos de dominância, os mesmos devem ser consideradoscomo �segundo efeito aleatório por indivíduo�. Neste caso, além dos arquivosde dados e de pedigree, deve ser fornecido um arquivo adicional com nomepadrão DF45#DAT, referente à inversa da matriz de parentesco de dominância.Este arquivo não formatado deve fornecer todos os elementos não zero dotriângulo inferior da matriz inversa e deve conter três colunas: um código inteiro(de 1 ao número de indivíduos na análise) referente ao número da coluna namatriz; um código inteiro referente ao número da linha (maior ou igual ao númeroda coluna) na matriz (de 1 ao número de indivíduos na análise); uma variávelverdadeira (real) fornecendo o elemento da inversa da matriz de parentesco dedominância.

89Documentos, 47

7. Modelos não Lineares para Variáveis Binomiais e Categóricas

Em teoria, variáveis categóricas e binomiais (tais como a presença ouausência de determinados atributos nos indivíduos) não são bem descritas pormodelos estatísticos lineares. Para estas variáveis, os modelos não linearespodem ser mais apropriados.

A técnica de modelos lineares generalizados (GLM), desenvolvida porNelder & Wederburn (1972), permite a generalização ou flexibilização dosmodelos lineares clássicos de variáveis contínuas, de forma que toda a estruturapara a estimação e predição em modelos lineares normais, pode ser estendidapara os modelos não lineares. Os modelos lineares clássicos são, em verdade,casos especiais de modelos lineares generalizados.

Neste caso, a variável observacional pode ser definida pelo modeloey += µ , em que m refere-se à esperança de y e e refere-se ao vetor de erros

aleatórios.

No caso especial em que y segue uma distribuição normal e g(m) é umaligação identidade, obtém-se o tradicional modelo linear misto eZaXby ++= ,

em que 2)(,)(,)( eIReCovGaCovXbyE σ==== e, consequentemente,

2'')( eIZGZRZGZyCov σ+=+= .

Para o caso em que y segue uma distribuição binomial, tem-se o caso daestimação e predição em modelos lineares generalizados com efeitos fixos ealeatórios, conforme Schall (1991).

A função de ligação logito, g(m), aplicada aos dados y é linearizada,conforme a expansão em série de Taylor de primeira ordem fornecendo y*, daseguinte forma:

)(')()()(* µµµ gygygy −+==

Assim tem-se:

)1(*

ii

iiii

yy

µµµη

−−+=

)1(1log

ii

ii

i

i y

µµµ

µµ

−−+

−

= .

De posse da variável observacional (ou dependente) ajustada y*, tem-seque o modelo linear misto eqüivale a )('* µegZaXby ++= , em que:

90 Documentos, 47

2121 '*)()]('[,)(,*)( ee WZGZyCoveWegCovGaCovXbyE σσµ −− +==== .

O modelo eZaXby ++=* tem a mesma estrutura de primeira e segunda

ordem que o modelo eZaXby ++= de forma que os algoritmos de estimaçãoe predição para o caso normal podem ser adaptados, apenas substituindo y por

y* e ReCov =)( por .)]('[ 21eWegCov σµ −=

Assim, tem-se a seguintes equações de modelo misto:

=

+ −

−

−−−

−−

*'

*'

ˆ

ˆ

''

''1

1

111

11

ySZ

ySX

a

b

GZSZXSZ

ZSXXSX

L

L, em que:

1−S = matriz com termos diagonais dados por ;1

)1(2

Leii σ

µµ −

2

Leσ = variância residual na escala contínua de tolerância (�liability�);

LL aeb = efeitos fixos e aleatórios na escala de tolerância.

No caso em que a refere-se a um vetor de valores genéticos aditivos,

tem-se que 2)(LaAGaCov σ== , em que A é a matriz de correlação genética

aditiva entre os indivíduos e 2

Laσ é a variância de La Neste caso, os estimadores

REML são dados por:

2

2221

12

2221

12

/)()(

)ˆˆ()'ˆˆ(ˆ;

/)(

ˆ'ˆˆ

L

L

L

L

L e

a

LLLLe

a

LLa

CAtrqxrN

aZbXySaZbXy

CAtrq

aAa σσ

σσ

σ−

−

−

−

+−−−−−−=

−=

Em resumo, o processo de estimação envolve:

(a) estimação de Nn /1=µ , em que 1n é o número de indivíduos querecebem o escore 1, dentre N indivíduos avaliados;

(b) obtenção de y*, a partir de y e m (neste passo, a variável passa dointervalo (0,1) para a reta real, ou seja, a função é linearizada);

(c) estimação de LL aeb ˆ , dados os valores atuais ou correntes de

22,LL ae e σσµ ;

91Documentos, 47

(d) obtenção de 22 ˆˆLL ae e σσ iterativamente e, após a convergência,

proceder à obtenção atualizada de LL aeb ˆˆ ;

(e) obtenção de LL aZbX ˆˆˆˆ +== θη ;

(f) obtenção de novo valor predito de m, usando a função de ligação, através

de θ

θ

µ ˆ

ˆ

1ˆ

e

eL +

= (neste passo, a variável volta ao intervalo (0,1));

(g) atualização de S-1 via 2111

1ˆ1

)ˆ1(ˆeL

Sσ

µµ −=− e de y* via

)ˆ1(ˆ

ˆˆ)ˆ1(ˆ

ˆ

ˆ1

ˆlog*

11

1

11

1

1

1

µµµθ

µµµ

µµ

−−+=

−−+

−

= yyy ;

(h) voltar ao passo (c), enquanto não se atingir a convergência.

É interessante notar que este algoritmo é essencialmente hierárquico,havendo, a cada iteração compreendendo os passos de (a) a (h), a necessidadede convergência no passo (d).

Software

Dentre os softwares mencionados neste artigo, o ASREML é o únicoadequado para a análise de variáveis binomiais. Para a versão �Windows�, oarquivo executável necessário é o ASRWIN.EXE. Para utilização do referidoaplicativo na análise de modelos mistos ao nível de plantas individuais, sãonecessários 3 arquivos: um arquivo de dados, um arquivo de pedigree (com osnúmeros de identificação dos genitores precedendo os números de identificaçãodos descendentes) e um arquivo de comandos (este contendo o modelo deanálise, o qual deve ser escrito pelo usuário). Os arquivos devem ser preparadosem formato ASCII, sendo que os arquivos de dados e de pedigree podem sersalvos usando o programa Notepad (ou bloco de notas, usando documentotexto, ou seja extensão .txt) ou mesmo o EXCEL usando a opção de salvarcomo �Texto (OS/2 ou MS-DOS), o que produz uma extensão .txt.

O arquivo de comandos deve conter a extensão .as e deve ser escritocom base em 5 seções: (i) linha de título; (ii) definição das colunas do arquivo

92 Documentos, 47

de dados; (iii) definição dos arquivos de pedigree e de dados; (iv) definição domodelo estatístico; (v) definição do modelo de variância (esta seção não énecessária em alguns casos). Este arquivo com extensão .as pode ser compostoe salvo facilmente dentro do próprio ASREML, através da modificação dearquivos pré-existentes. Os arquivos de resultados mais importantes doprograma são aqueles com extensão .sln (o qual apresenta a solução paratodos os efeitos do modelo com seus respectivos desvios padrões) e .asr (oqual sumariza os dados e a seqüencia das iterações, apresenta as estimativasdos componentes de variância, a análise de variância para os efeitos fixos esuas soluções).

Para a análise de variáveis binomiais, considere como exemplo umexperimento instalado no delineamento em blocos ao acaso, com 33 progêniesde meios irmãos (polinização aberta) e 6 blocos, em que foi avaliada a variávelsobrevivência (Sob). Tendo-se salvos os arquivos de dados e de pedigree comos nomes Dados.txt e Pedigree.txt, tem-se o seguinte arquivo com extensão.as :

Titulo Individuo !P Pai Mae 33 Bloco 6 SobPedigree.txt !SKIP 1 !MAKEDados.txt !SKIP 1 Sob !BIN !LOGIT ~ Bloco !r Individuo

Este arquivo de comando possui a seguinte interpretação:

(i) Linha 1 : Título qualquer;

(ii) Linhas 2 a 6 : Identificação de colunas no arquivo de dados, contendoos respectivos números de níveis;

(iii) Linhas 7 e 8 : Identificação dos arquivos de pedigree e de dados;

(iv) Linha 9 : Especificação do modelo de análise para a variável Sob;

Ainda no arquivo com extensão .as, tem-se que os comandos advêmapós o símbolo ! . Assim, tem-se:

93Documentos, 47

P: indica que o número de indivíduos deve ser lido no arquivo de pedigree;

SKIP: indica que deve ser ignorada a primeira linha dos arquivos, pois refere-se apenas às identificações;

MAKE: indica que deve ser feita a matriz de parentesco;

BIN: indica que a variável apresenta distribuição binomial;

LOGIT: indica que deverá ser usada a função de ligação logito;

r Individuo: indica que os efeitos de indivíduos são aleatórios;

~ Bloco: indica que os efeitos de blocos são fixos.

No caso, a seção (v) não foi necessária. Outra opção de análise refere-se à adoção de um modelo de genitor, sendo preditos (1/2) dos efeitos genéticosdos genitores e estimado (1/4) da variação genética aditiva. Neste caso, não énecessário o arquivo de pedigree e o arquivo .as apresenta como conteúdo:

Titulo Individuo 1188 Mae 33 Bloco 6 SobDados.txt !SKIP 1 Sob !BIN !LOGIT ~ Bloco !r Mae

O número 1188 refere-se ao número total de indivíduos, considerandoque havia 6 plantas por parcela.

A seguir será ilustrada a aplicação do software para a análise de umavariável contínua, como o peso de frutos em cacau. Considerando a situaçãodescrita no item 4.6 (cruzamentos dialélicos com medidas repetidas em cadaindivíduo), tem-se o seguinte arquivo .as, considerando cruzamentos envolvendo5 mães e 5 pais, experimentação em 4 blocos, 4 medições por indivíduo, 10famílias de irmãos germanos, 80 parcelas e 1200 indivíduos no total:

94 Documentos, 47

Título Individuo !P Pai 5 Mae 5 Bloco 4 Medicao 4 Familia 10 Permanente 1200 Parcela 80 PesoPedigree.txt !SKIP 1 !MAKE !REPEATDados.txt !SKIP 1 Peso ~ Bloco Medicao !r Individuo Familia Permanente Parcela

No caso, os efeitos de bloco e medição foram ajustados como fixos. Ocomando REPEAT indica que se trata de um caso de medidas repetidas.

Após compostos os arquivos de dados, de pedigree e de comandos, bastaexecutar este último e, então, abrir os arquivos de resultados.

As variáveis categóricas são, provavelmente, uma aproximação davariável real de interesse, sendo que, muitas vezes, as categorias surgem porquenão é possível medir a variável real de interesse. Tomar as variáveis categóricascomo normais é tanto mais apropriada quanto mais normais forem os escores.Assim, quanto maior o número de categorias, menor é a relevância datransformação das variáveis ou dos modelos para se adequarem as variáveis.

Considere a avaliação da variável número de frutos (denominada Frutos)de cacaueiros em dois locais, no delineamento em blocos ao acaso com 18progênies de meios irmãos e cinco blocos em cada local. Assumindo normalidade,tem-se que a composição do arquivo de comandos .as para a análise do modelobivariado, eqüivale a:

95Documentos, 47

Titulo Individuo !P Pai Mae 18 Bloco 10 Parcela 180 Frutos1 !M 0 Frutos2 !M 0Pedigree.txt !SKIP 1 !MAKEDados.txt !SKIP 1!ASUV Frutos1 Frutos2 ~ Trait Tr.Bloco !r Tr.Individuo Tr.Parcela !f mv 2 1 2 0 !s2=ve1 0 !s2=ve2

Tr.Individuo 2 Tr 0 US va1 va12 va2 Individuo

Tr.Parcela 2 Tr 0 US vc1 vc2 Parcela

!end

O comando !M0 deve ser incluído visando converter os valores zero doarquivo em valores inexistentes ou perdidos. No arquivo, os dados referentes acada local devem ser colocados em duas colunas distintas, prenchendo-se osdados inexistentes com zero (neste caso).

Por outro lado, o comando !ASUV é usado quando os dados sãoapresentados em uma forma multivariada mas a análise requerida refere-se aum único caráter. Com esta opção, se existem valores perdidos no arquivo dedados, deve-se incluir o comando !f mv no final da linha do modelo linear. Ocomando !ASUV deve ser colocado em uma linha logo após a linha dedenominação do arquivo de dados e antes da linha referente ao modelo linear.

As linhas após o modelo linear referem-se à definição do modelo (estrutura)de variância. No caso, ve1 e ve2 referem-se aos valores iniciais para as variânciasresiduais nos locais 1 e 2, respectivamente, e vc1 e vc2 referem-se aos valores

96 Documentos, 47

iniciais para as variâncias entre parcelas nos locais 1 e 2, respectivamente.Por outro lado, va1, va2 e va12, referem-se aos valores iniciais para as variânciasgenéticas aditivas nos locais 1 e 2 e covariância genética aditiva entre oslocais 1 e 2, respectivamente.

8. Ajuste de Covariável e Análise de Covariância

O ajuste de covariáveis é importante como forma de reduzir o erroexperimental, através da eliminação de certas diferenças ambientais aleatóriasentre parcelas dentro de blocos, como por exemplo, a sobrevivência diferenciadaentre parcelas, não devidas a causas genéticas. Nesta situação, o número deplantas na parcela deve ser ajustado como uma covariável. Outro exemplo, emque o ajuste de uma covariável pode ser necessário, refere-se à situação emque os indivíduos são avaliados em diferentes idades, para uma determinadacaracterística. Neste caso, a idade deve ser ajustada ao modelo, como umacovariável.

Considerando um modelo estatístico tradicional e incluindo como umacovariável x, o número de plantas na parcela, tem-se (Ramalho et al., 2000):

Yij = m + pi + rj + b )( xxij − + eij, em que:

Yij: observação da variável dependente de interesse, referente à progêniei no bloco j.;

m, pi, rj, ej: efeitos da média geral, da progênie i, do bloco j e do erro experimental,respectivamente;

xij: número de plantas na parcela ij (variável dependente), com média x ;b: coeficiente de regressão linear entre x e y;

Verifica-se que o componente b )( xxij − estaria inflacionando o erroexperimental, caso não fosse realizado o ajuste da covariável.

Dentre os requisitos para uso da análise de covariância ou ajuste de umacovariável, citam-se, conforme Steel e Torrie (1980) e Ramalho et al. (2000):

(i) As covariáveis x são efeitos fixos, medidos sem erros e independentesdos efeitos de tratamentos (progênies). Isto implica que não pode haverdiferenças significativas entre progênies para a covariável x;

(ii) A regressão de x em y, após a remoção das diferenças entre blocos etratamentos, é linear e independente dos tratamentos e blocos. Istosignifica que o efeito de x é no sentido de aumentar ou diminuir y por

uma constante (b) multiplicada por )( xxij − ;(iii) O erro experimental possui distribuição normal com média zero e

variância 2eIσ .

97Documentos, 47

Dessa forma, o ajuste do número de plantas por parcela como covariávelna metodologia de modelos mistos somente é recomendável quando asobrevivência no experimento não apresentar controle genético, ou seja, quandoa mesma ocorrer de forma aleatória. Para verificar esta suposição, recomenda-se a análise de variância e a verificação da significância da fonte de variaçãoprogênies. A significância desta fonte de variação indica que existem diferençasgenéticas entre progênies para o caráter e, portanto, o ajuste do número deplantas como covariável não é recomendado. Neste caso, é melhor realizar apredição de valores genéticos para a sobrevivência e posteriormente utilizá-latambém na seleção, conforme Resende (1999).

No contexto dos modelos mistos, a verificação do controle genético dasobrevivência pode ser realizada utilizando-se os próprios valores estimados daherdabilidade e de seu desvio padrão. Embora a não significância das diferençasde sobrevivência entre progênies, signifique que tal variável não está afetandoa comparação das mesmas para o outro caráter de interesse (variáveldependente), o ajuste da covariável pode ser relevante por permitir um melhorajuste dos dados de plantas individuais e, por conseguinte, aumentar a acuráciada predição dos valores genéticos individuais. Logicamente, o efeito benéfico étanto maior quanto maior for a variação na covariável e maior for a associaçãoentre x e y.

Na metodologia de modelos mistos, o ajuste de covariáveis é realizadopreviamente à estimação e predição. Assim, os modelos, estimadores epreditores apresentados independem do ajuste ou não de covariáveis e sãoválidos em geral. Para análise pelo software DFREML, basta acrescentar, noarquivo de dados, antes da primeira coluna de dados (primeiro caráter), umacoluna referente à covariável. No caso da sobrevivência, esta colunacontemplaria o número de plantas na parcela.

Finalmente, é importante ressaltar que o ajuste da covariável não étotalmente suficiente para considerar o efeito da competição diferenciada devidaàs falhas. Isto, porque o estande da parcela não considera as posições dasfalhas.

9. Espécies com Sistema Reprodutivo Misto

Os modelos, estimadores e preditores apresentados nos itens 4.1.1,4.1.2, 4.1.3, 4.1.4, 4.3.1, 4.3.2, 4.3.3, 4.3.4, 4.4.1, 4.4.2, 4.4.3, 4.4.4,4.51 e 4.5.2 são adequados também para populações com sistema reprodutivomisto. Neste caso, as herdabilidades estimadas devem ser corrigidas levando-se em consideração a taxa de autofecundação e os coeficientes de parentescocorrigidos apresentados por Resende et al. (1995). Posteriormente, asherdabilidades (ou variâncias e covariâncias genéticas) corrigidas devem ser

98 Documentos, 47

fixadas nos programas computacionais, visando à predição dos valoresgenéticos.

10. Referências Bibliográficas

ASSIS, T.F. Production and use of Eucalyptus hybrids for industrial purposes.In: DUNGEY, H.S.; DIETERS, M.J.; NIKLES, D.G., ed. Hybrid breeding andgenetics of forest trees: QFRI/CRC-SPF Symposium Noosa, Queensland,Australia, 9-14 April 2000. Brisbane: Department of Primary Industries,2000. p.63-74.

BOLDMAN, K.G.; KRIESE, L.A.; VLECK, L.D. van.; KACHMAN, S.D. A manualfor use of MTDFREML: a set of programs to obtain estimates of variancesand covariances. Washington: ARS / USDA, 1995. 120p.

BUENO FILHO, J.S.S. Seleção combinada versus seleção sequencial nomelhoramento de populações florestais. Piracicaba: ESALQ/USP, 1992,96p. Tese Mestrado.

BUENO FILHO, J.S.S. Uso de modelos mistos no melhoramento de populaçõesflorestais. Piracicaba: ESALQ/USP, 1997, 160p. Tese Doutorado.

COSTA, R.B.; RESENDE, M.D.V. de; ARAÚJO, A J.; GONÇALVES, P. S. BLUPindividual e índice multi-efeitos aplicados ao melhoramento da seringueira.In: SIMPÓSIO SOBRE RECURSOS GENÉTICOS PARA A AMÉRICALATINA E CARIBE, 2., 1999, Brasília. Brasília, Anais. Brasília: EmbrapaRecursos Genéticos e Biotecnologia, 1999. 1 CD ROM.

CRUZ, C.D. Programa Genes: aplicativo computacional em Genética eEstatística. Viçosa: Universidade Federal de Viçosa, 1997. 422p.

CRUZ, C.D.; REGAZZI, O.J. Modelos biométricos aplicados ao melhoramentogenético. Viçosa: Universidade Federal de Viçosa, 1994. 390p.

CULLIS, B.R.; GOGEL, B.; VERBYLA, A.P.; THOMPSON, R. Spacial analysisof multi-environment early generation variety trials. Biometrics, v.54, p.1-18, 1998.

DEMPSTER, A.P.; LAIRD, N.M.; RUBIN, D.B. Maximum likelihood fromincomplete data via the EM algorithm. Journal of the Royal Statistic Society,London, v.39, p.1-38, 1977.

FARIAS NETO, J.T.; RESENDE, M.D.V. de. Predição de valores genéticos eestimação de componentes de variância em pupunheira (Bactris gasipaes)pela metodologia BLUP/REML com ênfase na produtividade de palmito.Genetics and Molecular Biology , v.23, n.3, Suppl., p.533, 2000.

99Documentos, 47

GILMOUR, A.R.; CULLIS, B.R.; WELHAM, S.J. THOMPSON, R. ASREMLreference manual. Orange: NSW Agriculture, 2000. 218p.

GILMOUR, A.R.; THOMPSON, R.; CULLIS, B.R. Average information REML:An efficient algorithm for parameter estimation in linear mixed models.Biometrics, v.51, p.1440-1450, 1995.

GRASER, H.U.; SMITH, S.P.; TIER, B. A derivative free approach for estimatingvariance components in animal models by restricted maximum likelihood.Journal of Animal Science, Champaign, v.64, n.5, p.1362-1370, 1987.

HARVILLE, D.A.; CARRIQUIRY, A.L. Classical and Bayesian prediction asapplied to unbalanced mixed linear models. Biometrics, v.48, p.987-1003,1992.

HENDERSON, C.R. Aplications of linear models in animal breeding. Guelph:University of Guelph, 1984. 462p.

HENDERSON, C.R.; QUAAS, R.L. Multiple trait evaluation usingrelatives�records. Journal of Animal Science, v.43, p.1188-1197, 1976.

JOHNSON, D.L.; THOMPSON, R. Restricted maximum likelihood estimationof variance components for univariate animal models using sparse matrixtechniques and average information. Journal of Dairy Science, v.78, p.449-456, 1995.

KALIL, A N.; RESENDE, M.D.V.; KALIL, G.P.C. Componentes de variância epredição de valores genéticos em seringueira pela metodologia de modelosmistos (REML/BLUP). Pesquisa Agropecuária Brasileira, v.35, n.9, p.1883-1887, 2000.

MEYER, K. DFREML � a set of programs to estimate variance componentsunder an individual animal model. Journal of Dairy Science, v.2, Suppl,p.33-34, 1988.

MEYER, K. DFREML: version 3.0b user notes. Edinburgh: Institute of AnimalGenetics of Edinburgh / Armidale: University of New England, AnimalGenetics and Breeding Unit, 1998. 31p.

MEYER, K. Estimating variances and covariances for multivariate animal modelsby restricted maximum likelihood. Genetique, Selection, Evolution, Paris,v.23, p.67-83, 1991.

MEYER, K. Restricted maximum likelihood to estimate variance componentsfor animal models with several random effects using a derivative-freealgorithm. Genetics, Selection, Evolution, v.21, p.317-340, 1989.

NELDER, J.A.; WEDDERBURN, R.W.M. Generalized linear models. Journal ofthe Royal Statistic Society, Series A, v.135, p.370-384, 1972.

100 Documentos, 47

PAIVA, J.R.; RESENDE, M.D.V. de; CORDEIRO, E.R. Índice multi-efeitos (BLUP)e estimativas de parâmetros genéticos aplicados ao melhoramento daacerola. Pesquisa Agropecuária Brasileira, 2000. no prelo.

PATTERSON, H.D.; THOMPSON, R. Recovery of inter-block information whenblock sizes are unequal. Biometrika, v.58, p.545-554, 1971.

PIRES, I.E.; CRUZ, C.D.; BORGES, R.C.G.; REGAZZI. A.J. Índice de seleçãocombinada aplicada ao melhoramento de Eucalyptus spp. Revista Árvore,v.20, n.2, p.191-198, 1996.

RAMALHO, M.A.P.; SANTOS, J.B.; ZIMMERMANN, M.J.O. Genéticaquantitativa no melhoramento de plantas autógamas. Goiânia: UniversidadeFederal de Goiás, 1993.

RAMALHO, M.A P.; FERREIRA, D. F.; OLIVEIRA, A C. Experimentação emgenética e melhoramento de plantas. Lavras: UFLA, 2000. 303p.

RESENDE, M.D.V. de. Genética biométrica no melhoramento de fruteiras. In:ENCONTRO DE GENÉTICA DO NORDESTE, 15., 2000. Anais on line...Fortaleza, 2000. Fortaleza: Sociedade Brasileira de Genética, Regional doCeará, 2000. 11p. Site a ser disponibilizado.

RESENDE, M.D.V. de. Predição de valores genéticos, componentes de variância,delineamentos de cruzamento e estrutura de populações no melhoramentoflorestal. Curitiba: Universidade Federal do Paraná, 1999. 434p. TeseDoutorado.

RESENDE, M.D.V. de; DIAS, L.A.S. Aplicação da metodologia de modelos mistos(REML/BLUP) na estimação de parâmetros genéticos e predição de valoresgenéticos aditivos e genotípicos em espécies frutíferas. Revista Brasileirade Fruticultura, v.22, n.1, p.44-52, 2000.

RESENDE, M.D.V. de; STURION, J.A.; CARVALHO, A P. de ; SIMEÃO, R.M.;FERNANDES, J.S.C. Programa de melhoramento da erva-mate coordenadopela Embrapa- Resultados da avaliação genética de populações, progênies,indivíduos e clones. Colombo: Embrapa Florestas, 2000a. 45p. (EmbrapaFlorestas. Circular Técnica, 43). no prelo.

RESENDE, M.D.V. de; FURLANI JÚNIOR, E.; MORAES, M.L.T.; FAZUOLI, L.C.Estimação de parâmetros genéticos e predição de valores genotípicos nomelhoramento do cafeeiro pelo procedimento REML/BLUP. Bragantia,2000b. no prelo.

RESENDE, M.D.V. de; FERNANDES, J.S.C. Procedimento BLUP individual paradelineamentos experimentais aplicados ao melhoramento florestal. Revistade Matemática e Estatística. São Paulo, v.17. p.89-107, 1999.

101Documentos, 47

RESENDE, M.D.V. de; FERNANDES, J.S.C.; SIMEÃO, R.M. BLUP individualmultivariado em presença de interação genótipo x ambiente paradelineamentos experimentais repetidos em vários ambientes. Revista deMatemática e Estatística, São Paulo, v.17. p.209-228, 1999.

RESENDE, M.D.V. de; MORA, A.L.; HIGA, A.R.; PALUDZYSZYN FILHO, E.Efeito do tamanho amostral na estimativa da herdabilidade em espéciesperenes. Floresta, v.28, n.1/2, 1998.

RESENDE, M.D.V.; PRATES, D.F.; JESUS, A.; YAMADA, C.K. Estimação decomponentes de variância e predição de valores genéticos pelo método damáxima verossimilhança restrita (REML) e melhor predição linear nãoviciada (BLUP) em Pinus. Boletim de Pesquisa Florestal, Colombo, v.32/33, p.18-45, 1996.

RESENDE, M.D.V. de.; VENCOVSKY, R.; FERNANDES, J.S.C. Selection andgenetic gains in populations of Eucalyptus with a mixed mating system.In: IUFRO CONFERENCE, 1995, Hobart. Proceedings ... Hobart: IUFRO,1995. p.191-193.

RESENDE, M.D.V. de; HIGA, A.R. Estimação de valores genéticos nomelhoramento de Eucalyptus: seleção em um caráter com base eminformações do indivíduo e seus parentes. Boletim de Pesquisa Florestal,Colombo, n.28/29, p.11-36, 1994b.

RESENDE, M.D.V. de; HIGA, A.R. Maximização da eficiência da seleção emtestes de progênies de Eucalyptus através da utilização de todos os efeitosdo modelo matemático. Boletim de Pesquisa Florestal, Colombo, n.28/29,p.37-55, 1994a.

RESENDE, M.D.V. de; HIGA, A.R.; LAVORANTI, O.J. Predição de valoresgenéticos no melhoramento de Eucalyptus � Melhor Predição Linear. In:CONGRESSO FLORESTAL BRASILEIRO, 7., 1993, Curitiba. Anais. SãoPaulo: Sociedade Brasileira de Silvicultura, 1993. v.1, p.144-147.

SCHALL, R. Estimation in generalized linear models with random effects.Biometrika, London, v.78, p.719-727, 1991.

SEARLE, S.R.; CASELLA, G.; McCULLOCH, C.E. Variance components. NewYork. J. Wiley, 1992. 528p.

STEEL, R.G.D.; TORRIE, J.H. Principles and procedures of statistics. 2.ed.New York: Mc Graw-Hill, 1980. 633p.

VENCOVSKY, R. Herança quantitativa. In: PATERNIANI, E.; VIEGA, G.P., eds.Melhoramento e Produção do Milho. Campinas: Fundação Cargill, 1987.p.137-214.

VENCOVSKY, R.; BARRIGA, P. Genética biométrica no fitomelhoramento.Ribeirão Preto: Sociedade Brasileira de Genética, 1992. 486p.

Documents

análise estatística de modelos mistos via reml/blup na