View
217
Download
0
Category
Preview:
Citation preview
UNIVERSIDADE ESTADUAL PAULISTA “JULIO DE MESQUITA FILHO”FACULDADE DE CIÊNCIAS AGRÁRIAS E VETERINÁRIAS
CÂMPUS DE JABOTICABAL
MODELOS DE AVALIAÇÃO GENÉTICA ALTERNATIVOS NAPRESENÇA DE DIFERENÇAS GENÉTICAS ENTRE
AMBIENTES
Roberto CarvalheiroZootecnista
Orientadora: Profa. Dra. Sandra Aidar de QueirozCo-orientadores: Dr. Luiz Alberto Fries
Dr. Flávio Schramm Schenkel
Tese apresentada à Faculdade deCiências Agrárias e Veterinárias, Câmpusde Jaboticabal - UNESP, para a obtençãodo Título de Doutor em Zootecnia(Produção Animal).
JABOTICABAL - SÃO PAULO - BRASIL
2004
ii
DADOS CURRICULARES DO AUTOR
Roberto Carvalheiro, filho de Manuel Henriques Carvalheiro e de Alda Gonçalves
Carvalheiro, nasceu em 27 de setembro de 1974 em São Paulo, SP. Em janeiro de
1998, graduou-se no curso de Zootecnia pela Universidade Federal de Lavras (UFLA),
onde foi bolsista do Programa Institucional de Bolsa de Iniciação Científica –
CNPq/PIBIC no período de agosto de 1995 a julho de 1997. Em março de 2000, obteve
o título de Mestre em Zootecnia pela Faculdade de Ciências Agrárias e Veterinárias,
Universidade Estadual Paulista “Julio de Mesquita Filho”, Câmpus de Jaboticabal
(FCAV–UNESP/Jaboticabal), onde foi bolsista da CAPES no período de março de 1998
a fevereiro de 2000. Em fevereiro de 2004, obteve o título de Doutor em Zootecnia pela
FCAV–UNESP/Jaboticabal, sendo bolsista do CNPq por seis meses, da FAPESP por
dois anos e seis meses, e da CAPES - do programa de doutorado com estágio no
exterior (PDEE) - por um ano. O estágio no exterior foi realizado no Centre for Genetic
Improvement of Livestock, Department of Animal and Poultry Science, University of
Guelph, Guelph, Ontario, Canada, no período de setembro de 2002 a agosto de 2003.
iii
Dedico
À minha família e à Liziane, por tudo que vocês são e representam para mim!
Agradeço
À Profa. Dra. Sandra Aidar de Queiroz, ao Dr. Luiz Alberto Fries e ao Dr. Flávio
Schramm Schenkel, pela amizade, orientação, ensinamentos, apoio, motivação, ...
Vocês foram fundamentais para o meu crescimento profissional e pessoal!
Aos professores do Departamento de Zootecnia e do Departamento de Ciências Exatas
da FCAV-UNESP/Jaboticabal, pelo agradável convívio e por toda a contribuição em
minha formação acadêmica.
À Coordenadora do Programa de Pós-Graduação em Zootecnia da FCAV-
UNESP/Jaboticabal, Profa. Dra. Telma Teresinha Berchielli Moreno, por todo o auxílio e
incentivo prestados ao longo do curso.
Aos membros da Comissão Examinadora, Prof. Dr. Danísio Prado Munari, Prof. Dr.
Elias Nunes Martins, Dr. Roberto Augusto de Almeida Torres Júnior, Dr. Maurício Mello
de Alencar, pelas contribuições valiosas. Foi uma honra contar com a participação de
vocês!
Ao CNPq, FAPESP e CAPES, pela concessão de recursos durante períodos distintos
do doutorado.
Aos pesquisadores do Centre for Genetic Improvement of Livestock, University of
Guelph, em especial ao Dr. S. P. Miller, pela oportunidade prestada para a realização
do doutorado “sanduíche”, e ao Dr. L. R. Schaeffer, pelos ensinamentos.
iv
Aos amigos do GenSys, por todo o auxílio, apoio e motivação prestados ao longo do
doutorado.
À todos os amigos da pós-graduação, em especial aos meus contemporâneos, Laila,
Rodrigo, Luciele e Vânia. Foi uma benção e um privilégio ter a oportunidade de
“caminhar” com vocês!
Por fim, gostaria de agradecer de forma especial aos amigos da família Schenkel -
Sandra, Mariana, Daniel e Flávio - e ao amigo Vanerlei, pela acolhida formidável e por
terem tornado muito agradável a minha estada no Canadá.
v
SUMÁRIO
Resumo ........................................................................................................ vii
Summary..................................................................................................... viii
Capítulo 1 - Considerações Gerais ............................................................. 1
1.1 – Problema em estudo ............................................................................. 1
1.2 – Justificativa para a condução do estudo ............................................... 3
1.3 – Objetivos do estudo .............................................................................. 4
1.4 – Estratégias de desenvolvimento do trabalho......................................... 4
Capítulo 2 - Propriedades empíricas das soluções das equações demodelo misto de Henderson para diferentes situações deassociação entre touros e grupos de contemporâneos...... 6
Resumo ................................................................................................ 6
2.1 – Introdução ............................................................................................. 7
2.2 – Material e Métodos................................................................................ 8
2.2.1 – Estrutura das populações simuladas ....................................... 8
2.2.2 – Modelo de simulação ............................................................ 11
2.2.3 – Análises estatísticas ............................................................. 11
2.2.4 – Critérios de comparação dos modelos .................................. 13
2.3 – Resultados e Discussão...................................................................... 14
2.3.1 – Dados simulados ................................................................... 14
2.3.2 – Soluções para o efeito de grupo de contemporâneos ........... 16
2.3.3 – Soluções para touros............................................................. 18
2.3.4 – Discussão geral ..................................................................... 23
2.4 – Conclusões ......................................................................................... 26
vi
Capítulo 3 - Modelos de avaliação genética alternativos em situaçõesde seleção parental............................................................... 27
Resumo .............................................................................................. 27
3.1 – Introdução ........................................................................................... 28
3.2 – Material e Métodos.............................................................................. 29
3.2.1 – Estrutura da população simulada .......................................... 30
3.2.2 – Modelo de simulação............................................................. 30
3.2.3 – Critérios de seleção .............................................................. 31
3.2.4 – Informações adicionais do processo de simulação ............... 32
3.2.5 – Modelos de avaliação genética ............................................ 32
3.2.6 – Critérios de comparação dos modelos .................................. 36
3.3 – Resultados e Discussão...................................................................... 37
3.3.1 – Viés........................................................................................ 37
3.3.2 – Médias dos VGVs.................................................................. 42
3.3.3 – Tendências genéticas............................................................ 44
3.3.4 – Discussão geral ..................................................................... 49
3.4 – Implicações ......................................................................................... 51
3.5 – Conclusões ......................................................................................... 52
Referências Bibliográficas ....................................................................... 53
Apêndice 1 ................................................................................................. 57
Apêndice 2 ................................................................................................. 59
Apêndice 3 ................................................................................................. 65
Apêndice 4 ................................................................................................. 69
Apêndice 5 ................................................................................................. 76
vii
MODELOS DE AVALIAÇÃO GENÉTICA ALTERNATIVOS NA PRESENÇA DEDIFERENÇAS GENÉTICAS ENTRE AMBIENTES
Resumo: Investigou-se, por meio de simulação de dados, propriedades
empíricas das soluções fornecidas pelo modelo misto de Henderson (MMH) e por
modelos de avaliação alternativos, sob diferentes situações de diferenças genéticas
entre grupos de contemporâneos (GCs). Num primeiro estudo, diferenças genéticas
entre GCs foram geradas pela distribuição não aleatória da progênie dos touros nos
GCs. Sob esta condição, as soluções do modelo MMH foram viesadas, o que reduziu a
habilidade de MMH em classificar apropriadamente os animais, bem como sua
eficiência em selecionar animais com mérito genético superior. Dentre os modelos
alternativos testados, o modelo que assumiu touro como efeito fixo e vaca como efeito
aleatório apresentou os melhores resultados quanto aos critérios estudados,
mostrando-se superior a MMH nas situações de diferenças genéticas entre GCs, e
similar na situação controle. No segundo estudo, diferenças genéticas entre GCs foram
geradas pelo processo de seleção parental. Foram conduzidos três tipos de seleção
parental: com base no BLUP; no fenótipo; e no valor genético verdadeiro (VGV). O
modelo MMH apresentou soluções viesadas quando houve seleção com base no VGV,
e o viés dos modelos alternativos ocorreu principalmente na situação de seleção
baseada no BLUP. O viés apresentado pelo modelo MMH ocorreu no sentido de
subestimar as soluções dos touros usados em gerações com animais de mérito
genético superior. O viés apresentado pelos modelos alternativos, com seleção
baseada no BLUP, ocorreu no sentido oposto. O viés apresentado nas diferentes
situações teve conseqüências sobre a habilidade de cada modelo em selecionar
animais de mérito genético superior e em estimar a tendência genética. Quanto à estas
propriedades, evidências foram observadas de que modelos alternativos podem
apresentar resultados superiores aos do modelo MMH, e que nem sempre a seleção,
ou mais explicitamente, as diferenças genéticas entre níveis dos efeitos ambientais,
deveriam ser ignoradas nas avaliações genéticas.
Palavras-chave: BLUP, efeito de seleção, modelo misto, predição viesada
viii
ALTERNATIVE GENETIC EVALUATION MODELS UNDER THE PRESENCE OFMEAN GENETIC DIFFERENCES BETWEEN LEVELS OF ENVIRONMENTAL
EFFECTS
Summary: Stochastic simulations were carried out to investigate empirical
proprieties of solutions from Henderson's Mixed Model (HMM) and other alternative
models, under the presence of mean genetic differences between levels of
contemporary group effects (CGs). In a first study, mean genetic differences were
caused by non-randomly use of sires across CGs. Under this situation, HMM solutions
were biased. The bias reduced the ability of HMM in properly ranking animals and its
efficiency in selecting superior genetic animals. The alternative model, that assumed sire
as fixed and dam as random effects, presented, in general, better empirical statistical
and genetic proprieties than the other studied models under the presence of mean
genetic differences, and it was similar to HMM in a control situation. In the second study,
mean genetic differences between CGs were generated as a result of parental selection.
Three types of parental selection were carried out: based on BLUP, phenotype and true
breeding value (TBV). MMH presented biased solutions when selection was based on
TBV, the bias being in the direction of underestimating superior genetic sires. The
biases in the alternative tested models occurred mainly for BLUP selection, where sires
with superior genetic merit tended to be over evaluated. Biases presented by the
different models for each situation affected models’ ability to estimate genetic trends and
to select better animals. Regarding to these proprieties, evidences were observed that
alternative models can provide better results than MMH, and that genetic mean
differences between levels of CG effects should not always be ignored in genetic
evaluations.
Keywords: biased estimation, BLUP, mixed model, selection effect
1
CAPÍTULO 1 – CONSIDERAÇÕES GERAIS
1.1 - Problema em estudo
Há interesse, em programas de melhoramento, na predição de valores genéticos
e na utilização destas predições, ou funções das mesmas, como critério de seleção dos
animais, para que progresso genético possa ser obtido.
Sob normalidade e na classe de funções invariantes a translação, o melhor
preditor linear não viesado (BLUP), desenvolvido por HENDERSON (1949) e com
propriedades descritas por HENDERSON et al. (1959) e por HENDERSON (1963),
apresenta-se como critério de seleção ótimo no sentido de maximizar a probabilidade
de classificação correta dos animais quanto ao mérito genético, assim como de
maximizar a média dos valores genéticos de um determinado número de animais
selecionados (HENDERSON, 1973; FERNANDO & GIANOLA, 1986).
Na derivação do BLUP, pressupõe-se que a esperança marginal dos valores
genéticos de todos os animais que estão sendo avaliados seja igual a zero (E(ai)=0).
Esta pressuposição, como discutido a seguir, é raramente atendida para dados de
campo de programas de melhoramento animal.
A violação da pressuposição E(ai)=0 é geralmente tratada na literatura como um
problema de efeito de seleção. Entretanto, cabe salientar que forças ou práticas de
manejo dos animais que atuam no sentido de gerar diferenças genéticas entre níveis
dos efeitos ambientais podem fazer com que a pressuposição E(ai)=0 não seja válida.
Na prática, diferenças genéticas entre ambientes podem ser geradas como resultado de
tomadas de decisão dos produtores (ex.: quais touros usar e como alocar sua progênie
em diferentes grupos de manejo). A seleção parental, por exemplo, se bem aplicada,
faz com que animais de gerações posteriores tenham valor genético esperado superior
ao da média dos valores genéticos da população dos animais que os geraram.
Diferenças genéticas também podem ser criadas a partir do uso não aleatório dos
touros em diferentes ambientes (ex.: touros com mérito genético superior sendo
utilizados nos rebanhos com melhores condições ambientais).
2
Como conseqüência da violação de E(ai)=0, as soluções das Equações de
Modelo Misto de Henderson (EMMH), que forneceriam sob condições ideais o BLUP
dos valores genéticos, não são garantidas de serem não viesadas (HARVEY, 1979;
FRIES & SCHENKEL, 1993). Por sua vez, o viés das soluções das EMMH pode fazer
com que animais com mérito genético inferior sejam selecionados para a reprodução,
podendo também afetar as estimativas e predições de tendências ambientais e
genéticas, bem como a proporção de animais jovens de determinado rebanho a receber
certificado de superioridade genética, e outras conseqüências práticas. Resultados
nesse sentido foram observados por HARVEY (1979), SIMIANER & WOLLNY (1989),
UGARTE et al. (1992), FRIES & SCHENKEL (1993), VISSCHER & GODDARD (1993),
TÄUBERT et al. (2002), entre outros.
HENDERSON (1973 e 1975) apresentou condições especiais em que as
soluções das EMMH regulares são não viesadas mesmo que a pressuposição E(ai)=0seja violada. Tais condições, como, por exemplo, informação de parentesco completa e
decisões tomadas exclusivamente com base em funções invariantes a translação ou em
variáveis não correlacionadas ao valor genético, dificilmente são atendidas em
conjuntos de dados reais oriundos de programas de melhoramento. Para casos em que
estas condições não são atendidas, HENDERSON (1975) propôs modificações nas
EMMH regulares para que o BLUP dos valores genéticos fosse obtido. As EMMH
modificadas requerem uma matriz para descrever o processo seletivo que, no geral,
não é trivial de ser construída. Além disso, não há garantia de que as EMMH
modificadas forneçam valores genéticos preditos que sejam um critério de seleção
ótimo no sentido de permitir a seleção de animais com a média dos valores genéticos
maximizada.
GIANOLA et al. (1988), GIANOLA et al. (1989) e IM et al. (1989) propuseram
modelos alternativos baseados em métodos de estimação por máxima verossimilhança.
Nestes trabalhos, são apresentados argumentos favoráveis ao uso de funções de
verossimilhança não condicionais ao processo de seleção (uL). Se uL for utilizada, o
processo de seleção é ignorável (as funções de verossimilhança resultariam nos
mesmos estimadores considerando ou não os processos de seleção) quando for
3
baseado apenas em informação contida nos dados para análise, ou nos dados e em
variáveis independentes a eles. Caso contrário, o conhecimento do processo de
seleção é necessário para que inferência correta seja feita sobre os parâmetros de
interesse. Se a função conjunta das variáveis aleatórias e das observações fenotípicas
for maximizada condicionalmente ao processo de seleção (cL), as condições para
ignorá-lo são, de acordo com IM et al. (1989), ainda mais restritas do que as
apresentadas por HENDERSON (1975). GIANOLA et al. (1988) derivaram as equações
resultantes da maximização de cL e descreveram as situações especiais em que os
processos de seleção poderiam ser ignorados, como, por exemplo, quando a seleção
ocorre com base em funções das observações fenotípicas que sejam invariantes a
translação.
A derivação do BLUP pressupondo E(ai)≠≠≠≠0 resulta em soluções para os efeitos
ambientais e genéticos sendo obtidas pelo método de quadrados mínimos ponderados
(FRIES & SCHENKEL, 1993; SCHENKEL, 1998), ou pelo método de quadrados
mínimos ordinários (OLS) se homogeneidade de variância residual for assumida. Neste
caso, os efeitos ambientais e genéticos seriam tratados como efeitos fixos e, no geral,
não haveria possibilidade de aplicação do modelo animal individual em virtude da
deficiência de posto da matriz de coeficientes. Uma alternativa seria a utilização de um
modelo touro e vaca, considerando-os como efeitos fixos. Entretanto, assim como nos
modelos de seleção propostos por HENDERSON (1975), não há garantia de que esse
modelo forneça valores genéticos preditos que sejam um critério de seleção ótimo no
sentido de maximizar a média dos valores genéticos dos animais selecionados.
1.2 - Justificativa para a condução do estudoComo não há, até o presente momento, uma solução estatística clara e definitiva
para tratar a não aleatoriedade de ocorrência dos níveis de efeito genético nos níveis
de efeito ambiental, isto é, para tratar forças que atuam no sentido de gerar diferenças
genéticas entre ambientes, torna-se importante a condução de estudos comparando
diferentes modelos e procurando aqueles que forneçam melhores critérios de seleção
sob estas condições.
4
1.3 - Objetivos do estudoOs principais objetivos do presente trabalho foram: (1) avaliar propriedades das
soluções fornecidas pelas Equações de Modelos Mistos de Henderson, sob diferentes
situações de diferenças genéticas entre ambientes; (2) comparar modelos alternativos
de avaliação genética, para cada situação estudada, com base nas propriedades das
soluções fornecidas pelos diferentes modelos; e (3) fornecer informações que possam
auxiliar os melhoristas na escolha de modelos mais apropriados para situações de
diferenças genéticas entre ambientes.
1.4 - Estratégias de desenvolvimento do trabalho1.4.1 - Como comparar os modelos?
Na dificuldade de comparar analiticamente diferentes modelos quanto às suas
propriedades estatísticas e genéticas, especialmente quando E(ai)=0 não é uma
pressuposição atendida, optou-se pela condução de estudos de simulação, seguindo
recomendações de HENDERSON (1989 e 1990).
1.4.2 - Que situações simular?
Na deficiência e impossibilidade de simular todas as situações práticas possíveis,
dois casos isolados foram escolhidos de forma a gerar diferenças genéticas entre
ambientes. Em um primeiro trabalho, investigaram-se as propriedades empíricas das
soluções fornecidas por diferentes modelos sob situações de associação não aleatória
entre touros e grupos de contemporâneos. Um segundo estudo foi conduzido para
comparar os modelos na presença de diferentes tipos de seleção parental.
1.4.3 - Que modelos comparar?
As EMMH foram aplicadas sob seu modelo usual, considerando os valores
genéticos como efeito aleatório e os efeitos de GC como fixos. Os modelos alternativos
utilizados foram baseados nas propostas de FRIES & SCHENKEL (1993) e de
SCHAEFFER (2003), de considerar os valores genéticos ou parte deles como efeitos
fixos. Optou-se pelo emprego de tais modelos porque: (1) há evidências na literatura de
5
que os mesmos possam ser mais apropriados para situações de diferenças genéticas
entre ambientes (HARVEY, 1979; FRIES & SCHENKEL, 1993; SCHAEFFER, 2003); (2)
são modelos que não requerem a descrição/conhecimento dos processos responsáveis
pela não aleatoriedade de ocorrência dos níveis de efeito genético nos níveis de efeito
ambiental; e (3) são modelos de fácil implementação computacional.
6
CAPÍTULO 2 - PROPRIEDADES EMPÍRICAS DAS SOLUÇÕES DAS EQUAÇÕES DEMODELO MISTO DE HENDERSON PARA DIFERENTES SITUAÇÕES DEASSOCIAÇÃO ENTRE TOUROS E GRUPOS DE CONTEMPORÂNEOS
Resumo: Simulações estocásticas foram conduzidas com o objetivo de
investigar propriedades empíricas das soluções das equações de modelo misto de
Henderson (EMMH) sob quatro diferentes situações (ST1 a ST4) de associação entre
touros e grupos de contemporâneos (GC). Os touros tiveram progênie distribuída nos
GCs independentemente de seus valores genéticos verdadeiros (VGV) na situação
ST1, e de acordo com seus VGV nas situações ST2 a ST4, em que diferenças
genéticas entre GCs foram geradas. ST2 foi caracterizada por ausência de correlação
entre os efeitos de touro e de GC. ST3 e ST4 apresentaram, respectivamente,
correlação positiva e negativa entre os efeitos de touro e de GC. As EMMH foram
aplicadas sob um modelo que incluiu os efeitos de GC como fixo, e touro e vaca como
aleatórios (M1). Três modelos alternativos foram usados (M2 a M4). GC, touro e vaca
foram assumidos como efeitos aleatórios no modelo M2, e como efeitos fixos em M3.
No modelo M4, consideraram-se os efeitos de GC e touro como fixos e vaca como
aleatório. Na situação em que não houve diferenças genéticas entre GCs (ST1), os
modelos M1, M2 e M4 apresentaram resultados semelhantes entre si quanto aos
critérios de comparação estudados, enquanto que M3 forneceu soluções com maior
quadrado médio do erro de predição em comparação com os demais modelos. Na
presença de diferenças genéticas entre GCs (ST2 a ST4), as soluções do M1 foram
viesadas, o que reduziu sua habilidade em classificar apropriadamente os animais, bem
como sua eficiência em selecionar touros geneticamente superiores. Dentre os modelos
alternativos testados, M4 apresentou os melhores resultados quanto aos critérios
estudados, mostrando-se superior a M1 nas situações ST2 a ST4, e similar na ST1.
Palavras-chave: avaliação genética, BLUP, correlação entre efeitos ambientais e
genéticos, predições viesadas
7
2.1 - Introdução
Em melhoramento animal, o modelo de avaliação genética usualmente aplicado,
proposto por HENDERSON (1963), é baseado na pressuposição de que a esperança
marginal dos valores genéticos de todos os animais que estão sendo avaliados seja
igual a zero (E(ai)=0).
Diferentes formas de seleção ou práticas que resultem na distribuição não
aleatória dos animais nos níveis de efeitos ambientais (ex.: grupos de contemporâneos
(GC)) podem gerar diferenças genéticas entre estes níveis e, consequentemente,
invalidar a pressuposição E(ai)=0. A seleção parental, por exemplo, se bem aplicada,
faz com que animais de gerações posteriores tenham valor genético esperado superior
ao da média dos valores genéticos da população dos animais que os geraram.
Diferenças genéticas também podem ser criadas a partir de associações não aleatórias
entre touros e GCs como, por exemplo, touros com mérito genético superior sendo
utilizados nos melhores ambientes.
Como conseqüência da violação de E(ai)=0, as soluções das Equações de
Modelo Misto de Henderson (EMMH), que forneceriam sob condições ideais o BLUP
dos valores genéticos, não são garantidas de serem não viesadas (HARVEY, 1979;
FRIES & SCHENKEL, 1993). HENDERSON (1973, 1975) apresentou condições
especiais em que as soluções das EMMH são não viesadas mesmo que a
pressuposição E(ai)=0 seja violada. Tais condições, como, por exemplo, informação de
parentesco completa e diferenças genéticas geradas com base em funções das
observações fenotípicas invariantes a translação, dificilmente são atendidas em
conjuntos de dados reais oriundos de programas de melhoramento.
O viés das soluções das EMMH pode fazer com que animais com mérito
genético inferior sejam selecionados para a reprodução, podendo também afetar as
estimativas e predições de tendências genéticas e ambientais, bem como a proporção
de animais jovens de determinado rebanho a receber certificado de superioridade
genética. Diante de tais conseqüências, torna-se importante o estudo de modelos de
avaliação genética alternativos e o fornecimento de informações que auxiliem os
8
melhoristas na escolha de modelos mais adequados ou menos sensíveis à violação da
pressuposição E(ai)=0.
Os objetivos do presente trabalho foram os de investigar, por meio de simulação
estocástica, propriedades empíricas das soluções das EMMH sob situações de
diferenças genéticas entre GCs causadas pela associação não aleatória entre os
efeitos de touro e de GC, e comparar modelos alternativos nestas situações.
2.2 - Material e Métodos2.2.1 - Estrutura das populações simuladas
A população base simulada consistiu de 250 machos (touros) e 2.500 fêmeas
(vacas), não aparentados, não selecionados e assumidos de serem amostrados
aleatoriamente de uma população conceitualmente infinita. Cada vaca foi acasalada
duas vezes, com touros escolhidos aleatoriamente, gerando dois produtos, um por
acasalamento. Apenas uma geração de progênie foi simulada. Os 5.000 produtos
gerados foram distribuídos em 200 grupos de contemporâneos (GC) de acordo com
quatro situações distintas (ST1 a ST4).
Para gerar as diferentes situações, cinco conjuntos de 40 GCs (sGC1 a sGC5) e
cinco conjuntos de 50 touros foram formados com base na sua identificação (ID) ou na
classificação dos valores verdadeiros de seus efeitos (rank), dependendo da situação
simulada (segue ilustração na Tabela 2.1, e no Apêndice 1). Os touros foram agrupados
conforme sua ID na ST1 e conforme seu rank, em ordem decrescente dos valores
genéticos verdadeiros, nas situações ST2 a ST4. Os GCs foram agrupados conforme
sua ID nas situações ST1 e ST2, e seu rank nas situações ST3 (ordem decrescente) e
ST4 (ordem crescente).
9
Tabela 2.1 Valores genéticos verdadeiros (VGV) dos touros e efeitos verdadeiros dos gruposde contemporâneos (VGC), com respectivas classificações, referentes à primeiraamostra do processo de simulação utilizada para simular a situação controle (ST1a).
Touro Grupo de Contemporâneos
Identificação Classificaçãodescendente VGV (kg) Identificação Classificação
ascendenteClassificaçãodescendente VGC (kg)
1 125 -0,88 1 141 60 182,222 128 -1,10 2 74 127 165,85
... ... ... ... ... ... ...49 2 25,24 39 166 35 186,9550 100 1,19 40 73 128 165,0951 234 -17,45 41 18 183 149,9952 235 -17,47 42 172 29 190,27
... ... ... ... ... ... ...99 9 18,33 79 6 195 143,28
100 209 -11,83 80 194 7 201,97101 215 -12,82 81 37 164 157,32102 219 -13,36 82 182 19 194,88... ... ... ... ... ... ...149 81 3,45 119 28 173 154,39150 35 9,79 120 160 41 185,03151 76 3,82 121 179 22 194,08152 14 17,49 122 40 161 158,41... ... ... ... ... ... ...199 75 3,88 159 87 114 170,17200 45 7,37 160 142 59 182,48201 201 -10,40 161 71 130 165,00202 8 18,36 162 112 89 174,58... ... ... ... ... ... ...249 73 3,96 199 152 49 183,73250 71 4,11 200 155 46 184,53
a Situação caracterizada pela ausência de diferenças genéticas entre GCs e ausência de correlaçãogenética ambiental, com conjuntos de touros e de GCs formados de acordo com suas identificações.
As subclasses definidas por conjuntos de touros e de GCs apresentaram
diferentes probabilidades de ocorrência devido à distribuição não aleatória dos produtos
nos GCs (Tabela 2.2). Os valores das probabilidades foram definidos de forma
arbitrária, levando-se apenas em consideração que cada conjunto de GC e de touro
apresentasse igual probabilidade de ocorrência (0,20).
10
Tabela 2.2 Freqüências (%) esperadas e observadas da ocorrência das subclasses definidaspor conjuntos de touros e conjuntos de grupos de contemporâneos (GCs).
Conjuntos Conjuntos de GCs a
de Touros b 1-40 41-80 81-120 121-160 161-2001-50 12 c (11,96 d) 6 (5,93) 2 (1,96) 0 (0,00) 0 (0,00)
51-100 6 (6,01) 8 (8,02) 4 (4,04) 2 (1,98) 0 (0,00)101-150 2 (2,00) 4 (3,98) 8 (8,14) 4 (4,05) 2 (2,00)151-200 0 (0,00) 2 (2,01) 4 (4,05) 8 (7,99) 6 (5,91)201-250 0 (0,00) 0 (0,00) 2 (1,98) 6 (6,10) 12 (11,89)
a Os conjuntos de GCs foram formados conforme o número de identificação do GC nas situações 1 (ST1)e 2 (ST2), de acordo com a classificação descendente dos efeitos verdadeiros de GC (VGC) na ST3, econforme a classificação ascendente de VGC na ST4.
b Os conjuntos de touros foram formados de acordo com o número de identificação do touro na ST1, econforme a classificação descendente de seus valores genéticos verdadeiros nas situações ST2 a ST4.
c Valores esperados, que foram utilizados no processo de simulação.d Valores observados (média das 50 repetições).
Na ST1, situação controle, diferenças genéticas entre GCs não são esperadas
visto que os conjuntos de touros foram formados de acordo com sua ID. Entretanto,
para as situações ST2 a ST4, diferenças genéticas entre GCs foram geradas pois os
touros foram agrupados conforme seu rank, de forma que, sGC1 e sGC2 tiveram maior
proporção de produtos dos melhores touros, sGC3 apresentou maior proporção de
produtos dos touros intermediários, enquanto que sGC4 e sGC5 apresentaram maior
proporção de produtos dos piores touros (Tabela 2.2).
ST2 foi caracterizada por ausência de correlação genética ambiental (rG,E), pois
os GCs foram agrupados com base em sua ID. Já, para as situações ST3 e ST4, rG,E
positivas e negativas foram geradas em decorrência da formação de conjuntos de GCs
baseados em seu rank nas ordens decrescente e crescente, respectivamente.
A conectabilidade dos GCs foi garantida pela imposição de restrições sobre o
valor mínimo para número de produtos por touro (5), produtos por GC (10), touros por
GC (3) e GC por touro (3), e também por meio da aplicação do programa MILC (FRIES,
1998), que considera como dado conectado aquele que estiver em um GC com mais de
10 laços genéticos com outros GCs e que tenha pelo menos três pais (touros e/ou
11
vacas) conectados. Novas replicações foram simuladas caso algum GC estivesse
desconectado.
Para cada situação, 50 repetições foram simuladas, sendo gerados, portanto,
200 conjuntos de dados. Variaram, a cada replicação, o acasalamento entre os animais
base, o número de filhos por touro, a alocação e o número de animais por GC.
2.2.2 - Modelo de simulaçãoA cada repetição, observações fenotípicas de uma característica hipotética, que
será denominada como ganho de peso pós-desmame (GPPD), foram simuladas, exceto
para os animais base, de acordo com o modelo: yij = bi + aij + eij , em que yij é o GPPD
do animal j no GC i, bi é o efeito do GC i, aij é o valor genético aditivo do animal j no GC
i e eij é o termo referente ao erro aleatório.
Valores para eij foram independentemente amostrados de uma distribuição
normal com média zero e variância de 180 kg2 (N(0;180)). Valores para bi foram
amostrados de uma N(172,5;300). Os valores genéticos dos animais base foram
gerados a partir de uma N(0;120), e os valores genéticos de seus produtos foram
gerados como: aij = ½( asj + adj) + mij, em que asj e adj são os valores genéticos aditivos
do touro e da vaca que geraram o animal j, e mij é o efeito da Segregação Mendeliana
do animal j, que foi amostrada de uma N(0;60). Os parâmetros usados no processo de
simulação reproduziram uma característica com herdabilidade igual a 0,4 e são
semelhantes aos estimados por CARVALHEIRO (2000) para a característica GPPD de
um conjunto de dados de bovinos da raça Nelore.
Os programas para simular a estrutura dos dados e as observações fenotípicas
foram desenvolvidos no software estatístico SAS (Statistical Analysis System) (SAS,
1998), e se encontram nos Apêndices 2 e 3, respectivamente.
2.2.3 - Análises Estatísticas
Para cada um dos 200 conjuntos de dados, análises foram conduzidas sob
quatro diferentes modelos, que podem ser descritos pela equação:
y = Xββββ + Zss + Zdd + e ,
12
em que: y é o vetor de GPPD, ββββ é o vetor de efeito de GC, s e d são, respectivamente,
os vetores de efeito genético aditivo de touro e de vaca, e é o vetor de resíduos, X, Zs e
Zd são as matrizes de incidência que relacionam os elementos de ββββ, s e d com os
elementos de y, respectivamente. O modelo de touro e vaca foi utilizado, pois o mesmo
eqüivale ao modelo animal para as situações simuladas no presente estudo, em que
animais base não apresentaram dados (observações fenotípicas) e animais com dados
não apresentaram progênie (HENDERSON, 1984).
No modelo 1 (M1), ββββ foi considerado como vetor de efeito fixo, e s e d como
vetores de efeitos aleatórios. As matrizes de esperança e (co)variância são dadas por:
E(y) = Xββββ, E(s) = E(d) = E(e) = 0, Var(y) = V = 222 '' endddsss IZZZZ σσσσσσσσσσσσ ++ , Var(s) =
2ssI σσσσ , Var(d) = 2
ddI σσσσ e Var(e) = 2enI σσσσ , em que: sI , dI e nI são matrizes identidade de
ordens iguais aos números de touros, de vacas e de observações, respectivamente, 2sσσσσ
e 2dσσσσ são as variâncias dos efeitos genéticos de touro e vaca, que são iguais a um
quarto da variância genética aditiva ( 2sσσσσ = 2
dσσσσ =1/4 2aσσσσ ), e 2
eσσσσ é a variância residual.
Matrizes de (co)variância com uma estrutura diagonal foram utilizadas para s e d, pois
os touros e as vacas eram animais não aparentados nas populações simuladas.
Soluções para ββββ, s, e d foram obtidas com base nas equações de modelos mistos de
Henderson (EMMH) (HENDERSON, 1963).
O modelo 2 (M2) diferiu do M1 com respeito a ββββ. No M2, ββββ foi considerado como
vetor de efeito aleatório. Portanto, para M2, E(y) = µµµµ, E(ββββ) = 0, Var(y) =2en
2ddd
2sss
2gc I'ZZ'ZZ'XX σσσσ++++σσσσ++++σσσσ++++σσσσ e Var(ββββ) = 2
gcgcI σσσσ , em que: µµµµ é o vetor da média
geral, gcI é a matriz de incidência de ordem igual ao número de GC, e 2gcσσσσ é a variância
devida ao efeito de GC. As matrizes de esperança e (co)variância dos demais efeitos
aleatórios são iguais àquelas definidas no M1. As soluções também foram obtidas
conforme as EMMH, mas com o valor da relação entre as variâncias residual e de GC
( 2eσσσσ / 2
gcσσσσ ) adicionado aos elementos da diagonal da matriz de coeficientes (lado
esquerdo do sistema de equações) correspondentes ao efeito de GC.
13
O modelo M2 foi aplicado para investigar as considerações de VAN VLECK
(1987), UGARTE et al. (1992), e VISSCHER & GODDARD (1993) de que benefícios
poderiam ocorrer ao assumir GC como efeito aleatório em situações similares à ST3
simulada no presente trabalho.
No modelo 3 (M3), ββββ, s, e d foram assumidos como vetores de efeitos fixos.
Assim, E(y) = Xββββ + Zss + Zdd, E(e) = 0, e Var(y) = Var(e) = 2enI σσσσ . As soluções para M3
foram obtidas por um procedimento em dois passos. No primeiro, soluções foram
obtidas pelo método de quadrados mínimos ordinários (OLS), impondo-se as restrições
de que a soma dos elementos de s e d fossem iguais a zero. Como segundo passo, as
soluções para s e d foram multiplicadas pelo fator de regressão: np/(np+ 2eσσσσ /(1/4 2
aσσσσ )),
sendo np o tamanho da progênie dos correspondentes elementos em s e d.
Para o quarto modelo empregado (M4), ββββ e s foram considerados como vetores
de efeitos fixos e d como vetor de efeito aleatório, com E(y) = Xββββ + Zss, E(d) = E(e) = 0,
Var(y) = 22' enddd IZZ σσσσσσσσ + , Var(d) = 2ddI σσσσ , e Var(e) = 2
enI σσσσ . As soluções foram obtidas
conforme equações similares as EMMH, mas sem adicionar a relação entre as
variâncias residual e de touro ( 2eσσσσ / 2
sσσσσ ) aos elementos da diagonal da matriz de
coeficientes correspondentes ao efeito de touro. A restrição de que a soma dos
elementos em s fosse igual a zero foi imposta, e as soluções para s foram regredidas
como segundo passo usando o mesmo fator de regressão definido para o M3.
Para todos os modelos, os valores genéticos esperados (VGE) dos touros e
vacas foram obtidos multiplicando-se as soluções para s e d por dois. Os componentes
de variância usados nas análises foram iguais àqueles empregados no processo de
simulação dos dados, ou seja, não foram estimados.
Os programas desenvolvidos para conduzir as avaliações genéticas, sob os
quatro diferentes modelos, encontram-se no Apêndice 4.
2.2.4 - Critérios de comparação dos modelosOs modelos foram comparados com relação ao viés e ao quadrado médio do
erro de predição (QME), que foram definidos por:
14
viésw = 1/q∑=
−q
iii ww
1
)ˆ( , e QMEw = 1/q∑=
−q
iii ww
1
2)ˆ( ,
em que: wi é o efeito verdadeiro de GC (VGC) ou efeito genético verdadeiro (VGV) de
touro ou de vaca, iw é o efeito estimado de GC (EGC) ou o VGE de touro ou de vaca,
e q é o número de GCs, touros ou vacas, respectivamente.
Correlações de Spearman entre VGV e VGE foram calculadas como uma
alternativa de avaliar a habilidade de cada modelo em classificar apropriadamente os
animais. Na tentativa de mensurar a eficiência de cada modelo em selecionar animais
de mérito genético superior, também foram calculadas as médias dos VGVs de touros
selecionados conforme os VGEs fornecidos pelos diferentes modelos. Para este último
critério, foram conduzidos testes-t pareados com um nível de significância de 5%.
Para todos os critérios descritos acima, os modelos foram comparados com base
na média aritmética dos valores que cada critério assumiu em cada uma das 50
repetições.
2.3 - Resultados e Discussão2.3.1 - Dados Simulados
Resultados referentes à estrutura das populações simuladas são apresentados
na Tabela 2.3. Em média, 9,2% das subclasses definidas por touro e GC foram
preenchidas, os touros apresentaram o mínimo de 8,6 e o máximo de 33,5 produtos, e
os GCs apresentaram o mínimo de 12,5 e o máximo de 40,3 animais.
Tabela 2.3 Informações referentes à estrutura das populações simuladas (médias das 50repetições).
Média Mínimo MáximoProdutos por touro 20,00 8,60 33,48Produtos por GC 25,00 12,54 40,28Touros por GC 22,94 11,54 36,08GCs por touro 18,35 8,12 30,04% de subclasses touro x GCpreenchidas 9,18 9,10 9,26
15
Na Tabela 2.4, são apresentadas as médias e variâncias dos valores genéticos
verdadeiros (VGV) dos produtos e dos efeitos verdadeiros de GC (VGC) para as
diferentes situações simuladas. Como desejado, os valores observados das médias e
variâncias gerais (última linha da tabela) foram próximos aos parâmetros utilizados no
processo de simulação. As médias de VGV por conjunto de GC foram próximas a zero
na situação ST1, e variaram de –5,52 a 5,36 kg nas situações ST2 a ST4. As variâncias
de VGV foram reduzidas nas situações ST2 a ST4, mas foram semelhantes entre os
conjuntos de GC, isto é, não houve heterogeneidade de variância genética. As médias
de VGC por conjunto de GC foram próximas a 172,5 kg em ST1 e ST2, e variaram de
148,37 a 197,27 kg em ST3 e ST4. Heterogeneidade de variância de VGC entre os
conjuntos de GC foi observada nas situações ST3 e ST4. Seguindo o processo de
simulação, ST1 foi caracterizada por ausência de diferenças genéticas entre GCs e de
correlação entre o VGV dos produtos e o VGC (rG,E); ST2, ST3 e ST4 apresentaram
diferenças genéticas entre GCs, e rG,E iguais a 0,00, 0,34, e –0,34, respectivamente (as
correlações entre o VGV dos touros e o VGC foram iguais a 0,00 para ST1 e ST2, 0,68
para ST3 e –0,68 para ST4).
Tabela 2.4 Médias (kg) e variânciasa (kg2) dos valores genéticos verdadeiros dos produtos(VGV) e dos efeitos verdadeiros dos grupos de contemporâneos (VGC), porconjunto de GC e situação simuladab (médias das 50 repetições).
Conjunto VGV VGCde GC ST1 ST2 a ST4 ST1 e ST2 ST3 ST41-40 -0,09 (120,58) 5,36 (102,06) 172,89 (292,50) 197,27 (68,16) 148,37 (64,65)41-80 -0,07 (119,85) 3,07 (105,01) 172,73 (303,08) 181,97 (9,66) 163,30 (9,13)81-120 -0,12 (118,71) -0,13 (105,79) 172,64 (305,74) 172,55 (7,24) 172,55 (7,24)121-160 -0,03 (119,52) -3,20 (104,73) 172,50 (315,48) 163,30 (9,13) 181,97 (9,66)161-200 -0,15 (119,60) -5,52 (101,73) 172,70 (318,77) 148,37 (64,65) 197,27 (68,16)
Geral -0,09 (119,78) -0,08 (119,60) 172,69 (307,44) 172,69 (307,44) 172,69 (307,44)a Valores entre parênteses.b ST1: ausência de diferenças genéticas entre GCs e de correlação entre os efeitos de touro e de GC.
ST2: diferenças genéticas entre GCs e ausência de correlação entre os efeitos de touro e de GC.ST3: diferenças genéticas entre GCs e correlação positiva entre os efeitos de touro e de GC.ST4: diferenças genéticas entre GCs e correlação negativa entre os efeitos de touro e de GC.
16
2.3.2 - Soluções para o efeito de grupo de contemporâneos
São apresentados, na Tabela 2.5, o viés e o QME das soluções para os efeitos
de GC (EGC) fornecidas pelos diferentes modelos. Observou-se que o modelo M1
apresentou EGC viesado para as situações em que houve diferenças genéticas entre
GCs (ST2 a ST4). GCs com animais superiores geneticamente tiveram seus efeitos
superestimados (e vice versa), de acordo com as considerações de HARVEY (1979) e
FRIES & SCHENKEL (1993), de que as soluções para os efeitos fixos fornecidas pelas
EMMH podem estar contaminadas por efeitos genéticos. É interessante notar que
quando todos os GCs foram considerados (viés geral) o viés não foi observado.
O viés e o QME das soluções de M1 foram os mesmos para as situações ST2,
ST3 e ST4, evidenciando que o problema está associado à existência de diferenças
genéticas entre GCs, e não em razão da covariância genética ambiental. Mesmo
quando rG,E foi igual a zero, a soluções das EMMH foram viesadas (soluções do M1 na
ST2).
Considerar GC como efeito aleatório (modelo M2) resultou em pequena redução
do viés em comparação com o modelo M1, na ST2. A redução do QME também foi
pequena, em ST1 e ST2. Estes resultados estão relacionados ao tamanho dos GCs,
que em média apresentaram 25 animais, e ao valor relativamente pequeno da razão
entre as variâncias residual e de GC (HENDERSON, 1973). Na situação ST3, em
concordância com UGARTE et al. (1992) e VISSCHER & GODDARD (1993), M2
apresentou melhores resultados do que o modelo M1 com relação ao viés e ao QME.
As soluções regredidas do efeito de GC, obtidas ao considerá-lo como efeito aleatório
(M2), foram menos contaminadas pelos valores genéticos em comparação com M1. A
mesma redução no viés não foi observada em ST4. Nesta situação, o viés e o QME
foram maiores no modelo M2 do que no M1, assim como observado por VISSCHER &
GODDARD (1993). Portanto, parece que a decisão de tratar o efeito de GC como fixo
ou aleatório não depende apenas do tamanho do GC e do valor da razão entre as
variâncias residual e de GC, mas também da direção de uma possível covariância
genética ambiental.
17
Tabela 2.5 Viés e quadrado médio do erro (QME) das estimativas dos efeitos de grupos decontemporâneos (EGC) fornecidas pelos diferentes modelos, por conjunto de GC esituação simuladaa (médias das 50 repetições).
ST1Conjunto Modelo 1 (M1) Modelo 2 (M2) Modelo 3 (M3) Modelo 4 (M4)de GC viés (kg) QME (kg2) viés QME viés QME viés QME1-40 0,13 10,92 0,11 10,43 0,06 23,74 0,15 11,3041-80 -0,03 11,56 -0,03 10,90 0,04 22,59 -0,02 11,9081-120 -0,07 11,87 -0,06 11,54 0,00 23,21 -0,06 12,10121-160 0,07 11,03 0,08 10,64 0,05 22,95 0,04 11,20161-200 -0,11 12,22 -0,09 12,04 -0,15 24,47 -0,12 12,57
Geral 0,00 11,52 0,00 11,11 0,00 23,39 0,00 11,81ST2Conjunto Modelo 1 (M1) Modelo 2 (M2) Modelo 3 (M3) Modelo 4 (M4)de GC viés QME viés QME viés QME viés QME1-40 3,13 20,73 2,92 18,98 0,06 23,74 0,15 11,3041-80 1,75 14,63 1,63 13,57 0,04 22,59 -0,02 11,9081-120 -0,07 11,90 -0,07 11,56 0,00 23,21 -0,06 12,10121-160 -1,73 14,18 -1,61 13,33 0,05 22,95 0,04 11,20161-200 -3,08 21,54 -2,88 20,18 -0,15 24,47 -0,12 12,57
Geral 0,00 16,60 0,00 15,52 0,00 23,39 0,00 11,81ST3Conjunto Modelo 1 (M1) Modelo 2 (M2) Modelo 3 (M3) Modelo 4 (M4)de GC viés QME viés QME viés QME viés QME1-40 3,13 20,73 1,48 12,36 0,06 23,74 0,15 11,3041-80 1,75 14,63 0,96 11,56 0,04 22,59 -0,02 11,9081-120 -0,07 11,90 -0,06 10,97 0,00 23,21 -0,06 12,10121-160 -1,73 14,18 -0,94 11,18 0,05 22,95 0,04 11,20161-200 -3,08 21,54 -1,43 13,39 -0,15 24,47 -0,12 12,57
Geral 0,00 16,60 0,00 11,89 0,00 23,39 0,00 11,81ST4Conjunto Modelo 1 (M1) Modelo 2 (M2) Modelo 3 (M3) Modelo 4 (M4)de GC viés QME viés QME viés QME viés QME1-40 3,13 20,74 4,38 29,53 0,06 23,74 0,15 11,3041-80 1,75 14,63 2,32 16,15 0,04 22,59 -0,02 11,9081-120 -0,07 11,90 -0,06 11,07 0,00 23,21 -0,06 12,10121-160 -1,73 14,18 -2,29 15,70 0,05 22,95 0,04 11,20161-200 -3,08 21,54 -4,34 30,11 -0,15 24,47 -0,12 12,57
Geral 0,00 16,60 0,00 20,51 0,00 23,39 0,00 11,81a ST1: ausência de diferenças genéticas entre GCs e de correlação entre os efeitos de touro e de GC.
ST2: diferenças genéticas entre GCs e ausência de correlação entre os efeitos de touro e de GC.ST3: diferenças genéticas entre GCs e correlação positiva entre os efeitos de touro e de GC.ST4: diferenças genéticas entre GCs e correlação negativa entre os efeitos de touro e de GC.
18
Seguindo as considerações de HARVEY (1979) e FRIES & SCHENKEL (1993),
as soluções do efeito de GC fornecidas pelo modelo M3 foram não viesadas em todas
as situações simuladas (ST1 a ST4). Entretanto, como esperado (HENDERSON, 1978),
M3 apresentou maior QME do que M1, em decorrência da maior variância do erro de
predição (VEP) (VEP = QME - viés2). Note que as soluções do M3 foram obtidas por
OLS como primeiro passo e que as vacas apresentaram apenas dois produtos, fator
este que contribuiu para os resultados observados. O VEP de soluções por OLS
também pode ser altamente influenciado pelo grau de desbalanceamento dos dados. O
viés e o QME do M3 foram idênticos para todas as situações (ST1 a ST4), isto é, seus
valores independeram da presença de diferenças genéticas entre GCs e de correlação
genética ambiental.
Similarmente ao modelo M3, os resultados do modelo M4 com respeito ao viés e
ao QME foram os mesmos para todas as situações simuladas. Além de não viesadas,
as soluções do modelo M4 apresentaram QME semelhante ao do modelo M1 na
situação ST1. Para casos em que as fêmeas apresentam número reduzido de progênie
e não são a principal causa da existência de diferenças genéticas entre GCs (como, por
exemplo, para espécies em que há pouca oportunidade para a seleção operar sobre as
fêmeas), o uso do modelo M4 parece ser um comprometimento entre remover o viés
sem que ocorra aumento expressivo do VEP. Com relação ao viés e ao QME, M4
apresentou melhores resultados do que o modelo M1 nas situações ST2 a ST4. Mesmo
quando a pressuposição usual requerida pelas EMMH para fornecer estimativas não
viesadas foi atendida (ST1), M4 não apresentou resultados inferiores a M1.
2.3.3 - Soluções para touros
A Tabela 2.6 apresenta os valores de viés e QME dos VGEs dos touros para
cada situação (ST1 a ST4) e modelo (M1 a M4). Correlações de Spearman (CORR)
entre VGV e VGE também são apresentadas. Foram obtidos resultados gerais e por
conjunto de touros.
19
Tabela 2.6 Viés (kg) e quadrado médio do erro (QME) (kg2) dos valores genéticos esperadosdos touros (VGE), e correlação de Spearman entre VGE e o valor genéticoverdadeiro (CORR), para cada modelo, conjunto de touros e situação simuladaa
(médias das 50 repetições).
ST1Conjunto Modelo 1 (M1) Modelo 2 (M2) Modelo 3 (M3) Modelo 4 (M4)de touros viés QME CORR viés QME CORR viés QME CORR viés QME CORR
1-50 0,06 39,72 0,79 0,07 39,75 0,79 -0,06 72,27 0,67 0,02 40,45 0,7951-100 0,12 41,20 0,78 0,13 41,13 0,78 0,20 69,12 0,68 0,12 41,60 0,78101-150 0,05 38,92 0,80 0,05 38,85 0,80 0,01 69,81 0,67 0,04 39,23 0,80151-200 0,08 39,35 0,80 0,08 39,23 0,80 0,01 67,17 0,68 0,10 39,42 0,80201-250 0,35 39,57 0,80 0,33 39,58 0,80 0,49 67,41 0,69 0,37 39,75 0,80
Geral 0,13 39,75 0,80 0,13 39,71 0,80 0,13 69,16 0,69 0,13 40,09 0,80ST2Conjunto Modelo 1 (M1) Modelo 2 (M2) Modelo 3 (M3) Modelo 4 (M4)de touros viés QME CORR viés QME CORR viés QME CORR viés QME CORR
1-50 -8,06 95,55 0,51 -7,84 92,18 0,51 -4,55 85,52 0,38 -4,46 53,45 0,5151-100 -3,59 40,53 0,21 -3,46 39,58 0,22 -1,41 58,99 0,18 -1,49 32,35 0,21101-150 0,00 26,51 0,22 0,00 26,46 0,22 -0,05 58,91 0,16 -0,02 28,92 0,22151-200 3,94 41,72 0,25 3,81 40,63 0,25 1,76 59,18 0,19 1,85 32,08 0,25201-250 8,38 99,73 0,51 8,16 96,12 0,51 4,92 83,76 0,40 4,80 54,72 0,51
Geral 0,13 60,81 0,65 0,13 59,00 0,66 0,13 69,27 0,69 0,13 40,30 0,80ST3Conjunto Modelo 1 (M1) Modelo 2 (M2) Modelo 3 (M3) Modelo 4 (M4)de touros viés QME CORR viés QME CORR viés QME CORR viés QME CORR
1-50 -8,05 95,55 0,51 -6,40 71,68 0,51 -4,55 85,50 0,38 -4,46 53,44 0,5151-100 -3,59 40,53 0,21 -2,60 34,17 0,21 -1,41 58,99 0,18 -1,49 32,35 0,21101-150 0,00 26,51 0,22 -0,01 26,32 0,22 -0,05 58,91 0,16 -0,02 28,92 0,22151-200 3,94 41,72 0,25 2,96 34,83 0,25 1,75 59,17 0,19 1,84 32,08 0,25201-250 8,38 99,73 0,51 6,72 74,72 0,51 4,91 83,74 0,40 4,80 54,71 0,51
Geral 0,13 60,81 0,65 0,13 48,35 0,74 0,13 69,26 0,69 0,13 40,30 0,80ST4Conjunto Modelo 1 (M1) Modelo 2 (M2) Modelo 3 (M3) Modelo 4 (M4)de touros viés QME CORR viés QME CORR viés QME CORR viés QME CORR
1-50 -8,06 95,57 0,51 -9,29 116,97 0,51 -4,55 85,54 0,38 -4,46 53,46 0,5151-100 -3,59 40,53 0,21 -4,33 46,53 0,21 -1,41 58,99 0,18 -1,49 32,36 0,21101-150 0,00 26,51 0,22 0,00 26,66 0,22 -0,05 58,91 0,16 -0,02 28,92 0,22151-200 3,94 41,72 0,25 4,67 48,08 0,25 1,76 59,18 0,19 1,85 32,08 0,25201-250 8,38 99,75 0,51 9,62 122,19 0,51 4,92 83,78 0,40 4,80 54,73 0,51
Geral 0,13 60,82 0,65 0,13 72,08 0,56 0,13 69,28 0,69 0,13 40,31 0,80a ST1: ausência de diferenças genéticas entre GCs e de correlação entre os efeitos de touro e de GC.
ST2: diferenças genéticas entre GCs e ausência de correlação entre os efeitos de touro e de GC.ST3: diferenças genéticas entre GCs e correlação positiva entre os efeitos de touro e de GC.ST4: diferenças genéticas entre GCs e correlação negativa entre os efeitos de touro e de GC.
20
Em ST1, os VGEs fornecidos por todos os modelos estudados foram não
viesados. O modelo M3 apresentou maiores QME e menores CORR. Os demais
modelos apresentaram QME e CORR semelhantes entre si.
Nas situações ST2 a ST4, todos os modelos apresentaram soluções viesadas.
O viés dos modelos M3 e M4 está relacionado ao uso do fator de regressão (como
segundo passo) para obtenção das soluções, fazendo com que os touros extremos
tivessem seus VGEs proporcionalmente mais regredidos em relação a zero do que os
touros intermediários. M1 apresentou viés adicional pois, como mencionado
anteriormente, as soluções para os efeitos de GC deste modelo foram contaminadas
por efeitos genéticos. Os touros superiores tiveram seus VGEs subestimados porque
parte de sua superioridade foi estimada como efeito de GC, sendo que o oposto
ocorreu para os touros inferiores.
Ao considerar GC como efeito aleatório (M2), funções dos efeitos de GC são
incorporadas nos VGEs (VAN VLECK, 1987). Assim como em VISSCHER &
GODDARD (1993), a conseqüência deste confundimento foi que os resultados de M2
foram, em comparação com M1, favoráveis (menor viés e QME e maior CORR) nas
situações ST2 e ST3 e desfavoráveis em ST4. Os valores das correlações genética
ambiental nas situações ST2, ST3 e ST4 explicam estes resultados. Na situação ST4,
por exemplo, em que os melhores touros estão associados aos piores GCs, as funções
dos efeitos de GC incorporadas nos VGEs, ao considerar GC como aleatório, fizeram
com que os VGEs dos melhores touros fossem subestimados de forma mais acentuada,
e vice versa.
Em todas as situações estudadas, o modelo M3 apresentou menores CORR por
conjunto de touros do que o modelo M1, em decorrência da maior VEP. Entretanto, é
interessante notar que, nas situações ST2 a ST4, M3 apresentou maior CORR geral do
que M1, em decorrência do confundimento entre os efeitos de touro e de GC nas
soluções fornecidas por M1. Semelhantemente aos resultados de HARVEY (1979), a
CORR geral do modelo M3 permaneceu a mesma para as diferentes situações,
enquanto que a CORR geral do modelo M1 foi maior em ST1 do que nas situações ST2
a ST4.
21
Diferenças genéticas entre GCs (ST2 a ST4) reduziram a habilidade de M4 em
classificar apropriadamente os animais por conjunto de touros, assim como para os
outros modelos, pois touros de mérito genético similar tenderam a ser comparados mais
freqüentemente entre eles. Contudo, a CORR geral do modelo M4 permaneceu
constante (0,8) para todas as situações, e foi superior àquelas obtidas pelos demais
modelos nas situações ST2 a ST4.
Na tentativa de mensurar a eficiência de cada modelo em predizer a
superioridade genética nas diferentes situações, foram calculadas as médias dos VGVs
de touros “top” selecionados conforme os VGEs fornecidos pelos diferentes modelos
(Tabela 2.7). Três intensidades de seleção foram aplicadas: 50% (top50), 20% (top20) e
2% (top2) dos melhores touros. Na última coluna da Tabela 2.7 são apresentadas as
médias dos VGVs dos touros “top” numa situação hipotética em que estes seriam
selecionados de acordo com o VGV, apenas para avaliar quão distante cada modelo
está desta situação ideal.
Para os modelos M1 e M2, as diferenças genéticas entre GCs tiveram,
proporcionalmente, maior impacto sobre o VGV médio de touros selecionados com
intensidade moderada (20%) e baixa (50%). No M1, o VGV médio dos top20 e top50 foi
menor para as situações ST2 a ST4 do que para a ST1 (p<0,05). O mesmo foi
observado para o modelo M2 (p<0,05). A habilidade de M3 e M4 em selecionar touros
não foi afetada pela situação simulada, isto é, os resultados de ST1 e ST2 a ST4 não
diferiram (p>0,05). Considerando as situações ST2 a ST4, o modelo M1 apresentou
maior VGV médio do que M3 para os top2, mas menor para os top50, e o modelo M4
apresentou maior VGV médio do que M1 para todas as intensidades de seleção
(p<0,05). Contrastando os modelos M4 e M2, M4 foi superior a M2 para os top50 e
top20 na situação ST3 e para todas as intensidades de seleção na situação ST4
(p<0,05).
22
Tabela 2.7 Médias (kg) dos valores genéticos verdadeiros dos touros (VGV) selecionadosconforme as soluções de cada modelo, para diferentes intensidades de seleção esituações simuladasa (médias das 50 repetições).
N.º de touros Modelo 1 (M1) Modelo 2 (M2) Modelo 3 (M3) Modelo 4 (M4) VGVSelecionados ST1 ST2-ST4 ST1 ST2 ST3 ST4 ST1 ST2-ST4 ST1 ST2-ST4 ST1-ST4
125 (50%) 6,92 5,61 6,90 5,73 6,40 4,84 5,99 5,99 6,93 6,92 8,5250 (20%) 12,28 10,37 12,29 10,53 11,47 9,23 10,68 10,60 12,28 12,28 15,055 (2%) 20,73 20,64 20,68 20,59 21,11 20,26 18,01 18,73 20,94 21,29 25,84
a ST1: ausência de diferenças genéticas entre GCs e de correlação entre os efeitos de touro e de GC.ST2: diferenças genéticas entre GCs e ausência de correlação entre os efeitos de touro e de GC.ST3: diferenças genéticas entre GCs e correlação positiva entre os efeitos de touro e de GC.ST4: diferenças genéticas entre GCs e correlação negativa entre os efeitos de touro e de GC.
Conforme os resultados apresentados, é possível notar que a existência de
heterogeneidade de variância ambiental entre os conjuntos de GC nas situações ST3 e
ST4 não afetou as soluções dos modelos que assumiram GC como fixo (M1, M2 e M3),
pois estes apresentaram resultados iguais para as situações ST3 e ST4 em
comparação com a situação ST2 - caracterizada pela ausência de heterogeneidade de
variância ambiental.
As comparações para as soluções de vacas não foram apresentadas porque
todos os modelos tiveram resultados semelhantes independente da situação simulada,
como esperado, uma vez que as vacas não eram fonte da existência de diferenças
genéticas entre GCs.
Os VGEs dos produtos foram obtidos por retro-substituição (HENDERSON,
1984). Considerando o modelo M1 e as situações ST2 a ST4, os VGEs dos produtos
não foram tão afetados pelo viés quanto os VGEs dos touros (dados não
apresentados). Este resultado é explicado pela existência de viés em direção oposta
para as soluções de touro e de GC, que tenderam a se cancelar ao estimar o efeito da
Segregação Mendeliana.
23
2.3.4 - Discussão geral
Propriedades empíricas das soluções das equações de modelo misto de
Henderson foram investigadas para diferentes situações de associação entre touros e
GCs. As situações ST2 a ST4 são casos de “seleção do tipo L’u” de acordo com a
terminologia adotada por HENDERSON (1973), pois os touros tiveram seus produtos
alocados nos GCs com base em informações “externas” (conhecimento a priori do VGV
dos touros). Segundo o autor, se a associação entre touros e GCs ocorresse com base
no BLUP, em vez do VGV, as soluções do M1 seriam não viesadas.
Na prática, diferenças genéticas entre GCs podem ser geradas como resultado
de tomadas de decisão dos produtores (ex.: quais touros usar e como alocar sua
progênie em diferentes grupos de manejo). Normalmente, estas decisões não são
tomadas apenas com base no BLUP dos valores genéticos. HENDERSON (1975, 1990)
sugeriu que o estudo de situações de “seleção do tipo L’u” poderia ser útil para
representar casos reais comuns como, por exemplo, diferenças genéticas sendo
criadas com base em informações prévias ou em variáveis correlacionadas com o VGV
e não disponíveis ou utilizadas na análise. Nestas condições, o uso do modelo M1
resultou em soluções viesadas e, como conseqüência, em redução da habilidade em
classificar os animais apropriadamente.
HENDERSON (1973) mencionou que embora seja lógico considerar rebanho
como efeito aleatório, considerá-lo como fixo elimina o viés causado por diferenças no
mérito de rebanhos associados à determinados touros. Os resultados do presente
estudo não estão em desacordo com esta afirmação, pois HENDERSON (1973) não se
referiu à situações como a ST3 ou a ST4 simuladas no presente estudo, mas sim à
situação em que a média dos efeitos de GC difere entre os touros, mas não há
diferenças genéticas entre GCs.
Ao expressar o melhor preditor linear não viesado (BLUP) dos valores genéticos
(û) desenvolvido por HENDERSON (1949, 1963) na forma )ˆXy(V'GZu 1 ββββ−−−−==== −−−− , talvez
torna-se mais claro que o viés em ββββ pode afetar as soluções de û. Se ββββ é tratado como
fixo, HENDERSON (1973) mostrou que o valor esperado de û fornecido pelas EMMH é
24
invariante a ββββ , o que não significa necessariamente que û é livre de um possível viés
em ββββ .
Estimadores não viesados podem ser inadmissíveis sob o critério QME, isto é,
estimadores viesados com menor QME podem existir (GIANOLA, 1990). No entanto,
com relação as EMMH e as situações simuladas, o viés que afetou ββββ foi uma função
dos efeitos genéticos, o que reduziu a habilidade das EMMH em discriminar os
melhores animais, o que pode ser observado na Tabela 2.6 contrastando a CORR do
M1 na ST1 contra as demais situações (ST2 a ST4).
Viés nas soluções das EMMH também foi observado por HARVEY (1979),
SIMIANER & WOLLNY (1989), UGARTE et al. (1992), FRIES & SCHENKEL (1993),
VISSCHER & GODDARD (1993), TORRES JR. et al. (1997), e TÄUBERT et al. (2002).
SIMIANER & WOLLNY (1989) reportaram que a estratégia de tratar as filhas de
determinados touros em teste para que esses apresentassem melhores provas (VGE)
teve efeito oposto, ou seja, fez com que tivessem valores genéticos subestimados, pois
parte da superioridade genética dos touros foi estimada como efeito de tratamento.
TORRES JR. et al. (1997) simularam uma situação comparável a ST3 do
presente estudo e observaram que a presença de parentesco entre os touros reduziu,
mas não eliminou o viés das soluções fornecidas pelas EMMH.
O uso de grupos genéticos poderia ser uma alternativa para reduzir ou eliminar o
viés apresentado pelo modelo M1. Essa alternativa não foi testada no presente estudo
porque em conjuntos de dados reais dificilmente há oportunidade de definir grupos
genéticos de forma apropriada como em estudos de simulação. A inclusão de grupos
genéticos desnecessários no modelo pode levar à redução da acurácia de predição
(TORRES JR. et al., 1997).
Tratar GC como efeito aleatório (M2) parece não ser uma alternativa adequada
se há evidências da existência de covariância genética ambiental negativa. VISSCHER
& GODDARD (1993) discutiram algumas situações práticas em que os efeitos de touro
e de GC podem estar negativamente associados e salientaram que, normalmente, na
prática, a covariância entre touros e GC é meramente o resultado da escolha de
25
criadores por determinados touros, e que esta associação não deveria ser usada para
predizer a performance futura da progênie de determinado touro, uma vez que esse não
é um parâmetro populacional propriamente dito. Ao assumir GC como aleatório, em
situações de diferenças genéticas entre GCs, UGARTE et al. (1992) observaram que a
redução na VEP não acompanhou o aumento do viés para casos em que o GC era
relativamente pequeno e o valor da razão entre as variâncias residual e de GC era
baixo.
As soluções do primeiro passo dos modelos M3 e M4 podem ser vistas como
casos especiais dos modelos de seleção de Henderson para lidar com casos de
“seleção do tipo L’u” (HENDERSON, 1975), em que a matriz que descreve o processo
de seleção (L) foi considerada igual a uma matriz identidade para touros e vacas no
modelo M3, e igual a uma matriz identidade para os touros e a uma matriz nula para as
vacas no M4. Este procedimento adotado foi sugerido por HENDERSON (1973) caso L
fosse difícil de ser definida (como ocorre usualmente com dados de campo). Conforme
os resultados do presente estudo, o modelo M3 apresentou soluções não viesadas para
as diferentes situações simuladas às custas de alta variância do erro de predição das
estimativas (VEP), o que pode não ser vantajoso sob o aspecto de maximizar o
progresso genético. Por sua vez, o uso do modelo M4 parece ser um comprometimento
entre remover o viés sem que ocorra aumento expressivo da VEP, para situações em
que as fêmeas apresentam número reduzido de progênie e não são a principal causa
da existência de diferenças genéticas entre GCs.
É importante notar que a comparação entre métodos de estimação viesados e
não viesados pode ser altamente dependente do espaço paramétrico em estudo
(GIANOLA, 1990; SIMIANER, 1991), e generalizações com respeito aos resultados do
presente estudo devem ser feitas com precaução.
HENDERSON (1973, 1975) apresentou algumas situações como, por exemplo,
quando diferenças genéticas entre GCs são geradas com base em funções dos dados
invariantes a translação, em que as soluções de modelos semelhantes a M3 e M4 do
presente estudo poderiam ser viesadas, o que evidencia a importância da condução de
mais estudos nesta linha de pesquisa.
26
2.4 - ConclusõesEvidências empíricas mostraram que as soluções das equações regulares de
modelo misto de Henderson podem apresentar propriedades afetadas pela presença de
diferenças genéticas entre GCs, causadas pela associação não aleatória entre os
efeitos de touro e de GC (uma forma de “seleção do tipo L’u”), e que modelos
alternativos podem fornecer melhores resultados sob esta condição.
Os resultados sugerem que a fonte principal de um possível viés nas soluções
fornecidas pelas EMMH regulares está mais associada à presença de diferenças
genéticas entre GCs do que a existência de correlação entre os efeitos genéticos e
ambientais.
A busca de modelos que forneçam soluções com menor QME parece estar mais
associada à obtenção de critérios ótimos no sentido de permitir que a média do mérito
genético de um grupo de animais selecionados seja maximizada, do que a busca de
modelos que forneçam soluções não viesadas ou com variância do erro de predição
reduzida, isoladamente.
27
CAPÍTULO 3 - MODELOS DE AVALIAÇÃO GENÉTICA ALTERNATIVOS EMSITUAÇÕES DE SELEÇÃO PARENTAL
Resumo: Simulações estocásticas foram conduzidas com o objetivo de
investigar propriedades empíricas das equações de modelo misto de Henderson
utilizando um modelo animal (MMH_a) e de outros sete modelos de avaliação genética
alternativos, sob três tipos de seleção parental (com base no BLUP, no fenótipo e no
valor genético verdadeiro (VGV)) e duas situações de informação de parentesco
(completa e 10% da informação de parentesco referente ao touro perdida). Foram
simuladas 50 repetições de populações compostas por 12.000 animais distribuídos em
600 grupos de contemporâneos (GCs) e seis gerações. A cada geração houve
reposição de 50% dos machos e de 10% das fêmeas em reprodução. Os parâmetros
utilizados conferiram à característica hipotética simulada uma herdabilidade igual a 0,4.
Quanto ao viés das soluções dos diferentes modelos, para a situação de parentesco
completo, MMH_a apresentou soluções viesadas quando houve seleção com base no
VGV, e o viés dos modelos alternativos ocorreu principalmente, no geral, na situação de
seleção baseada no BLUP. O viés apresentado pelo modelo MMH_a ocorreu no sentido
de subestimar as soluções dos touros usados em gerações com animais de mérito
genético superior. O viés apresentado pelos modelos alternativos, com seleção
baseada no BLUP, ocorreu no sentido oposto. Informação de touro perdida fez com que
todos os modelos apresentassem viés no sentido de subestimar as soluções dos touros
usados em gerações com animais de mérito genético superior. O viés apresentado nas
diferentes situações teve conseqüências sobre a habilidade de cada modelo em
selecionar animais de mérito genético superior e em estimar a tendência genética.
Quanto à estas propriedades empíricas, evidências foram observadas de que modelos
alternativos podem apresentar resultados superiores aos do modelo MMH_a, e que
nem sempre a seleção, ou mais explicitamente, as diferenças genéticas entre níveis
dos efeitos ambientais, deveriam ser ignoradas.
Palavras-chave: avaliação genética, BLUP, efeito de seleção, predições viesadas
28
3.1 – Introdução
Há interesse, em programas de melhoramento, na predição de valores genéticos
e na utilização destas predições ou funções das mesmas como critério de seleção dos
animais. Sob normalidade e na classe de funções invariantes a translação, o melhor
preditor linear não viesado (BLUP), desenvolvido por HENDERSON (1949) e com
propriedades descritas por HENDERSON et al. (1959) e por HENDERSON (1963),
apresenta-se como critério de seleção ótimo no sentido de maximizar a probabilidade
de classificação correta dos animais quanto ao mérito genético, assim como de
maximizar a média dos valores genéticos de determinado número de animais
selecionados (HENDERSON, 1973; FERNANDO & GIANOLA, 1986).
Na derivação do BLUP, pressupõe-se que a esperança marginal dos valores
genéticos de todos os animais que estão sendo avaliados seja igual a zero (E(ai)=0).
Diferentes formas de seleção ou práticas que resultem na distribuição não aleatória dos
animais nos níveis de efeitos ambientais podem gerar diferenças genéticas entre estes
níveis e, consequentemente, invalidar a pressuposição E(ai)=0. A seleção parental, por
exemplo, se bem aplicada, faz com que animais de gerações posteriores tenham valor
genético esperado superior ao da média dos valores genéticos da população dos
animais que os geraram.
Como conseqüência da violação de E(ai)=0, as soluções das Equações de
Modelo Misto de Henderson (EMMH), que forneceriam sob condições ideais o BLUP
dos valores genéticos, não são garantidas de serem não viesadas (HARVEY, 1979;
FRIES & SCHENKEL, 1993). HENDERSON (1973 e 1975) apresentou condições
especiais em que as soluções das EMMH regulares são não viesadas mesmo que a
pressuposição E(ai)=0 seja violada. Tais condições, como, por exemplo, informação de
parentesco completa e seleção dos animais com base em funções invariantes a
translação, dificilmente são atendidas em conjuntos de dados reais oriundos de
programas de melhoramento. Para casos em que estas condições não são atendidas,
HENDERSON (1975) propôs modificações nas EMMH regulares para que o BLUP dos
valores genéticos fosse obtido. As EMMH modificadas requerem uma matriz para
descrever o processo seletivo que, no geral, não é trivial de ser construída.
29
FRIES & SCHENKEL (1993) e SCHAEFFER (2003) propuseram modelos
alternativos de avaliação genética que não requerem a pressuposição de ausência de
diferenças genéticas entre os níveis dos efeitos ambientais. Entretanto, assim como nos
modelos de seleção propostos por HENDERSON (1975), não há garantia de que os
valores genéticos preditos sejam um critério de seleção ótimo no sentido de permitir a
seleção de animais com a média dos valores genéticos maximizada.
Simulações conduzidas por CARVALHEIRO et al. (2004 – capítulo anterior)
evidenciaram que modelos alternativos baseados nas propostas de FRIES &
SCHENKEL (1993) e de SCHAEFFER (2003), de considerar os valores genéticos ou
parte deles como efeitos fixos, podem apresentar soluções com propriedades empíricas
superiores àquelas fornecidas pelas EMMH regulares, para casos em que a
pressuposição E(ai)=0 não é válida. O estudo de CARVALHEIRO et al. (2004– capítulo
anterior) se limitou, no entanto, a situações que envolviam apenas uma geração de
progênie e que apresentavam diferenças genéticas entre os níveis de efeitos
ambientais (grupos de contemporâneos (GC)) geradas a partir da associação entre os
valores genéticos dos touros e os GC.
No presente estudo de simulação, houve interesse em comparar modelos de
avaliação genética alternativos em situações de seleção parental, visto que esta é uma
prática comum e fundamental em programas de melhoramento e que não há uma
solução estatística definitiva para resolver os possíveis problemas de inferência
causados por ela.
3.2 - Material e Métodos
Na dificuldade de comparar analiticamente diferentes modelos quanto às suas
propriedades, especialmente sob violação da pressuposição E(ai)=0, optou-se pela
condução de um estudo de simulação, seguindo recomendações de HENDERSON
(1989 e 1990).
30
3.2.1 - Estrutura da população simuladaA população base (G0) simulada consistiu de 100 machos e 2.000 fêmeas, não
aparentados, não selecionados e assumidos de serem amostrados aleatoriamente de
uma população conceitualmente infinita. Cada fêmea foi acasalada aleatoriamente com
um dos machos e gerou um produto. Os 2.000 produtos gerados constituíram os
animais da geração G1 e foram distribuídos aleatoriamente em 100 grupos de
contemporâneos (GC), sendo estipulado que os animais dos primeiros 50 GCs eram
fêmeas e os demais eram machos.
Caracterizando o processo de seleção parental, 50 machos e 1.800 fêmeas da
G0 e 50 machos e 200 fêmeas da G1 foram selecionados, com base em critérios de
seleção descritos adiante, para gerar os animais da G2. Houve, portanto, sobreposição
de gerações. Este processo de reposição de 50% dos machos e de 10% das fêmeas
em reprodução se repetiu até que os animais da G6 fossem gerados. A cada período
de acasalamento, 2.000 produtos foram gerados e distribuídos aleatoriamente em 100
GCs, totalizando 12.000 animais em 600 GCs.
A conectabilidade entre os GCs foi garantida pela imposição de restrições sobre
o valor mínimo para número de produtos por reprodutor (5), produtos por GC (10),
reprodutor por GC (3) e GC por reprodutor (3), e também por meio da aplicação do
programa MILC (FRIES, 1998). Sempre uma nova repetição foi simulada caso algum
GC estivesse desconectado.
3.2.2 - Modelo de simulaçãoObservações fenotípicas foram simuladas, exceto para os animais da geração
G0, seguindo o modelo: yij = bi + aij + eij , sendo yij a observação fenotípica do animal j
no GC i, bi o efeito do GC i, aij o valor genético aditivo do animal j no GC i e eij o termo
referente ao erro aleatório associado a observação yij.
Valores para bi foram amostrados de uma distribuição uniforme com parâmetros
(valores de mínimo e máximo) iguais a 122,5 e 222,5 kg. Valores para eij foram
independentemente amostrados de uma distribuição normal com média zero e variância
de 180 kg2 (eij ~N(0;180)). Os valores genéticos dos animais base foram gerados a
31
partir de uma N(0;120), e os valores genéticos dos demais animais foram gerados como
aij = ½( asj + adj) + mij, em que asj e adj são os valores genéticos aditivos do macho e da
fêmea que geraram o animal j, e mij é o efeito da Segregação Mendeliana do animal j,
que foi amostrada de uma N(0;60).
Os parâmetros usados no processo de simulação reproduziram uma
característica com herdabilidade igual a 0,4, e são semelhantes aos estimados por
CARVALHEIRO (2000) para a característica ganho de peso pós-desmame de um
conjunto de dados de bovinos da raça Nelore.
3.2.3 - Critérios de seleção
Na prática, inúmeras são as fontes de informação que podem ser utilizadas como
critério de seleção dos animais e que, se correlacionadas com o valor genético, podem
gerar diferenças genéticas entre anos/gerações/períodos consecutivos de seleção. Na
deficiência e impossibilidade de simular todas as situações práticas possíveis, três
casos isolados foram escolhidos de forma a gerar diferenças genéticas. Os três critérios
de seleção parental empregados a cada período de acasalamento foram: (1) o BLUP
dos valores genéticos, obtido com o emprego das EMMH regulares a cada geração; (2)
as observações fenotípicas; e (3) os valores genéticos verdadeiros (VGV).
De acordo com a terminologia adotada por HENDERSON (1973 e 1975), as
situações de (1) a (3) são, respectivamente, casos de: (1) “seleção do tipo L’y” com
L’X=0, em que L é a matriz que descreve o processo de seleção e L’X=0 caracteriza a
condição de seleção invariante a translação ou, equivalentemente, invariante aos
valores assumidos pelos efeitos ambientais (ββββ) (no Apêndice 5, encontra-se uma prova
da equivalência entre “seleção do tipo L’y” com L’X=0 e a seleção com base no BLUP);
(2) “seleção do tipo L’y” com L’X≠≠≠≠0, isto é, seleção com base em funções de y
(observações fenotípicas) que não são invariantes a ββββ; e (3) “seleção do tipo L’u”, em
que u é o valor genético verdadeiro. Embora, na prática, não seja possível selecionar
os animais com base no valor genético verdadeiro, HENDERSON (1975 e 1990)
sugeriu que o estudo desta situação poderia ser útil para representar casos reais
32
comuns como, por exemplo, seleção com base em informações prévias ou em variáveis
correlacionadas com o VGV e não disponíveis ou não utilizadas na análise.
As fêmeas de descarte, 10% das fêmeas em reprodução, foram sempre
escolhidas aleatoriamente. As fêmeas de reposição foram selecionadas com base nos
critérios descritos anteriormente, de acordo com cada uma das três situações
simuladas. Os machos, tanto os de descarte quanto os de reposição, foram sempre
escolhidos com base nos critérios de seleção. Quando o critério de seleção adotado foi
o fenótipo, os machos da geração G0, por não apresentarem essa informação, foram
selecionados com base em uma variável aleatória com correlação de 0,4 ao VGV.
3.2.4 - Informações adicionais do processo de simulação
Com relação à informação de parentesco, duas situações foram simuladas: (1)
informação de parentesco completa; e (2) 10% dos animais da G2 a G6 (1.000 animais)
com informação de progenitor (pai) perdida. Houve interesse em simular esta segunda
situação, pois é comum, em conjuntos de dados reais, que parte dos animais não tenha
informação de parentesco conhecida devido, por exemplo, ao uso de lotes com mais de
um reprodutor.
Para cada uma das seis situações simuladas, compreendidas pela combinação
entre os três critérios de seleção e os dois tipos de informação de parentesco utilizados,
50 repetições foram geradas, resultando em um total de 300 conjuntos de dados.
Caracterizando a condição de efeito fixo, conforme a escola estatística
frequentista, os valores dos efeitos de GC (bi) gerados na primeira repetição foram
mantidos nas demais repetições.
3.2.5 - Modelos de avaliação genética
Os componentes de variância utilizados nas avaliações genéticas foram iguais
àqueles empregados no processo de simulação dos dados, ou seja, eles não foram
estimados. Portanto, o termo avaliação genética se refere apenas à estimação dos
efeitos de GC e à predição dos valores genéticos.
33
Para cada um dos 300 conjuntos de dados, avaliações genéticas foram
conduzidas sob sete modelos diferentes, que podem ser, em geral, descritos pela
equação:
y = Xββββ + Zss + Zdd + m + e ,
em que: y é o vetor de observações fenotípicas, ββββ é o vetor de efeitos de GC, s e d são,
respectivamente, os vetores de efeito de progenitores e progenitoras (que serão
mencionados como efeitos de touro e vaca), m é o vetor referente aos efeitos de
Segregação Mendeliana, e é o vetor de erros aleatórios, X, Zs e Zd são as matrizes de
incidência que relacionam os elementos de ββββ, s e d com os elementos de y,
respectivamente. As pressuposições, e esperanças e (co)variâncias das variáveis
aleatórias de cada modelo são descritas a seguir.
3.2.5.1 - Modelo Misto de Henderson – Modelo Animal individual (MMH_a)
Modelo predominantemente aplicado em programas de melhoramento animal,
em que ββββ é considerado como vetor de efeitos fixos; Za = Zss + Zdd + m, sendo a ovetor aleatório de efeito genético aditivo de cada animal e Z a matriz que associa os
elementos de a com os de y. As matrizes de esperança e (co)variâncias são dadas por:
E(y) = Xββββ, E(a) = E(e) = 0, Var(y) = V = 2en
2a I'ZAZ σσσσ++++σσσσ , Var(a) = 2
aAσσσσ e Var(e) = 2enI σσσσ ,
em que A é a matriz de numeradores do coeficiente de parentesco genético aditivo
(WRIGHT, 1922), nI é uma matriz identidade de ordem n (número de animais em y),2aσσσσ é a variância genética aditiva na população base e 2
eσσσσ é a variância residual.
Soluções para ββββ e a foram obtidas com o emprego das EMMH regulares
(HENDERSON, 1963).
3.2.5.2 - Modelo Alternativo 1 – Modelo Touro e Vaca (MA1_tv)
A derivação do BLUP pressupondo E(a)≠0 resulta em soluções para ββββ e a sendo
obtidas pelo método de quadrados mínimos ponderados (FRIES & SCHENKEL, 1993;
SCHENKEL, 1998) ou pelo método de quadrados mínimos ordinários (OLS) se
homogeneidade de variância residual for assumida. Neste caso, ββββ e a seriam tratados
34
como efeitos fixos e, no geral, não haveria possibilidade de aplicação do modelo animal
devido à deficiência de posto da matriz de coeficientes. Uma alternativa, que foi
empregada no presente estudo, seria a utilização de um modelo touro e vaca,
considerando-os como efeitos fixos, e somando os vetores m e e para compor o vetor
aleatório de resíduos (εεεε). Neste modelo, assumiu-se: E(y) = Xββββ + Zss + Zdd, E(εεεε) = 0, e
Var(y) = Var(εεεε) = 2nI εεεεσσσσ . As soluções para ββββ, s, e d foram obtidas por OLS, impondo-se as
restrições de que a soma dos elementos de s e d fossem iguais a zero.
Os valores genéticos preditos (â) dos touros e vacas foram obtidos multiplicando-
se s e d por dois, e para os produtos (animais sem progênie), utilizou-se a expressão
â= s+ d+m , sendo:
com k=0,5 2aσσσσ /(0,5 2
aσσσσ + 2eσσσσ ) se a informação de parentesco fosse completa, e
k=0,75 2aσσσσ /(0,75 2
aσσσσ + 2eσσσσ ) se a informação de touro fosse perdida.
3.2.5.3 - Modelo Alternativo 2 – Modelo Touro e Vaca (MA2_tv)
Como as fêmeas apresentam, normalmente, número pequeno de descendentes,
considerá-las como efeito fixo pode resultar em soluções com elevado erro de predição
(CARVALHEIRO et al., 2004– capítulo anterior). Assim, um outro modelo alternativo
investigado considerou ββββ e s como vetores de efeitos fixos e d como vetor de efeito
aleatório, com E(y) = Xββββ + Zss, E(d) = E(εεεε) = 0, Var(y) = 2n
2ddd I'ZZ εεεεσσσσ++++σσσσ , Var(d) = 2
ddI σσσσ ,
e Var(εεεε) = 2nI εεεεσσσσ . As soluções foram obtidas conforme equações semelhantes às de OLS,
porém adicionando o termo ( 2εεεεσσσσ / 2
dσσσσ ) aos elementos da diagonal da matriz de
coeficientes correspondentes ao efeito de vaca. A restrição de que a soma dos
elementos em s seja igual a zero foi imposta. Os valores genéticos preditos (â) foram
obtidos como em MA1_tv.
Além de procurar não obter soluções com elevado erro de predição, o uso de
vaca como efeito aleatório também se justificaria pelo fato de, no geral, haver baixa
, k*)dZsZˆXy(m ds −−−−−−−−ββββ−−−−====
35
pressão de seleção sobre as fêmeas em condições reais, o que faz com que elas não
sejam a principal causa da existência de diferenças genéticas.
Conforme salientado por FRIES (1999), as soluções para s e d de um modelo
touro e vaca levam em consideração apenas a informação da progênie, ignorando a
informação própria e a dos pais. Com isso, as principais fontes de informação para
animais com tamanho reduzido de progênie e com informação própria não são
utilizadas na predição de seus valores genéticos. Procurando aproximar os dois
modelos alternativos descritos anteriormente (MA1_tv e MA2_tv) a um modelo animal,
para que as diferentes fontes de informação fossem utilizadas na predição dos valores
genéticos, quatro outros “modelos” alternativos (não são modelos em si, mas o foram
denominados como tal) foram empregados e são descritos a seguir.
3.2.5.4 - Modelo Alternativo 3 – Modelo “Animal” (MA3_a)
Os valores genéticos preditos (â) foram obtidos por: â= 2aAσσσσ Z’V-1(y- *ˆXββββ ), sendo
*ββββ as soluções para os efeitos de GC fornecidas pelo modelo MA1_tv.
A motivação para o uso deste modelo foi que, ao contrário das soluções
fornecidas pelas EMMH regulares para os efeitos de GC, os valores de *ββββ não são
correlacionados ou possivelmente contaminados pelos valores genéticos verdadeiros
(Cov( *ββββ ,a)=0) (FRIES & SCHENKEL, 1993).
3.3.5.5 - Modelo Alternativo 4 – Modelo “Animal” (MA4_a)
Os valores genéticos preditos (â) foram obtidos por: â= 2aAσσσσ Z’V-1(y- oˆXββββ ), sendo
oββββ as soluções para os efeitos de GC fornecidas pelo modelo MA2_tv.
3.2.5.6 - Modelo Alternativo 5 – Combinando Soluções (MA5_c)
Conforme descrito em VANRADEN & WIGGANS (1991), o â fornecido pelas
EMMH regulares pode ser decomposto em: â = w1(informação própria) +
w2(informação dos pais) + w3(informação da progênie), sendo w1=n/(n+2k+0,5pk),
36
w2=2k/(n+2k+0,5pk) e w3=0,5pk/(n+2k+0,5pk), em que n é o número de observações
fenotípicas do animal, k= 2eσσσσ / 2
aσσσσ e p é o tamanho da progênie. SCHAEFFER (2003)
propôs o uso destes fatores de ponderação para combinar as duas soluções que um
animal com informação própria e da progênie pode apresentar quando o modelo touro e
vaca é empregado. Este procedimento foi adotado considerando as soluções â, s e dfornecidas pelo modelo MA1_tv. Assim, os valores genéticos preditos dos animais com
progênie, combinando as diferentes fontes de informação (âc) foram obtidos por:
âc=(((w1+w2)â)+(w3 s ))/(w1+w2+w3), caso o animal fosse touro (exceto touros da G0),
e âc=(((w1+w2)â)+(w3 d))/(w1+w2+w3), caso o animal fosse vaca (exceto vacas da
G0).
3.2.5.7 - Modelo Alternativo 6 – Combinando Soluções (MA6_c)
Similar ao procedimento descrito anteriormente (MA5_c), porém utilizando as
soluções â, s e d do modelo MA2_tv, para obter âc.
3.2.6 - Critérios de comparação dos modelos
Os modelos foram comparados com relação ao viés das soluções, definido por:
viésw = 1/q∑∑∑∑====
−−−−q
1iii )ww( , em que wi é o efeito verdadeiro de GC (VGC) ou valor genético
verdadeiro (VGV), iw é o efeito estimado de GC (EGC) ou o valor genético predito
(VGE), e q é o número de níveis do efeito em consideração.
Na tentativa de mensurar a eficiência de cada modelo em predizer a
superioridade genética, também foram calculadas as médias dos VGVs de animais
selecionados sob diferentes pressões de seleção e com base nas soluções fornecidas
pelos diferentes modelos. Para este critério de comparação, testes-t pareados, com um
nível de significância de 5%, foram conduzidos contrastando todos os modelos, um por
vez, com o modelo MMH_a.
Os modelos também foram avaliados quanto à capacidade de predição da
tendência genética, calculando-se a média dos valores genéticos preditos, por geração.
37
Todos os critérios de comparação foram tomados com base na média dos
valores das 50 repetições.
3.3 - Resultados e Discussão
O problema de violação da pressuposição E(ai)=0 é geralmente tratado na
literatura como um problema de efeito de seleção. Entretanto, cabe salientar que forças
ou práticas de manejo dos animais que geram diferenças genéticas entre níveis dos
efeitos ambientais, entre GCs, por exemplo, estarão atuando no sentido de invalidar a
pressuposição E(ai)=0. Com isso, enfatiza-se que o principal foco dos resultados e
discussões a seguir deveria ser dado sobre as conseqüências da existência de
diferenças genéticas entre GCs e não da seleção em si.
3.3.1 - ViésO viés das estimativas de efeito de GC (EGC), por geração, encontra-se na
Tabela 3.1. Foi apresentado apenas o viés referente aos três primeiros modelos
descritos no material e métodos, pois para os demais “modelos” os efeitos de GC não
foram estimados.
Quando houve seleção com base no BLUP e informação de parentesco
completa, apenas as soluções das EMMH regulares (modelo MMH_a) não
apresentaram viés. Esse resultado empírico está de acordo com as considerações de
HENDERSON (1973) de que as EMMH regulares acomodariam diferenças genéticas
entre níveis de efeitos ambientais sendo geradas seguindo seleção com base em
funções lineares das observações fenotípicas e que sejam invariantes a translação,
como é o caso do BLUP.
Considerando ainda a situação de seleção com base no BLUP e informação de
parentesco completa, é possível notar, na Tabela 3.1, que os modelos touro e vaca
apresentaram EGCs viesados. O viés ocorreu no sentido de subestimar EGCs de
gerações com animais de mérito genético superior. Embora o modelo MA1_tv não
requeira em sua derivação a pressuposição de ausência de diferenças genéticas entre
38
GCs (E(ai)=0), pois touro e vaca são considerados efeitos fixos, suas soluções foram
viesadas porque o emprego de tal modelo eqüivale a assumir herdabilidade igual a um
(HENDERSON et al., 1959) ou, de modo semelhante, a utilizar apenas a informação
“intra-bloco” (CUNNINGHAM & HENDERSON, 1966), sendo bloco, neste caso, os
efeitos de touro e vaca.
Tabela 3.1 Viés (kg) das estimativas de efeito de grupo de contemporâneos, por geração,critério de seleçãoa, modelo de avaliaçãob e tipo de informação de parentescoc
(médias das 50 repetições).
BLUP BLUP (10% ITP)Geração MMH_a MA1_tv MA2_tv MMH_a MA1_tv MA2_tv
G1 -0,46 -0,49 -0,33 -0,59 -0,60 -0,38G2 -0,50 -1,95 -1,53 0,48 -1,62 -1,12G3 -0,43 -2,84 -1,82 1,80 -0,81 0,32G4 -0,36 -3,70 -1,96 2,98 0,11 2,03G5 -0,44 -4,60 -2,04 3,89 0,74 3,55G6 -0,30 -5,47 -1,95 4,70 1,10 4,91
Fenótipo Fenótipo (10% ITP)Geração MMH_a MA1_tv MA2_tv MMH_a MA1_tv MA2_tv
G1 -0,07 0,62 0,02 -0,03 0,69 0,02G2 0,24 0,54 0,09 0,84 0,72 0,22G3 0,39 0,72 0,62 1,58 1,62 1,50G4 0,35 0,71 1,03 2,11 2,38 2,70G5 0,20 0,53 1,34 2,41 2,80 3,65G6 0,36 0,57 1,90 2,86 3,38 4,76
VGV VGV (10% ITP)Geração MMH_a MA1_tv MA2_tv MMH_a MA1_tv MA2_tv
G1 -0,22 -0,23 -0,22 -0,40 -0,30 -0,25G2 2,59 -0,28 0,30 3,62 -0,14 0,50G3 4,88 -0,14 1,32 6,93 1,54 3,10G4 7,24 -0,05 2,35 10,18 3,33 5,89G5 9,33 -0,17 3,50 12,96 4,67 8,51G6 11,67 -0,12 4,91 15,77 5,91 11,11
a Três critérios de seleção parental foram empregados: (1) o BLUP dos valores genéticos; (2) o fenótipo;e (3) os valores genéticos verdadeiros (VGV).
b Modelos MMH_a, MA1_tv, MA2_tv, conforme descrito no material e métodos.c Informação de parentesco completa, e 10% dos animais das gerações G2 a G6 com informação de
touro perdida (10% ITP).
39
Assim como em SCHENKEL et al. (2002), as soluções para GC do modelo
MMH_a não foram afetadas por seleção fenotípica, com informação de parentesco
completa. Esse resultado inesperado (HENDERSON ,1975; FERNANDO & GIANOLA,
1990) poderia, de acordo com SCHENKEL et al. (2002), estar em parte associado ao
fato de diferenças genéticas expressivas entre GCs de uma mesma geração não serem
esperadas para o processo de simulação utilizado, uma vez que, a cada geração, os
animais foram distribuídos aleatoriamente entre os GCs, e também pelo fato dos GCs
apresentarem, em média, número razoável de animais, permitindo assim estimação
acurada de seus efeitos.
Dentre os modelos touro e vaca empregados, apenas o modelo que os
considerou como efeitos fixos (MA1_tv) apresentou EGCs não viesados para a situação
de seleção fenotípica com informação de parentesco completa. O viés nos EGCs do
modelo MA2_tv está possivelmente associado ao uso de uma matriz diagonal para
descrever o parentesco entre as vacas.
Seleção do tipo L’u (com base no VGV) fez com que os modelos que
considerassem os efeitos genéticos ou parte deles como aleatórios, apresentassem
EGCs viesados. Mesmo quando uma matriz de parentesco correta e completa foi
definida, o modelo que assumiu o valor genético aditivo como efeito aleatório (modelo
MMH_a) não foi capaz de acomodar as diferenças genéticas entre GCs de diferentes
gerações, ao contrário do ocorrido para os demais tipos de seleção estudados.
Considerar touro e vaca como fixos (modelo MA1_tv) fez com que os EGCs fossem não
viesados. Resultados semelhantes foram observados por CARVALHEIRO et al. (2004–
capítulo anterior), porém estudando situações de diferenças genéticas entre GCs de
uma mesma geração.
Informação de touro perdida (10%ITP) fez com que todos os modelos
apresentassem EGCs viesados no sentido de superestimar o efeito de GCs de
gerações com animais de mérito genético superior. Mesmo os modelos MMH_a e
MA1_tv, que não haviam sido afetados por seleção com base no BLUP e no fenótipo e
com base no fenótipo e no VGV, respectivamente, apresentaram viés. É interessante
notar que considerando os modelos MA1_tv e MA2_tv e seleção com base no BLUP, o
40
viés apresentado pela perda de informação de parentesco foi em sentido oposto ao viés
dos EGCs com informação de parentesco completa.
Na Tabela 3.2, o viés dos valores genéticos preditos dos touros é apresentado.
Demais categorias (vacas e animais sem progênie) apresentaram resultados similares
aos de touro, porém, no geral, com viés (quando foi o caso) um pouco menos
acentuado.
Tabela 3.2 Viés (kg) dos valores genéticos preditos dos touros, por geração, critério deseleçãoa, modelo de avaliaçãob e tipo de informação de parentescoc (médias das50 repetições).
BLUP BLUP (10% ITP)Geração MMH_a MA1_tv MA2_tv MA3_a MA4_a MA5_c MA6_c MMH_a MA1_tv MA2_tv MA3_a MA4_a MA5_c MA6_c
G1 -0,03 2,30 1,67 1,42 1,34 2,30 1,67 -3,84 2,22 1,64 1,32 1,22 2,22 1,64G2 -0,06 5,08 4,77 1,75 1,24 6,18 5,70 -5,37 3,70 3,42 0,83 0,27 4,74 4,28G3 -0,08 7,01 6,64 3,16 1,79 8,17 7,51 -7,07 2,91 2,51 0,15 -1,32 4,26 3,54G4 -0,13 8,81 8,47 4,99 2,56 9,93 9,14 -8,55 1,64 1,12 -0,36 -2,97 3,17 2,15G5 -0,19 10,43 10,17 6,51 3,07 11,51 10,50 -9,76 0,58 -0,01 -0,86 -4,54 2,27 0,86G6 -0,27 12,37 12,26 7,82 3,58 13,43 11,90 -10,39 0,52 -0,05 -0,83 -5,34 2,42 0,36
Fenótipo Fenótipo (10% ITP)Geração MMH_a MA1_tv MA2_tv MA3_a MA4_a MA5_c MA6_c MMH_a MA1_tv MA2_tv MA3_a MA4_a MA5_c MA6_c
G1 0,30 1,20 1,42 1,33 1,25 1,20 1,42 -2,02 1,19 1,35 1,33 1,23 1,19 1,35G2 -0,48 1,23 1,53 0,33 0,01 1,77 1,88 -3,51 0,80 1,00 0,08 -0,29 1,32 1,30G3 -0,62 1,03 1,31 0,35 -0,46 1,75 1,81 -4,41 -0,59 -0,45 -0,71 -1,58 0,27 0,17G4 -0,43 1,09 1,36 0,84 -0,59 1,96 1,93 -4,92 -1,81 -1,76 -1,18 -2,71 -0,70 -0,97G5 -0,34 1,18 1,48 1,27 -0,73 2,12 2,04 -5,31 -2,77 -2,76 -1,55 -3,68 -1,51 -1,89G6 -0,38 1,33 1,63 1,73 -0,71 2,52 2,19 -5,53 -3,50 -3,55 -1,64 -4,21 -1,86 -2,57
VGV VGV (10% ITP)Geração MMH_a MA1_tv MA2_tv MA3_a MA4_a MA5_c MA6_c MMH_a MA1_tv MA2_tv MA3_a MA4_a MA5_c MA6_c
G1 2,48 1,02 0,82 0,95 0,83 1,02 0,82 -1,50 1,10 1,02 0,99 0,89 1,10 1,02G2 -2,71 1,02 0,87 -2,40 -3,29 1,20 1,00 -8,27 0,09 0,05 -3,13 -4,03 0,14 0,03G3 -6,30 0,86 0,72 -2,78 -4,88 1,03 0,76 -13,19 -2,45 -2,57 -5,32 -7,46 -2,18 -2,43G4 -9,95 0,82 0,77 -2,54 -6,16 1,02 0,67 -18,01 -5,40 -5,55 -7,33 -11,01 -4,88 -5,35G5 -13,10 0,87 0,75 -2,45 -7,52 1,09 0,41 -21,91 -7,86 -8,12 -9,09 -14,23 -7,13 -8,00G6 -16,19 0,95 0,78 -3,06 -9,24 1,26 -0,09 -25,31 -9,75 -10,07 -10,92 -17,15 -8,69 -10,26
a Três critérios de seleção parental foram empregados: (1) o BLUP dos valores genéticos; (2) o fenótipo;e (3) os valores genéticos verdadeiros (VGV).
b Modelos MMH_a, MA1_tv, MA2_tv, MA3_a, MA4_a, MA5_c, MA6_c, conforme descrito no material emétodos.
c Informação de parentesco completa, e 10% dos animais das gerações G2 a G6 com informação detouro perdida (10% ITP).
41
Com informação de parentesco completa, os VGEs dos touros fornecidos pelo
modelo MMH_a foram não viesados para as situações de seleção com base no BLUP e
no fenótipo e viesados quando houve seleção com base no VGV. Para esta última
situação, como mencionado anteriormente, as soluções para os efeitos de GC do
modelo MMH_a foram contaminadas por efeitos genéticos. Com isso, os touros
superiores tiveram seus VGEs subestimados porque parte de sua superioridade foi
estimada como efeito de GC, sendo que o oposto ocorreu para os touros com mérito
genético inferior.
Os modelos touro e vaca (MA1_tv e MA2_tv), por considerarem touro como
efeito fixo, apresentaram, considerando informação de parentesco completa, soluções
não viesadas nos casos de seleção fenotípica e baseada no VGV, e VGEs viesados
para a situação de seleção com base no BLUP. O viés ocorreu no sentido de
superestimar os VGEs dos touros usados em gerações com mérito genético superior.
Os modelos MA5_c e MA6_c, por utilizarem as soluções dos modelos MA1_tv e
MA2_tv, respectivamente, para compor os VGEs dos touros, apresentaram
comportamento similar.
O procedimento de utilizar, como segundo passo, uma matriz de parentesco
correta e completa para descrever a covariância entre os valores genéticos fez com que
as soluções dos modelos MA3_a e MA4_a fossem menos viesadas do que aquelas
fornecidas pelos demais modelos alternativos (MA1_tv, MA2_tv, MA5_c e MA6_c), na
situação de informação de parentesco completa e seleção baseada no BLUP. Viés foi
observado, especialmente para o modelo MA4_a, quando houve seleção com base no
VGV, situação esta em que os outros modelos alternativos praticamente não
apresentaram viés. Esse resultado decorre do modelo MA4_a ter utilizado como
primeiro passo, no pré-ajuste das observações fenotípicas, as soluções dos efeitos de
GC fornecidas pelo modelo MA2_tv, soluções estas que apresentaram viés.
Assim como ocorreu com os EGCs, informação de touro perdida (10% ITP) fez
com que todos os modelos apresentassem VGEs viesados, para todas as situações
simuladas. O viés ocorreu no sentido de subestimar os VGEs dos touros usados em
gerações com animais de mérito genético superior. Na situação de seleção com base
42
no BLUP e 10% ITP, o viés dos modelos alternativos ocorreu no sentido oposto ao
observado na situação de parentesco completa, fazendo com que o viés dos VGEs
desses modelos, exceto MA4_a, fosse menos acentuado.
3.3.2 – Médias dos VGVsNa Tabela 3.3, são apresentadas as médias dos valores genéticos verdadeiros
dos 35 touros (10%) melhor classificados conforme os VGEs de cada modelo. Os
resultados mostraram que mesmo na situação ideal para o modelo MMH_a, isto é,
seleção com base no BLUP e informação de parentesco completa, as médias dos
modelos alternativos MA3_a e MA4_a não foram inferiores à do modelo MMH_a. Na
mesma situação, demais modelos alternativos, possivelmente por apresentarem VGEs
com viés relativamente acentuado, apresentaram médias inferiores à do modelo
MMH_a. Comportamento semelhante foi observado na situação de seleção fenotípica e
informação de parentesco completa, com MA3_a e MA4_a apresentando valores muito
próximos à MMH_a, e demais modelos com médias um pouco inferiores.
Tabela 3.3 Média (kg) dos valores genéticos verdadeiros dos touros 10% superiores,selecionados conforme soluções dos diferentes modelos de avaliação. Dados decada modelo são apresentados por critério de seleção e tipo de informação deparentesco, e são referentes à média dos valores das 50 repetições.
Modelo BLUP BLUP(10% ITP) Fenótipo Fenótipo
(10% ITP) VGV VGV(10% ITP)
MMH_a * 39,82 39,71 29,17 28,93 47,10 46,22MA1_tv 39,05 38,66 27,57 26,80 47,05NS 45,12MA2_tv 39,50 39,20 28,23 27,35 47,30> 45,44MA3_a 39,72NS 39,59 29,00 28,81NS 48,22> 47,61>
MA4_a 39,74NS 39,50 29,08NS 28,59 47,82> 46,78>
MA5_c 39,20 38,99 28,06 27,48 47,67> 46,43>
MA6_c 39,66 39,32 28,61 27,88 47,63> 46,31NS
* Testes-t pareados, com nível de significância de 5%, foram conduzidos contrastando todos os modelos,um por vez, com o modelo MMH_a. NS indica os contrastes que foram não significativos (p>0,05); >
refere-se à valores maiores do que os fornecidos pelo modelo MMH_a (p<0,05); ausência desobrescrito se refere à valores menores do que os fornecidos pelo modelo MMH_a (p<0,05).
43
Na situação de diferenças genéticas geradas com base no VGV, assim como
observado por CARVALHEIRO et al. (2004– capítulo anterior), modelos alternativos que
consideraram os efeitos genéticos ou parte deles como fixos permitiram, no geral, a
seleção de touros com mérito genético superior ao do modelo MMH_a.
Também foi possível observar na Tabela 3.3 que a informação de touro perdida
está associada à redução da habilidade em selecionar touros geneticamente
superiores, para todos os modelos e situações estudadas, mesmo que 10% ITP tenha
ocasionado redução do viés dos VGEs fornecidos pelos modelos MA1_tv, MA2_tv,
MA3_a, MA5_c e MA6_c na situação de seleção com base no BLUP.
Para as vacas 10% melhor classificadas, o modelo MMH_a apresentou médias
dos VGVs superiores aos demais modelos em todas as situações (p<0,05), embora os
modelos MA3_a e MA4_a tenham apresentado resultados muito próximos ao MMH_a
(Tabela 3.4).
Tabela 3.4 Média (kg) dos valores genéticos verdadeiros das vacas 10% superiores,selecionadas conforme soluções dos diferentes modelos de avaliação. Dados decada modelo são apresentados por critério de seleção e tipo de informação deparentesco, e são referentes à média dos valores das 50 repetições.
Modelo BLUP BLUP(10% ITP) Fenótipo Fenótipo
(10% ITP) VGV VGV(10% ITP)
MMH_a * 29,73 29,31 20,12 19,84 37,17 35,78MA1_tv 23,08 23,04 14,82 14,79 31,23 31,18MA2_tv 18,02 17,97 13,60 13,56 22,57 22,50MA3_a 29,29 28,89 19,53 19,38 36,46 35,46MA4_a 29,30 28,80 19,61 19,44 36,09 34,89MA5_c 21,58 20,79 14,01 13,87 27,07 26,19MA6_c 27,61 26,64 18,24 18,06 33,72 31,99
* Testes-t pareados, com nível de significância de 5%, foram conduzidos contrastando todos os modelos,um por vez, com o modelo MMH_a. Ausência de sobrescrito ao lado dos valores de média, refere-se àvalores menores do que os fornecidos pelo modelo MMH_a (p<0,05).
Pelos resultados da Tabela 3.4 se verificou que, conforme salientado por FRIES
(1999), a seleção das vacas foi seriamente comprometida ao utilizar modelo touro e
vaca (MA1_tv e MA2_tv), pois as principais fontes de informação (própria e dos pais)
44
não foram utilizadas no cálculo dos VGEs das vacas. A inferioridade do modelo MA2_tv
em relação ao modelo MA1_tv, quanto à média das vacas selecionadas, possivelmente
está associada ao uso, em MA2_tv, de uma matriz diagonal para descrever o
parentesco entre as vacas. Em CARVALHEIRO et al. (2004– capítulo anterior), MA2_tv
se mostrou superior à MA1_tv, quanto às propriedades empíricas estudadas, porém
naquele caso não havia realmente parentesco entre as vacas da população simulada.
Utilizar a proposta de SCHAEFFER (2003), de combinar as diferentes fontes de
informação, teve resultados favoráveis (maiores médias dos VGVs) para o modelo que
assumiu vaca como efeito aleatório (MA6_c) e desfavoráveis ao assumir vaca como fixo
(MA5_c). Mais investigações devem ser conduzidas para identificar porque o modelo
MA5_c apresentou médias dos VGVs das vacas inferiores às do modelo MA1_tv.
Outras intensidades foram aplicadas, selecionando 2%, 20% e 50% dos touros e
vacas melhores classificados, e resultados semelhantes aos descritos acima foram
observados (dados não apresentados).
3.3.3 – Tendências genéticasA seguir, o termo tendência genética será utilizado se referindo à media dos
valores genéticos preditos por geração. No presente estudo, tendências genéticas não
foram estimadas com a aplicação de modelos de regressão.
Os resultados de tendências genéticas apresentados nas Figuras 3.1 a 3.3
seguem os resultados referentes ao viés das soluções de cada modelo nas diferentes
situações. As tendências dos modelos MA5_c e MA6_c não foram apresentadas, pois
elas foram muito próximas as tendências dos modelos MA1_tv e MA2_tv,
respectivamente. A linha representada por VGV é referente a tendência verdadeira.
Considerando informação de parentesco completa, os modelos que assumiram
touro e vaca como efeitos fixos (MA1_tv, MA3_a e MA5_c) superestimaram o ganho
genético quando houve seleção com base no BLUP, e estimaram a tendência de forma
apropriada para as demais situações, exceto o modelo MA3_a que subestimou o ganho
na seleção com base no VGV, pois os VGEs dos touros e, consequentemente, dos
produtos, apresentaram um pouco de viés nesta situação. Informação de touro perdida
45
fez com que os modelos MA1_tv, MA3_a e MA5_c subestimassem o ganho em todas
as situações, assim como ocorrido com os demais modelos.
Modelos que consideraram touro como fixo e vaca como efeito aleatório
(MA2_tv, MA4_a e MA6_c), apenas não subestimaram o ganho genético para a
situação de seleção com base no BLUP e informação de parentesco completa.
Seguindo os resultados de viés, observou-se que o modelo MMH_a foi adequado
para estimar o ganho genético nas situações de seleção com base no BLUP e no
fenótipo e informação de parentesco completa. Quando diferenças genéticas com base
no VGV foram geradas, o modelo MMH_a foi o que mais subestimou a tendência
genética.
A combinação de seleção com base no BLUP e informação de parentesco
perdida fez com que as tendências genéticas estimadas pelos modelos MA1_tv, MA3_a
e MA5_c fossem mais próximas da tendência verdadeira do que aquela estimada pelo
modelo MMH_a.
46
Figura 3.1 Tendências genéticas para os diferentes modelos, com e sem informação de touroperdida (10% ITP), na situação de seleção com base no BLUP.
Critério de Seleção: BLUP
23,5
21,2
18,0
15,4
0,0
5,0
10,0
15,0
20,0
25,0
30,0
G1 G2 G3 G4 G5 G6Geração
Méd
ia d
os v
alor
es g
enét
icos
(kg)
TBVMMH_aMA3_aMA4_aMMH_a (10%MPI)MA3_a (10%MPI)MA4_a (10%MPI)
Critério de Seleção: BLUP
21,2
26,1
22,8
19,5
15,9
0,0
5,0
10,0
15,0
20,0
25,0
30,0
G1 G2 G3 G4 G5 G6Geração
Méd
ia d
os v
alor
es g
enét
icos
(kg)
TBVMA1_tvMA2_tvMA1_tv (10%MPI)MA2_tv (10%MPI)
47
Figura 3.2 Tendências genéticas para os diferentes modelos, com e sem informação de touroperdida (10% ITP), na situação de seleção fenotípica.
Critério de Seleção: Fenótipo
12,011,4
10,09,1
7,7
0,0
2,0
4,0
6,0
8,0
10,0
12,0
14,0
G1 G2 G3 G4 G5 G6Geração
Méd
ia d
os v
alor
es g
enét
icos
(kg)
TBVMMH_aMA3_aMA4_aMMH_a (10%MPI)MA3_a (10%MPI)MA4_a (10%MPI)
Critério de Seleção: Fenótipo
12,0
10,19,3
7,2
0,0
2,0
4,0
6,0
8,0
10,0
12,0
14,0
G1 G2 G3 G4 G5 G6Geração
Méd
ia d
os v
alor
es g
enét
icos
(kg)
TBVMA1_tvMA2_tvMA1_tv (10%MPI)MA2_tv (10%MPI)
48
Figura 3.3 Tendências genéticas para os diferentes modelos, com e sem informação de touroperdida (10% ITP), na situação de seleção com base no valor genético verdadeiro(VGV).
Critério de Seleção: TBV
28,5
16,6
23,9
20,3
12,3
18,8
15,2
0,0
5,0
10,0
15,0
20,0
25,0
30,0
G1 G2 G3 G4 G5 G6Geração
Méd
ia d
os v
alor
es g
enét
icos
(kg)
TBVMMH_aMA3_aMA4_aMMH_a (10%MPI)MA3_a (10%MPI)MA4_a (10%MPI)
Critério de Seleção: TBV
28,5
23,322,3
17,2
0,0
5,0
10,0
15,0
20,0
25,0
30,0
G1 G2 G3 G4 G5 G6Geração
Méd
ia d
os v
alor
es g
enét
icos
(kg)
TBVMA1_tvMA2_tvMA1_tv (10%MPI)MA2_tv (10%MPI)
49
3.3.4 – Discussão geralOs resultados empíricos do presente estudo de simulação, em concordância com
aqueles apresentados por CARVALHEIRO et al. (2004– capítulo anterior), evidenciaram
que o modelo de avaliação genética predominantemente aplicado em programas de
melhoramento (MMH_a) não é capaz de acomodar apropriadamente diferenças
genéticas entre GCs causadas por “seleção do tipo L’u”, mesmo que uma matriz de
parentesco correta e completa seja utilizada.
Na prática, não é possível conduzir “seleção do tipo L’u” ou tomar decisões, que
gerem diferenças genéticas entre GCs, com base no valor genético verdadeiro dos
animais. Entretanto, como descrito anteriormente, HENDERSON (1975 e 1990) sugeriu
que o estudo desta situação poderia ser útil para representar casos reais comuns como,
por exemplo, seleção com base em informações prévias ou em variáveis
correlacionadas com o VGV e não disponíveis ou não utilizadas na análise.
HENDERSON (1990) ainda empregou modelos de avaliação para lidar com “seleção do
tipo L’u” em casos de associação entre os efeitos de touro e de GC, população base
selecionada e grupos genéticos na avaliação de touros, ou seja, casos em que as
diferenças genéticas existentes não são geradas exclusivamente com base no BLUP
dos valores genéticos ou em outra função linear das observações fenotípicas que seja
invariante a translação.
HARVEY (1979), BURNSIDE & MEYER (1988), SIMIANER & WOLLNY (1989),
UGARTE et al. (1992), VISSCHER & GODDARD (1993), TORRES JR. et al. (1997),
TÄUBERT et al. (2002), entre outros, também observaram viés nas soluções do modelo
MMH_a em situações de diferenças genéticas entre níveis dos efeitos ambientais
causadas por variantes do processo de “seleção do tipo L’u”. No geral, os diferentes
autores observaram que, como no presente trabalho, as soluções para os efeitos
ambientais foram contaminadas por efeitos genéticos e, consequentemente, os animais
superiores tiveram seus VGEs subestimados porque parte de sua superioridade foi
estimada como efeito ambiental, sendo que o oposto ocorreu para os animais de mérito
genético inferior.
50
Dentre os modelos alternativos empregados, os mais promissores foram os
modelos MA3_a e MA4_a, que apresentaram certa vantagem em relação ao modelo
MMH_a na situação de “seleção do tipo L’u”, quanto aos critérios de comparação
estudados, e, nos demais tipos de seleção, apresentaram habilidade semelhante ao
modelo MMH_a em selecionar animais de mérito genético superior.
Sob o contexto Bayesiano, o uso dos modelos alternativos MA3_a e MA4_a não
seria adequado no sentido de não considerar a incerteza envolvida nas estimativas dos
efeitos de GC ao estimar os valores genéticos (SORENSEN & GIANOLA, 2002). As
conseqüências de uma estimação em dois passos, conforme empregada nos modelos
MA3_a e MA4_a, poderiam ser expressivas caso a quantidade de informação existente
para estimar os parâmetros de interesse secundário (EGCs, no caso) fosse limitada, o
que não ocorreu no presente estudo, em que os GCs apresentaram 20 animais, em
média.
GIANOLA et al. (1988), GIANOLA et al. (1989) e IM et al. (1989) propuseram
modelos alternativos baseados em métodos de estimação por máxima verossimilhança.
Nestes trabalhos, são apresentados argumentos favoráveis ao uso de funções de
verossimilhança não condicionais ao processo de seleção (uL). Se uL for utilizada, o
processo de seleção é ignorável quando for baseado apenas em informação contida
nos dados para análise, ou nos dados e em variáveis independentes a eles. Caso
contrário, o conhecimento do processo de seleção é necessário para que inferência
correta seja feita sobre os parâmetros de interesse. Se a função conjunta das variáveis
aleatórias e das observações fenotípicas for maximizada condicionalmente ao processo
de seleção (cL), as condições para ignorar o processo de seleção são, de acordo com
IM et al. (1989), ainda mais restritas do que as apresentadas por HENDERSON (1975).
As três situações de seleção simuladas no presente trabalho seriam ignoráveis se uL
fosse utilizada, ou seja, as funções de verossimilhança resultariam nos mesmos
estimadores considerando ou não os processos de seleção. Caso a opção fosse por
empregar cL, a seleção fenotípica não seria ignorável, por ser dependente dos efeitos
de GC (GIANOLA et al., 1988).
51
No caso de métodos de inferência baseados em distribuições amostrais,
HENDERSON (1990) mencionou que não estava certo se MMH_a ou um modelo
alternativo deveria ser adotado para casos em que MMH_a apresentasse soluções
viesadas. Os resultados do presente trabalho evidenciaram que modelos alternativos
podem apresentar propriedades superiores às do modelo MMH_a, e que nem sempre a
seleção, ou mais explicitamente, as diferenças genéticas entre níveis dos efeitos
ambientais, deveriam ser ignoradas.
O uso de grupos genéticos poderia ser uma alternativa para reduzir ou eliminar o
viés apresentado pelo modelo MMH_a na situação de “seleção do tipo L’u”, ou para o
caso de informação de parentesco perdida. Essa alternativa não foi testada no presente
estudo porque em conjuntos de dados reais dificilmente há oportunidade de definir
grupos genéticos de forma apropriada como em estudos de simulação. A inclusão de
grupos genéticos desnecessários no modelo pode acarretar em redução da acurácia de
predição (TORRES JR. et al., 1997), ou ainda resultar em problemas de estimabilidade
SULLIVAN (2002).
3.4 – Implicações
Os resultados encontrados indicam que progressos genéticos podem ser obtidos
com a aplicação dos diferentes modelos testados e que, de acordo com os resultados
referentes as médias dos valores genéticos verdadeiros dos touros classificados como
10% superiores, os progressos genéticos esperados seriam semelhantes.
Diferenças marcantes entre os modelos de avaliação ocorreram quanto a
habilidade em selecionar vacas de mérito genético superior. Neste caso, o progresso
genético poderia ser comprometido, e aconselha-se a adoção de modelos que não
usem apenas a informação da progênie para predizer o mérito genético das vacas.
Os valores de viés apresentados pelos diferentes modelos, nas diferentes
situações, evidenciam que a proporção de animais jovens de determinado rebanho a
receber certificado de superioridade genética poderia ser afetada, dependendo do
modelo adotado. Modelos que assumem o efeito de touro como aleatório, podem
favorecer a certificação de animais provenientes de rebanhos com mérito genético
52
inferior, caso as diferenças genéticas entre os rebanhos não possam ser explicadas
pelas informações contidas nos dados.
3.5 – Conclusões
Evidências foram encontradas de que modelos alternativos que consideram os
efeitos genéticos ou parte deles como efeito fixo podem apresentar propriedades
superiores às do modelo predominantemente aplicado em programas de melhoramento
(MMH_a), especialmente os modelos MA3_a e MA4_a.
Para casos em que as diferenças genéticas não são geradas seguindo decisões
tomadas unicamente com base no BLUP dos valores genéticos, touros com maior
proporção de filhos nos GCs/rebanhos/programas com animais de mérito genético
superior podem ter seu mérito genético subestimado se o modelo MMH_a for aplicado,
e tendências genéticas podem ser subestimadas.
Na prática, diferentes critérios/forças/decisões podem atuar no sentido de gerar
diferenças genéticas entre GCs e, possivelmente, todos os modelos testados
forneceriam soluções viesadas. Porém, com uma diferença marcante: modelos que
assumem os efeitos genéticos como aleatórios apresentariam viés no sentido de
subestimar o efeito de touros com maior proporção de filhos nos GCs/rebanhos com
animais de mérito genético superior, para casos em que não houvesse informação
completa e correta contida nos dados das forças que atuaram sobre a esperança dos
valores genéticos; e modelos que assumem os efeitos genéticos como fixos
apresentariam viés no sentido oposto, na presença de diferenças genéticas (entre GCs
de diferentes gerações) geradas com base no BLUP.
53
REFERÊNCIAS BIBLIOGRÁFICAS
BURNSIDE, E. B.; MEYER, K. Potential impact of bovine somatotropin on dairy sire
evaluation. J. Dairy Sci., v.71, p.2210-2219. 1988.
CARVALHEIRO, R. Flexibilizando a matriz R na predição de valores genéticos.
Dissertação (Mestrado em Zootecnia), Faculdade de Ciências Agrárias e
Veterinárias, Universidade Estadual Paulista, Câmpus de Jaboticabal, 2000. 107p.
CARVALHEIRO, R.; SCHENKEL, F. S.; FRIES, L. A.; QUEIROZ, S. A.; MILLER, S. P.
Empirical statistical and genetic proprieties of solutions from Henderson's mixed
model equations when sires are non-randomly used across contemporary groups. J.Anim. Breed. Genet. 2004 (a ser submetido).
CUNNINGHAM, E. P.; HENDERSON, C. R. Analytical techniques for incomplete block
experiments. Biometrics, v.22, p.829-842. 1966.
FERNANDO, R. L.; GIANOLA, D. Optimal properties of the conditional mean as a
selection criterion. Theor. Appl. Genet., v.72, p.822-825. 1986.
FERNANDO, R. L.; GIANOLA, D. Statistical inferences in populations undergoing
selection and non-random mating. In: Advances in Statistical Methods for GeneticImprovement of Livestock (ed. D. Gianola, and K. Hammond), Springer-Verlag,
Berlin. p.437-453. 1990.
FRIES, L. A. Connectability in beef cattle genetic evaluation: the heuristic approach
used in MILC.FOR. In: WORLD CONGRESS ON GENETICS APPLIED TO
LIVESTOCK PRODUCTION, 6., 1998, Armidale, Australia, Proceedings... v.27,
p.449-450.
FRIES, L. A. Selection amenable alternative models. In: INTERNATIONAL
SYMPOSIUM ON ANIMAL BREEDING AND GENETICS, 1999, Viçosa, MG, Brasil.
p.35-77.
54
FRIES, L. A.; SCHENKEL, F. S. Estimation and prediction under a selection model. In:
REUNIÃO ANUAL DA SOCIEDADE BRASILEIRA DE ZOOTECNIA, 30., 1993, Rio
de Janeiro, Brasil. Anais dos Simpósios... p.1-20.
GIANOLA, D. Can BLUP and REML be improved upon? In: WORLD CONGRESS ON
GENETICS APPLIED TO LIVESTOCK PRODUCTION, 4., 1990, Proceedings...
v.13, p.445-449.
GIANOLA, D.; FERNANDO, R. L.; IM, S.; FOULLEY, J. L. Likelihood estimation of
quantitative genetic parameters when selection occurs: models and problems.
Genome, v.31, p.768-777. 1989.
GIANOLA, D.; IM, S.; FERNANDO, R. L. Prediction of breeding value under
Henderson's selection model: A revisitation. J. Dairy Sci., v.71, p.2790-2798. 1988.
HARVEY, W.R. Accuracy of simplified regressed least-squares (SRLS) vs BLUP
methods for ranking sires. Indian J. Anim. Genet. Breed., v.1, p.7-9. 1979.
HENDERSON, C. R. Estimates of changes in herd environment. J. Dairy Sci., v.32,
p.706. 1949.
HENDERSON, C. R. Selection index and expected genetic advance. In: STATISTICAL
GENETICS AND PLANT BREEDING. Natl. Acad. Sci. Nat. Res. Council. Publ.,
p.141-163, 1963.
HENDERSON, C. R. Sire evaluation and genetics trends. In: ANIMAL BREEDING AND
GENETIC SYMPOSIUM IN HONOR OF DR. JAY L. LUSH, ASAS, 1973, Illinois,
USA, Proceedings... p.10-41.
HENDERSON, C. R. Best linear unbiased estimation and prediction under a selection
model. Biometrics, v.31, p.423-447. 1975.
HENDERSON, C. R. Undesirable properties of regressed least squares prediction of
breeding values. J. Dairy Sci., v.61, p.114-120. 1978.
HENDERSON, C. R. Applications of linear models in animal breeding. University of
Guelph, Ontario, Canada. 1984. 462 p.
55
HENDERSON, C. R. Comment. In: IM et al. (1989). Likelihood inferences in animal
breeding under selection: a missing-data theory view point. Genet. Sel. Evol., v.21,
p.409-410. 1989.
HENDERSON, C. R. Accounting for selection and mating biases in genetic evaluations.
In: Advances in Statistical Methods for Genetic Improvement of Livestock (ed.
D. Gianola, and K. Hammond), Springer-Verlag, Berlin. p.413-436. 1990.
HENDERSON, C. R.; KEMPTHORNE, O.; SEARLE, S. R.; VON KROSIGK, C. M. The
estimation of environmental and genetic trends from records subject to culling.
Biometrics, v.15, p.192-218. 1959.
IM, S.; FERNANDO, R. L.; GIANOLA, D. Likelihood inferences in animal breeding under
selection: a missing-data theory view point. Genet. Sel. Evol., v.21, p.399-414. 1989.
SAS Institute Inc. SAS/STAT, 1998. User guide. Cary: SAS Institute Inc., USA.
SCHAEFFER, L. R. Effects of non-random mating. In: QUANTITATIVE GENETICS
AND ANIMAL MODELS, Lesson 17, Winter Course. University of Guelph, Ontario,
Canada. 2003. 7p.
SCHENKEL, F. S. Studies on effects of parental selection on estimation of geneticparameters and breeding values of metric traits. Ph.D. Thesis. University of
Guelph, Ontario. 1998. 191p.
SCHENKEL, F. S.; SCHAEFFER, L. R.; BOETTCHER, P. J. Comparison between
estimation of breeding values and fixed effects using Bayesian and empirical BLUP
estimation under selection on parents and missing pedigree information. Genet. Sel.Evol., v.34, p.41-59. 2002.
SIMIANER, H. Prospects for third generation methods of genetic evaluation. In:
ANNUAL MEETING OF THE EUROPEAN ASSOCIATION FOR ANIMAL
PRODUCTION, 42., 1991, Germany, Proceedings... 13p.
SIMIANER, H.; WOLLNY, C. Impact of the potential use of bovine somatotropin on the
efficiency of a conventional dairy cattle breeding scheme. Livest. Prod. Sci., v.22,
p.31. 1989.
56
SORENSEN, D. A.; GIANOLA, D. Likelihood, Bayesian, and MCMC methods inquantitative genetics. Springer. 2002. 740p.
SORENSEN, D. A.; KENNEDY, B. W. Estimation of genetic variances from unselected
and selected populations. J. Anim. Sci., v.59, p.1213-1223. 1984.
SULLIVAN, P. Genetic evaluation strategies for multiple traits and countries. Ph.D.
Thesis. University of Guelph, Ontario. 2002. 152p.
TÄUBERT, H.; SWALVE, H. H.; SIMIANER, H. Treatment of management groups in
dairy cattle evaluations. In: WORLD CONGRESS ON GENETICS APPLIED TO
LIVESTOCK PRODUCTION, 7., 2002, Montpellier, France, Proceedings...
Communication 20-12.
TORRES JR., R. A. A.; BRACCINI NETO, J.; SILVA, M. A.; LOPES, P. S. Avaliação de
metodologias de predição de valor genético por meio de simulação. Rev. Bras.Zootec., v.26, p.1142-1146. 1997.
UGARTE, E.; ALENDA, R.; CARABAÑO, M. J. Fixed or random contemporary groups in
genetic evaluations. J. Dairy Sci., v.75, p.269-278. 1992.
VAN DER WERF, J. H. J. Models to estimate genetic parameters in cross breddairy cattle populations under selection. Ph. D. Thesis, Department of Animal
Breeding, Wageningen Agricultural University, Netherlands. 1990.
VAN VLECK, L. D. Contemporary groups for genetic evaluations. J. Dairy Sci., v.70,
p.2456-2464. 1987.
VANRADEN, P. M.; WIGGANS, G. R. Derivation, calculation and use of national animal
model information. J. Dairy Sci., v.74, p.2737-2746. 1991.
VISSCHER, P. M.; GODDARD, M. E. Fixed and random contemporary groups. J. DairySci., v.76, p.1444-1454. 1993.
WRIGHT, S. Coefficients of inbreeding and relationship. American Naturalist, v.56,
p.330-338. 1922.
57
Apêndice 1: Freqüências esperadas (%) da ocorrência das subclasses definidas por
conjuntos de touros e conjuntos de grupos de contemporâneos (GCs), para as
diferentes situação simuladas.
! Situação 1 – Os conjuntos de touros e de GCs foram formados conforme o número de
identificação (ID), resultando em uma situação caracterizada pela ausência de diferênças
genéticas entre conjuntos de GCs, e ausência de correlação genética ambiental.
! Situação 2 – Os conjuntos de touros foram formados conforme sua classificação (rank), em
ordem decrescente dos valores genéticos verdadeiros, e os conjuntos de GCs foram
formados conforme o número de identificação (ID), resultando em uma situação
caracterizada pela presença de diferênças genéticas entre conjuntos de GCs, e ausência de
correlação genética ambiental.
GCTouro 1-40 41-80 81-120 121-160 161-2001-50 12 6 2 0 0
51-100 6 8 4 2 0101-150 2 4 8 4 2151-200 0 2 4 8 6201-250 0 0 2 6 12
IDID
GCTouro 1-40 41-80 81-120 121-160 161-2001-50 12 6 2 0 0
51-100 6 8 4 2 0101-150 2 4 8 4 2151-200 0 2 4 8 6201-250 0 0 2 6 12
IDrank
58
! Situação 3 – Os conjuntos de touros e os conjuntos de GCs foram formados conforme suas
classificações (rank), em ordem decrescente dos efeitos verdadeiros, resultando em uma
situação caracterizada pela presença de diferênças genéticas entre conjuntos de GCs, e
presença de correlação genética ambiental positiva.
! Situação 4 – Os conjuntos de touros foram formados conforme o rank, em ordem
decrescente dos valores genéticos verdadeiros, e os conjuntos de GCs foram formados
conforme o rank, em ordem crescente dos efeitos verdadeiros de GC, resultando em uma
situação caracterizada pela presença de diferênças genéticas entre conjuntos de GCs, e
presença de correlação genética ambiental negativa.
GCTouro 1-40 41-80 81-120 121-160 161-2001-50 12 6 2 0 0
51-100 6 8 4 2 0101-150 2 4 8 4 2151-200 0 2 4 8 6201-250 0 0 2 6 12
rank (ordem decrescente)rank
GCTouro 1-40 41-80 81-120 121-160 161-2001-50 12 6 2 0 0
51-100 6 8 4 2 0101-150 2 4 8 4 2151-200 0 2 4 8 6201-250 0 0 2 6 12
rank (ordem crescente)rank
59
Apêndice 2: Programa de simulação desenvolvido em SAS para gerar a estrutura dos
dados simulados no primeiro estudo, conforme descrito no Capítulo 2, item 2.2.1.
/*************************************//* RC *//* *//* doutorado JAN/2003 *//* *//* gerando estrutura dos dados *//* *//*************************************/
proc iml;
seed=27903441;
%MACRO CRIAR; /* comando MACRO usado para gerar repetições */%DO J=1 %TO 50; /* e gravar arq. saída com diferentes nomes */
n1=5000; /* n1=nº total de observações (animais) */n2=250; /* n2=nº de touros */n3=200; /* n3=nº de GC´s */
t=j(n1,1,0); /* t=touro (n2 touros gerando n1 animais) */gc=j(n1,1,0); /* n1 animais distribuídos em n3 GC´s */tgc=j(n2,n3,0); /* tgc subclasses touro*gc */ntgc=j(n3,1,0); /* ntgc=nº de touros por GC */ngct=j(n2,1,0); /* ngct=nº de GCs por touro */nt=j(n2,1,0); /* nt=nº de filhos por touro */ngc=j(n3,1,0); /* ngc=nº de animais por GC */
vaca=j(n1,1,0);an=j(n1,1,0);
/* "Restrições": mínimo máximo *//* (1) filhos por touro n4 n5 *//* (2) animais por GC n6 n7 *//* (3) touro por GC n8 n9 *//* (4) GC por touro n10 n11 */
n4=5;n5=50;n6=10;n7=100;n8=3;n9=50;n10=3;n11=40;
60
/* Iniciando Processo de amostragem (pseudo)aleatória *//* usando distribuição uniforme para amostrar touro e GC */
R=1;DO WHILE(R=1);
REINI:do i= 1 to n1;
an[i]=20000+i; if i<=(n1/2) then vaca[i]=10000+i; else vaca[i]=10000+i-(n1/2);
INIT: t[i]=int(ranuni(seed)*n2)+1;
if t[i]<=50 then rt=1; if t[i]>50 then if t[i]<=100 then rt=2; if t[i]>100 then if t[i]<=150 then rt=3; if t[i]>150 then if t[i]<=200 then rt=4; if t[i]>200 then rt=5;
prob1=0; rng1=ranuni(seed); if rng1<=.6 then prob1=1; if rng1>.6 then if rng1<=.9 then prob1=2; if rng1>.9 then prob1=3;
prob2=0; rng2=ranuni(seed); if rng2<=.3 then prob2=1; if rng2>.3 then if rng2<=.7 then prob2=2; if rng2>.7 then if rng2<=.9 then prob2=3; if rng2>.9 then prob2=4;
prob3=0; rng3=ranuni(seed); if rng3<=.1 then prob3=1; if rng3>.1 then if rng3<=.3 then prob3=2; if rng3>.3 then if rng3<=.7 then prob3=3; if rng3>.7 then if rng3<=.9 then prob3=4; if rng3>.9 then prob3=5;
if rt=1 then if prob1=1 then gc[i]=int(ranuni(seed)*20)+1; if rt=1 then if prob1=2 then gc[i]=int(ranuni(seed)*20)+41; if rt=1 then if prob1=3 then gc[i]=int(ranuni(seed)*20)+81;
if rt=2 then if prob2=1 then gc[i]=int(ranuni(seed)*20)+1; if rt=2 then if prob2=2 then gc[i]=int(ranuni(seed)*20)+41; if rt=2 then if prob2=3 then gc[i]=int(ranuni(seed)*20)+81; if rt=2 then if prob2=4 then gc[i]=int(ranuni(seed)*20)+121;
61
if rt=3 then if prob3=1 then gc[i]=int(ranuni(seed)*20)+1; if rt=3 then if prob3=2 then gc[i]=int(ranuni(seed)*20)+41; if rt=3 then if prob3=3 then gc[i]=int(ranuni(seed)*20)+81; if rt=3 then if prob3=4 then gc[i]=int(ranuni(seed)*20)+121; if rt=3 then if prob3=5 then gc[i]=int(ranuni(seed)*20)+161;
if rt=4 then if prob2=4 then gc[i]=int(ranuni(seed)*20)+41; if rt=4 then if prob2=3 then gc[i]=int(ranuni(seed)*20)+81; if rt=4 then if prob2=2 then gc[i]=int(ranuni(seed)*20)+121; if rt=4 then if prob2=1 then gc[i]=int(ranuni(seed)*20)+161;
if rt=5 then if prob1=3 then gc[i]=int(ranuni(seed)*20)+81; if rt=5 then if prob1=2 then gc[i]=int(ranuni(seed)*20)+121; if rt=5 then if prob1=1 then gc[i]=int(ranuni(seed)*20)+161;
resto=(mod(i,2)); if resto^=0 then gc[i]=gc[i]+20;
nt[t[i]]=nt[t[i]]+1; if nt[t[i]]>n5 then do; /* máximo de filhos por touro */ nt[t[i]]=nt[t[i]]-1; go to INIT; end;
ngc[gc[i]]=ngc[gc[i]]+1; if ngc[gc[i]]>n7 then do; /* máximo de animais por GC */ nt[t[i]]=nt[t[i]]-1; ngc[gc[i]]=ngc[gc[i]]-1; go to INIT; end;
tgc[t[i],gc[i]]=1; ntgc[gc[i]]=0; ngct[t[i]]=0;
do l=1 to n2; ntgc[gc[i]]=ntgc[gc[i]]+tgc[l,gc[i]]; end; if ntgc[gc[i]]>n9 then do; /* máximo de touros por GC */ nt[t[i]]=nt[t[i]]-1; ngc[gc[i]]=ngc[gc[i]]-1; tgc[t[i],gc[i]]=0; go to INIT; end;
do l=1 to n3; ngct[t[i]]=ngct[t[i]]+tgc[t[i],l]; end; if ngct[t[i]]>n11 then do; /* máximo de GCs por touro */ nt[t[i]]=nt[t[i]]-1; ngc[gc[i]]=ngc[gc[i]]-1; tgc[t[i],gc[i]]=0; go to INIT; end;
62
end;
restr1=0;restr2=0;restr3=0;restr4=0; /* Verificando Restrições */ /* */do m=1 to n2; /* */ if nt[m]<n4 then restr1=1; /* mínimo de filhos por touro */end; /* */ /* */
do m=1 to n3; /* */ if ngc[m]<n6 then restr2=1; /* mínimo de animais por GC */end; /* */ /* */do m=1 to n3; /* */ if ntgc[m]<n8 then restr3=1; /* mínimo de touros por GC */end; /* */ /* */do m=1 to n2; /* */ if ngct[m]<n10 then restr4=1; /* mínimo de GCs por touro */end; /* */
/* Iniciando avaliação de conectabilidade das subclasses (touro*GC) *//* de acordo com Schaeffer (1983 - p.39). *//* Se nsub=soma, então os dados estão conectados, *//* senão, REINIciar amostragem. */
nsub=0;obs=0;soma=sum(tgc);
do i1=1 to n2; do j1=1 to n3;
if obs=0 then do; if tgc[i1,j1]=1 then do; tgc[i1,j1]=0; nsub=nsub+1; obs=obs+1; CONT: do i2=1 to n3; if tgc[i1,i2]=1 then tgc[i1,i2]=2; end; do j2=1 to n2; if tgc[j2,j1]=1 then tgc[j2,j1]=2; end;
end; end;
63
if tgc[i1,j1]=2 then do; tgc[i1,j1]=0; nsub=nsub+1; go to CONT; end;
if i1=n2 then if j1=n3 then do; do i3=1 to n2; do j3=1 to n3; if tgc[i3,j3]=2 then do; i1=1; j1=1; end; end; end; end;
end;end;
do o=1 to n2; /* Zerando contadores */ nt[o]=0; /* para a próxima repetição */end; /* ou para REINIciar se */do p=1 to n3; /* restrições de mínimo não */ ngc[p]=0; /* foram atendidas (restr=1) */end; /* ou ainda se dados não */do q=1 to n2; /* estão conectados */ do s=1 to n3; tgc[q,s]=0; end;end;
print restr1 restr2 restr3 restr4 soma nsub;
if restr1=1 then go to REINI;if restr2=1 then go to REINI;if restr3=1 then go to REINI;if restr4=1 then go to REINI;if nsub^=soma then go to REINI;
R=R+1;END;
CREATE ESQ&J VAR{an t vaca gc};APPEND;CLOSE ESQ&J;
%END;%MEND CRIAR;%CRIAR;
quit;run;
64
%MACRO GRAVAR;%DO J=1 %TO 50;
data a;set esq&J;file "c:\roberto\s030331\dados&J";put an 1-6 t 8-13 vaca 15-20 gc 22-24;run;
%END;%MEND GRAVAR;%GRAVAR;
65
Apêndice 3: Programa de simulação desenvolvido em SAS para gerar os parâmetros
do modelo e as observações fenotípicas das simulações referentes ao primeiro estudo,
conforme descrito no Capítulo 2, item 2.2.2.
/********************************************************************** DOUTORADO (FEV/2003)
Programa para gerar Y (GPP), nas diferentes situações de associação touro_x_GC.
(1) var(a)=120; var(e) = 180; var(p)=300 kg^2 ; h^2=0,4; (2) E(egc)=172,5 ; var(egc)=300; (3) GPP=vga+egc+e**********************************************************************/
data clast;do i=1 to 250; touro=i; output;end;drop i;
%MACRO CRIAR;%DO J=1 %TO 50;
/* ST2: diferenças genéticas entre GCs (r(GC,touro)=0) */
data a;infile "c:\roberto\s030331\dados&J";input an touro vaca gc;proc sort;by touro;run;
data a2; /* TBV – touros */do i=1 to 250; vgat=rannor(0)*10.954; output;end;proc sort;by descending vgat;run;
data b;merge clast a2;drop i;proc sort;by touro;run;
66
data c;merge a b;by touro;proc sort;by vaca;run;
data d; /* TBV – vacas */do vaca=10001 to 12500; vgav=rannor(0)*10.954; output;end;
data e;merge c d;by vaca;
data f;set e; /* TBV – produtos */sm=rannor(0)*7.746;vga=((vgat+vgav)/2)+sm;proc sort;by gc;run;
data g; /* TGC */do gc=1 to 200; egc=rannor(0)*17.3205+172.5; output;end;
data h;merge f g;by gc;
data i;set h;e=rannor(0)*13.416;GPP=vga+egc+e;proc sort;by an;run;
data j;set i;file "c:\roberto\s030331\dat2r&J";put an 1-6 touro 8-13 vaca 15-20 gc 22-24 gpp 26-32 .3;run;
data k;set i;file "c:\roberto\s030331\cor2r&J";put an 1-6 vga 8-15 .4 touro 17-22 vgat 24-31 .4 vaca 33-38 vgav 40-47 .4 gc 49-51 egc 53-60 .4 e 62-69 .4 sm 71-78 .4;run;
67
/* ST1: ausência de diferenças genéticas entre GCs */
data l;set a2;rename i=touro;proc sort;by touro;run;
data l3;merge a l;by touro;proc sort;by an;run;
data l6;set k;keep an vgav egc e sm;
data l9;merge l3 l6;by an;vga=((vgat+vgav)/2)+sm;GPP=vga+egc+e;
data l11;set l9;file "c:\roberto\s030331\dat1r&J";put an 1-6 touro 8-13 vaca 15-20 gc 22-24 gpp 26-32 .3;run;
data l11;set l9;file "c:\roberto\s030331\cor1r&J";put an 1-6 vga 8-15 .4 touro 17-22 vgat 24-31 .4 vaca 33-38 vgav 40-47 .4 gc 49-51 egc 53-60 .4 e 62-69 .4 sm 71-78 .4;run;
/* ST3: diferenças genéticas entre GCs (r(GC,touro)>0) */
data m;do i=1 to 200; gc=i; output;end;drop i;
data m3;set g;rename gc=i;proc sort;by descending egc;run;
68
data m6;merge m m3;drop i;
data m9;set i;keep an vga touro vgat vaca vgav gc e sm;proc sort;by gc;run;
data m11;merge m6 m9;by gc;GPP=vga+egc+e;proc sort;by an;run;
data m13;set m11;file "c:\roberto\s030331\dat3r&J";put an 1-6 touro 8-13 vaca 15-20 gc 22-24 gpp 26-32 .3;run;
data m13;set m11;file "c:\roberto\s030331\cor3r&J";put an 1-6 vga 8-15 .4 touro 17-22 vgat 24-31 .4 vaca 33-38 vgav 40-47 .4 gc 49-51 egc 53-60 .4 e 62-69 .4 sm 71-78 .4;run;
%END;%MEND CRIAR;%CRIAR;
69
Apêndice 4: Programa desenvolvido em linguagem FORTRAN para conduzir
avaliações genéticas, conforme modelos descritos no Capítulo 2, item 2.2.3.
C RC - FEV/2003CCC M1 - (gc fixo e touro e vaca aleatorios)C M2 - (gc, touro e vaca aleatorios)C M3 - (gc, touro e vaca fixos)C M4 - (gc e touro fixos e vaca aleatorio)CCC h2=0.4 (rvep=8; regd=0.125)CC PARAMETER (nobs=20000,nivel=1000,rvep=8.0,regd=0.125)
INTEGER KA(nobs),KT(nobs),KV(nobs),KG(nobs) INTEGER SIRE(nivel),DAM(nobs),GC(nivel) INTEGER ISIRE(nobs),IDAM(nobs),IGC(nobs) INTEGER WT1(nobs),WT2(nobs),WV1(nobs),WV2(nobs), * WG1(nobs),WG2(nobs) INTEGER NT,NV,NG,IREG INTEGER BT,BV,BG REAL Y(nobs),MU,MUGF REAL VT(nivel),AT(nivel),VV(nobs),AV(nobs),VG(nivel),AG(nivel) INTEGER nIT(nivel),nIV(nobs),nIG(nivel) REAL LIM,DIFT,DIFT2,DIFV,DIFV2,DIFG,DIFG2
CC formato de entrada dos dados:C AN SIRE DAM GC GPPC 911 FORMAT(I6,1X,I6,1X,I6,1X,I3,1X,F7.3)CC obs: iSIRE, iDAM e iGC sao a "ID original"C
911 FORMAT(I6,1X,I6,1X,I6,1X,I3,1X,F7.3) 912 FORMAT(I6,1X,I6,1X,F12.7) 913 FORMAT(I6,1X,I6,1X,F12.7) 914 FORMAT(I6,1X,I6,1X,F12.7) 915 FORMAT(I6,1X,F12.7,1X,F12.7) 7891 FORMAT(T3,I5,T13,F10.5,T25,F10.5,T37,F10.5)
OPEN(11,FILE='dados',STATUS='OLD') OPEN(12,FILE='gcHtv',STATUS='UNKNOWN') OPEN(13,FILE='toHtv',STATUS='UNKNOWN') OPEN(14,FILE='vaHtv',STATUS='UNKNOWN') OPEN(15,FILE='anHtv',STATUS='UNKNOWN')
70
C Lendo arquivo de dadosC I=1 MU=0.0 10 CONTINUE READ(11,911,END=12)KA(I),ISIRE(I),IDAM(I),IGC(I),Y(I) MU=MU+(Y(I)-MU)/I I=I+1 GOTO 10 12 CONTINUE IREG=I-1 WRITE(*,*)' IREG=',IREG WRITE(*,*)' Media Geral=',mu
CC (i)Gerando nova ID para SIRE, DAM e GC de acordo com a ordem queC aparecem no arquivo de dadosC obs: KT, KV e KG sao a "ID sequencial"C (ii)Obtendo numero de touros, vacas e GC presentes noC arquivo de dados (NT,NV,NG)C
NT=0 NV=0 NG=0
DO 14 I=1,IREG WT1(I)=0 WT2(I)=0 WV1(I)=0 WV2(I)=0 WG1(I)=0 WG2(I)=0 14 CONTINUE
DO 16 I=1,IREG
IF(ISIRE(I).NE.0)THEN
DO 18 J=1,NT IF(WT1(J).EQ.ISIRE(I))THEN KT(I)=WT2(J) GOTO 20 ENDIF 18 CONTINUE NT=NT+1 WT1(NT)=ISIRE(I) WT2(NT)=NT KT(I)=NT
20 CONTINUE
ENDIF IF(IDAM(I).NE.0)THEN
71
DO 22 J=1,NV IF(WV1(J).EQ.IDAM(I))THEN KV(I)=WV2(J) GOTO 24 ENDIF 22 CONTINUE NV=NV+1 WV1(NV)=IDAM(I) WV2(NV)=NV KV(I)=NV
24 CONTINUE
ENDIF
DO 26 J=1,NG IF(WG1(J).EQ.IGC(I))THEN KG(I)=WG2(J) GOTO 16 ENDIF 26 CONTINUE NG=NG+1 WG1(NG)=IGC(I) WG2(NG)=NG KG(I)=NG
16 CONTINUE
DO 28 I=1,IREG IF(ISIRE(I).NE.0)SIRE(KT(I))=ISIRE(I) IF(IDAM(I).NE.0)DAM(KV(I))=IDAM(I) GC(KG(I))=IGC(I) 28 CONTINUE
DO 34 I=1,NG VG(I)=0.0 AG(I)=0.0 nIG(I)=0 34 CONTINUE WRITE(*,*)NG,' Grupos Contemporaneos'
DO 36 I=1,NT VT(I)=0.0 AT(I)=0.0 nIT(I)=0 36 CONTINUE WRITE(*,*)NT,' Touros'C DO 38 I=1,NV VV(I)=0.0 AV(I)=0.0 nIV(I)=0 38 CONTINUE WRITE(*,*)NV,' Vacas'
72
C INICIA PROCESSO ITERATIVOC
ITR=0 LIM=0.0005 MUGF=MU 50 CONTINUE IVOLTA=0 DIFT=0.0001 DIFV=0.0001 DIFG=0.0001 ITR=ITR+1 IF(ITR.EQ.501)GOTO 9000
CC TOUROSC
DO 54 J=1,NT AT(J)=0.0 nIT(J)=0 54 CONTINUE
DO 60 I=1,IREG IF(ISIRE(I).NE.0)THEN A1=Y(I)-MUGF-VG(KG(I))-VV(KV(I)) AT(KT(I))=AT(KT(I))+A1 nIT(KT(I))=nIT(KT(I))+1 ENDIF 60 CONTINUEC bt=0 SOMAT=0.0
C se touro eh fixo, usar AT(J)=AT(J)/nIT(J) e impor restricao AT(J)=AT(J)-CTcC se touro eh aleatorio, usar AT(J)=AT(J)*nIT(J)/(nIT(J)+rvep)C
DO 70 J=1,NT IF(nIT(J).NE.0)THEN AT(J)=AT(J)/nIT(J)ccc AT(J)=AT(J)*nIT(J)/(nIT(J)+rvep) SOMAT=SOMAT+AT(J) bt=bt+1 ENDIF 70 CONTINUE
CT=SOMAT/BT MUGF=MUGF+CT DO 80 J=1,NT IF(nIT(J).NE.0)THEN AT(J)=AT(J)-CT DIF=AT(J)-VT(J)
73
DIFT2=ABS(DIF) IF(DIFT2.GT.DIFT)DIFT=DIFT2 VT(J)=AT(J) ENDIF 80 CONTINUE IF(DIFT.GT.LIM)IVOLTA=1
CC GCSC DO 85 J=1,NG AG(J)=0.0 nIG(J)=0 85 CONTINUE
DO 90 I=1,IREG
IF(ISIRE(I).NE.0.AND.IDAM(I).NE.0) * A1=Y(I)-MUGF-VT(KT(I))-VV(KV(I)) AG(KG(I))=AG(KG(I))+A1 nIG(KG(I))=nIG(KG(I))+1
90 CONTINUE
C se GC eh fixo, usar AG(J)=AG(J)/nIG(J) e impor restricao AG(J)=AG(J)-CORGcC se GC eh aleatorio, usar AG(J)=AG(J)*nIG(J)/(nIG(J)*0.8)C bg=0 SOMAG=0.0 DO 95 J=1,NG IF(nIG(J).NE.0)THEN AG(J)=AG(J)/nIG(J)ccc AG(J)=AG(J)*nIG(J)/(nIG(J)*0.8) SOMAG=SOMAG+AG(J) bg=bg+1 ENDIF 95 CONTINUE CORG=SOMAG/BG MUGF=MUGF+CORG DO 100 J=1,NG IF(nIG(J).NE.0)THEN AG(J)=AG(J)-CORG DIF=AG(J)-VG(J) DIFG2=ABS(DIF) IF(DIFG2.GT.DIFG)DIFG=DIFG2 VG(J)=AG(J) ENDIF 100 CONTINUE IF(DIFG.GT.LIM)IVOLTA=1
74
CC VACASC
DO 150 J=1,NV AV(J)=0.0 nIV(J)=0 150 CONTINUE
DO 160 I=1,IREG IF(IDAM(I).NE.0)THEN A1=Y(I)-MUGF-VG(KG(I))-VT(KT(I)) AV(KV(I))=AV(KV(I))+A1 nIV(KV(I))=nIV(KV(I))+1 ENDIF 160 CONTINUE
C se vaca eh fixo, usar AV(J)=AV(J)/nIV(J) e impor restricao AV(J)=AV(J)-CORVcC se vaca eh aleatorio, usar AV(J)=AV(J)*nIV(J)/(nIV(J)+rvep)C bv=0 SOMAV=0.0 DO 170 J=1,NV IF(nIV(J).NE.0)THEN AV(J)=AV(J)/nIV(J)ccc AV(J)=AV(J)*nIV(J)/(nIV(J)+rvep) SOMAV=SOMAV+AV(J) bv=bv+1 ENDIF 170 CONTINUE
CORV=SOMAV/BV MUGF=MUGF+CORV DO 180 J=1,NV IF(nIV(J).NE.0)THEN AV(J)=AV(J)-CORV DIF=AV(J)-VV(J) DIFV2=ABS(DIF) IF(DIFV2.GT.DIFV)DIFV=DIFV2 VV(J)=AV(J) ENDIF 180 CONTINUE IF(DIFV.GT.LIM)IVOLTA=1C imit=mod(itr,10) if(itr.lt.6.or.imit.eq.0) then WRITE(*,7891) ITR,DIFT,DIFG,DIFV endif
IF(IVOLTA.EQ.1) GOTO 50CC WRITE(*,*) ' I T E R A C O E S T E R M I N A R A M ! ! !'
75
c WRITE(*,*)' GRAVANDO DP.G ...' DO 512 J=1,NG 512 WRITE(12,912)GC(J),nIG(J),VG(J)c WRITE(*,*)' GRAVANDO DP.T ...' DO 513 J=1,NT 513 WRITE(13,913)SIRE(J),nIT(J),VT(J)c WRITE(*,*)' GRAVANDO DP.V ...' DO 514 J=1,NV 514 WRITE(14,914)DAM(J),nIV(J),VV(J)c WRITE(*,*)' GRAVANDO DP.A ...' DO 515 I=1,IREG IF(ISIRE(I).NE.0.AND.IDAM(I).NE.0)THEN D=Y(I)-MUGF-VG(KG(I))-VT(KT(I))-VV(KV(I)) SM=D*regd DEPA=0.5*(VT(KT(I))+VV(KV(I)))+SM ENDIF
WRITE(15,915)KA(I),SM,DEPA 515 CONTINUECC GOTO 9001 9000 WRITE(*,*)' NAO HOUVE CONVERGENCIA APOS 500 ITERACOES !!! ' 9001 continueC STOP END
76
Apêndice 5: Desdobramento das equações de modelos mistos de Henderson
modificadas para a obtenção do BLUE/BLUP sob situações de “seleção do tipo L’y”
com L’X=0, e seleção com base no BLUP.
Baseado nos resultados de PEARSON (1903), HENDERSON (1975) derivou as
seguintes equações para a obtenção do BLUE/BLUP sob situações de seleção:
====
++++−−−−−−−−++++
−−−−
−−−−
−−−−
−−−−−−−−−−−−−−−−−−−−
−−−−−−−−−−−−−−−−−−−−
−−−−−−−−−−−−
yR'ByR'ZyR'X
tub
BR'BBR'BG'BZR'BXR'B
BGBR'ZGZR'ZXR'ZBR'XZR'XXR'X
1e
1
1
u1
ue1
e1
u1
e1
e
u1
e1111
e111
. (1)
Seleção com base em y:
Se a seleção for baseada nas observações fenotípicas, HENDERSON (1975)
demonstrou que as equações (1) se reduzem a:
====
++++
−−−−
−−−−
−−−−
−−−−−−−−−−−−
−−−−−−−−
yR'LyR'ZyR'X
tub
VL'L0X'L0GZR'ZXR'ZL'XZR'XXR'X
1
1
1
111
11
. (2)
Para que as equações (2) sejam equivalentes as EMMH regulares, a condição
L’X=0 deve ser atendida, isto é, a matriz que descreve o processo de seleção (L’) deve
ser ortogonal à matriz X. Esta condição ocorrerá quando as decisões baseadas em yforem tomadas dentro dos diferentes níveis dos efeitos fixos/ambientais, o que
raramente ocorre na prática, sobretudo na existência de covariáveis afetando y (FRIES,
1999; SCHAEFFER, 1999).
Seleção com base no BLUP:
Se o critério de seleção for o BLUP, então: Bu=Cov(u,BLUP) e
Be=Cov(e,BLUP). A seguir, as equações (1) são desdobradas considerando o BLUP
77
como critério de seleção. O objetivo desde desdobramento é averiguar se (1) se
reduziria às EMMH regulares caso a seleção fosse praticada com base no BLUP. Para
que isso ocorra, temos que provar que:
i) X’R-1Be=0ii) Z’R-1Be-G-1Bu=0
No 3º e 4º passos descritos a seguir, i) e ii) serão, respectivamente,
demonstrados.
1º passo: desdobrar Bu.
Bu = Cov(u,BLUP) = Cov(u,GZ’V-1(y-Xb ))
= Cov(u,GZ’V-1y-GZ’V-1Xb ) = Cov(u,GZ’V-1y-GZ’V-1X(X’V-1X)-1X’V-1y) = Cov(u,y)V-1ZG – Cov(u,y)V-1X(X’V-1X)-1X’V-1ZG = GZ’V-1ZG – GZ’V-1X(X’V-1X)-1X’V-1ZG
2º passo: desdobrar Be.
Be = Cov(e,BLUP) = Cov(y-Xb-Zu,BLUP) = Cov(y,BLUP) – Cov(Zu,BLUP) = Cov(y,GZ’V-1y- GZ’V-1X(X’V-1X)-1X’V-1y) – Z Cov(u,BLUP) = Cov(y,y)V-1ZG- Cov(y,y)V-1X(X’V-1X)-1X’V-1ZG) – Z Cov(u,BLUP) = ZG- X(X’V-1X)-1X’V-1ZG – ZGZ’V-1ZG + ZGZ’V-1X(X’V-1X)-1X’V-1ZG = ZG- X(X’V-1X)-1X’V-1ZG – (I-RV-1)ZG + (I-RV-1)X(X’V-1X)-1X’V-1ZG = ZG- X(X’V-1X)-1X’V-1ZG – ZG + RV-1ZG + X(X’V-1X)-1X’V-1ZG
- RV-1X(X’V-1X)-1X’V-1ZG = RV-1ZG - RV-1X(X’V-1X)-1X’V-1ZG
78
3º passo: desdobrar X’R-1Be.
X’R-1Be = X’R-1(RV-1ZG – RV-1 X(X’V-1X)-1X’V-1ZG) = X’V-1ZG – X’V-1X(X’V-1X)-1X’V-1ZG = X’V-1ZG – X’V-1ZG = 0 (c.q.d.)
4º passo: desdobrar Z’R-1Be-G-1Bu.
Z’R-1Be-G-1Bu = Z’R-1RV-1ZG – Z’R-1RV-1X(X’V-1X)-1X’V-1ZG – G-1GZ’V-1ZG + G-1GZ’V-1X(X’V-1X)-1X’V-1ZG
= Z’V-1ZG – Z’V-1X(X’V-1X)-1X’V-1ZG – Z’V-1ZG + Z’V-1X(X’V-1X)-1X’V-1ZG = 0 (c.q.d.)
Seguindo os resultados do 3º e 4º passos, as equações (1) se reduzem a:
====
++++++++
−−−−
−−−−
−−−−
−−−−−−−−
−−−−−−−−−−−−
−−−−−−−−
yR'ByR'ZyR'X
tub
BR'BBR'B00
0GZR'ZXR'Z0ZR'XXR'X
1e
1
1
u1
ue1
e
111
11
.
Recommended