View
218
Download
0
Embed Size (px)
Citation preview
Gene Discovery
em Eucalipto
Doutoranda: Marcela Mendes Salazar
Orientador: Prof. Dr. Gonçalo A. G. Pereira
Análise do genoma de espécies de eucalipto visando a identificação de genes/metabolismo chave para o incremento da sua produtividade para orientar o seu melhoramento tanto pela via convencional como pela transgenia
Doutoranda: Marcela Mendes Salazar
Orientador: Prof. Dr. Gonçalo A. G. Pereira
Resumo
• Eucalipto
• Por que o eucalipto?
• Dados do projeto Genolyptus
• Objetivos
• Resultados preliminares
• Próximas etapas
O Eucalipto
• Angiosperma - família Myrtaceae
• Gênero Eucalyptus: mais de 670 espécies, subespécies, variedades botânicas e híbridos
1774
Descrito por Brutelle -1788
1868
O Eucalipto• 1868: decoração, quebra-vento
• 1910: fins industriais – Cia. Paulista de Estradas de Ferro
• 1950: matéria prima para produção de celulose
• 1980: Brasil é 1º produtor e exportador de celulose
O Eucalipto• Florestas plantadas:
Fontes de celulose, madeira, carbono capturado Conservação da natureza Eucalipto: gênero florestal mais plantado no mundo
2005
NorteNE
CentralSE
Sul
• O Brasil: Destaque como produtor e exportador de derivados de eucalipto 2005 – 1,7 milhões de ha para indústria de papel e celulose
28,5%
O Eucalipto
• No cenário internacional: 2005: 4,6% das exportações de produtos florestais madeireiros 1º produtor e exportador de celulose branqueada de eucalipto Um dos países mais procurados no mercado de carbono
• Espécies mais plantadas: Eucalyptus grandris: crescimento rápido; Eucalyptus urophylla: rusticidade; Eucalyptus globulus: alto teor de celulose.
O Eucalipto• Manter a competitividade do eucalipto:
Investimentos em pesquisa e desenvolvimento; Melhoramento genético; Rede de pesquisas genômicas:
Forest: Eucalyptus Genome Project Consortium
Genolyptus: Rede Brasileira de Pesquisa do genoma do Eucalipto
• Geração de 168105 reads;
• Reads válidos:125034 (74,4 % );
Distribuição de reads por tamanho
0
10000
20000
30000
40000
50000
60000
70000
Tamanhos dos reads (pb)
Total submetidosTotal válidos
• Bibliotecas:
Código Descrição Total 250 pb com phred > 20BC BAC (Bacterial Artificial Chromosome) 24278 18064 (74.4%)FL Flor 782 660 (84.4%)FX Floema - mistura 15634 12883 (82.4%)GE Genômico 10289 6421 (62.4%)ML Folha totalmente expandida ( Mature Leaf ) 8292 6221 (75%)PU Folha jovem naturalmente infectada por 9865 8207 (83.2%)RX Raiz – mistura 3264 1181 (36.2%)SE Plântula ( Seedling ) 15814 11322 (71.6%)TS Plântula tratada (Treated Seedling) 18250 14016 (76.8%)XX Xilema – mistura 288 229 (79.5%)XY Xilema ( Xylem ) 60364 45030 (74.6%)YL Folha jovem ( Young Leaf ) 985 800 (81.2%)
• Clusterização:– 40899 clusters:
• 17005 contigs• 23894 singlets
Distribuição de contigs por tamanho
0
1000
2000
3000
4000
5000
6000
7000
< 200
200 - 300
300 - 400
400 - 500
500 - 600
600 - 700
700 - 800
800 - 900
900 - 1000
1000 - 1100
1100 - 1200
1200 - 1300
1300 - 1400
1400 - 1500
> 1500
Tamanho dos contigs (pb)
Tota
l de
cont
igs
• Blastx realizado com contigs
Cobertura dos contigs (blastx NR)
No hits27%
Hits73%
Objetivos
• Mineração de banco de dados
• Identificação de genes e fatores de transcrição
• Análise da expressão de genes específicos:• RT-PCR• Northern blot
• Proposição de genes para melhoramento
• Construção de vias metabólicas - BioCyc
Bancos de dados
• Projeto Genolyptus Saturação do banco de dados:
Eletronic Northern Gene ProjectsOutros banco de dados
• Microarranjo Dados Jorge Lepikson Dados NimbleGen
Dados - Projeto Genolyptus
Dados – Projeto Genolyptus
•Via Eletronic northern
• Fatores de trancrição
Descricao Blastx/NR FamíliaContig249 gi|15227958|ref|NP_179397.1| ANAC037 transcription factor [Arabidopsis thaliana] NACContig2000 gi|15237699|ref|NP_196061.1| NAC2 transcription factor [Arabidopsis thaliana] NACContig13753 gi|25140464|gb|AAN71732.1| WRKY transcription factor IId-3 [Lycopersicon esculentum] WRKYContig15444 gi|18417696|ref|NP_567861.1| WRKY32 WRKYContig6535 gi|32493108|gb|AAP85545.1| putative WRKY-type DNA binding protein [Glycine max] WRKY
EUGL-XY-001-006-C10-AF.R gi|15234113|ref|NP_192034.1| WRKY22 WRKYContig13792 gi|14530687|dbj|BAB61056.1| WRKY DNA-binding protein [Nicotiana tabacum] WRKYContig11732 gi|10798760|dbj|BAB16432.1| WRKY transcription factor NtEIG-D48 [Nicotiana tabacum] WRKYContig207 gi|48686707|gb|AAT46067.1| DNA binding protein WRKY2 [Vitis vinifera] WRKY
Contig14208 gi|83630931|gb|ABC26914.1| WRKY40 [Glycine max] WRKYEUGR-XY-022-013-A11-BA.T gi|83630939|gb|ABC26918.1| WRKY82 [Glycine max] WRKY
Contig2693 gi|83630939|gb|ABC26918.1| WRKY82 [Glycine max] WRKYEUGR-XY-006-012-F02-RS.R gi|48686707|gb|AAT46067.1| DNA binding protein WRKY2 [Vitis vinifera] WRKY
Contig9413 gi|1430846|emb|CAA67600.1| myb-related transcription factor [Lycopersicon esculentum] MYBContig2906 gi|1430846|emb|CAA67600.1| myb-related transcription factor [Lycopersicon esculentum] MYB
EUPE-XY-000-029-B03-MG.R gi|12321839|gb|AAG50958.1| Myb-family transcription factor, putative [Arabidopsis thaliana] MYBContig761 gi|18415984|ref|NP_567664.1| MYB85 DNA binding / transcription factor [Arabidopsis thaliana] MYB
Contig13440 gi|18874263|gb|AAL78741.1| MYB-like transcription factor DIVARICATA [Antirrhinum majus] MYBEUPE-XY-000-070-D10-MG.R gi|23476313|gb|AAN28287.1| myb-like transcription factor 6 [Gossypium raimondii] MYB
Contig224 gi|23476313|gb|AAN28287.1| myb-like transcription factor 6 [Gossypium raimondii] MYBEUUR-XY-000-007-A01-BA.F gi|24850307|gb|AAN63154.1| transcription factor MYBS3 [Oryza sativa (japonica cultivar-group)] MYB
Contig13026 gi|28629811|gb|AAO45179.1| transcription factor Myb1 [Malus xiaojinensis] MYBEUUR-XY-000-023-H09-BA.R gi|28629811|gb|AAO45179.1| transcription factor Myb1 [Malus xiaojinensis] MYB
Contig11339 gi|28629811|gb|AAO45179.1| transcription factor Myb1 [Malus xiaojinensis] MYBContig13228 gi|31980091|emb|CAD98760.1| MYB transcription factor R3 type [Populus tremula x Populus MYBContig926 gi|34451908|gb|AAQ72433.1| MYB family transcription factor [Gossypium hirsutum] MYBContig418 gi|39725413|emb|CAE09057.1| MYB transcription factor [Eucalyptus gunnii] MYBContig2294 gi|39725415|emb|CAE09058.1| MYB transcription factor [Eucalyptus gunnii] MYB
Dados – Projeto Genolyptus
• Gene Projects
Dados – Projeto Genolyptus
•Clusterização dos reads
•Blast
• Via outros bancos de dados
Dados – Projeto Genolyptus
• Blast
Gene Contigs/Singlets FL FX GE ML PU RX SE TS XX XY YLAt1g52890 3853 x xAt2g46770 249/431/EUUR-XY-000-054-F09-BA.R x xAt3g61910 249/247/EUUR-XY-000-054-F09-BA.R xAt5g13180 13506/838 x x xAt1g32770 249/431/EUGL-XY-001-108-C09-AF.R x xAt1g12260 249/247 x xAt5g62380 249/EUUR-XY-000-054-F09-BA.R xAt1g71930 249/EUUR-XY-000-054-F09-BA.R x xAt1g01720 8519/10689/12961 x x x x xAt5g08790 8519/12961/8465/10689/13298/11490 x x x xAt3g15500 3853/8519/ EUGR-TS-002-050-E06-CN.R xAt3g15170 16969 xAt5g53950 16969/EUGR-TS-001-047-C02-GO.R x xAt1g76420 16969 xAt1g56010 16969 xAt5g04410 10957/ EUGR-GE-002-027-A06-DF.F x xAt1g52880 10689/ 8519/ 16969 x x x xAt1g69490 EUGR-TS-002-050-E06-CN.R x
Familia Nac 96 membros NENST1
NST2
NST3
Dados – Projeto Genolyptus
• Família de Fatores Saturada
•Fatores específicos de plantas: regulam formação da parede secundária
Dados – Projeto Genolyptus
• Comparação com dados do Xylem Eletronic Northern
Dados – Projeto Genolyptus
• Programa MEME
Dados Microarranjo – Jorge
• Objetivo Comparar a expressão gênica do xilema de
diferentes espécies identificar genes relacionados com características importantes para o desenvolvimento da planta e da formação de celulose e lignina.
• Projeto de Mestrado
Análise da Expressão Gênica em eucalipto
Dados Microarranjo – Jorge
• Biblioteca Genolyptus– 500 genes
• RNA xilema Eucalyptus grandis folhas Eucalyptus grandis xilema Eucalyptus globulus xilema Eucalyptus urophylla xilema Eucalyptus pellita
Dados Microarranjo – Jorge
Dados Microarranjo – NimbleGen
• 21,442 Unigenes de Eucalyptus
• 10 lâminas: 2 lâminas hibridizadas com RNA de folha (E. grandis): 2 lâminas
com réplicas biológicas (“ramets”).
8 lâminas hibridizadas com RNA de xilema (sendo 4 de E. grandis e 4 de E. globulus): dois grupos de lâminas formados por indivíduos de pais diferentes com duas réplicas biológicas (“ramets”) em cada grupo.
Dados Microarranjo – NimbleGen
• Análise 1
21,442 Unigenes
Xilema/E. grandis Xilema/E.globulusX
Genes diferencialmente expressos entre
espécies
256 genes up-regulated em Grandis
286 genes up-regulated em Globulus
Dados Microarranjo – NimbleGen• Análise 2
21,442 Unigenes
Xilema/Grandis Folha/GrandisX
Genes específicos de xilema
Xilema/GlobulusX
Genes específicos de xilema diferencialmente expressos
entre as espécies
256 genes up-regulated em Grandis
286 genes up-regulated em Globulus
1674 genes
Montagem de vias metabólicas - BioCyc
•Integração da informação genômica – construção de vias metabólicas
Alguns Genes Selecionados
• Contig 13753 (3 reads) Família de fatores WRKY• Função: regulação em resposta à infecção e outros stresses• Eletronic Northern
• Xylem Eletronic Northern
• NimbleGen: globulus up
Inte
nsid
ade
Alguns Genes Selecionados• Contig 2906 (5 reads) Família de fatores MYB
• Função: regulação do metabolismo secundário
• Eletronic Northern
• Xylem Eletronic Northern – não tem correspondente
• NimbleGen: globulus up
Inte
nsid
ade
Alguns Genes Selecionados
• Contig 7474 (8 reads) Gene CesA• Função: produção de celulose na parede celular
• Eletronic Northern
• NimbleGen: xylem upCelulose na parede
secundária??
Inte
nsid
ade
Genes CesA• Codificação da subunidade catalítica do complexo celulose sintase• Em Arabidopsis: família de 10 isoformas
3 isoformas – celulose da parede primária 3 isoformas – celulose da parede secundária
Elementos de xilema colapsados;
1/3 da quantidade de celulose
Homólogo em Eucalipto
AtCesA7
Alguns Genes Selecionados
• Contig 13017 (2 reads) Gene CesA• Função: produção de celulose na parede celular
• Eletronic Northern
• NimbleGen: xylem upCelulose na parede
primária??
Inte
nsid
ade
Próximas etapas• Seqüenciar genes candidatos
• Confirmar expressão de genes específicos
• Proposição de genes para programas de melhoramento
• Integração dos dados de expressão nas vias metabólicas
FIMFIM