49
Softwares de Análises Estatísticas em Biologia Sistêmica Prof. Dr. Éder Maiquel Simão Email: [email protected] Rio Grande, Setembro de 2012 V Conferência Sul em Modelagem Computacional

Softwares de Análises Estatísticas em Biologia Sistêmica

  • Upload
    jory

  • View
    48

  • Download
    0

Embed Size (px)

DESCRIPTION

V Conferência Sul em Modelagem Computacional. Softwares de Análises Estatísticas em Biologia Sistêmica. Prof. Dr. Éder Maiquel Simão Email: [email protected] Rio Grande, Setembro de 2012. Roteiro. 1- Teoria 1.1 Introdução; 1.2 Informação Genética; 1.3 Formação do Câncer; - PowerPoint PPT Presentation

Citation preview

Software para Anlises Estatsticas em Biologia Sistmica

Softwares de Anlises Estatsticas em Biologia SistmicaProf. Dr. der Maiquel SimoEmail: [email protected]

Rio Grande, Setembro de 2012

V Conferncia Sul em Modelagem Computacional Roteiro1- Teoria1.1 Introduo;1.2 Informao Gentica;1.3 Formao do Cncer;1.4 Expresso de Protenas;

2- Prtica2.1 Normalizao;2.2 Atividade Relativa - Diversidade Relativa;2.3 Mudana de Expresso;2.4 Mapas Funcionais.

1.1 IntroduoBiologia Sistmica: Integrao entre os fenmenos e as teorias que envolvem os sistemas biolgicos. - Informao;- Abordagem sistmica;

O objetivo do mini curso ser mostrar a funcionalidade de alguns softwares de anlises estatsticas usados pela biologia sistmica para investigar a expresso de vias e genes relacionados a doenas humanas.

1- Dados de expresso do GEO e genes da Ontologia Ontocancro;

2- Software R, com pacotes do Bioconductor;

3- Software ViaComplex;

4- Mapas Funcionais Banco de Dados String. 1.2 Informao GenticaUmcromossomo uma longa sequncia deDNA, que contm vriosgenes, e outras sequncias de nucleotdeos com funes especficas nasclulasdosseres vivos.

(String)Um conjunto de protenas desempenha uma funo especfica.

Ex: - Protenas que do cor aos olhos;- Envolvidas na morte celular;- Na proliferao celular...

1.4 EXPRESSO DE PROTENAS

GENOMAPROTEOMA

TRANSCRIPTOMAinteraoprot-geneMETABOLOMA

CitratesynthaseMalatedehydrogenaseFumaraseSuccinatedehydrogenaseINTERATOMAinteraoprot-protExpresso de protenas: Todos as clulas tem a mesma quantidade de genes e as clulas com funes diferentes produzem protenas especializadas naquela funo.

COMO MEDIR A EXPRESSO DE PROTENAS?

7MICROARRANJOSRNA-Seq

23

23 Bancos de Dadoshttp://www.ncbi.nlm.nih.gov/geo/

Bancos de Dados

Adrenocortical Carcinomas , AdenomasGSE10927

PASTA 1- ARQUIVOS .CEL (GSE10927)

Glndulas suprarrenais: Estimulam a converso de protenas e gorduras em glicose, ao mesmo tempo que diminuem a captao de glicose pelas clulas, aumentando, assim, a utilizao de gorduras.2.1 Normalizao

Software R com pacotes do Bioconductor

ARQUIVOS .CELGrfico de bigodes, indica a disperso entre as amostras. A linha preta a mediana, a caixa representa os elementos entre o 10 e o 30 quadrante.

ABRINDO O ARQUIVO GSE10927_RMA.XLS

MATRIZ NORMALIZADA- Cada elemento representa uma sonda de um gene;- Cada linha corresponde ao valor de expresso do mesmo gene;- Cada Coluna corresponde a uma amostra (microarranjo) de um determinado tecido.

AGRUPAR OS TECIDOS

1- Criar 2 colunas em branco, separando as amostras;2- Fazer a mdia entre as amostras;3- Expandir o clculo para todos os genes.

4- Criar nova planilha e colar as sondas com as mdias;

5- Para gerar o arquivo de expresso usado no software ViaComplex devemos baixar o arquivo da plataforma referente a srie que estamos analisando:6- Deste arquivo 2 colunas so extradas:- A primeira corresponde ao IDENTIFICADOR da SONDA;- A segunda corresponde ao SMBOLO APROVADO DO GENE.

OBS: Passo j realizado. 7- Com a plataforma devemos formar as combinaes de expresso a serem analisadas:ADENOMA x NORMAL e CNCER x NORMAL

Observaes Importantes: No arquivo TXT de expresso no pode aparecer o caractere / ou espaos em branco nas clulas de clculo.# Devemos sempre cuidar o espao existente no final do arquivo.

ADENOMA x NORMAL e CNCER x NORMALSALVAR CADA UM DESTES ARQUIVOS COMO:texto (separado por tabulao)

PASTA 2 - Criar arquivos para o SOFTWARE VIACOMPLEXBANCOS DE DADOS DE VIAS E GENES:NCI PATHAWAY, REACTOME, BIOCARTA e ONTOLOGIA ONTOCANCRO

http://ontocancro.inf.ufsm.br/

PASTA 3 - VIAS E GENES - ONTOLOGIA ONTOCANCRO

23Diversidade Entropia de ShannonFrequncia da diversidade do gene i

Diversidade relativa

2.2 Atividade Relativa - Diversidade RelativaCncer NormalAtividade relativa

25

26

27

282.3 Mudana de ExpressoCncer, adenoma Normal

No de vezes que a expresso varia entre os genes de uma via (conjunto de genes com uma determinada funo)Para encontrar a mudana de expresso entre os genes de uma via:

1- Encontrar as vias de interesse:

http://ontocancro.inf.ufsm.br/

PASTA 5 - Fold Change

Software R com pacotes do BioconductorMudana de Expresso Para efetuarmos os clculos da mudana de expresso so necessrios alguns arquivos importantes:1- Vias de interesse;2- Arquivo RData, salvo durante a Normalizao dos dados;3-Script.

Objetivo: Atravs da atividade relativa iremos analisar a expresso das amostras de tecidos pr cancerosos do clon em uma rede de protenas envolvida na manuteno do genoma. Para isso precisaremos construir uma rede de interao.2.4 Mapas funcionais

http://ontocancro.inf.ufsm.br/

http://string-db.org/Banco de Dados String

Contm vrias informaes do genoma:Inclu mais de 5 milhes de protenas de 1133 Organismos

Passo 6 - Software STRINGArquivo Medusa

Resultado

Artigos publicados com os Softwares