53
ANÁLISE DE DADOS ANÁLISE DE DADOS NA AGROPECUÁRIA NA AGROPECUÁRIA Dra. Carolina Bremm Dra. Carolina Bremm Fepagro Fepagro Sede Sede

ANÁLISE DE DADOS NA AGROPECUÁRIA - fepagro.rs.gov.br - Análise de Dados na... · NA AGROPECUÁRIA Dra. Carolina Bremm FepagroFepagroSede Sede . Fisher (1930): ... UnidadeUnidade

Embed Size (px)

Citation preview

ANÁLISE DE DADOSANÁLISE DE DADOSNA AGROPECUÁRIANA AGROPECUÁRIA

Dra. Carolina BremmDra. Carolina BremmFepagroFepagro Sede Sede

Fisher (1930): Introduz o conceito de delineamentoexperimental e compara tratamentospelo “valor p”

Neyman – Pearson (1935):Juntamente com Fisher definem o “testede Hipóteses”

ESTATÍSTICAESTATÍSTICA

�� éé umum conjuntoconjunto dede técnicastécnicas ee métodosmétodosdede pesquisapesquisa queque envolveenvolve ooplanejamentoplanejamento dodo experimentoexperimento aa serserrealizado,realizado, aa coletacoleta qualificadaqualificada dosdosdados,dados, oo processamento,processamento, aa análiseanálise ee aadivulgaçãodivulgação dasdas informaçõesinformações..

PlanejamentoPlanejamento do experimento a do experimento a ser realizadoser realizado

�� reduçãoredução dodo númeronúmero dede ensaiosensaios semsem prejuízoprejuízo dadaqualidadequalidade dada informaçãoinformação;;

�� estudoestudo simultâneosimultâneo dede diversasdiversas variáveis,variáveis, separandoseparandoseusseus efeitosefeitos;;

�� realizaçãorealização dada pesquisapesquisa emem etapas,etapas, numnum processoprocessoiterativoiterativo dede acréscimoacréscimo dede novasnovas hipóteses/ensaioshipóteses/ensaios;;

HipóteseHipótese

�� ConceitualConceitual�� DistintasDistintas alturasalturas dede manejomanejo dada

pastagempastagem modificammodificam asas respostasrespostas dosdosanimaisanimais emem pastejopastejo..

�� EstatísticaEstatística�� HH00:: µµ11 == µµ22 == µµ33�� HH11:: µµ11 ## µµ22 ## µµ33

�� QualQual aa perguntapergunta aa serser respondidarespondida?? QualQual aavariávelvariável centralcentral dodo estudoestudo??

�� QuaisQuais serãoserão osos tratamentostratamentos testadostestados??

�� QualQual tipotipo dede dadodado éé necessárionecessário parapara utilizarutilizarasas ferramentasferramentas desejadasdesejadas ee responderresponder aapergunta?pergunta?

�� ComoComo coletarcoletar essesesses dadosdados comcom oo mínimomínimo dedeesforçoesforço ee erro?erro? QualQual oo períodoperíodo emem queque ososdadosdados serãoserão coletados?coletados?

�� ConsumoConsumo porpor bovinosbovinos (g MS/min)(g MS/min)�� PastagemPastagem de de AveiaAveia ((AvenaAvena strigosastrigosa))�� DistintasDistintas alturasalturas de de manejomanejo da da pastagempastagem::

15, 20, 25, 30, 35, 40, 45 e 50 cm15, 20, 25, 30, 35, 40, 45 e 50 cm

Uma definição importante (para a escolha datécnica estatística e das interpretações dosresultados) é a classificação dos dados.

AnimaisAnimais 4 4 novilhasnovilhas

UnidadeUnidade experimentalexperimental

2 rep de 2 rep de áreaárea e 2 rep no tempoe 2 rep no tempoPermitePermite obterobter umauma estimativaestimativa dede comocomo oo erroerro experimentalexperimental

afetaafeta osos resultadosresultados dosdos ensaiosensaios ee sese essesesses resultadosresultados sãosão

estatisticamenteestatisticamente diferentesdiferentes..

DelineamentoDelineamento experimental experimental

BlocosBlocos casualizadoscasualizados

PeríodoPeríodo de de avaliaçõesavaliações

18 18 diasdias

Uma das exigências do uso da metodologiaestatística para o planejamento experimental e para aanálise dos resultados é que as variáveis estudadas e oserros experimentais observados apresentem um caráteraleatório, o que é conseguido pelo emprego daaleatoridade.

Bloco 1

Bloco 2Bloco 3

50

150

250

350

450

0 10 20 30 40 50 60 70 80 90 100 110 120 130 140

tamanho da amostra

Suficiência Amostral

Importante!!!

-Construir uma metodologia para nos certificarde que todas as informações estão definidas;

-Coletar os dados de forma consistente ehonesta;

-Certificar-se de que existe tempo suficientepara a coleta de dados;

- Definir quais informações adicionais serãonecessárias para estudos futuros, referências oureconhecimento.

�� MetodologiaMetodologia parapara consumoconsumo

�� MetodologiaMetodologia parapara alturaaltura da da pastagempastagem

Coleta qualificada dos dadosColeta qualificada dos dados

�� NãoNão sese devedeve coletarcoletar dadosdados semsem queque antesantes sese tenhatenhadefinidodefinido claramenteclaramente oo problemaproblema ouou situaçãosituação aa serserenfrentada,enfrentada, bembem comocomo osos objetivosobjetivos comcom relaçãorelaçãoaosaos mesmosmesmos;;

�� OsOs sistemassistemas dede mediçãomedição (instrumento,(instrumento, operadores,operadores,método,método, meio)meio) queque serãoserão utilizadosutilizados devemdevem serseravaliadosavaliados ee terter capacidadecapacidade dede mediçãomedição suficientesuficiente;;

�� OsOs cálculoscálculos ee leiturasleituras devemdevem serser feitosfeitos comcom muitamuitaatençãoatenção parapara evitarevitar distorçõesdistorções;;

�� DevemDevem serser utilizadosutilizados métodosmétodos adequadosadequados paraparacoletacoleta dede dadosdados dede acordoacordo comcom oo problemaproblemaestudadoestudado..

Antes da exposição dos dados coletados é necessárioque se faça um trabalho de revisão e correção nosdados coletados na tentativa de eliminar possíveisenganos (outliers).

Processamento dos dadosProcessamento dos dados

Erro amostral

Não pode ser eliminado, porém, frequentemente podeser reduzido. Se um erro sistemático se origina de umresultado de medição e pode ser quantificado, umacorreção ou fator de correção pode ser aplicado paracompensar o efeito.

Erro sistemático

As amostras coletadas são utilizados para ajustar asestimativas visuais em cada avaliação, utilizando regressão linear(y = a + bx) entre a massa de forragem atribuída pelo avaliador(x) e a massa de forragem colhida (y) na amostra.

AnáliseAnálise de de covariânciacovariância

�� Forma de Forma de ajustarajustar osos dados dados parapara umaumavariávelvariável nãonão bembem controladacontrolada

�� Ex. Alturas Ex. Alturas iniciaisiniciais distintasdistintas, peso vivo , peso vivo inicialinicialdistintodistinto

Análise dos dadosAnálise dos dados

�� determinardeterminar quaisquais variáveisvariáveis sãosão maismaisinfluentesinfluentes nosnos resultadosresultados;;

�� atribuiratribuir valoresvalores àsàs variáveisvariáveis influentesinfluentes dedemodomodo aa minimizarminimizar aa variabilidadevariabilidade dosdosresultadosresultados;;

�� atribuiratribuir valoresvalores àsàs variáveisvariáveis influentesinfluentes dedemodomodo aa minimizarminimizar aa influênciainfluência dede variáveisvariáveisincontroláveisincontroláveis..

Distribuição dos dadosDistribuição dos dados

Shapiro-Wilk W Test

W Prob<W0.960178 0.4670

Medidas RepetidasMedidas Repetidas

�� ObjetivoObjetivo: : Verificar o comportamento de um Verificar o comportamento de um determinado indivíduo ao longo do tempo.determinado indivíduo ao longo do tempo.

�� É usado para designar medidas feitas ou na É usado para designar medidas feitas ou na mesma unidade experimental ou no mesmo mesma unidade experimental ou no mesmo indivíduo em mais de uma ocasião, ou indivíduo em mais de uma ocasião, ou seja, períodos de tempo distintos seja, períodos de tempo distintos ((DiggleDiggle, 1988 e , 1988 e CrowderCrowder & & HandHand, 1990). , 1990).

ModelosModelos mistosmistos

�� Distingue Distingue osos efeitosefeitos fixosfixos e e aleatóriosaleatórios

�� ComponentesComponentes de de variânciavariância

ParâmetrosParâmetros de de covariânciacovariância

�� ReduzReduz o o erroerro experimentalexperimental

Num DenEffect DF DF F Value Pr > F

Trat 7 11 30.96 <.0001Bloco 1 11 2.74 0.0614

Standard LetterTrat Estimate Error Group

15 33.3620 1.7823 D20 39.8631 1.2832 CD25 44.6210 1.7823 BC30 54.8515 1.2832 A35 51.0379 1.2832 AB40 51.5527 1.7823 AB45 42.2818 1.7823 C50 42.8686 1.7823 C

AnáliseAnálise de de VariânciaVariânciaComparaçãoComparação de de médiasmédias

RelaçãoRelação entre entre variáveisvariáveis

Análise de correlação

Matriz de Correlação

O coeficiente de correlação não mede a relaçãocausa-efeito entre as variáveis, apesar de que essa relaçãopossa estar presente.

- Altura do pasto +

Consumo de forragem

Análise de Regressão

y= -11,59+ 3,751x - 0,055x2

R2 aj = 0,81; EP = 3,4; P<0,0001

Co

nsum

o

Regressão Múltipla

� Uma das mais importantes aplicações daanálise de regressão múltipla é a escolha,entre diversas variáveis independentes,daquelas mais úteis na previsão de Y;

� A variância total de Y é em parte explicadapelas diversas variáveis x's e o restante pelavariabilidade devido ao erro (ε).

Stepwise

� As variáveis são incluídas uma a uma;

� Após cada etapa de incorporação de umavariável, temos uma etapa em que uma dasvariáveis já selecionadas pode serdescartada;

� O procedimento chega ao final quandonenhuma outra variável é incluída oudescartada.

�� ConfundimentoConfundimento entre entre relaçõesrelações diretasdiretase e indiretasindiretas

�� NãoNão consideraconsidera respostasrespostas biológicasbiológicas

Regressão múltipla Stepwise

Path AnalysisPath AnalysisAnáliseAnálise de de trilhatrilha

� Proporciona a criação de um modeloonde todas as variáveis estãorelacionadas (diretamente ouindiretamente)

EfeitosEfeitos diretosdiretos e e indiretosindiretos

�� A A variávelvariável independenteindependente (x) (x) podepodeafetarafetar a a variávelvariável respostaresposta (y) de (y) de duasduasformasformas::

�� EfeitoEfeito diretodireto de xde x11 em yem y–– Ex., xEx., x11 →→ yy

�� EfeitoEfeito indiretoindireto de xde x11 em y em y atravésatravés de de outraoutra variávelvariável correlacionadacorrelacionada (x(x22) )

Relação direta entre duas variáveis, de causa-efeito

Correlação ou covariância entre duas variáveis

TI

Altura do pasto (cm)

TB

Altura do pasto (cm)

Busca

Altura do pasto (cm)

Colh

eita

Altura do pasto (cm)

Mastigaçã

o

Altura do pasto (cm)

MB

Altura do pasto (cm)

PB

Altura do pasto (cm)

AB

Altura do pasto (cm)

Biomassa: disponibilidade, densidade, acessibilidade

Modelo Conceitual

ModeloModelo GeralGeral

U

Yj ZXi

p7

p8

p9

p14

p11

p15

p16

MB

TB

TI

p10

p12

p13

ML

MC

DensL

DensC

MF

Dens

Altura

p1

p2

p3

p4

p5

p6

MB

TB

MF

ML

MC

Dens

C

Dens

L

Dens

Alt

0.96***

0.51*

0.71***

0.87***

0.91***

0.84***

0.90***

0.66**

0.43*

0.96***

0.61**

0.54**

-0.35ns

0.60**

0.48**

0.72

0.99***

-0.25ns

TI

0.55

0.78***

0.26ns

0.64***

0.81

ModeloModelo CompletoCompleto

MB

TB

Dens

Alt

0.51*

0.74

0.99***

-0.25ns

TI

0.55

0.78***

0.49*

0.67***

0.86

MF

0.71***

0.96***

ModeloModelo SimplificadoSimplificado

Pressuposições do modelo

� Todos os efeitos causais devem serdevidamente incluídos no modelo

� Se determinada variável causal é excluídaé porque ela é independente das outrasvariáveis que foram incluídas no modelo

� Todos os efeitos devem ser lineares eaditivos

0,66*MB

TI

MB

NSAltura

y = 33,41x + 6,241R² = 0,733

0

5

10

15

20

25

30

35

40

45

50

0,0 0,2 0,4 0,6 0,8 1,0 1,2

Tax

a de

inges

tão (

g/m

in)

Massa do bocado (g)

0,4

0,6

0,8

1,0

1,2

1,4

1,6M

assa

dobo

cado

(g)

5 10 15 20 25 30 35 40 45 50

Altura do pasto (cm)

Importante:

Definir quais variáveis X influenciam Y

Considerar que X e Y são mutualmenteinfluenciadas por outras variáveis, quandotodas são medidas ao mesmo tempo

Modelo conceitual

O uso da Path Analysis permite relações dedependência e independência entre variáveis

Pressuposição

A distribuição conjunta das variáveisdeve ser a mesma para cada caso.

Análise Multivariada Componentes Principais

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

-5.00 -2.50 0.00 2.50 5.00

CP 1 (53.4%)

-5.00

-2.50

0.00

2.50

5.00

CP

2 (24.3

%)

Alt

TI MB

TB

MF

ML

MC

DL

DC

DT

Alt

TI MB

TB

MF

ML

MC

DL

DC

DT

Avena

Análise Multivariada Componentes Principais

Explicação da variação total: 77,7%

�� ÉÉ utilizadoutilizado comocomo métodométodo exploratórioexploratório dededadosdados comcom aa finalidadefinalidade dede obterobter maiormaiorconhecimentoconhecimento sobresobre aa estruturaestrutura dasdasobservaçõesobservações//variáveisvariáveis emem estudoestudo..

�� SeSe usausa umauma matrizmatriz dede distânciadistância ((p*p)p*p) entreentreparespares dede variáveisvariáveis ii ee jj parapara i,ji,j==11,,......,p,p..

�� ÉÉ precisopreciso sempresempre padronizarpadronizar asas variáveisvariáveisantesantes dede procederproceder aa análiseanálise..

Análise MultivariadaAnálise de AgrupamentoAnálise de Agrupamento

Análise de AgrupamentoAnálise de AgrupamentoMétodoMétodo: : LigaçãoLigação MédiaMédiaA distância entre dois grupos i e j é dada pela

média das distâncias entre os elementos dos doisgrupos.

Student version Student version Student version Student version Student version

Student version Student version Student version Student version

Student version Student version Student version Student version Student version

Student version Student version Student version Student version

Student version Student version Student version Student version Student version

Student version Student version Student version Student version

Student version Student version Student version Student version Student version

Student version Student version Student version Student version

Student version Student version Student version Student version Student version

Student version Student version Student version Student version

Student version Student version Student version Student version Student version

Student version Student version Student version Student version

Student version Student version Student version Student version Student version

Student version Student version Student version Student version

Student version Student version Student version Student version Student version

Student version Student version Student version Student version

Student version Student version Student version Student version Student version

Student version Student version Student version Student version0.00 1.73 3.45 5.18 6.91

15.00

20.00

25.00

30.00

35.00

40.00

45.00

50.00

Average linkage

Distance: (Euclidean)

Trat

amen

tos

(altu

ra, cm

)

Cophenetic correlation= 0.910

Análise de AgrupamentoAnálise de AgrupamentoLigaçãoLigação MédiaMédia

Divulgação das informaçõesDivulgação das informações

Interpretação dos resultados

Publicação

Programas estatísticosProgramas estatísticos

OBRIGADO!OBRIGADO!

[email protected]