Upload
dangphuc
View
215
Download
0
Embed Size (px)
Citation preview
O uso de estatística em ecologia animal O papel da matemática e estatística em biologia e em ecologia Lógica: dedução e indução Técnicas de investigação: amostragem, experimentação e simulação Estatística: descrição e inferência Modelo geral linear paramétrico Tipos de estudos em biologia Estatística paramétrica e estatística não paramétrica Hipótese nula: hipótese estatística Concepção de um teste estatístico I Poder de um teste estatístico
PAPEL CRESCENTE DE MATEMÁTICA E ESTATÍSTICA EM BIOLOGIA
LÛgica(DeduÁ„ o e InduÁ„ o)
LÛgicaProposicional(sentencial)
LÛgicaPredicativa
LÛgica Modal
LÛgicaInformal
LÛgica Matem· tica
LÛgicaFilosÛfica
LÓGICA
DEDUÇÃO INDUÇÃO
GERAL PARA PARTICULAR PARTICULAR PARA GERAL
INTERPOLAÇÃO EXTRAPOLAÇÃO
TÈcnicas de
InvestigaÁ„ o
InferÍ nciaIndutiva
InferÍ nciaDedutiva
EstatÌsticaTÈcnicas AnalÌticas
TÈcnicas de
ProgramaÁ„ o
Matem· tica SimulaÁ„ o
TÈcnicas de
InvestigaÁ„ o
TÈcnicas de
ObtenÁ„ ode Dados
TÈcnicas N„ o-Manipulativas
TÈcnicas Manipulativas
TÈcnicas de
ObtenÁ„ ode Dados
TÈcnicas N„ o-Manipulativas
TÈcnicas Manipulativas
TÈcnicas de
InvestigaÁ„ o
InferÍ nciaIndutiva
InferÍ nciaDedutiva
EstatÌstica
TÈcnicas AnalÌticas
TÈcnicas de
ProgramaÁ„ o
Matem· tica SimulaÁ„ o
TÈcnicas de
InvestigaÁ„ o
TÈcnicas TeÛricas
TÈcnicas N„ o-TeÛricas
TÈcnicasN„ o-
Manipulativas
TÈcnicasManipulativas
Experimentos
DelineamentosExperimentais
Estudos Descritivos
Estudos Correlacionais
EstudosComparativos
DelineamentosAmostrais
DelineamentosAmostrais
DelineamentosAmostrais
Amostragens casuaisAmostragens hier· rquicasAmostragens sistem· ticas
ModelosAnalÌticos
Modelosde SimulaÁ„ o
Modelos DeterminÌsticos
ModelosEstoc· sticos
Modelos DeterminÌsticos
ModelosEstoc· sticos
Estatística
Estatística
Descrição Inferência
Estimação
Testesde
Hipóteses
Intervalode Confiança
Testes Estatísticos
MédiaVariância
TÈcnicas de
InvestigaÁ„ o
TÈcnicasde
InferÍ nciaIndutiva
EstatÌstica
ModeloGeralLinearGLM
ModeloBivariado
ModeloMultivariado1 vari· vel
dependente
ModeloMultivariado
mais de 1 vari· veldependente
MODELO GERAL LINEAR – GLMModelo Bivariado
LegendaCódigo Tipo e Número de Variáveis
Yc variável contínuaXc variável contínuaXb variável bináriaYb variável bináriaYd variável discreta (integros)Xd variável discreta (integros)Yf variável de frequencia (contagem)Yi múltiplas variáveisXi múltiplas variáveis
Procedimento Estatístico Váriáveis
Correlação Pearson Yc XcCorrelação de ponto biserial Yc Xb
Coeficiente PHI Yb Xb
MODELO GERAL LINEAR – GLMModelo multivariado – uma variável dependente
LegendaCódigo Tipo e Número de Variáveis
Yc variável contínuaXc variável contínuaXb variável bináriaYb variável bináriaYd variável discreta (integros)Xd variável discreta (integros)Yf variável de frequencia (contagem)Yi múltiplas variáveisXi múltiplas variáveis
Procedimento Estatístico Váriáveis
Regressão Linear Múltipla Yc XicAnálise de Variância (ANOVA) Yc Xid
Análise de Covariância (ANCOVA) Yc Xic XidAnálise Discriminante – 2 grupos Yb Xic
Análise de Frequencia Multidimensional (LOGIT) Xid Yid
MODELO GERAL LINEAR – GLMModelo Multivariado – múltiplas variáveis dependentes
LegendaCódigo Tipo e Número de Variáveis
Yc variável contínuaXc variável contínuaXb variável bináriaYb variável bináriaYd variável discreta (integros)Xd variável discreta (integros)Yf variável de frequencia (contagem)Yi múltiplas variáveisXi múltiplas variáveis
Procedimento Estatístico Váriáveis
Correlação Canônica Yic XicAnálise de Variância Multivariada (MANOVA) Yic Xid
Análise de Covariância Multivariada (MANCOVA) Yic Xic XidAnálise de Perfil Yic Xid
Análise Discriminante -mais de 2 grupos Yic XicAnálise Fatorial Yic Xic
Análise de Componentes Principais (PCA) Yic XicAnálise de Contingência Multidimensional (LOGLINEAR) Xid Yf
Estudos Fenomenológicos ou Descritivos em Ecologia
Tipo de Estudo Fenomenológicos ou Descritivos Objetivo básico Estabelecimento de fatos básicos e
padrões Objetivos adicionais Criação de hipóteses
Teste de hipóteses em situações especiais
Tratamento de variáveis Mensurativo Estatística Paramétrica e Não-Paramétrica Tipos de procedimentos estatísticos Descrição e inferência
Métodos estatísticos métodos univariados, bivariados e
multivariados l Exemplos de Estudos Descritivos
Levantamentos de fauna Amostragens pontuais e seriais espaciais e temporais Contrastes em situações de "experimentos naturais" (eg. Auto-agrupamentos naturais, e situações pré-pós) Análises correlacionais (e.g. gradientes espaciais e temporais)
Estudos Comparativos em Ecologia
Tipo de Estudo Comparativo Objetivo básico Estabelecimento de padrões Objetivos adicionais em certos casos Criação e teste de hipóteses Tratamento de variáveis Mensurativo Estatística Paramétrica e Não-Paramétrica Tipos de procedimentos estatísticos Procedimentos estatísticos de aplicação
específica a filogenias, incluindo testes de hipóteses Procedimentos estatísticos de aplicação específicos à meta-análise
Métodos estatísticos Métodos univariados, bivariados e multivariados
Exemplos de Estudos Comparativos Análises correlacionais Análises comparativas estruturadas em filogenia Meta-análises Revisões críticas
Estudos Experimentais em Ecologia
Tipo de Estudo l Experimental Objetivo Básico Teste de hipóteses específicas Objetivos adicionais geração de hipóteses Tratamento de variáveis manipulativo Estatística paramétrica e Não-paramétrica Tipos de Procedimentos Estatísticos Procedimentos estatísticos
exclusivos para testes de hipóteses Métodos estatísticos Métodos univariados, bivariados e
multivariados Exemplos de Estudos Experimentais Delineamentos experimentais
clássicos
Estudos Teóricos em Ecologia
Tipo de Estudo Teórico Objetivo básico Criação de modelos verbais, algébricos
e de simulação Objetivos adicionais Criação e teste teórico de hipóteses
Tratamento de variáveis Não mensurativo Não manipulativo
Estatística Paramétrica e Não Paramétrica Tipos de
procedimentos analíticos
Otimização Probabilidade
Algebra Linguagens de simulação
Métodos matemáticos e estatísticos Métodos algébricos, probabilisticos, estatísticos e de simulação
Métodos de estatistica univariada,bivariada e multivariada
Exemplos de Estudos Teóricos
Modelos genéticos Modelos de otimização Modelos probabilísticos
Modelos verbais Modelos estatísticos Modelos algébricos
Modelos de simulação Revisões teóricas críticas
Tipo de Estatística PARAMÉTRICA NÃO-PARAMÉTRICADistribuição Fundamental Distribuição Normal, de
GaussDistribuição Uniforme
DiscretaEstado dos valores dasvariáveis usados nos
procedimentos estatísticos
Valores brutos em que aacurácia e precisão do valor
são mantidas.Toda a informação contida
nas mensurações estápresente
Valores brutos da variáveltransformados em postos.
Informação sobre aordenação do menor aomaior valor é mantida.
Informação sobre a própriamagnitude do valor é
perdida.Transformações Transformações
Z,logarítmica,etc. preservama informação contida na
medida da variável
Transformação em postos
Algumas distribuiçõesassociadas
Distribuição tDistribuição FDistribuição ZDistribuição X2
Distribuição HDistribuição UDistribuição X2
Algumas estatísticas Coeficiente de correlação dePearson
Coeficiente de correlação deSpearman
Estatística U de Mann-Whitney
Estatística H de Kruskal-Wallis
Estatística Paramétrica & Estatística Não Paramétrica
Tipo de Estatística PARAMÉTRICA NÃO-PARAMÉTRICA
Distribuição Fundamental
Distribuição Normal, de Gauss
Distribuição Uniforme Discreta
Estado dos valores das variáveis usados nos
procedimentos estatísticos
Valores brutos em que a acurácia e precisão do valor
são mantidas. Toda a informação
contida nas mensurações está
presente
Valores brutos da variável
transformados em postos.
Informação sobre a ordenação do
menor ao maior valor é mantida.
Informação sobre a própria magnitude do valor é perdida.
Estatística Paramétrica & Estatística Não Paramétrica
Tipo de Estatística PARAMÉTRICA NÃO-PARAMÉTRICA
Transformações Transformações Z,logarítmica,etc.
preservam a informação contida
na medida da variável
Transformação em postos
Algumas distribuições associadas
Distribuição t Distribuição F Distribuição Z Distribuição X2
Distribuição H Distribuição U Distribuição X2
Alguns procedimentos
estatísticos
Coeficiente de correlação de
Pearson Teste T entre médias Análise de Variância
Coeficiente de correlação de
Spearman Estatística U de Mann-Whitney
Estatística H de Kruskal-Wallis
HIPÓTESE ESTATÍSTICA A SER TESTADAHipótese Nula
Ho
O pesquisador elabora uma hipótese científica.
Uma hipótese científica,mesmo quando traduzida precisa e acuradamente em uma hipóteseestatística é testada diretamente em estatística clássica (frequentista; Zolman 1993: 23).
A lógica de um teste estatístico consiste em construir uma hipótese nula que é o opostológico da hipótese científica.
A lógica de um teste estatístico é presumir que a hipótese nula é correta e gerar umadistribuição teórica da estatística teste em acordo com esta premissa (mod. Zolman 1993:26).
Hipótese NulaHo
Uma hipótese nula em estatística é sempre construída especificamente em função de umparâmetro estatístico (eg. média, variância, mediana, etc.)
A estrutura de testes estatísticos, e o procedimento utilizado, são bastante semelhantes aofalsificacionismo de Karl Popper.
A rejeição de uma hipótese é um procedimento de lógica inconteste.
O único meio de prover suporte para a hipótese científica, em estatística clássica(frequentista) é através da rejeição da hipótese nula
Concepção de um teste estatístico
Concepção de um teste estatístico
Concepção de um teste estatístico
Concepção de um teste estatístico
PROBABILIDADE ASSOCIADA E CRITÉRIO DE SIGNIFICÂNCIA
Critério de significância usual em biologia:
alfa igual a 0,05
Probabilidade Associada a um teste estatístico: p
Procedimento para se verificar significância estatística de um teste
Compara-se p com alfa
Se p é igual ou menor que alfa então o resultado do teste é significante
Se p é maior que alfa então o resultado do teste não é significante
Poder de Testes Estatísticos
O poder estatístico de um teste é afetado pelas seguintes variáveis
Valor de alfa
Magnitude do efeito (effect size)
l Tamanho amostral
Poder é a probabilidade de rejeitar corretamente uma hipótese nula falsa (http:/davidmlane.com/hyperstat/A108717.html) Poder é a probabilidade de que um teste estatístico irá rejeitar a hipótese nula, para um valor especificado da hipótese alternativa Ha (High, 2000)
Resultado do teste
Aceitação de H0 Rejeição de H0
H0 verdadeira Decisão correta Erro Tipo I (Alfa)
Realidade
H0 falsa Erro Tipo II (Beta) Decisão correta
Hipótese Nula Falsa
Ho Falsa
Aceitação da Hipótese Estatística
Valores de teste estatístico E1, E2, E3 dentro da região de aceitação de Ho
Decisão Incorreta: Aceita-se Ho Falsa
Erro tipo II Erro tipo Beta
Valores de teste estatístico E1, E2, E3 fora da região de aceitação de Ho
Decisão Correta: Rejeita-se Ho Falsa
Poder do teste estatístico: probabilidade de rejeitar Ho falsa
Hipótese Nula Verdadeira
Ho Verdadeira
Rejeição da Hipótese Estatística
Valores de teste estatístico E1, E2, E3 dentro da região de aceitação de Ho
Decisão Correta: Aceita-se Ho Verdadeira
Valores de teste estatístico E1, E2, E3 fora da região de aceitação de Ho
Decisão Incorreta: Rejeita-se Ho Verdadeira
Erro tipo I Erro tipo alfa
O uso de estatística em ecologia animal Concepção de um teste estatístico II ausência de diferença biológica pequena diferença biológica grande diferença biológica Tipos de variáveis Ordenação por postos (ranks) Teste de Mann Whitney: comparação de grupos Teste de Spearman: associação entre variáveis Métodos de enumeração e frequencia
Hemípteros aquáticos em lagos
Caso A: Ausência de diferenças biológicas entre amostras.
Uma espécie de Hemiptera aquático é endêmica de uma ilha no Oceano Atlântico.Há 1000 indivíduos, ninfas e adultos, de uma espécie de Hemiptera aquático em um lago.Coleta-se 2 amostras de 10 indivíduos para se medir o comprimento total do exosqueleto.
Condições de coleta são idênticas para as duas amostras.
comprimento do exosqueleto
1,881,75
1,631,50
1,381,25
1,131,00
,88,75,63,50,38,25
120
100
80
60
40
20
0
Std. Dev = ,24 Mean = 1,00
N = 1000,00
CONCEPÇÃO DE UM TESTE ESTATÍSTICO
Amostre-se aleatoriamente as populações de uma espécie aquática de Hemiptera presente
em dois lagos. No lago 1 obteve-se 10 indivíduos adultos e no lago 2 obteve-se 10
indivíduos adultos.
Hipótese Científica: Há diferença no comprimento médio dos indivíduos das duas
populações da espécie de Hemiptera. Note que essa afirmação é equivalente a 1 2µ µ≠
Construa uma Hipótese Nula, que seja o oposto lógico da hipótese científica,
neste caso. 1 2µ µ=
Construa uma estatística-teste ou utilize uma estatística-teste que possa testar a hipótese
nula,
Amostre um grande número de vezes, N, e com reposição, os valores da variável envolvida
(no caso:comprimento), utilizando uma amostra de tamanho n=10, para o grupo do
lago 1.
Amostre um grande número de vezes, N, e com reposição, os valores da variável envolvida(no caso:comprimento), utilizando uma amostra de tamanho n=10, para o grupo do lago2.
CONCEPÇÃO DE UM TESTE ESTATÍSTICO
Aplique a estatística teste N vezes, isto é, aos N pares (grupo lago1 vs. grupo lago2).
Faça uma distribuição de freqüências dos N valores da estatística-teste .
Utilize a função conhecida da estatística teste para encontrar os percentis da área sob a
curva da distribuição de freqüências, após padronização da curva, ou encontre os percentis
tabulados.
Utilize um procedimento específico para determinar os valores-limite da estatística-
teste,dado um critério a priori a respeito do valor crítico de α
, eg. Enumeração de valores
críticos
Considere como estatisticamente significante o valor observado da estatística-teste (o valor
da estatística teste t aplicada às amostras dos indivíduos dos dois lagos) se ele estiver além
dos valores-limite.
Assim, a hipótese nula é rejeitada se o valor observado da estatística-teste estiver além dosvalores-limite, e é aceita se o valor observado
Caso A: Ausência de diferenças biológicas entre amostras.
Sampling: 10.000 samples, sizes:10,10 1/10.000=0,0001
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10Mann-Whitney U 33,000 31,000 41,000 46,000 46,000 46,000 42,000 39,500 44,000 49,000Mann-Whitney U 33,000 31,000 41,000 46,000 46,000 46,000 42,000 39,500 44,000 49,000
Z -1,285 -1,436 -,680 -,302 -,302 -,302 -,605 -,794 -,454 -,076Z -1,285 -1,436 -,680 -,302 -,302 -,302 -,605 -,794 -,454 -,076
Exact Sig. (2-tailed)
0,218 0,165 0,529 0,796 0,796 0,780 0,579 0,448 0,684 0,971
Exact Sig. (2-tailed)
0,218 0,165 0,529 0,796 0,796 0,780 0,579 0,448 0,684 0,971
a Not corrected for ties.
Hemípteros aquáticos em lagos
Caso B: Pequena diferença biológica em tamanho do exosqueleto entre 2 lagos.
Uma espécie de Hemiptera aquático é endêmica de uma ilha no Oceano Atlântico.Há 1000 indivíduos, ninfas e adultos, de uma espécie de Hemiptera aquático no lago 1.Há 1000 indivíduos, ninfas e adultos, de uma espécie de Hemiptera aquático no lago 2.
Coleta-se 1 amostra de 10 indivíduos para se medir o comprimento total do exosqueleto emcada um dos lagos.
Condições de coleta são idênticas para as duas amostras.
comprimento do exosqueleto
1,881,75
1,631,50
1,381,25
1,131,00
,88,75,63,50,38,25
120
100
80
60
40
20
0
Std. Dev = ,24 Mean = 1,00
N = 1000,00
comprimento do exosqueleto
1,501,38
1,251,13
1,00,88,75,63,50,38,25,13
0,00
140
120
100
80
60
40
20
0
Std. Dev = ,25 Mean = ,76
N = 1000,00
Caso B: Pequena diferença biológica em tamanho do exosqueleto entre 2 lagos.
Sampling: 10.000 samples, sizes:10,10 1/10.000=0,0001
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10Mann-Whitney
U29,000 23,000 20,000 35,000 43,000 38,000 35,000 36,000 20,000 10,000
Mann-WhitneyU
29,000 23,000 20,000 35,000 43,000 38,000 35,000 36,000 20,000 10,000
Z -1,587 -2,041 -2,268 -1,134 -,529 -,907 -1,134 -1,059 -2,268 -3,024Z -1,587 -2,041 -2,268 -1,134 -,529 -,907 -1,134 -1,059 -2,268 -3,024
Exact Sig.(2-tailed)
0,123 0,043 0,023 0,280 0,631 0,393 0,280 0,305 0,023 0,002
Exact Sig.(2-tailed)
0,123 0,043 0,023 0,280 0,631 0,393 0,280 0,305 0,023 0,002
a Not corrected for ties.
Hemípteros aquáticos em lagos
Caso C: Grande diferença biológica em tamanho do exosqueleto entre 2 lagos.
Uma espécie de Hemiptera aquático é endêmica de uma ilha no Oceano Atlântico.Há 1000 indivíduos, ninfas e adultos, de uma espécie de Hemiptera aquático no lago 3.Há 1000 indivíduos, ninfas e adultos, de uma espécie de Hemiptera aquático no lago 4.
Coleta-se 1 amostra de 10 indivíduos para se medir o comprimento total do exosqueleto emcada um dos lagos.
Condições de coleta são idênticas para as duas amostras.
compr imento do exosqueleto
1,881,75
1,631,50
1,381,25
1,131,00
,88,75,63,50,38,25
120
100
80
60
40
20
0
Std. Dev = ,24 Mean = 1,00
N = 1000,00
comprimento do exosque leto
3,062,94
2,812,69
2,562,44
2,312,19
2,061,94
1,811,69
1,561,44
1,311,19
120
100
80
60
40
20
0
Std. Dev = ,25 Mean = 2,01
N = 1000,00
Caso C: Grande diferença biológica em tamanho do exosqueleto entre 2 lagos.
Sampling: 10.000 samples, sizes:10,10 1/10.000=0,0001
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10Mann-
Whitney U0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
Mann-Whitney U
0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
Z -3,780 -3,780 -3,780 -3,780 -3,780 -3,780 -3,780 -3,780 -3,780 -3,780Z -3,780 -3,780 -3,780 -3,780 -3,780 -3,780 -3,780 -3,780 -3,780 -3,780
Exact Sig.(2-tailed)
0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
Exact Sig.(2-tailed)
0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
a Not corrected for ties.
TIPOS DE VARIÁVEIS
Variável Contínua – números não inteiros (fracionários) ordenável
quantitativo categorizável (classes)
várias unidades
Variável Descontínua – números inteiros (não fracionários) ordenável
quantitativo categorizável (classes)
várias unidades
Variável Nominal – não númericas grosseiramente ordenável ou não ordenável
semi-quantitativa ou não quantitativa eminentemente categorica
várias unidades
ORDENAÇÃO (RANKING) Substituição de valores por postos (RANKS) O número de postos é igual ao número de valores Ordena-se valores do menor valor ao maior valor Quando valores forem iguais calcula-se a média aritmética dos postos Atribui-se aos valores iguais a média aritmética dos postos
1 1 2 1 2 2 1 3 2 2 4 4 3 5 5 4 6 6 5 7 7 6 8 9 6 9 9 6 10 9 7 11 11,5 7 12 11,5 8 13 13,5 8 14 13,5 9 15 16,5 9 16 16,5 9 17 16,5 9 18 16,5 10 19 19,5 10 20 19,5
ORDENAÇÃO (RANKING)
Postos (Ranks)
Valor Posto Valor Posto Valor Posto 1,2 1 0,1 1 2,3 1 2,3 2 1 2 3 2 3,4 3 10 3 4 3 4,2 4 1000 4 5 4
Valor Posto Valor Posto Valor Posto 100 1 1 1,5 1 1 200 2 1 1,5 2 2 400 3 4 3 3 3,5 600 4 5 4 3 3,5
ORDENAÇÃO (RANKING)
Postos (Ranks)
Testes de Associação (ex. Teste de Spearman): atribuir postos separadamente a cada uma das duas
variáveis
X Y Postos (X) Postos (Y) 1,1 2 1 1 1,2 3 2 2 2,3 4 3 3 3,4 5 4 4
Testes de Comparação (ex. Teste de Mann-Whitney): atribuir postos aos valores dos dois grupos
conjuntamente. G1 G2 Postos
(G1) Postos
(G2) 1,2 4,2 1 4 2,3 5,1 2 5 3,1 8,9 3 7 6,4 9,6 6 8
Teste de Mann-Whitney : comparação de duas amostras de dados independentes Atribuição de N (n1+n2) postos a todos os valores das duas amostras ordenados de forma crescente ou decrescente, substituindo cada valor por um posto de 1 até N.
N é o número total de valores nas duas amostras, (n1+n2).
O menor posto é dado para o menor valor da variável independentemente do grupo.
Para valores iguais, empates, calcule a média aritmética dos postos correspondentes.
Calcule R1, a soma dos postos da primeira amostra, n1
Calcule R2, a soma dos postos da segunda amostra, n2
Aplique a fórmula do U, de Mann-Whitney; atenção à notação!
1 11 2 1
( 1)2
n nU n n R+= + −
´ 2 21 2 2
( 1)2
n nU n n R+= + −
Teste de Mann-Whitney : comparação de duas amostras de dados independentes
Escolha o menor dos dois valores de U e o compare com o valor crítico, dados n1 e n2, na Tabela abaixo. Se o valor observado de U for menor que o valor do U crítico rejeita-se a hipótese de ausência de diferença entre as amostras ao nível alfa de 0,05. Se o valor observado de U for igual ou maior do que o valor do U crítico aceita-se a hipótese de ausência de diferença entre as amostras ao nível alfa de 0,05.
G1 G2 Postos G1 Postos G2 1 6 1 6 2 7 2 7 3 8 3 8 4 9 4 9 5 10 5 10
SOMA=15 SOMA=40 l U=40-40=0 U´=40-15=25
G1 G2 Postos G1 Postos G2 Postos G1 Postos G2 1 1 1 2 1,5 1,5 2 2 3 4 3,5 3,5 3 3 5 6 5,5 5,5 4 4 7 8 7,5 7,5 5 5 9 10 9,5 9,5
SOMA=27,5
SOMA=27,5
U=40-27,5=12,5 U´=40-27,5=12,5
Ausência de superposição entre os dois grupos
U=40-15=25 U´=40-40=0
Pequena superposição entre os dois grupos
U=40-17=23 U´=40-38=2
Total superposição entre os dois grupos
U=40-27,5=12,5 U´=40-27,5=12,5
Correlação não-paramétrica de Spearman para duas variáveis independentes
Ordene todos os valores da primeira variável substituindo cada valor por um posto de 1 até N, N é o número total de valores da primeira variável, V1.
Ordene todos os valores da segunda variável substituindo cada valor por um posto de 1 até
N, N é o número total de valores da segunda variável, V2.
O menor posto é dado para o menor valor de cada uma das variáveis independentemente do
pareamento.
Para valores iguais calcule a média aritmética dos postos correspondentes.
Para cada par de postos calcule a diferença entre eles, di.
Eleve os di ao quadrado
Aplique a fórmula do Rs de Spearman
Coeficiente de Correlação Não-Paramétrica Rho () de Spearman
O coeficiente de correlação Rho () de Spearman é calculado através da seguinte fórmula:
Coeficiente de Correlação Não-Paramétrica Rho () de Spearman
Outros modos de se apresentar a fórmula do coeficiente de correlação Rho () de Spearman são:
2
12
6. ( ( ) ( ))1
.( 1)
N
i i
s
R X R YR
N N
é ù-ê úê ú= -
-ê úê úë û
å
2 2
1 1( ( ) ( ))
i N N
i i iid R X R Y
=
=
= -å å
2
13
61
N
ii
s
dR
N N== −−
∑
peso da brânquia
(g)
peso do corpo-
peso da brânquia
R(Xi) R(Yi) Produto
0.159 14.241 5 6 -1.5 -0.5 0.75 -1 1
0.179 15.021 6 8 -0.5 1.5 -0.75 -2 4
0.100 11.200 3.5 5 -3.0 -1.5 4.5 -1.5 2.25
0.045 2.455 1 2 -5.5 -4.5 24.75 -1 1
0.384 22.316 12 12 5.5 5.5 30.25 0 0
0.230 14.670 9 7 2.5 0.5 1.25 2 4
0.100 1.31 3.5 1 -3.0 -5.5 16.5 2.5 6.25
0.320 15.490 10.5 10 4.0 3.5 14.0 0.5 0.25
0.080 4.110 2 3 -4.5 -3.5 15.75 -1 1
0.220 15.170 8 9 1.5 2.5 3.75 -1 1
0.320 16.930 10.5 11 4.0 4.5 18.0 -0.5 0.25
0.210 9.310 7 4 0.5 -2.5 -1.25 3 9
127.5
R X ni( ) − +1
2R Y n
i( ) −+12 R X R Yi i( ) ( )− R X R Yi i( ) ( )− 2
Correlação Não-Paramétrica de Spearman Relação entre o peso corporal e o peso da brânquia no caranguejo Pachygrapsus crassipes
(Sokal & Rohlf 1981: box 15.1: 576-577)
Correlação Não-Paramétrica de Spearman Relação entre o peso corporal e o peso da brânquia no caranguejo Pachygrapsus crassipes
(Sokal & Rohlf 1981: box 15.1: 576-577)
Ignorando o fato de ocorrerem empates temos
12)1(
21)(
21)(
21
−⎭⎬⎫
⎩⎨⎧ +
−+
−
=∑=
nn
nYRnXRn
iii
ρ127 5171612
.
= 0.891608
ρ = −−
1 612
Tn n( )
1- = 1-0.104895 = 0.895104
Correlação Não-Paramétrica de Spearman
Relação entre o peso corporal e o peso da brânquia no caranguejo Pachygrapsus crassipes
(Sokal & Rohlf 1981: box 15.1: 576-577)
peso da brânquia (g)
peso do corpo-
peso da brânquia
R(Xi) R(Yi)
0.159 14.241 5 6 -1 1
0.179 15.021 6 8 -2 4
0.100 11.200 3.5 5 -1.5 2.25
0.045 2.455 1 2 -1 1
0.384 22.316 12 12 0 0
0.230 14.670 9 7 2 4
0.100 1.31 3.5 1 2.5 6.25
0.320 15.490 10.5 10 0.5 0.25
0.080 4.110 2 3 -1 1
0.220 15.170 8 9 -1 1
0.320 16.930 10.5 11 -0.5 0.25
0.210 9.310 7 4 3 9
R X R Yi i( ) ( )− R X R Yi i( ) ( )− 2
Ignorando o fato de ocorrerem empates temos
N3-N = 1716
Rs = [1- (180/1716)]
Rs = 1-0,1049
Rs = 0,8951
2
13
61
N
ii
s
dR
N N== −−
∑ 2 2
1 1( ( ) ( ))
i N N
i i iid R X R Y
=
=
= −∑ ∑
2
1
30i N
iid
=
=
=å
Se o valor observado de Rs for menor do que o valor crítico de Rs na tabela abaixo, para alfa=0,05 e para um dado valor de N, aceita-se a hipótese de ausência de associação entre as duas variáveis. Se o valor observado de Rs for maior do que o valor crítico de Rs na tabela abaixo, para alfa=0,05 e para um dado valor de N, rejeita-se a hipótese de ausência de associação entre as duas variáveis.
Coeficiente de Correlação Não Paramétrico de Spearman
Variáveis Rs de Spearman P associado significância estatística
V1 V2 +0,994 0,0005 significante p<0,05 V3 V4 +0,652 0,041 significante p<0,05 V5 V6 -0,758 0,011 significante p<0,05 V7 V8 +0,040 0,912 não-significante
p>0,05
Coeficiente de Correlação Não Paramétrico de Spearman
Variáveis Rs de Spearman P associado significância estatística
V1 V2 +0,994 0,0005 significante p<0,05 V3 V4 +0,652 0,041 significante p<0,05 V5 V6 -0,758 0,011 significante p<0,05 V7 V8 +0,040 0,912 não-significante
p>0,05
Coeficiente de Correlação Não Paramétrico de Spearman
Variáveis Rs de Spearman P associado significância estatística
V1 V2 +0,994 0,0005 significante p<0,05 V3 V4 +0,652 0,041 significante p<0,05 V5 V6 -0,758 0,011 significante p<0,05 V7 V8 +0,040 0,912 não-significante
p>0,05
Coeficiente de Correlação Não Paramétrico de Spearman
V3
1614121086420
V4
10
8
6
4
2
0
Rs=0,652p=0,041
l RANDOM RESAMPLING: V4 by V3
Using 10000 subsampling with 10 observations (Seed = 80000962)
Spearman's rho = ,6522
Estimator's descriptive statistics
Minimum -,9524 Maximum ,9075
MÉTODOS ESTATÍSTICOS DE ENUMERAÇÃO
Variáveis nominais (não numéricas) = Variáveis categóricas
Variáveis nominais ou categóricas apresentam estados ou níveis Porém é comum sinonimizar-se categoria e estado
Variável [ Estados]
Eg. Sexo [Machos e Fêmeas] Idade [Jovens e Adultos]
Status [Ausente ou Presente]
MÉTODOS ESTATÍSTICOS DE ENUMERAÇÃO
Tabelas de Contingência
Usualmente obtem-se o número de casos de cada um dos estados da variável categórica Eg. Variável categórica=sexo – 53 machos e 37 fêmeas.
Tabelas de contingência tem linhas (rows=r) e colunas (columns=c)
Assim, tabelas de contingência são classificadas pelo números de linhas e colunas
Eg. Tabela rxc=2x2.
Nas tabelas de contingência 1xn, a linha se refere à frequência de ocorrência
As tabelas de contingência mais simples são 1x1
Tabela de Contingência 1x1
Pessoas
Frequência 152
Tabela de Contingência 1x2 Sexo
Machos Fêmeas
Frequência 63 37
MÉTODOS ESTATÍSTICOS DE ENUMERAÇÃO
Tabela de Contingência 2x2
Variáveis: Sexo e Idade Sexo [Machos e Fêmeas]
Idade [Jovens e Adultos]
Machos Fêmeas
Jovens 32 56
Adultos 45 62
Notação Generalizada das células em tabelas de contingência 2x2
Variável 1 Estado 1
Variável 1 Estado 2
Variável 2 Estado 1
Frc Frc
Variável 2 Estado 2
Frc Frc
Notação específica das células em tabelas de contingência 2x2
Variável 1 Estado 1
Variável 1 Estado 2
Variável 2 Estado 1
F11 F12
Variável 2 Estado 2
F21 F22
MÉTODOS ESTATÍSTICOS DE ENUMERAÇÃO Teste comumente aplicado à variáveis nominais ou categóricas: Chi Quadrado.
Objetivos dos métodos estatísticos de enumeração
Teste de ajuste à expectativa teórica (goodness of fit)
Teste de independência entre variáveis
Teste de ajuste à expectativa teórica (goodness of fit)
A hipótese nula (Ho) é construída considerando que um bom ajuste à expectativa teórica significa ausência de diferença entre observado (resultados empíricos) e esperado (expectativa teórica).
Teste de independência entre variáveis
A hipótese nula (Ho) é que existe independência entre as frequências de ocorrência dos estados de uma variável e as frequências de ocorrência dos estados de outra variável.
A hipótese nula (Ho) é ausência de interação entre as variáveis.
Teste de ajuste à expectativa teórica (goodness of fit)
A hipótese nula (Ho) é construída considerando que um bom ajuste à expectativa teórica significa ausência de diferença entre observado (resultados empíricos) e esperado (expectativa teórica).
Variável: Cores de 100 flores de uma espécie
Ho: a amostra pertence a uma população que tem razão 3:1 de flores amarelas:verdes Ha: a amostra pertence a uma população que não tem razão 3:1 de flores amarelas:verdes
amarela verde
observado 84 16
esperado 75 25
( )22
1
i ki i
i
O EX
E
=
=
-=å
Graus de Liberdade (GL) v=k-1=1
X2=4,320 20.05,1 3,841X = p=0.038, portanto rejeita-se Ho
Teste de independência entre variáveis
A hipótese nula (Ho) é que existe independência entre as frequências de ocorrência dos estados de uma variável e as frequências de ocorrência dos estados de outra variável.
A hipótese nula (Ho) é ausência de interação entre as variáveis.
Cor de cabelo em Homens e Mulheres
Preto Castanho
Loiro Ruivo Total
Homens 32 41 16 9 100
Mulheres
55 65 64 16 200
Total 87 106 80 25 300
Preto Castanho
Loiro Ruivo Total
Homens F11 F12 F13 F14 R1
Mulheres
F21 F22 F23 F24 R2
Total C1 C2 C3 C4 n
Teste de independência entre variáveis
Preto Castanho
Loiro Ruivo Total
Homens F11 F12 F13 F14 R1
Mulheres
F21 F22 F23 F24 R2
Total C1 C2 C3 C4 n
Frequencia esperada em uma célula
ˆ . ji CRFn n
æ öæ ö= ç ÷ç ÷è ø è ø
.ˆ i jR CF
næ ö
= ç ÷è ø
Teste de independência entre variáveis
Cor de cabelo em Homens e Mulheres
Preto Castanho
Loiro Ruivo Total
Homens 32 41 16 9 100
29 36 26,67 8,33
Mulheres
55 65 64 16 200
58 72 53,33 16,67
Total 87 106 80 25 300
22
1 1
ˆ( )ˆ
ij ij
i j ij
F FX
F= =
-=å å
v=(r-1)(c-1)=3
20.05,3 7,815X =
X2 =8,987, p=0,029, portanto rejeita-se Ho
ANEXOS
Poder de testes estatísticos
Poder () Critério : estabelecido a priori. Quanto menor , menor é o Poder . Magnitude do efeito (magnitude da diferença): quanto maior a magnitude do efeito maior a probabilidade de detectá-lo Variância: Em geral, quanto menor é a variância maior é a chance de detectar um efeito, já que estatísticas de magnitude do efeito geralmente utilizam a variância como denominador Tamanho amostral: quanto maior o tamanho amostral em geral menor é a variância e portanto maior a chance de detectar um efeito, já que estatísticas de magnitude do efeito geralmente utilizam a variância como denominador
Erro Tipo I (alfa): rejeição de H0 verdadeira
Erro Tipo II (beta): aceitação de H0 falsa
Poder de testes estatísticos e Erro Beta População a de camundongos População b de camundongos
23.0m= 25.3m=
Poder de testes estatísticos
C - Distribuição de valores de tobs obtida por meio de amostragens, n=20, com reposição.Os teste t se referem à comparação das médias das amostras com . Portanto essa é a distribuição de t para a hipótese nula Ho. As flechas indicam os valores críticos de t para
D - Distribuição de valores de t
obs obtida por meio de amostragens, n=20, com reposição.Os teste t se referem à comparação da média das amostras
com . Portanto essa é a distribuição de t para a hipótese alternativa Ha. A região à esquerda da flecha indica todos os valores de t referentes à aceitação incorreta de Ho, isto é, erro Tipo II, ou erro
Poder de testes estatísticos
Poder De Testes estatísticos
Efeitos da magnitude da diferença, valor da variância e valor critério
Poder De Testes estatísticos
Efeitos da magnitude da diferença, valor da variância e valor critério
Poder De Testes estatísticos
Efeitos da magnitude da diferença, valor da variância e valor critério