Upload
duongcong
View
230
Download
0
Embed Size (px)
Citation preview
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Estatística para dados direccionais
Susana Barbosa
Mestrado em Ciências Geofísicas 2012-2013
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Dados direccionais
observações de direcções no plano ou no espaço
2-D (plano): dados circulares
3-D (espaço): dados esféricos
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Estatística circular
Estatística circular
métodos estatísticos para análise de dados circulares
“A curious byway of statistics. . . somewhere between theanalysis of linear and the analysis of spherical data”
(Fisher 1993)
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Dados circulares
I direcção representada por um ângulo medido em relaçãoa uma direcção “zero” arbitrária
I não há uma ordenação natural das observações
I 0 = 2π (o início e o fim coincidem)
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Dados circulares em geofísica
Medidas
I ventoI ondulaçãoI ...
Aplicações
I produção de energia renovávelI riscos, protecção costeiraI ...
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
Direcção tomada por 76 tartarugas após serem libertadas(Stephens, 1969)
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
Direcção tomada por 76 tartarugas após serem libertadas(Stephens, 1969)
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
Direcção tomada por 76 tartarugas após serem libertadas(Stephens, 1969)
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
Direcção do eixo maior de 164 formas de feldspato em basalto(Fisher, 1993)
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Representação de dados circulares
(x = r cos α, y = r sinα)⇐⇒ (r , α)
r = 1 (na estatística circular o interesse é apenas na direcção)
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Direcção média
A direcção média (direcção preferencial) não deve sercalculada a partir da média dos ângulos!
Exemplo:
(45 + 90 + 135)/3 = 90
(0 + 45 + 315)/3 = 120
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Direcção média
O valor da média angular depende
I origem (arbitrária)I sentido (horario, anti-horario)
=⇒ é necessária uma medida alternativa da média para dadosdireccionais
=⇒ como a variância depende da média, é também necessáriauma medida alternativa de dispersão para dados direccionais
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Direcção média
n observações (xi , yi)⇔ (cos αi , sinαi), i = 1, ...,n
Vector resultante: R = (∑n
i=1 cos αi ,∑n
i=1 sinαi) ≡ (C,S)
A média circular α0 é definida como
α0 = arctg(S/C))
Nota: quando R = 0 não existe uma direcção média (observações distribuídasuniformemente sobre o círculo, não há uma direcção preferencial)
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Dispersão circular
A variância circular é definida como
S = 1− 1n∑n
i=1 cos(αi − α0) = 1− ||R||/n
onde R é o vector resultante R = (∑n
i=1 cos αi ,∑n
i=1 sinαi)
N: 0 < S < 1
S ∼ 0 observações com a mesma direcção
S ∼ 1 observações dispersas pela circunferência unitária
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Distribuição de probabilidade circular
Distribuição circular: distribuição de probabilidade paravariáveis angulares em que toda a probabilidade estáconcentrada na circunferência do ciclo unitário
A função densidade de probabilidade circular f (θ) verifica
f (θ) ≥ 0
´ 2π0 f (θ)dθ = 1
f (θ) = f (θ + k2π)∀k
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Distribuição uniforme
A função densidade de probabilidade da distribuição circularuniforme é
f (θ) = 12π , θ ∈ [0,2π)
(todas as direcções têm igual probabilidade)
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Distribuição de von Mises
A fdp da distribuição de von Mises é
f (θ) = 12πI0(k)
exp[kcos(θ − µ)], θ ∈ [0,2π), k > 0
onde
I0(k) é uma função de Bessel modificada de ordem 0,
I0(k) = 12π
´ 2π0 exp[k cosθdθ]
(“distribuição normal circular” - distribuição mais comum para dadoscirculares simétricos e unimodais)
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Distribuição de von Mises
µ- direcção média
a distribuição de von Mises tem o valor máximo para θ = µ
a distribuição é simétrica em torno de µ
k - parâmetro de dispersão
k → 0 distribuição von Mises→ distribuição uniforme
k →∞ distribuição concentrada na direcção de µ
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Testes de hipótese para dados circulares
I Testes de Uniformidade
I Testes de Homogeneidade
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Testes de uniformidade
Distribuição uniforme
f (θ) = 12π , θ ∈ [0,2π)
(todas as direcções têm igual probabilidade)
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Teste de Rayleigh
Assumindo que a distribuição dos dados é de Von Mises comparâmetro de dispersão k
H0 : k = 0
H1 : k > 0
(distribuição unimodal com direcção média desconhecida)
H1 : k > 0 & µ = µ0
(distribuição unimodal com direcção média µ0)
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
H0 : k = 0H1 : k > 0
P-value: 0.15
H0 : k = 0H1 : k > 0 & µ = π
P-value: 0.96
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
H0 : k = 0H1 : k > 0
P-value: 0
H0 : k = 0H1 : k > 0 & µ = π
P-value: 0
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Teste de KuiperTeste não-paramétrico de uniformidade
H0 : a distribuição dos dados é uniforme (todas as direcções têmigual probabilidade)
P-value > 0.15 P-value:< 0.01
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Outros testes de uniformidade não-paramétricos
I Teste de Watson
I Teste de espaçamento de Rao
I Teste de Ajne
I ...
Vantagens dos testes não-paramétricos
- amostras pequenas
- dados não-unimodais
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Testes de homogeneidade
Para duas amostras de dados circulares
I a direcção média (direcção preferencial) das duaspopulações é a mesma?
I a variância circular (dispersão) é igual?
Em ambos os casos assume-se que os dados são amostras depopulações com distribuição de von Mises
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Teste de Watson
H0 : µ1 = µ2
P-value < 0.05
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Teste de Watson
H0 : µ1 = µ2
P-value < 0.05
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Teste de Rao
H0 : k1 = k2
P-value > 0.1
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Teste de Rao
H0 : k1 = k2
P-value < 0.01
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Intervalos de confiança - exemplo
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Intervalos de confiança - exemplo
mle.vonmises(x)
mu: 2.974( 0.1080 )
kappa: 2.308( 0.3966 )
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Intervalos de confiança - exemplo
Bootstrap ConfidenceIntervals
Confidence Level:95 %
Mean Direction:Low = 2.7 High = 3.2
ConcentrationParameter:Low = 1.8 High = 3.1
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Correlação circular
O coeficiente de correlação circular para dois conjuntos de dadoscirculares (αi , βi ), i = 1, ...,n com direcção média µ e ν (em relação àmesma direcção inicial e com o mesmo sentido de rotação) é dado por
ρc =E [cos(α− β − µ+ ν)− cos(α + β − µ− ν)]
2√
E [sin2(α− µ)]E [sin2(β − ν)]
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Correlação circular
Propriedades do coeficiente de correlação circular
I ρc(α, β) = ρc(β, α)
I |ρc(α, β)| ≤ 1
I ρc = 0 se α e β são independentes (o inverso não éverdadeiro)
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Correlação circular
O coeficiente de correlação circular amostral para duas amostras(αi , βi ), i = 1, ...,n com direcção média α e β é dado por
rc =
∑ni=1 sin(αi − α)sin(βi − β)√∑ni=1 sin2(αi − α)sin2(βi − β)
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
rc = 0.90P-value < 0.01
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Exemplo
rc = 0.21P-value = 0.07
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013
Introdução Medidas descritivas Distribuições de probabilidade circulares Testes de hipótese
Referências
Batschelet, E. (1981). Circular Statistics in Biology, AcademicPress
Jammalamadaka, S.R. & Sengupta, A. (2001). Topics inCircular Statistics. World Scientific, River Edge, N.J.
Susana Barbosa: Análise de dados em Geociências Mestrado em Ciências Geofísicas 2012-2013