13
1 1 KRIGAGEM INDICATIVA KRIGAGEM INDICADORA (Krigagem da Indicatriz) Avaliação dos valores médios das variáveis que definem um recurso natural: krigagem ordinária. E para características extremas? Para valores acima, ou abaixo, de valores de corte? A relação entre um recurso natural e o seu entorno. Uma pluma de um poluente não significa que a “não-pluma” adjacente esteja completamente limpa daquele contaminante. Funções de distribuição de probabilidades locais estimadas para fornecer mapas de riscos 2 O estimador fornecido pela krigagem ordinária suaviza os resultados. O estimador é não-enviesado em relação à média da lei de distribuição da variável Z(x), mas não em relação à lei de distribuição de probabilidades de Z(x). A krigagem de Z(x) é um estimador ótimo em relação à media, mas não em relação à variância. Relação intrínseca entre o fenômeno de suavização e o erro associado ao processo de estimação: a variância dos valores reais é maior que a variância dos valores estimados. À medida que aumenta a quantidade de informação para estimar a mesma área, o erro tende a ser menor, e, por conseqüência, menos acentuado o efeito de suavização. 3 4 média variância 359 pontos 1,288 0,738 259 pontos 1,309 0,837 100 pontos 1,234 0,482

Avaliação dos valores médios das variáveis que definem um ... · sobreestimação dos valores abaixo da média. Exemplo: numa área com solo potencialmente ... conseqüentemente,

  • Upload
    voduong

  • View
    220

  • Download
    0

Embed Size (px)

Citation preview

1

1

KRIGAGEM INDICATIVA KRIGAGEM INDICADORA (Krigagem da Indicatriz)

Avaliação dos valores médios das variáveis que definem um recurso natural: krigagem ordinária. E para características extremas? Para valores acima, ou abaixo, de valores de corte? A relação entre um recurso natural e o seu entorno. Uma pluma de um poluente não significa que a “não-pluma” adjacente esteja completamente limpa daquele contaminante. Funções de distribuição de probabilidades locais estimadas para fornecer mapas de riscos

2

O estimador fornecido pela krigagem ordinária suaviza os resultados. O estimador é não-enviesado em relação à média da lei de distribuição da variável Z(x), mas não em relação à lei de distribuição de probabilidades de Z(x). A krigagem de Z(x) é um estimador ótimo em relação à media, mas não em relação à variância. Relação intrínseca entre o fenômeno de suavização e o erro associado ao processo de estimação: a variância dos valores reais é maior que a variância dos valores estimados. À medida que aumenta a quantidade de informação para estimar a mesma área, o erro tende a ser menor, e, por conseqüência, menos acentuado o efeito de suavização.

3 4

média variância

359 pontos 1,288 0,738

259 pontos 1,309 0,837

100 pontos 1,234 0,482

2

Uma das mais importantes conseqüências do efeito de suavização: enviesamento dos valores extremos, com subestimação dos valores acima da média e sobreestimação dos valores abaixo da média. Exemplo: numa área com solo potencialmente contaminado pretende-se avaliar qual a porção a ser limpa e qual a que não esta contaminada e que, conseqüentemente, não deve ser removida ou recuperada

5

Erros de classificação: I. Classificar como segura uma localização

contaminada II. Classificar como contaminada uma localização

segura Uma localização é classificada como segura quando a

respectiva estimativa calculada se encontra abaixo do limite máximo permitido (zc) para o contaminante de interesse. Essa localização não estara sujeita a nenhum tratamento ou remediação.

Caso contrário, a localização será classificada como contaminada e estará sujeita a tratamento.

6

Erro tipo I (risco (x) ou falso positivo) ocorre quando a estimativa em uma localização segura u (Prob Z(x)≤zc) é superestimada (Z*(x)>zc); seu valor fica acima do limite máximo permitido (u)=Prob{Z(x)≤zc|Z*(x)>zc,(n)} =F(x;zc|(n)), para todas as localizações x tal que a estimativa Z*(x)>zc. Erro tipo II (risco β(x) ou falso negativo) ocorre quando uma localização contaminada u (ProbZ(x) >zc é subestimada (Z*(x)≤zc); seu valor fica abaixo do limite máximo permitido β(x)=Prob{Z(x)>zc|Z*(x)≤zc,(n)} =1-F(x;zc|(n)), para todas as localizações x tal que a estimativa Z*(x)≤zc.

7

(Myers, 1997:463)

8

3

Uma técnica completamente diferente das apresentadas

anteriormente trabalha com a variável indicadora que é obtida por uma transformação não linear conforme a equação:

Este método se deve a Journel (1983, p. 450-454) que o propôs como adequado para modelar distribuições lognormais.

A krigagem de variáveis indicadoras evita o problema da contaminação pela presença de poucos valores altos na interpolação de regiões com valores baixos.

Para a transformação de uma variável aleatória contínua em uma variável binária trabalha-se com o conceito do teor de corte/cutoff, termo emprestado da mineração.

9

zc

zczcxI

Z(x) se ,0

Z(x) se ,1),(

Variável indicativa: variável binária com apenas duas possibilidades 0 ou 1

Os 0’s e 1’s podem ser usados para designar duas diferentes classes: 0 = folhelho e 1= arenito 0= impermeável e 1= permeável 0= minério e 1= rejeito

Podem ser usadas para separar uma variável continua em duas categorias: 1: Pb10ppm e 0: Pb> 10ppm

10

11

Incertezas locais A geoestatística considera os valores de um atributo para cada posição no espaço como uma realização de uma variável aleatória; na posição x, Z(x) pode assumir diferentes valores para o atributo considerado e cada valor com uma probabilidade de ocorrência associada a ele. A variavel aleatória pode ser caracterizada pela sua função de distribuição de probabilidades acumuladas. Na krigagem linear, a modelagem da incerteza em locais não amostrados esta baseada na hipótese de distribuição gaussiana, com estimativa de um valor médio z*(x), respectiva variância s²*(x) e construção de um intervalo de confiança. Hipótese fortemente restritiva. 12

Dada uma variável aleatória , pode-se definir um teor de corte zc, de tal modo que esteja no intervalo de amostragem da variável . A idéia básica é discretizar uma distribuição contínua em K teores de corte obtendo-se K funções indicadoras. A Figura abaixo ilustra esquematicamente uma distribuição lognormal sendo discretizada em quatro teores de corte (zc=1,2,3,4).

4

A krigagem indicadora requer um variograma da variável indicadora para cada teor de corte zc.

Como a função variograma é calculada como a média das diferenças entre pontos separados por uma distância h, nem sempre é possível obter um variograma da indicadora, principalmente para teores de corte nos extremos da distribuição.

Assim, o melhor variograma da variável indicadora corresponde ao teor de corte igual à mediana da distribuição, pois metade dos valores são iguais a um e outra metade iguais a zero

A krigagem indicadora pode ser usada para derivar a função de distribuição acumulada condicional e assim estimar a probabilidade que o teor em um ponto não amostrado seja menor que o teor de corte: P(Z(x0)≤zc)

13 14

Para construção da função da distribuição acumulada condicional é necessário que toda a distribuição da variável de interesse seja amostrada em termos de teores de corte zc. Isso significa subdividir o intervalo de variação de Z(x) em teores de corte tanto quanto forem necessários. Para cada teor de corte estima-se a probabilidade do ponto não amostrado ser menor que o teor de corte. As probabilidades P(Z(x0)≤zc1),P(Z(x0)≤zc2,...,PZ(x0)≤zck) associadas aos valores de teores de cortes constituem a distribuição de probabilidade de Z(x) . As probabilidades calculadas devem ser monotônicas crescentes, ou seja, P(Z(x0)≤zc1)<P(Z(x0)≤zc2<,...,<PZ(x0)≤zck) para zc1<zc2<zck<zck+1. Se houver algum caso em que isso não ocorra, diz-se, então, que houve problema de relação de ordem Problemas de relação de ordem acontecem, pois a estimativa da probabilidade associada a cada teor de corte é feita com base em um modelo de variograma diferente.

15

Assim, para evitar problemas de relação de ordem, Deutsch & Journel (1992, p. 74-75) propuseram o uso da indicadora da mediana, para a qual se calcula e modela um único variograma. Esse modelo de variograma da indicadora da mediana é aplicado para a estimativa de todas as probabilidades , as quais são usadas para compor a função de distribuição acumulativa condicional. A partir dessa função, pode-se determinar a probabilidade , para qualquer valor de teor de corte, mesmo que este não tenha sido amostrado.

A Krigagem indicativa com múltiplos níveis de corte é aplicada para encontrar a função de distribuição acumulada de cada ponto a ser estimado.

Nesse caso alem de estimar o valor, é também calculado um intervalo de confiança e a correspondente probabilidade de exceder ou não um certo valor.

A média ponderada das variáveis indicativas é uma estimativa da probabilidade acumulada

16

5

17

Exemplo: Arquivo 12;anexo B (Yamamoto e Landim, 2013) http://lig.igc.usp.br/geoestatistica/anexob

18

05%: 0,186 10%: 0,221 20%: 0,282 30%: 0,429 40%: 0,663 50%: 1,089 60%: 1,456 70%: 1,937 80%: 2,320 90%: 3,618 95%: 5,198

19

Variograma da mediana (50%):

20

Mapa 05: Zc = 0,186(05%)

As curvas de distribuição acumulativa condicional são calculadas por meio da discretização do intervalo de variação da variável aleatória em 11 percentis, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% e 95%. Construção dos Mapas 05,10,20,30,40,50,60,70,80,90,95

6

21 22

Mapa 50: Zc = 1,089 (50%)

23 24 Mapa 95: Zc = 5,198 (95%)

7

25

1**

21,

* ;;

koko

K

kkkoE zcxFzcxFzcxZ

21

1,

kk

kk

zczczc

A função de distribuição acumulada condicional fornece a média condicional (estimativa do tipo E) e a variância condicional (Deutsch & Journel, 1992, p. 76):

: ponto médio da classe

m 1s: 84%

m 1s: 16%

desvio padrão condicional 0.5(84% - 16%)

26

0,5*(0,221+0,186)*(mapa10-mapa05)+0,5*(0,282+0,221)*(mapa20-mapa10) +0,5*(0,429+0,282)*(mapa30-mapa20)+0,5*(0,663+0,429)*(mapa40-apa30)+0,5*(1,089+0,663)*(mapa50-mapa40)+ 0,5*(1,456+1,089)*(mapa60-mapa50)+0,5*(1,937+1,456)*(mapa70-mapa60)+ 0,5*(2,320+1,937)*(mapa80-mapa70)+0,5*(3,618+2,320)*(mapa90-mapa80)+0,5(5,198+3,618)*(mapa95-mapa90) = mapa de estimativas do tipo E

27

As estatísticas para a distribuição de estimativas do tipo-E mostram grandes diferenças em relação às estatísticas dos dados reais, significando que a estimativa do tipo-E não pode ser usada para fazer inferência espacial. Krigagem indicadora é uma técnica que deve ser considerada para estimar probabilidades de ocorrências.

Escolha dos níveis de corte

Conhecimento “a priori” ou distribuição de probabilidades acumuladas

Objetivos: procura de valores acima do nível de corte, como na

determinação de teores anômalos de um determinado bem mineral

procura de valores abaixo do nível de corte, como em análise ambiental para a determinação de níveis de poluição abaixo de um certo teor.

28

8

Transformar os dados originais em indicadores, isto é, transformar os valores que estão acima de um determinado nível de corte em zero (0) e os que estão abaixo em um (1):

Neste tipo de transformação, os menores valores estimados indicarão maior probabilidade de ocorrência de valores acima do nível de corte e os maiores valores estimados indicarão menor probabilidade de ocorrência de valores acima do nível de corte.

cj

cj

cjvv se 0

vv se 1)v(i

29

cj

cj

cjvv se 0

vv se 1)v(i

Neste tipo de transformação, os maiores valores estimados indicarão maior probabilidade de ocorrência de valores acima do nível de corte e os menores valores estimados indicarão menor probabilidade de ocorrência de valores acima do nível de corte.

30

31

Mais exemplos

1) Bacia Delaware/Novo México/EUA (Hohn, 1999) Poços para produção de petróleo: produtivos e improdutivos

32

9

"X" "Y" "Z" 27 42 0 29 42 0 30 42 0 44 42 0 36 43 0 39 43 0 48 43 0 41 44 0 42 44 0 48 44 0 41 17 1 20 20 1 20 21 1 21 21 1 35 21 1 32 33 1 33 33 1 34 33 1 36 33 1 41 33 1

1: poço produtivo 0: poço improdutivo

33 34

35

2) Probabilidade de ocorrências de casos de malária em Porto Velho/RO Distribuição de pontos

36

10

Curva de probabilidade acumulada

37

Mapa para a probabilidade de ocorrer 53 casos de malária (1=0% probabilidade de ocorrência; 0=100% probabilidade de ocorrência)

38

espessura do solo e profundidade do nível freático

Dados obtidos em poços no sítio urbano de Bauru (SP)

Duas variáveis essenciais opara determinar localização de depósitos de lixo.

694000.00 696000.00 698000.00 700000.00 702000.00 704000.007524000.00

7525000.00

7526000.00

7527000.00

7528000.00

7529000.00

7530000.00

7531000.00

7532000.00

7533000.00

7534000.00

7535000.00

SAMPLE LOCALIZATION

3) Geotecnia (Sturaro e Landim)

40

Topografia e lençol freático

11

Relação entre as duas variáveis Profundidade do nível freático (14 m)

Espessura do solo (18 m)

695000 696000 697000 698000 699000 700000 701000 702000 703000 704000 705000

UTM - EAST

7525000

7526000

7527000

7528000

7529000

7530000

7531000

7532000

7533000

7534000

UT

M -

NO

RT

H

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

WATER TABLE DEEPNESS PROBABILITY > 14m

Probabilidade da profundidade do nivel freático ser maior que 14m

12

695000 696000 697000 698000 699000 700000 701000 702000 703000 704000 705000

UTM - EAST

7525000

7526000

7527000

7528000

7529000

7530000

7531000

7532000

7533000

7534000

UT

M -

NO

RT

H

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

SOIL THICKNESS PROBABILITY > 18m

Probabilidade da espessura do solo ser maior que 18m

Em termos probabilísticos, as áreas mais recomendadas estão localizadas na parte central e a sudeste. Como a parte central acha-se ocupada pelo sítio urbano de Bauru, a porção sudeste torna-se a mais indicada.

Probabilidade conjunta para nível freático >14m e espessura do solo>18

47

4) Krigagem Indicativa para elaboracão de Mapas Probabilisticos em Agricultura de Precisão (Talita Tanaka Fernandes, 2013)

Pontos de coleta na sub-bacia hidrografica do Rio Araqua.

48

13

49

Níveis de corte Areia >700: Solo Arenoso Argila >350: Solo Argiloso Fosforo <16: Adubação Potassio <3,1: Adubação Saturação por Base <60: Calagem

50

Mapas de Probabilidade de ocorrência das variaveis (a) Fosforo; (b) Potássio; (c) Saturacção por Base.

51

Localidades com menos areia e mais argila são aquelas onde existe maiores probabilidades de ocorrer Fosforo, Potassio e Saturação por Bases. Solo argiloso é mais fertil, pois as partículas de argila propiciam maior capacidade de troca catiôonica, tornando esses macro nutrientes mais disponíveis para as plantas.