78
UFU/FAMAT Geoestatística Básica e Aplicada Prof. Dr. Ednaldo Carvalho Guimarães 1 UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA NÚCLEO DE ESTUDOS ESTATÍSTICOS E BIOMÉTRICOS GEOESTATÍSTICA BÁSICA E APLICADA EDNALDO CARVALHO GUIMARÃES Fevereiro - 2004 Uberlândia - MG

Apostila de Geoestatistica

Embed Size (px)

DESCRIPTION

GEOESTATÍSTICA

Citation preview

Page 1: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 1

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA

NÚCLEO DE ESTUDOS ESTATÍSTICOS E BIOMÉTRICOS

GEOESTATÍSTICA BÁSICA E APLICADA

EDNALDO CARVA LHO GUIMARÃES

Fevereiro - 2004 Uberlândia - MG

Page 2: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 1

SUMÁRIO 1. INTRODUÇÃO........................................................................................................... 2 2. ANÁLISE EXPLORATÓRIA DE DADOS............................................................. 3 2.1. Distr ibuição de freqüências e histograma............................................................... 3 2.2. As estatísticas............................................................................................................. 3 2.3. Outras análises descritivas........................................................................................ 7 2.4. Amostragem........................................................................................................................................... 7 2.5. Exemplos de análise exploratór ia aplicando o programa GS+............................. 8 3. PRINCÍPIOS DA ANÁLISE GEOESTATÍSTICA.................................................. 14 3.1. Um breve histór ico.................................................................................................... 14 3.2. Estacionar idade......................................................................................................... 15 3.3. Kr igagem universal................................................................................................... 20 4. ANÁLISE DA DEPENDÊNCIA ESPACIAL............................................................ 21 4.1. Autocorre lação e Autocorre lograma....................................................................... 21 4.2. Semivar iograma......................................................................................................... 25 4.3. O uso do software GS+ na determinação do semivar iograma.............................. 36 4.4. Exemplos de aplicação............................................................................................... 41 5. KRIGAGEM................................................................................................................. 50 5.1. O interpolador ........................................................................................................... 50 5.2. A kr igagem no programa GS+................................................................................. 52 6. SEMIVARIOGRAMA CRUZADO E COKRIGAGEM.......................................... 55 6.1. Semivar iograma cruzado.......................................................................................... 55 6.2. Co-kr igagem.............................................................................................................. 56 6.3. Var iância da estimativa............................................................................................ 60 6.4. Número de vizinhos das estimativas........................................................................ 62 6.5. O uso do programa GS+ na determinação do semivar iograma cruzado,

da co-kr igagem e no mapeamento da var iável....................................................... 64

6.6. Exemplos de aplicação no GS+................................................................................ 67 7. VALIDAÇÃO DE MODELOS DE SEMIVARIOGRAMAS................................... 70 8. BIBLIOGRAFIA RECOMENDADA......................................................................... 74

Page 3: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 2

1. INTRODUÇÃO Métodos clássicos de análise estatística de dados geralmente supõem que, as

realizações das variáveis aleatórias são independentes entre si, ou seja, que observações

vizinhas não exercem influências umas sobre as outras.

Fenômenos naturais apresentam-se freqüentemente com uma certa estruturação nas

variações entre vizinhos, desta forma pode-se dizer que as variações não são aleatórias e,

portanto, apresentam algum grau de dependência espacial.

A análise espacial de dados apresenta-se como uma alternativa e/ou como uma

complementação da análise clássica de dados, sendo que este tipo de análise considera as

correlações entre as observações quando se faz estimativas.

A literatura apresenta alguns procedimentos de análise espacial de dados, sendo que,

nos últimos tempos, uma metodologia de análise denominada “geoestatística” ganhou

ênfase neste tipo de estudo.

Neste trabalho serão abordados aspectos básicos da metodologia geoestatística para

a análise espacial de dados, com ênfase na análise do semivariograma como ferramenta de

determinação da dependência espacial.

Inicialmente serão abordados aspectos básicos de uma análise exploratória de

dados; em seguida serão introduzidos conceitos básicos da geoestatística e da análise da

dependência espacial por meio de semivariograma e também de interpolação utilizando a

metodologia da krigagem e, por fim serão abordados conceitos básicos de semivariogramas

cruzados e co-krigagem. Sempre que possível os tópicos serão acompanhados de exemplos

de aplicação.

Page 4: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 3

2. A ANÁLISE EXPLORATÓRIA DE DADOS

A análise exploratória de dados é um procedimento de grande importância na

análise estatística e aplica-se para qualquer metodologia que se queira utilizar. Nesta

análise preliminar dos dados tem-se o objetivo de conhecer a variável em estudo e resumi-

la. Basicamente, este tipo de análise se baseia em construção e interpretação gráfica e

cálculos e interpretação de estatísticas.

No presente texto faremos uma revisão dos principais instrumentos de análise

exploratória de dados, sendo que estes procedimentos podem ser encontrados em cursos de

estatística básica e em livros de estatística básica como Costa Neto (1979), Bussab e

Morettin (1987), Triola (1999), Lopes (1999), entre outros.

2.1. A distr ibuição de freqüências e o histograma

A distribuição de freqüências consiste em agrupar as observações de uma variável

em classes ou categorias e o histograma é uma das representações gráficas dessa

distribuição. A distribuição de freqüências e o histograma podem ser obtidos em programas

computacionais comercias com o Excel, Statistica e em programas específicos para análise

geoestatística, como, por exemplo, o GS+.

A finalidade da distribuição de freqüências e do histograma é a de permiti r uma

visualização do comportamento da variável em estudo, com relação à tendência de

concentração de dados (tendência simétrica ou assimétrica). Esta tendência, principalmente

na análise não espacial de dados, pode direcionar procedimentos diferenciados de análise.

2.2. As estatísticas

O cálculo de estatísticas como a média, a variância, o desvio padrão, o coeficiente

de variação, valor mínimo, valor máximo, coeficiente de assimetria e coeficiente de

curtose, colaboram na descrição da variável. Passaremos a rever rapidamente estas

estatísticas.

Page 5: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 4

- A média ar itmética ( X )

A média aritmética é uma medida de posição bastante utilizada na estatística e tem

como características principais à facilidade de cálculo, a sua adaptabilidade ao tratamento

algébrico e, também, geralmente, é uma medida não tendenciosa, precisa, eficiente e

suficiente.

Vale ressaltar que nem sempre a média aritmética é a medida de posição que melhor

representa uma variável, por exemplo, em dados com assimetria à direita acentuada a moda

ou a média geométrica pode representar melhor a variável em estudo.

A fórmula para o cálculo da média é:

n

xX

n

ii∑

== 1

em que: X é a média aritmética; xi é cada valor observado; n é o número total de

observações.

- Var iância (s2) e desvio padrão (s)

A variância e o desvio padrão são estatísticas que nos fornece uma idéia de

variabilidade das observações em torno da média aritmética.

As fórmulas de cálculo são, respectivamente:

1

2

12

−=

∑=

n

)Xx(s

n

ii

2ss +=

Note que em interpretações de dados, ou seja, na análise descriti va a média

aritmética deve estar sempre acompanhada do desvio padrão para que possamos visualizar

a dispersão média dos valores.

- Coeficiente de var iação (CV)

O coeficiente de variação fornece a dispersão relativa dos dados, facilitando

visualizar a dimensão da dispersão dos valores observados em relação à média.

O coeficiente de variação é dado por:

Page 6: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 5

X

sCV 100(%) =

- Valor Mínimo e Valor Máximo

Estes valores permitem visualizar a menor ocorrência e a maior ocorrência e

podem ser um primeiro indicativo de erros de amostragem, digitação, etc..

A obtenção desses valores se faz a partir da ordenação das observações.

- Coeficiente de assimetr ia (Cs) e coeficiente de cur tose (Ck)

O coeficiente de assimetria mostra o afastamento da variável em relação a um valor

central, ou seja, na distribuição simétrica tem-se 50% dos valores observados acima da

observação central e 50% abaixo. Se a distribuição é assimétrica, esta relação não é

observada.

O coeficiente de curtose mostra a dispersão (achatamento) da distribuição em

relação a um padrão, geralmente a curva normal.

Estes dois coeficientes são utilizados para inferências sobre a normalidade da

variável em estudo.

Antes de definirmos estes dois coeficientes e tecermos comentários sobre eles

vamos definir os momentos estatísticos.

Se x1, x2, ... ,xn são os n valores assumidos pela variável X, definimos o momento de

ordem t dessa variável como:

n

xM

n

i

ti

t

∑== 1

Note que se t=1 temos a média aritmética, ou seja, a média aritmética é igual ao

primeiro momento em relação à origem.

O momento de ordem t centrado em uma constante K , com K ≠ 0 é definido como:

n

KxM

n

i

ti

Kt

∑=

−= 1

)(

Page 7: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 6

Observe que: se t = 1 e K = X , temos 011 == mM X (propriedade da média

aritmética) e, se t =2 e K = X , temos XM 2 = m2 = σ2.

Vamos definir agora o coeficiente de assimetria (Cs) e o coeficiente de curtose

(Ck).

O coeficiente de assimetria é utilizado para caracterizar como e quanto à

distribuição de freqüências se afasta da simetria, sendo que: se Cs > 0 temos a distribuição

assimétrica à direita; se Cs < 0 a distribuição é assimétrica à esquerda; e se Cs = 0 a

distribuição é simétrica.

O momento centrado na média de ordem 3 pode ser utilizado como medida de

assimetria, entretanto, é mais conveniente a utilização de uma medida admensional e que

será chamada de coeficiente de assimetria:

32

3

)(m

mCs =

Em que m2 e m3 são, respectivamente, o segundo e o terceiro momento centrados

na média.

O coeficiente de curtose é utilizado para caracterizar a forma da distribuição de

freqüências quanto ao seu “achatamento” . O termo médio de comparação é a distribuição

normal e esta apresenta o valor de Ck = 3. A classificação da distribuição quanto à curtose

recebe a seguinte denominação: se Ck = 3 a distribuição é mesocúrtica (distribuição

normal); se Ck < 3 a distribuição é platicúrtica; e se Ck > 3 a distribuição é leptocúrtica. Em

alguns programas computacionais como o Excel, Statistica e GS+ existe uma padronização

do valor de Ck e o valor de comparação é o zero, portanto, se Ck = 0 temos a mesocúrtica,

se Ck < 0 temos a platicúrtica e se Ck > 0 temos a leptocúrtica.

Para verificar o termo de comparação é necessário consultar o manual ou a "ajuda"

do programa.

A fórmula para cálculo de Ck é :

42

4

)(m

mCk =

sendo que: m4 é o quarto momento em relação à média aritmética.

Page 8: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 7

Para uma melhor interpretação do coeficiente de assimetria e do coeficiente de

curtose, alguns programas, como o GS+, calcula também o erro padrão desses coeficientes

e a partir dos valores dos coeficientes associados com seus respectivos erros padrão, pode-

se concluir se os dados tem distribuição normal ou não. Por exemplo: Se o valor obtido na

amostra para Cs = 0,30 com erro padrão de 0,65 e se o valor de Ck = 2,5 com erro padrão de

0,80, podemos dizer que a distribuição tende a normal (simétrica e mesocúrtica), pois

0,3±0,65 e 2,5±0,80, incluem os valores zero e três, respectivamente.

2.3. Outras análises descritivas

As análises descritas acima são as mais comuns e as que freqüentemente são usadas

como análise exploratória dos dados. Entretanto outros recursos podem ser aplicados como,

por exemplo: gráfico box-plot; gráficos da distribuição normal; gráfico h-dispersão, outras

estatísticas (quartil, mediana, moda, etc.); testes de normalidade (Shapiro – Wilk,

Kolmogorov – Smirnov, etc.), etc.. Tais resultados também contribuem para a descrição e

conhecimento da variável em estudo. Os procedimentos para este tipo de análise são

encontrados em programas de estatísticas.

2.4. Amostragem

Um requisito básico na amostragem para fins de análise de dependência espacial

utilizando métodos geoestatísticos é que as observações, ou seja, que as amostras sejam

referenciadas. Não é necessário utilizar coordenadas geográficas, mas algum tipo de

referenciação deve existir.

Exemplos de referenciações são: a) amostras coletadas ao longo do tempo �

cada

observação é referenciada com relação ao tempo (Ex: Estudo da precipitação anual na

região X); b) amostras coletadas ao longo de uma linha reta em uma certa cultura agrícola �

cada observação é referênciada por um único ponto no espaço (Ex: amostras coletadas

em transeções); c) amostras coletadas em uma área �

cada observação será identificada

por um par ordenado de coordenadas pertencente ao espaço (Ex: amostras coletadas em

uma área X).

Page 9: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 8

Um tipo de amostragem bastante utilizado em geoestatística é a amostragem

sistemática. Neste tipo de amostragem os pontos avaliados (amostras) são obtidos de forma

equidistantes, quer seja no espaço ou no tempo, formando uma malha de pontos no caso

bidimensional. No entanto esse não é um procedimento obrigatório, basta que se tenha a

referenciação dos dados para se proceder a análise espacial. Um exemplo típico de

amostragem não sistemática é para variáveis climáticas, onde as estações climatológicas,

geralmente, não são equidistantes mas apresentam a referencia geográfica.

Outro questinamento básico da geoestatística é "Quantas amostras devo utilizar para

a análise geoestatística?". Alguns autores recomendam que seja utilizados pelo menos 100

pontos amostrais, entretanto isso não é regra e sim recomenndação, existem trabalhos com

bons resultados de ajuste de semivariogramas usando 45 pontos de amostragem. É sabido

que quanto maior o número de pontos, maior será o número de pares para o cálculo das

semivariâncias e, teoricamnte, maior será a precisão das estimativas das semivariâncias.

Pode-se dizer que o número de observações dependerá dos objetivos que se tem no

trabalho, da escala (ou seja da dimensão), entre os outros fatores que devem ser avaliados

pelo pesquisador. Outro aspecto relacionado com o ajuste de semivariograma e

indiretamente com o tamanho da amostra é a presença de tendência da variável e/ou o uso

de duas populações distintas que abordaremos em tópicos seguintes, mas que, de maneira

geral, dificultam o ajuste de semivariogramas com dados originais, mesmo que o volume

de observações seja grande.

2.5. Exemplos de análise exploratór ia aplicando programa GS+

Passaremos a descrever exemplos de análise exploratória de dados do GS+. Nestes

exemplos será utilizado a Versão Beta do GS+ (5.0.3) que é de domínio publico, conforme

mostra a Figura 1.

Page 10: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 9

Figura 1. Programa GS+ Versão 5.0.3

Como ponto de partida vamos descrever a estrutura de arquivos de dados com

vistas a posterior análise geoestatística, pois, na análise geoestatística necessita-se que os

dados observados estejam referenciados, ou seja, tenham coordenadas. Trabalharemos com

a análise bidimensional e, portanto, teremos as coordenadas X e Y para cada observação.

Vale ressaltar que, se o objetivo do estudo não for a geoestatística ou a análise espacial, esta

referenciação não se faz necessária e ainda ressaltamos que a estrutura de dados

apresentada neste tópico é válida para diversos programas de análise espacial.

O arquivo pode ser criado no próprio programa GS+ ou em outro programa como o

Excel, necessitando, neste caso de uma importação de dados ou do famoso "copiar" e

"colar". A Figura 2 mostra o aspecto básico do arquivo de dados.

Page 11: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 10

Figura 2. Janela inicial do GS+ com exemplo de arquivo de dados contento as coordenadas (x,y) e 4 variáveis para a análise.

Neste exemplo temos um arquivo de dados editado no GS+. Na primeira coluna

temos a coordenada X, na segunda coluna temos a coordenada Y e da terceira a sexta

colunas temos as variáveis, ou seja, neste caso estamos trabalhando com 4 variáveis.

Se o arquivo for editado em outro programa, deve-se importar os dados para o GS+

utilizando o procedimento padrão do Windows de copiar e colar, ou recortar e colar, ou

ainda, ativar o ícone Import file localizado no canto superior direto da Figura 2.

Para selecionar outra variável a ser estudada basta clicar na coluna correspondente e

selecioná-la como a variável principal. Por exemplo, se o objetivo é a análise da terceira

variável (usatpc), procederíamos da seguinte forma (Figura 3):

Figura 3. Exemplo de mudança de variável para análise

Page 12: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 11

- clique sobre a coluna de interesse (coluna 5, neste exemplo). A coluna é selecionada e

aparece a segunda janela, indicando a coluna ativa.

- Clique em Z (Primary variable) para selecionar esta coluna como sendo sua variável de

analise.

- Clique em OK para confirmar a opção

Pode-se ainda trabalhar com duas variáveis simultaneamente. Neste caso seleciona-

se uma variável Z2 como covariável. Voltaremos ao assunto no tópico de semivariograma

cruzado.

Voltando à Figura 2 vamos descrever os procedimento da análise exploratória de

dados.

A barra de ferramenta apresenta os seguintes símbolos que são destinados a este tipo

de análise:

Os ícones não ativos são destinados a análise com duas variáveis (semivariograma

cruzados, co-krigagem, etc).

Para exemplificar o resultado deste tipo de análise vamos utilizar os dados da

primeira variável (usatpd – coluna 3). Ativando o ícone ∑∑ e teremos o resultado das

principais estatísticas, conforme Figura 4:

Planilha ativa Principais

Estatísticas

Análise gráfica histograma

Posição das observações selecionadas por quartil

Page 13: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 12

Figura 4. Estatísticas da variável “usatpd” .

Como uma análise geral desses dados verifica-se que a umidade de saturação do

solo no plantio direto (usatpd) apresentou média de 44,0069 (cm3/100cm3), com uma

dispersão média em torno desse valor de 4,3190 (cm3/100cm3) e, portanto, uma

variabilidade de 9,81%, deste modo nota-se que as observações se dispersam relativamente

pouco em torno da média. O menor valor observado (36,27 cm3/100cm3) e o maior valor

observado (54,810 cm3/100cm3) reforçam a idéia de baixa variabilidade das observações e

também mostram que, provavelmente, não temos valores discrepantes que poderiam ser

atribuídos a erros de determinação, digitação ou de amostragem. O histograma mostra uma

tendência dos dados à simetria e este fato também pode ser verificado por meio dos

coeficientes de assimetria e curtose associados aos seus respectivos erros padrão, que são

respectivamente: 0,46±0,30 e 0,34±0,50, ou seja, assimetria e curtose próximos de zero

indicando distribuição normal aproximada dos dados.

Note ainda que existe a possibilidade de se fazer análises com dados transformados.

Um detalhamento da distribuição da variável pode ser obtida clicando o ícone do

histograma na barra de ferramentas. Em um primeiro momento tem-se a visualização

do histograma e posteriormente pode-se fazer análises com distribuição de freqüências

acumuladas e gráfico da distribuição normal, conforme mostra a Figura 5.

média

Desvio padrão

variância

mínimo

máximo

Número de dados e Dados perdidos

histograma

Coeficiente de assimetria e erro padrão

Coeficiente de curtose e erro padrão

Page 14: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 13

Figura 5. Análise gráfica dos dados

Uma outra análise utilizada no GS+ é a localização espacial dos pontos amostrados

com relação a intervalos de ocorrência. Este mapa é obtido por meio do ícone . Veja o

exemplo na Figura 6.

Figura 6. Localização espacial das observações

Verifica-se, por meio da Figura 6, que a princípio não há indícios de concentração

de valores altos ou baixos em setores específicos da malha, portanto parece não existir

tendência nos dados e, provavelmente, se existir relação espacial, esta poderá ser

representada por um semivariograma médio (isotrópico).

Histograma – freqüência simples

Gráfico de freqüência acumulada

Gráfico da distribuição normal

Page 15: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 14

3. PRINCÍPIOS DA ANÁLISE GEOESTATÍSTICA

3.1. Um breve histór ico

A preocupação com a dependência espacial ou temporal de observações realizadas

para um determinado atributo é bastante antiga, sendo comprovado este fato por trabalhos

científicos datados do início do século XX, conforme mostra Vieira (1995).

Em algumas áreas da ciência, como a agricultura, a partir da metade do século XX

adotou-se a metodologia de análise de dados proposta por Fisher. Esta metodologia

considera, no seu desenvolvimento e aplicação, as seguintes suposições: normalidade da

variável; independência de erros e homocedasticidade de variância (homogeneidade de

variância).

A normalidade da variável e a homogeneidade de variâncias podem ser testadas

facilmente em programas de estatísticas por meio de testes específicos como, por exemplo,

Shapiro-Wilk (W teste) para normalidade e F máximo de Hartley para homogeneidade de

variâncias. Se for observado não normalidade de dados e/ou não homogeneidade de

variâncias, procedimentos como a transformação de dados podem ser adotados para que a

variável atenda estas hipóteses básicas da metodologia de análise não espacial proposta por

Fisher.

Já a independência não pode ser testada por métodos simples e a solução deste

problema, proposta pela metodologia não espacial, é a repetição e a aleatorização das

observações. Esta solução, em muitos casos, não garante a independência entre as

observações, isto porque algumas variáveis apresentam forte dependência espacial

(autocorrelação entre as observações) que não é desfeita com este procedimento.

Krige (1951) citado por Vieira (1995), em seus trabalhos com dados de mineração

da África do Sul, concluiu que a variância dos dados possuía uma estruturação que

dependia da distância de amostragem. A partir desta constatação surgiu os conceitos

básicos de geoestatística.

Os fundamentos teóricos da geoestatística podem ser encontrados nos trabalhos

desenvolvidos por Matheron (1963) e Matheron (1971).

A análise espacial de dados, utilizando a geoestatística, ganhou impulso em áreas

distintas da mineração e da geologia a partir de 1980, com grande aplicabilidade na ciência

Page 16: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 15

do solo. Uma justificativa para tal fato é a facilidade computacional que viabilizou alguns

cálculos relativamente trabalhosos nesta metodologia.

No Brasil destaca-se trabalhos pioneiros nesta área desenvolvidos pelos

pesquisadores Sidney Rosa Vieira, Paulo Libardi e Klaus Reichardt. Ainda na década de

80.

Atualmente a aplicabilidade e a utilização da geoestatística como metodologia de

análise de dados no espaço ou no tempo esta difundida em vários ramos da ciência,

envolvendo áreas de ciências humanas, biológicas e exatas.

Em linhas gerais podemos dizer que a geoestatística está interessada em determinar

a dependência espacial das observações de uma variável e recebeu tal denominação devido

aos trabalhos desenvolvidos por Krige na África do Sul. Este pesquisador é homenageado

com o nome do método de interpolação utilizado na geoestatística, a krigagem.

Outras metodologias e alternativas de análise de dependência espacial são descritas

em Papadakis (1937), Bartlett (1978), Zimmerman e Harville (1991), Cressie e Hartfield

(1996), Duarte (2000), entre outros autores.

3.2. Estacionaridade

Antes de iniciarmos a discussão sobre a estacionaridade da variável vamos adotar

uma simbologia para a variável em estudo. Ao falarmos da variável Z(t) estaremos falando

de ocorrências da variável Z com uma referenciação t, que pode ser uma posição no tempo

(unidimensional, por exemplo: t1, t2, ...,tk) ou no espaço (unidimensional, por exemplo: x1,

x2, ..., xn; ou bidimensional, por exemplo; (x1,y1),(x1,y2), ..., (xn, yn))

Diz-se que um processo (ou uma variável) é estacionária se o desenvolvimento

desse processo no tempo ou no espaço ocorrer de maneira mais ou menos homogênea, com

oscilações aleatórias contínuas em torno de um valor médio, em que nem a amplitude

média e nem as oscilações mudam bruscamente no tempo ou no espaço. Como exemplo de

processo estacionário pode-se citar as oscilações da tensão em uma rede elétrica.

Note que as características de um processo estacionário independe da origem

adotada.

Page 17: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 16

Diz-se que um processo é não estacionário quando não apresenta as características

citadas anteriormente e, neste caso, as características do processo dependem da origem que

é tomada como referência. Pode-se utilizar como exemplo de um processo não estacionário

o relevo no estado de Minas Gerais, ou ainda, as chuvas mensais durante um ano no estado

de Minas Gerais.

Observação: Processos não estacionários podem apresentar trechos estacionários.

Pode-se definir uma função aleatória Z(t) como estacionária, se todos os momentos

estatísticos são invariantes para toda mudança de origem.

Estatisticamente pode-se dizer que, se o processo é estacionário de ordem k, então:

E[Z(t)] = m1(t) = constante ∀ t

E[Z2(t)] = m2(t) = constante ∀ t

. . .

. . .

. . .

E[Zk(t)] = mk = constante ∀ t

Observação: Se um processo é estacionário na ordem k ele também será

estacionário para as ordens inferiores a k. Por exemplo, se o processo é estacionário de

ordem 4, ele também será estacionário nas ordens 1, 2 e 3.

Para estudos de geoestatística necessita-se, como restrição máxima, que o primeiro e

o segundo momento em relação à origem sejam constante, ou seja, exige-se no máximo a

estacionaridade de segunda ordem.

Se a esperança matemática de uma variável aleatória é constante,

independentemente da origem que se toma no espaço ou no tempo, podemos dizer que a

variável é estacionária de primeira ordem e, portanto, a média será a mesma para todo o

processo.

E[Z(t)] = m1(t) = µ = constante

Page 18: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 17

Se o segundo momento em relação à origem é constante, temos então que a

variância é constante independente da origem no espaço ou no tempo e, portanto, o

processo é estacionário de ordem 2.

E[Z2(t)] = m2(t) = constante

Var [Z(t)] = E[Z2(t)] – { E[Z(t)]} 2 = m2(t) – [m1(t)]2 = constante

Seja agora a covariância, ou seja, a esperança do produto do que ocorre em t e t’ ,

com h = t’ – t, definida como:

C(t, t’) = E[Z(t).Z(t’) ] - µ2

Se Z(t) é estacionária esta covariância não depende de t e t’ , ou seja, da origem, mas

somente da distância h entre os pontos e desta forma:

C(t, t+h) = C(h)

Note que a variância é um caso particular da covariância quando h = 0.

C(0) = E[Z2(t)] - µ2 = Var[Z(t)]

Geralmente utiliza-se a função de covariância normada pela variância:

)]([

)()(

tZVar

hCh =ρ

Neste caso chamamos ρ de função de correlação ou coeficiente de correlação, que

nada mais é do que a correlação entre seções da variável separadas por um passo h.

Portanto, ρ(0) = 1.

Podemos definir uma variável como estr itamente estacionár ia se seus momentos

estatísticos são invariantes a translações na origem. Isto significa que o processo Z(t) e

Z(t+h) tem a mesma estatística para qualquer h.

Uma variável é chamada de estacionár ia de segunda ordem se:

A média é constante:

E[Z(t)] = µ

O segundo momento existe:

E[Z2(t)] < ∞

Para cada par { Z(t), Z(t+h)} a função covariância existe e depende apenas de

h.

C(t, t+h) = C(h)

Page 19: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 18

A estacionaridade da covariância implica na estacionaridade da variância:

Var{ Z(t)} = C(0) e do variograma que é definido como:

2γ(h) = E{ [Z(t+h) – Z(t)]2} =

= E{ [Z(t+h)2} +E{ [Z(t)]2} -2E{ Z(t+h) Z(t)} =

= E{ [Z(t+h)]2} +E{ [Z(t)]2} -2µ2 =

= E{ [Z(t+h)]2} - µ2+ E{ [Z(t)]2} -µ2 =

= C(0) – C(h)

O coeficiente de correlação entre Z(t+h) e Z(t), chamado de correlograma ou

autocorrelograma, é igual a:

)0(

)(1

)0(

)()(

C

h

C

hChr

γ−==

Note que, se ocorre a estacionaridade de segunda ordem, o correlograma

(autocorrelograma) e o variograma (semivariograma) serão ferramentas correspondentes na

determinação da dependência espacial. Mas se a estacionaridade de segunda ordem não é

atendida o autocorrelograma não pode ser usado, pois, o denominador da função

autocorrelação é uma variância e, neste caso, C(0) ≠ constante.

Observação: A existência de estacionaridade permite a repetição de um

experimento, mesmo que as amostras sejam coletadas em pontos diferentes, em relação ao

experimento inicial. Esta fato é justificado em função de que todas as amostras pertencem a

populações com os mesmos momentos estatísticos.

A dependência espacial ou temporal de uma variável Z(t) é definida por uma

amplitude a, sendo que para variáveis com estacionaridade de segunda ordem:

C(h) = 0 se | h | > a

Ou

γ(h) = C(0) = Var [Z(t)] se | h | > a

Quando se trabalha com o tempo a constante a é chamada de tempo de corre lação

de Z(t). Se o estudo for espacial, por analogia, podemos chamar a de domínio de

corre lação.

Page 20: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 19

A hipótese de estacionaridade de segunda ordem assume a existência de uma

covariância e assim de uma variância finita. Var[Z(t)] = C(0). A existência do variograma é

uma hipótese mais fraca do que a existência da covariância, e existem muitos fenômenos

que possuem uma grande capacidade de dispersão, isto é, que não possuem uma variância a

priori nem uma covariância, mas um variograma pode ser definido. Uma hipótese mais

fraca (mais abrangente) é a hipótese intrínseca.

Na hipótese intr ínseca temos:

a) a esperança Z(t) existe e não depende do ponto t.

E[Z(t)] = µ

b) para todo h, a variância da diferença [Z(t+h) – Z(t)] existe e não depende do ponto t.

Var[Z(t+h) – Z(t)] = E{ [Z(t+h) – Z(t)]2} = 2γ(h)

Observação: Se uma variável é estacionária de segunda ordem, então ela é também

intrínseca, mas o inverso nem sempre ocorre.

A hipótese intrínseca é a hipótese mais freqüentemente usada em geoestatística, por

ser menos restriti va e, portanto, o semivariograma é a ferramenta mais difundida na

geoestatística porque exige apenas a hipótese intrínseca, enquanto o autocorrelograma

exige a estacionaridade de segunda ordem.

As Figuras 7A, 7B e 7C ilustram, respectivamente, uma variável estacionária de

segunda ordem, uma variável estacionária de primeira ordem e uma outra não estacionária.

Note que no caso da Figura 7A, para qualquer trecho que selecionarmos e calcularmos a

média e a variância, estas permanecerão aproximadamente constante, já no caso da Figura

7B, apenas a média permanece constante e no caso da Figura 7C nem a media e nem a

variância permanecem constantes.

Page 21: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 20

18

20

22

24

26

28

0 10 20 30 40 50

X

Y

1517192123252729

0 10 20 30 40 50

X

Y

5

10

15

20

25

30

0 10 20 30 40 50

X

Y

Figura 7. Exemplos de estacionaridade: A) Processo estacionário de segunda ordem; B)

Processo estacionário de primeira ordem e C) Processo não estacionário

3.3. Kr igagem universal (tendência)

Na hipótese de tendência (Krigagem universal), a variável Z(t) pode ser decomposta

em dois componentes:

Z(t) = m(t) + e(t)

A

B

C

Page 22: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 21

em que m(t) é a tendência principal (drift) e e(t) é o resíduo.

Para se trabalhar com essa hipótese é necessário que, para cada posição t se

determine à tendência m(t) e, assim, trabalha-se com o semivariograma dos resíduos.

Note que se m(t) = constante, então o semivariograma da variável Z(t), usando as

observações reais, será igual ao semivariograma dos resíduos e(t), mas, se ocorre algum

tipo de tendência nos dados (tendência linear, quadrática, etc.), o semivariograma dos

resíduos pode-se apresentar com melhor estruturação e definição dos parâmetros,

produzindo estimativas mais confiáveis (com menor variância) na krigagem.

4. ANÁLISE DA DEPENDÊNCIA ESPACIAL

As duas funções utilizadas com maior intensidade na geoestatística para a

determinação da dependência espacial ou temporal de variáveis são a função autocorrelação

(que gera o autocorrelograma) e a função semivariância (que gera o semivariograma).

Passaremos a descrever rapidamente a função autocorrelação e em seguida, com

maior detalhamento, será descrita a função semivariância e semivariograma com

instrumento de análise espacial de dados.

4.1. Autocorre lação e autocorre lograma

Quando estamos trabalhando com variáveis bidimensionais, temos que a

covariância é uma medida de associação entre as variáveis. Entretanto esta função tem a

desvantagem de possuir as unidades das variáveis que a geram e, também, não ter um

padrão de comparação, por exemplo, se calculamos a covariância entre X e Y e

encontramos o valor de 0,75 não podemos dizer se as variáveis estão com forte associação

positi va ou não.

A covariância é dada por:

]}yY].[xX{[E)y,xcov( µ−µ−=

O cálculo da covariância pode ser pensada também para a análise espacial. Se

analisarmos a Variável Z nas posições t e t+h temos:

Page 23: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 22

)])ht(Z).()t(Z[(E)]ht(Z),t(Zcov[ )ht(Z)t(z +µ−+µ−=+

Se a variável Z é estacionária, esta função poderá ser estimada por:

11

−+−=+

∑=

)h(n

]Z)ht(Z[]Z)t(Z[))ht(Z),t(Zcov(

)h(n

iii

, pois

neste caso a média de Z(t) será igual à média de Z(t+h).

Uma propriedade da covariância diz que "se duas variáveis aleatórias são

independentes então a covariância entre elas é igual a zero". Portanto, ao analisarmos a

variável Z nas posições t e t+h, com h=1,2,...k, espera-se que o valor da covariância comece

alto e depois tenda a zero, sendo que quanto maior for o valor da covariância maior será a

relação espacial e para covariância zero teremos independência. A Figura 9 ilustra uma

função covariância.

-1

0

1

2

3

0 100 200 300 400 500 600

distâncias (m)

cova

riânc

ias

Figura 8. Exemplo de uma função covariância

Comentamos, anteriormente, que a autocovariância apresenta algumas dificuldades

de interpretação. Vamos então definir a função autocovariância como uma alternativa de

interpretação da dependência espacial de uma variável Z.

Esta função tem a vantagem de ser adimensional e estar limitada ao valor -1 e 1,

permitindo comparações entre variáveis e também inferências sobre o grau de associação

(dependência).

Vamos inicialmente fazer uma analogia com as variáveis bidimensionais.

Considerando as variáveis X e Y, temos:

Page 24: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 23

yx

)]Y,Xcov[)y,x(

σσ=ρ que pode ser estimada por:

yx

n

i

SSn

]YY[]XX[

)y,x(r 11

−−

=

∑=

Neste caso quanto mais próximo de 1 ou de -1, maior a relação entre as variáveis e

quanto mais próximo de 0, menor a relação linear entre X e Y.

A função autocorrelação é definida como sendo a razão entre a covariância dos

valores assumidos pela variável Z, nas posições t e t+h e a variância dessa variável Z, em

função da distância h, no caso de variável estacionária de segunda ordem. Desta forma tem-

se:

2

)](),([

)]([

)](),(cov[)(

σρ htZtZCov

tZVar

htZtZh

+=

+=

Trabalhando-se com dados amostrais ρ(h) pode ser estimado por r(h):

2

1

1

s

)h(n

]Z)ht(Z[]Z)t(Z[

)h(r

)h(n

iii

−+−

=

∑=

em que:

ρ (h) é a autocorrelação entre os valores da variável Z, separados pela distância h

(autocorrelação populacional);

Cov [Z(t), Z(t+h)] é a covariância entre a variável Z(t) e a variável Z(t+h);

Var[Z(t)] = σ2 é a variância populacional, ou seja, a covariância entre Z(t) e Z(t+h) quando

h=0;

r(h) é a autocorrelação amostral para a distância h;

n(h) é o número de pontos amostrais separados pela distância h;

Z é o valor médio (média amostral) da variável Z(t);

s2 é a variância amostral de Z(t).

Page 25: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 24

A Figura 9 mostra um exemplo de comportamento da função autocorrelação.

-0.4-0.2

00.20.40.60.8

1

0 100 200 300 400 500 600

distância (m)

r(h)

Figura 9. Exemplo de um autocorrelograma experimental

O uso dessa função no estudo da dependência espacial ou temporal só é válida se a

hipótese de estacionaridade de segunda ordem for atendida.

Teoricamente, para h = O a autocorrelação é máxima, ou seja, r(0) = 1 e este valor

decresce até o zero, ou seja, até uma distância ou tempo que não exista relação entre as

observações. Esta distância define a amplitude de dependência espacial ou temporal (a),

sendo que acima dessa distância os dados são considerados independentes entre si. Este tipo

de comportamento indica que quanto mais próximas estiverem as amostras maior o grau de

semelhança entre elas e este grau de semelhança decresce com o aumento da distância entre

observações.

Podemos ter ainda o autocorrelograma para toda distância com valor de

autocorrelação igual a zero (r(h) = 0), exceto para h=0 em que r(0) = 1, assim temos

independência entre as amostras para toda à distância ou tempo de estudo.

Uma outra possibilidade é o autocorrelograma com autocorrelações flutuando em

torno de zero (indica independência entre as observações) e o autocorrelograma cíclico, que

indica flutuações periódicas na variável estudada, conforme Figura 10A e 10B.

Page 26: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 25

-0.20

0.20.40.60.8

11.2

0 5 10 15 20

h

r(h

)

-0.4-0.2

00.20.40.60.8

11.2

0 5 10 15 20

h

r(h

)

Figura 10. Exemplos de autocorrelogrmas: A) independência entre observações; B)

periodicidade da variável.

4.2. Semivar iograma

a) Definição do semivar iograma

O semivariograma é definido como:

)]}()([{2

1)( htZtZVarh +−=γ

Note que Var[Z(t) –Z(t+h)] é a variância dos dados separados por uma distância h,

mas, na expressão acima, esta variância está sendo divida por dois, então se utiliza o

prefixo “semi” para distinguir da variância e daí vem o nome semivariância para γ(h) e

semivariograma para o gráfico de γ(h) em função de h.

A

B

Page 27: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 26

Observação: O divisor 2 da variância surge das deduções e simplificações

matemáticas.

Sob a suposição de tendência zero, temos: E[Z(t+h)] = E[Z(t)] e, portanto:

})]()([{2

1)( 2tZhtZEh −+=γ

e uma estimativa de γ(h) chamada de )(^

hγ é dada por:

)(2

)]()([)(

)(

1

2

^

hn

tZhtz

h

hn

i∑

=−+

em que n(h) é o número de pares separados pela distância h.

Relembrando a condição de estacionaridade, temos que a utilização do

semivariograma exige que pelo menos a hipótese intrínseca seja atendida, ou seja, exige a

condição de estacionaridade mais fraca quando comparada com a autocorrelação.

b) Caracterização do semivar iograma

Analisando a expressão da função semivariância, pode-se imaginar que quanto mais

próximos estiverem os pontos amostrados, maior será a semelhança entre eles e, portanto,

menor a semivariância; e quanto mais distantes estiverem os pontos amostrados menor será

a semelhança e, consequentemente, maior a dispersão (variância). Na teoria temos que para

a distância h=0 a semivariância γ(0) = 0 e, a semivariância γ(h) cresce com o incremento

de h, até atingir um valor constante para γ(h) que corresponde às variações aleatórias, ou

seja, variações que não são justificada pela semelhança de um ponto com outro.

A distância h a partir da qual γ(h) se torna aproximadamente constante é chamada

de alcance da dependência espacial (a) sendo que as medições realizadas a distâncias

maiores que a, tem distribuição espacial aleatória e, portanto, são independentes entre si. O

valor de γ(h) constante é chamado de patamar (C).

A utilização de dados amostrais na estimativa da semivariância e na construção do

semivariograma, revela que, freqüentemente, para h = 0 a semivariância γ(0) difere de zero.

A impossibilidade de se fazer reamostragem exatamente sobre um ponto já amostrado

Page 28: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 27

(nestes casos pode ocorrer variações a distâncias menores do que a menor distância de

amostragem) e erros como erros de amostragem, erros de análise de laboratório, etc., são

justificativas dessa descontinuidade na origem. Quando γ(0) ≠ 0, surge um novo termo no

semivariograma chamado de efeito pepita (C0) e, neste caso, o patamar é dado por:

C0 + C.

Observação: Pode-se mostrar que o patamar do semivariograma (C0 + C) é uma

estimativa sem tendência da variância (σ2) da variável Z(t).

Nas Figuras 11A e 11B apresentamos o comportamento ideal de um

semivariograma e também são mostrados os parâmetros do modelo descritos acima.

Figura 11. Semivariogramas: (A) sem efeito pepita; (B) com efeito pepita

Os semivariogramas apresentados na Figura 11 indicam estacionaridade de segunda

ordem para a variável, porque apresenta patamar claro e bem definido.

Se o semivar iograma for constante e igual ao patamar para qualquer valor de h,

temos o efeito pepita puro e, neste caso, temos a ausência total de dependência espacial,

ou seja, a dependência espacial, se existir, será manifestada à distância ou tempo menor do

que o menor espaçamento entre amostras.

Um outro tipo de semivariograma é aquele que apresenta a semivariância com

flutuações. Este semivariograma é chamado de semivar iograma periódico ou cícli co e

indica uma periodicidade nos dados que pode ser explicada por algum fator conhecido e

analisada por meio da densidade espectral.

a

C C0 + C

C0

a INDEP DEP. DEP.

INDEP.

(A) (B)

Page 29: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 28

Também podemos ter um tipo de semivariograma em que as semivariâncias

crescem, sem limites, para todos os valores de h, ou seja, semivar iogramas sem patamar

definido. Este semivariograma indica que a hipótese de estacionaridade de segunda ordem

não foi atendida e, provavelmente, estamos trabalhando com a hipótese intrínseca (

fenômeno com capacidade infinita de dispersão). Ele indica também que a máxima

distância h entre as amostras não foi capaz de exibir toda a variância dos dados e

provavelmente existe tendência dos dados para determinada direção. Se for verificada a

tendência remove-se esta tendência e verifica-se se a variável resíduo apresenta

semivariograma com patamar (estacionaridade de segunda ordem). Uma outra alternativa é

trabalhar com a hipótese de tendência nos dados originais. Vale ressaltar que a primeira

alternativa é a mais simples e a mais utilizada. Se o semivariograma dos resíduos apresenta

efeito pepita puro, pode-se dizer que a superfície de tendência é a melhor representação

espacial da variável. Uma metodologia de se ajustar superfícies de tendência é a utilização

de regressão múltipla.

Podemos ter ainda um semivariograma com mais de uma estrutura de variância, que

são chamados de semivar iogramas com estruturas entrelaçadas ou semivar iogramas

imbr icados. Neste caso uma explicação prática poderia estar associada ao fato de estarmos

trabalhando com mais de uma população, ou seja, até uma distância X estamos trabalhando

com uma determinada população e a partir daí outra ou outras populações.

As Figuras 12A, 12B, 12C, 12D e 12E, mostram respectivamente, semivariogramas

experimentais com patamar definido, efeito pepita puro, sem patamar, cíclico e com

estruturas entrelaçadas.

Page 30: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 29

0

5

10

15

20

0 5 10 15 20

h

gam

a (h

)

0

5

10

15

20

0 5 10 15 20

h

gam

a (h

)

0

5

10

15

20

0 5 10 15 20

h

gam

a (h

)

0

2

4

6

8

10

0 5 10 15 20

h

gam

a (h

)

A

B

C

D

Page 31: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 30

0

10

20

30

40

0 5 10 15 20 25 30

h

gam

a(h

)

Figura 12. Semivariogramas: A) Com patamar; B) Efeito pepita puro; C) sem patamar

D)Cíclico e E) Com estruturas entrelaçadas

c) Grau de dependência espacial

Quanto ao grau de dependência espacial da variável em estudo, podemos classifica-

la como:

i) var iável com for te dependência espacial – se o efeito pepita for menor ou igual a 25%

do patamar

<

+25,0

0

0

CC

C;

ii ) var iável com moderada dependência espacial – se o efeito pepita representar entre

25% e 75% do patamar

+≤ 75,025,0

0

0

CC

C;

iii ) var iável com fraca dependência espacial – se a relação entre efeito pepita e patamar

estiver entre 75% e 100%

<

+< 00,175,0

0

0

CC

C

iv) var iável independente espacialmente – se a relação entre efeito pepita e patamar for

igual a 100%, neste caso temos o semivariograma com efeito pepita puro

=

+00,1

0

0

CC

C.

E

Page 32: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 31

d) Isotropia e anisotropia

Note que h é um vetor e, consequentemente, o semivariograma depende da

magnitude e da direção de h. Quando o semivariograma é idêntico para qualquer direção de

h ele é chamado de isotrópico e quando o semivariograma apresenta os parâmetros C, C0, a

e/ou modelo diferenciado dependendo da direção de h, ele é chamado anisotrópico

(podemos classificar a anisotropia em anisotropia geométr ica ou anisotropia zonal). Se o

semivariograma é anisotrópico ele deve sofrer transformações antes de ser usado. Vieira

(1995) alega que, em geral, a precisão da interpolação ou o tipo de hipótese satisfeita, não

são afetados se, ao invés de se preocupar com a escolha de método de transformação de

anisotropia, apenas limitar a faixa de distância na qual se utiliza o semivariograma. As

principais direções de h que são examinadas são: 0o (na direção X), 90o (na direção Y), 45o

e 1350 (nas duas diagonais principais).

Quando os dados forem coletados em uma transeção (linha), o semivariograma é

unidimensional e nada pode ser dito sobre anisotropia.

e) Os pr incipais modelos de semivar iogramas

Dados experimentais são influenciados por uma série de fatores. Um pesquisador,

geralmente, não é capaz de controlar todos os fatores que influenciam um conjunto de

dados. Desta idéia surge a distinção entre modelo matemático e modelo estatístico.

No modelo matemático não temos desvios em relação à função proposta, ou seja,

todos os pontos experimentais devem estar sobre a função proposta para explicar

determinado fenômeno. Por exemplo, se tomarmos os pares ordenados (0,0); (2,4); (3,9);

(4,16) e (5,25) como sendo valores experimentais e propormos o modelo: Y i= Xi2, como o

modelo que explique o comportamento desses dados experimentais, estaremos trabalhando

com um modelo matemático, pois, todas as observações pertencem ao modelo proposto

(Figura 13).

Page 33: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 32

y = x2

-50

510

1520

2530

0 1 2 3 4 5 6

X

Y

Figura 13. Modelo Matemático

Para o modelo estatístico os valores experimentais apresentam desvios (erros) em

relação ao modelo proposto (ajustado) e estes erros são atribuídos a fontes de variações não

controladas pelo pesquisador. Por exemplo, podemos ter o seguinte modelo estatístico que

explique o comportamento linear de uma variável Y em função de X: Yi = a +bXi +ei,

(Figura 14) em que a e b são as constantes que definem a reta e ei são os erros

experimentais (maiores detalhes podem ser obtidos em textos e livros sobre modelos

lineares ou análise de regressão).

y = 2.0286x + 1.4286+ei

0

5

10

15

0 1 2 3 4 5 6

X

Y

Figura 14. Modelo Estatístico

Na aplicação da teoria geoestatística a dados experimentais, vamos ajustar modelos

teóricos de semivariogramas as semivariâncias experimentais, e desta forma estaremos

trabalhando com modelos estatísticos de semivariogramas.

Page 34: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 33

O gráfico da semivariância (γ(h)) em função da distância (h), mostrará uma série de

pontos discretos que é chamado semivariograma experimental. Uma função contínua deve

ser ajustada as semivariâncias experimentais.

A escolha do modelo de semivariograma que será utilizado é um dos aspectos mais

importantes da geoestatística. Todos os cálculos da geoestatística dependem do modelo de

semivariograma ajustado e, conseqüentemente, se o modelo ajustado não for apropriado,

todos os cálculos seguintes conterão erros que poderão afetar as inferências, portanto o

ajuste de semivariograma é uma fase crucial na análise geoestatística e deve receber uma

atenção especial.

Vários métodos são utilizados para verificar a qualidade do ajuste do

semivariograma aos dados experimentais.

Vieira et al (1983) sugerem o método de ajuste por tentativa e erro (ajuste a critério

do observador) associado à avaliação do modelo pela técnica de validação cruzada ou

autovalidação (“ jack-Knifing” ).

Macbratney e Webster (1986) sugerem o método do Critério de Informação de

Akaike (AIC) para avaliar o modelo. Já Pannatier (1996) sugere a utilização do "Indicação

da Qualidade do Ajuste" (IGF).

A descrição de cada método de seleção pode ser encontrado nos respectivos

trabalhos originais dos autores e cada programa de análise geoestatística de dados apresenta

um critério de seleção.

O programa GS+, com o qual estamos exemplificando este texto, aplica a

metodologia dos mínimos quadrados para os ajustes dos modelos e utiliza como critérios

para seleção do modelo: i) o coeficiente de determinação (R2), que, relembrando os

conceitos de análise de regressão, é uma relação entre a soma de quadrados devido ao

modelo ajustado e a soma de quadrados total (mede a variação dos dados devido ao modelo

ajustado em relação à variação total dos dados) e quanto mais próximo da unidade estiver o

valor de R2 melhor será o modelo ajustado; ii ) Soma de quadrados de resíduos (RSS) –

quanto menor for este valor, melhor será o modelo de semivariograma. O GS+ utiliza este

resultado para a seleção do modelo e, por meio de combinações dos parâmetros do modelo,

minimiza esta soma de quadrados de resíduos. O autor do programa alega que a utilização

Page 35: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 34

desse critério na seleção do modelo é preferido, por ser este mais sensível e mais robusto

quando comparado com o coeficiente de determinação (R2).

Observação: Em muitos casos (talvez na maioria dos casos) a sensibilidade de quem está

trabalhando com os dados e o conhecimento sobre a variável é de fundamental importância

na opção do modelo de semivariograma. Às vezes é preferível selecionar um modelo com

R2 um pouco menor ou RSS um pouco maior que o sugerido pelo programa, mas que

represente melhor os dados. De maneira geral, quanto mais simples puder ser o modelo

ajustado, melhor, e também não se deve dar importância excessiva a pequenas flutuações.

A condição para o ajuste de modelos a dados experimentais é que ele represente a

tendência de γ(h) em relação à h e que o modelo tenha positi vidade definida condicional.

De maneira geral, um modelo é positi vamente condicional se γ(h)> 0 e γ(-h) = γ(h),

qualquer que seja h.

Definindo C0 como efeito pepita, C0 + C como patamar e a como alcance, os

principais modelos de semivariogramas utilizados na geoestatística são:

i) modelo linear com patamar

>+

≤≤+=

ahCC

ahha

CC

h

0

0 0)(γ

Neste caso C/a é o coeficiente angular para 0< h < a

ii ) modelo esférico

>+

≤≤

+

=

ahCC

aha

h

a

hCC

h

0

3

0 02

1

2

3

)(γ

iii ) modelo exponencial

[ ] dheCCh ah <<−+= − 01)( )]/(3[0γ

Page 36: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 35

Neste modelo e no modelo de gaussiano d é a distância máxima na qual o semivariograma

é definido e nestes modelos o patamar (a) é atingido apenas assintoticamente O parâmetro a

é determinado visualmente como a distância após a qual o semivariograma se estabiliza.

iv) modelo gaussiano

[ ] dheCCh ah ≤≤−+= − 01)(2)/(3[

v) modelos sem patamar

200 <<+=γ BAhC)h( B

Os parâmetros A e B são constantes que definem o modelo, sendo que B tem que ser

estritamente maior que zero e menor que dois para garantir a condição de positi vidade

definida condicional.

Observação: dependendo da escala de trabalho e do espaçamento entre amostras, pode-se

ter mais de um modelo de semivariograma para os dados. Nestes casos temos as estruturas

entrelaçadas.

As Figuras 15A e 15B mostram os aspectos gerais dos modelos de semivariogramas

discutidos anteriormente.

Figura 15. Modelos de semivariograma: (A) com patamar; (B) sem patamar.

Observação: Nos modelos exponencial e gaussiano, apresentados no programa GS+, a

amplitude a que deve ser considerada como a amplitude de dependência espacial deve ser

igual a três vezes e 3 vezes, respectivamente, o valor de A0, ou seja, a amplitude efetiva

Linear Gaussiano Exponencial Esférico

A=8,0; B=0,5 A=0,9; B=1,0 A=0,1;B=1,5

(A) (B)

Page 37: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 36

apresentada na coluna posterior a coluna de A0. Isto ocorre porque os modelos

exponencial e gaussiano utilizados no programa não consideram o fator 3 apresentados nos

modelos anteriores.

4.3. O uso do software GS+ na determinação do semivar iograma

No programa GS+ o ícone indica que a análise da dependência espacial será

realizada por meio do semivariograma.

Observação: Existem outras opções de análises que são apresentadas em

“autocorre lation” ou nos respectivos ícones na barra de ferramentas.

Ativando o ícone do semivariograma, o programa apresenta a seguinte janela

(Figura 16):

Figura 16. Análise da semivariância

Distância máxima para cálculo das semivariâncias

Passos para cálculo da semivariância

Análise de anisotropia

Cálculo das semivariâncias e do semivariograma

Exibe o semivar.

Variância amostral

Semivar. escalonado

Semivariograma isotrópico

Semivariogramas anisotrópicos

Page 38: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 37

A distância máxima para cálculo da semivar iância deve ser no máximo igual à

máxima distância de coleta da amostra. O GS+ adota como critério inicial 80% da distância

máxima, isto se justifica pelo fato de que a grandes distâncias o número de pares para o

cálculo da semivariância reduz-se drasticamente, fazendo com que a estimativa da

semivariância tenha pouca precisão. Este valor pode ser alterado pelo usuário.

Os passos para cálculo das semivar iâncias consiste em como as semivariâncias

vão ser agrupadas. Quanto maior for este valor menos pontos teremos no semivariograma.

Vale ressaltar também que, se este passo for muito pequeno, teremos classes de distância

sem pares para cálculo da semivariância.

Para a análise do semivariograma isotrópico o ângulo de tolerância (offset

tolerance) deve ser de 900 e, neste caso, os semivariogramas para as diferentes direções

(anisotrópico) serão iguais ao semivariograma isotrópico. Não abordaremos neste texto a

discussão sobre anisotropia e procedimentos de análise de anisotropia.

A janela apresentada na Figura 9 mostra também as opções de exibição do

semivariograma. Se marcarmos apenas a primeira opção, teremos o semivariograma

experimental e uma proposta de modelo ajustado. Marcando-se a primeira e a segunda

opções, temos o semivariograma experimental, a proposta de modelo e uma linha paralela

ao eixo X que representa a variância dos dados. Na terceira opção é exibido o

semivariograma escalonado, ou seja, o semivariograma onde cada semivariância é dividida

pela variância dos dados.

A Figura 17 ilustra o resultado de um semivariograma.

Page 39: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 38

Figura 17. Exemplo de um semivariograma

Note que a Figura 17 apresenta ainda a opção model e a opção expand. O resultado

da execução dessas funções são apresentados nas Figuras 18 e 19.

A Figura 18 exibe as opções de modelos de semivariogramas.

Figura 18. Modelos e análises dos modelos

Mostra o semivariograma com os respectivos parâmetros e ajuste

Mostra as opções de modelos com os parâmetros e ajuste

modelos Efeito pepita

patamar amplitude

Amplitude efetiva (exp e gaussiano).

Relação entre C e patamar

Coef. Determinação e soma de quadrados de erros

Refaz o semivariograma padrão do GS+

Aplica o novo modelo caso haja modificação

Page 40: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 39

O GS+ permite, no comando model (Figura 18), visualizar os modelos com os

respectivos ajuste feito pelo programa (vale relembrar que o GS+ seleciona o modelo com

menor soma de quadrados de resíduos (RSS)). Ao usuário é permitido a modificação do

modelo selecionado pelo GS+ ou, então, dos parâmetros dos modelos e, realizadas

modificações, o comando apply deve ser ativado para que o programa tome este modelo

como o modelo de variabilidade espacial ou temporal daquela variável. Para retornar ao

modelo padrão do GS+ utilize o comando refit.

Observações:

a) O programa não apresenta o modelo de efeito pepita puro. Para obter este modelo

utilize o modelo linear com C0 = C0 +C.

b) A amplitude efetiva é utilizada no GS+ para determinar a amplitude de dependência

espacial dos modelos exponencial e gaussiano, devido a formula de cálculo desses

modelos no programa, A0 ≠ A (Estes modelos no GS+ não consideram o fator

multiplicativo 3).

c) A inclinação no modelo linear e linear com patamar (coeficiente angular) e dado pela

relação entre C e A0, ou seja, C/A0.

d) A relação entre C e C0+C nos dá uma idéia do grau de dependência espacial da variável,

sendo que quanto mais próximo de 1, maior a dependência espacial. Note que

CC

C

CC

C

+−=

+ 00

0 1 e o primeiro termo já foi discutido no item grau de dependência

espacial, classificando a dependência como fraca, moderada e forte.

e) R2 (coeficiente de determinação) e RSS (soma de quadrados de resíduos) nos informa

sobre a qualidade do ajuste do modelo.

f) No ajuste do modelo a sensibilidade do usuário é muito mais importante do que os

valores de R2 e RSS e, portanto, tentativas de ajustes diferentes ao proposto pelo

programa devem ser utilizadas, mesmo que isso cause queda no valor de R2 e acréscimo

no valor de RSS.

g) O programa não apresenta a opção de ajuste de modelo sem patamar diferente do linear.

Neste caso, sugere-se que se copie as semivariâncias calculadas para outro programa e

que o gráfico seja feito neste outro programa, por exemplo, O Excel.

Page 41: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 40

A Figura 19 mostra o resultado da execução do comando expand.

Figura 19. Semivariograma e opções de edição Nesta tela temos a exibição das semivariância calculadas, do modelo de

semivariograma ajustado e dos parâmetros desse modelo. A listagem dos valores de

semivariâncias com as respectivas distâncias de cálculo (list values), permite que estes

valores sejam transportados para outros programas e que se faça vários modelos em uma

única figura.

Semivariograma experimental e modelo ajustado

Parâmetros do modelo ajustado

Lista semivariância calculada, com distâncias e número de pares

Mostra as diferenças quadráticas que geram a semivariância

Edita o semivariograma

Page 42: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 41

4.4. Exemplos de aplicação

1) Suponha que os dados abaixo representem a variável Z (por exemplo, % de areia de um

certo solo). A amostragem foi feita em uma transeção e as amostras foram coletadas a

cada 20 m. Faça a análise descriti va da variável, calcule as semivariâncias, monte o

semivariograma experimental e proponha um modelo de ajuste. (note que estes dados

são unidimensionais).

Tabela 1. Dados de % de areia em um solo. h (m) 0 20 40 60 80 100 120 140

%Areia 16 18 17 20 15 15 15 15 h(m) 160 180 200 220 240 260 280 300

%Areia 17 17 17 18 18 19 18 18 h(m) 320 340 360 380 400 420 440 460

%Areia 18 21 16 20 16 18 18 17 h(m) 480 500 520 540 560 580 600 620

%Areia 18 18 20 17 17 17 17 18 Observação: para ser resolvido sem o uso de programas de geoestatística

Solução:

a) Análise descriti va

Média 17.46875 Erro padrão

0.265581

Mediana 17.5 Moda 18 Desvio padrão

1.50235

Variância 2.257056 Curtose 0.129546 Assimetria 0.27713 Mínimo 15 Máximo 21

A análise descriti va mostra que os dados possuem uma distribuição de probabilidade

normal aproximada (média, mediana e moda aproximadamente iguais; curtose e assimetria

próximos de zero; gráfico tendendo à simetria). A variabilidade do dados é relativamente

baixa (desvio padrão = 1,5023 e CV = 8,6%) e os valores mínimo e máximo indicam a não

existência de problemas amostrais com os dados.

Page 43: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 42

b) Semivariância e semivariograma

Os valores das distâncias h, das semivariâncias (γ(h)) e números de pares(n(h)) utilizados

no cálculo são apresentados abaixo.

Distâncias de cálculo, valores de semivariância e número de pares. Distância h (m) Semivariância (γ(h)) Número de pares (n(h))

20 2,129 31 40 1,417 30 60 2,500 29 80 2,214 28 100 2,037 27 120 2,327 26 140 2,120 25 160 2,396 24 180 2,065 23 200 2,545 22 220 2,738 21 240 2,825 20 260 2,711 19 280 1,778 18 300 2,735 17 320 1,719 16 340 3,367 15 360 1,857 14 380 2,808 13 400 2,375 12 420 2,318 11 440 2,400 10 460 1,056 9

A representação gráfica (semivariograma) das semivariâncias em função da distância h

(semivariograma experimental) e uma proposta de modelo ajustado aos dados

experimentais são apresentados na figura abaixo.

0.000

1.000

2.000

3.000

4.000

0 100 200 300 400 500

h (m)

sem

ivar

iânc

ia

Semivariograma experimental e modelo ajustado.

Page 44: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 43

O modelo proposto inicialmente é um modelo exponencial, com efeito pepita (C0)

de 1,0 (%)2, patamar (C0+C) de 2,3 (%)2 e alcance (a) de 120 m. (Observação: não foi

realizado nenhum teste para verificar se este é o melhor modelo de semivariograma para

esta variável).

Neste caso o semivariograma mostra uma dependência espacial para a % de areia

até 120 m, ou seja, amostras coletadas a distância inferiores a 120 m possui dependência

espacial e, no caso da utilização de métodos de análises estatísticas que consideram

independência entre amostras, à distância de amostragem mínima deveria ser de 120 m.

OBS: Exercício resolvido com o auxílio do MS-EXCEL

2) Utilizando os dados do exemplo anterior (exemplo1) refaça a análise utilizando o GS+

Solução:

a) Análise descriti va

b) Semivariograma

O modelo proposto pelo GS+ foi:

Page 45: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 44

O modelo proposto no exemplo 1 apresenta o seguinte resultado:

Comparando os dois modelos verifica-se ligeiro aumento de r2, mantendo-se o mesmo valor

de RSS, desta forma o modelo proposto no exemplo 1 poderia ser utilizado.

As descrições e discussões seguem o padrão do exemplo 1.

Lembre-se que o modelo adotado foi o exponencial e portanto o alcance efetivo será de

40,80 m no primeiro caso e de 120 m no segundo caso.

Outros modelos poderiam ser sugeridos neste caso.

Page 46: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 45

3) A seguir apresentamos as coordenadas X (m), Y (m) e a variável silte (%) em uma área

experimental.

X 0 0 0 0 0 0 0 0 10 10 10 10 10 10 10 10

Y 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70

PBPD 12.77 12.84 11.39 12.30 12.43 12.43 12.45 12.74 11.39 12.32 12.16 11.49 10.39 11.32 11.24 12.49

X 20 20 20 20 20 20 20 20 30 30 30 30 30 30 30 30

Y 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70

PBPD 11.25 11.97 12.38 12.85 12.55 12.49 12.58 12.82 12.49 11.67 11.59 12.72 11.12 11.18 11.53 11.48

X 40 40 40 40 40 40 40 40 50 50 50 50 50 50 50 50

Y 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70

PBPD 11.81 11.19 11.46 11.44 12.39 12.17 11.69 12.32 11.58 11.11 11.55 10.79 11.13 11.29 12.62 12.01

X 60 60 60 60 60 60 60 60 70 70 70 70 70 70 70 70

Y 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70

PBPD 12.66 11.49 11.25 12.87 12.77 11.95 11.96 11.11 10.81 11.65 12.36 11.90 12.16 12.56 12.54 11.46

Realizar a análise dos dados e verificar se existe dependência espacial para essa variável.

SOLUÇÃO:

a) Análise descriti va

O resultado das principais estatísticas dessa variável é apresentado a seguir:

Nota-se que a área apresenta, em média, 11,92% de silte, com dispersão média em torno

desse valor de 0,6302%. Esta dispersão em torno da média representa uma variabilidade de

5,29% (CV=5,29%), mostrando que os dados têm uma baixa dispersão. Os coeficientes de

assimetria e curtose com os respectivos erros padrão indicam tendência simétrica dos

dados, mas a curva do tipo platicúrtica, diferindo da curva normal (mesocúrtica). Com base

em uma análise visual do histograma, verifica-se uma distribuição de freqüências bimodal

para esta variável.

A distribuição das amostras na área segundo o valor de ocorrência é a seguinte:

Page 47: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 46

Não se observa tendências de concentração de valores em posições específicas da área e

também não ocorre sentido preferencial na distribuição dos dados, tal fato é um primeiro

indicativo de que a distribuição espacial dessa variável, nesta área, é aleatória e isotrópica.

b) Análise do semivariograma

A seguir é mostrado o semivariograma dessa variável:

Page 48: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 47

O modelo apropriado para descrever o comportamento espacial dessa variável foi o modelo

de efeito pepita puro. Nota-se que as semivariâncias experimentais estão em torno da linha

paralela ao eixo x, ou seja, C0 + C = 0,397. Conclui-se, portanto, que a distribuição espacial

do silte nesta área experimental é aleatória e as amostras, para a malha amostrada (com

distância entre pontos de 10 m), são independentes.

4) Os dados apresentados abaixo referem-se a umidade de um solo. As amostras foram

coletadas em uma malha contendo 63 pontos com espaçamento de 20 m entre amostra,

perfazendo 9 colunas e 7 linhas de amostragem.

X 20 40 60 80 100 120 140 160 180 20 40 60 80 100 120 140

Y 20 20 20 20 20 20 20 20 20 40 40 40 40 40 40 40

U 28.16 27.16 26.09 27.27 27.61 26.61 26.13 29.73 31.12 27.52 26.54 26.45 24.98 27.93 26.91 24.13

X 160 180 20 40 60 80 100 120 140 160 180 20 40 60 80 100

Y 40 40 60 60 60 60 60 60 60 60 60 80 80 80 80 80

U 27.80 29.69 28.40 27.63 27.42 26.81 26.37 28.61 27.66 30.17 28.86 26.58 26.03 26.72 27.50 26.44

X 120 140 160 180 20 40 60 80 100 120 140 160 180 20 40 60

Y 80 80 80 80 100 100 100 100 100 100 100 100 100 120 120 120

U 23.63 26.83 25.46 24.17 26.61 24.49 22.35 22.05 22.05 24.98 23.35 26.18 22.30 27.89 24.64 24.20

X 80 100 120 140 160 180 20 40 60 80 100 120 140 160 180

Y 120 120 120 120 120 120 140 140 140 140 140 140 140 140 140

PBPD 25.36 24.77 27.54 25.49 24.45 24.36 26.39 26.73 29.87 23.63 25.30 23.27 25.82 26.85 25.36

Realizar a análise dos dados e verificar se existe dependência espacial para essa variável.

Page 49: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 48

Solução:

a) Análise descriti va

As estatísticas e o histograma da variável umidade foram:

Verifica-se que este solo apresentou, na época de coleta, umidade média de 26, 24 g de

água/100g de solo, com desvio padrão de 2,020 g/100g, o que representa uma variabilidade

de 7,7%, considerada uma baixa variabilidade dos dados em torno do valor médio. Os

histogramas, associado à assimetria e à curtose dos dados, mostram que os dados se

distribuem segunda a curva normal.

As posições ocupadas pelos valores de umidade do solo na área experimental (figura

abaixo), mostram tendência de que os valores mais altos de umidade (acima de 27,50

g/100g) se concentrem na metade inferior da malha, considerando o eixo Y como referência

e, conseqüentemente, os valores abaixo de 27,50 g/100g se concentram na parte superior da

malha, mostrando uma distribuição espacial não aleatória dos dados. Não é possível

visualizar tendência de distribuição dos dados nas direções preferencias da malha, ou seja,

provavelmente exista uma isotropia na distribuição da umidade do solo nesta área.

Page 50: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 49

b) Análise do semivariograma

O semivariograma desta variável é:

Nota-se que a variável umidade do solo apresenta dependência espacial, que pode ser

descrita pelo modelo exponencial com alcance de 81 m, ou seja, amostras de umidade do

solo selecionadas a distâncias inferiores a 81 m estão correlacionadas entre si. A relação

entre o efeito pepita e o patamar de 13,63%, indica que a dependência espacial é forte.

Page 51: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 50

5. KRIGAGEM

5.1. O interpolador

O semivariograma é a ferramenta da geoestatística que permite verificar e modelar a

dependência espacial de uma variável. Uma aplicação imediata do semivariograma é a

utilização das informações geradas por ele na interpolação, ou seja, na estimativa de dados

e posterior mapeamento da variável. O interpolador que utiliza o semivariograma em sua

modelagem é chamado de krigagem. O nome krigagem é uma homenagem ao engenheiro

sul-africano D. G. Krige.

Para a aplicação da krigagem assume-se: que sejam conhecidas as realizações z(t1),

z(t2), ..., z(tn) da variável Z(t), nos locais t1, t2, ..., tn; que o semivariograma da variável já

tenha sido determinado; e que o interesse seja estimar um valor z* na posição t0.

O valor estimado z*(t0) é dado por:

)()(*1

0 ∑=

=n

iii tztz λ

em que: n é o número de amostras de Z(t) envolvidas na estimativa de z*(t0), e λi são os

pesos associados a cada valor medido, z(ti).

Observação: Se existe a dependência espacial, os pesos λi são variáveis de acordo com a

distância entre o ponto a ser estimado z*(t0) e os valores z(ti) envolvidos nas estimativas. Se

ocorre a independência espacial, então : λi = 1/n e, portanto temos a média aritmética

simples.

A melhor estimativa de z*(t0) é obtida quando:

a) o estimador é não tendencioso

0)}()(*{ 00 =− tztzE

b) a variância da estimativa é mínima

mínimotztzVar =− )]()(*[ 00

Para que z* seja uma estimativa não tendenciosa de z, a soma dos pesos das

amostras tem que se igualar a 1.

1=∑ iλ

Page 52: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 51

E para obter a variância mínima sob a condição de ∑λi = 1, introduz-se o

multiplicador de Lagrange para a dedução das equações e o sistema de krigagem resultante

é:

),(),( 01

tttt i

n

ijii γµγλ =+∑

=

em que: µ é o multiplicador de Lagrange.

A variância de estimativa é dada por:

),( 02 tt iiE γλµσ ∑+=

O sistema de equações da krigagem contém n+1 equações e n+1 incógnitas e uma

única solução produz n pesos λ e um multiplicador de Lagrange µ.

Em notação matricial, chamando de A a matriz das semivariâncias dos valores

amostrados envolvidos na estimativa de z*(t0); λλ a matriz coluna que contém os pesos λi e o

multiplicador de Lagrange e b a matriz coluna das semivariâncias entre os valores

amostrados e o ponto a ser estimado, tem-se:

Aλλ=b

E, portanto:

λλ=A-1b

A variância da estimativa (σE2) e dada por:

σE2 = btλλ

As matrizes A, b e λλ são:

A=

0111

1),(.....),(),(

....

....

....

1),(....),(),(

1),(....),(),(

21

22212

12111

nnnn

n

n

tttttt

tttttt

tttttt

γγγ

γγγγγγ

; b=

1

),(

.

.

.

),(

),(

0

02

01

tt

tt

tt

γγ

; λλ=

µλ

λλ

n

.

.

.2

1

Page 53: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 52

Observações:

i) A matriz A é simétrica e possui diagonal principal igual a zero, ou igual ao valor do

efeito pepita.

ii ) Os valores 1 que aparecem nas matrizes A e b são conseqüência do multiplicador de

Lagrange.

iii ) O sistema deve ser resolvido para cada estimativa z* e para cada variação do

número de amostras envolvidos na estimativa.

5.2. A kr igagem no programa GS+

A Figura 20 mostra a janela da krigagem no GS+. Para ativar a krigagem basta ativar o

ícone com a letra k.

Figura 20. Krigagem no GS+

A krigagem pode ser expressa por meio de mapas, sendo necessário para isto, ativar o ícone

map, tendo como resultado a Figura 21.

Informações sobre a malha

Arquivo e tipo de arquivo para gravar a krigagem

vizinhos

Método de krigagem

Modelo de semivariograma

Validação cruzada

Page 54: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 53

Figura 21. Opções de mapas no GS+

Exemplo: Utilizando os dados no exemplo de umidade do solo (exemplo 4) fazer a

krigagem e o mapeamento da variável umidade.

Solução:

Como exemplo de saída dos resultados da krigagem temos uma pequena parte dos

resultados da krigagem, os resultados apresentam com as coordenadas (x,y), os valores

krigados, os desvios padrão desses valores e o número de vizinhos utilizados na estimativa.

Page 55: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 54

O mapa da umidade do solo é apresentado a seguir:

Neste mapa são apresentadas as regiões de ocorrência das umidades do solo.

Page 56: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 55

6. SEMIVARIOGRAMA CRUZADO E COKRIGAGEM

6.1. Semivariograma cruzado

Os semivariogramas cruzados objetivam descrever a variação espacial e/ou temporal

simultânea de duas variáveis aleatórias. Na natureza é comum encontrar variáveis que estão

fortemente associadas entre si, por exemplo, a umidade relativa do ar está intimamente

relacionada à precipitação pluviométrica.

Em algumas situações a determinação de variáveis é cara e difícil e isto pode

comprometer o estudo da variabilidade espacial daquela variável, entretanto se sabemos que

existe uma outra variável de simples determinação e que apresenta boa correlação espacial

com a de difícil determinação pode-se fazer a estimativa de uma delas usando-se informações

de ambas expressas no semivariograma cruzado, por meio do método chamado co-krigagem.

Estaremos, neste caso, trabalhando com a idéia de covariável.

Consideremos duas variáveis {Z1(t1i), i=1,...,n1} e {Z2(t2j), j=1,...,n2} , com as

amostragens feitas no mesmo espaço (área ou tempo), mas que o número de amostras de Z1

seja superior ao número de amostras de Z2 (n1 >n2).

Assumindo que pelo menos a hipótese intrínseca está sendo atendida para cada

variável individualmente e para a distribuição conjunta das variáveis, podemos definir os

semivariograma individuais e os semivariogramas cruzados como:

Ai) Os semivariogramas de Z1(t1i) e Z2(t2j):

})t(Z- h)+t(Z{ E = (h) 21i11i111 2

1γ B

})t(Z- h)+t(Z{ E = (h) 22j22j222 2

1γ C

ii ) O semivariograma cruzado entre Z1(t1i) e Z2(t2i), igual ao semivariograma cruzado entre

Z2(t2j) e Z1(t1i):

)]}t(Z- h)+t(Z)][t(Z- h)+t(Z{[ E = )h( = (h) 2j22j21i12i12112 2

1γγ

D

Page 57: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 56

Portanto, a semivariância pode ser estimada por:

)]t(Z-h)+t(Z)][t(Z-h)+t(Z[2n(h)

1=(h) 2j22j21i11i1

n(h)

1=i12 ∑γ E

onde n(h) é o número de valores de Z1 e Z2 separados por um vetor h.

Pode-se notar que o semivariograma é um caso particular do semivariograma

cruzado, quando as duas variáveis são idênticas.

O semivariograma cruzado só será calculado usando as informações existentes para

posições geográficas coincidentes. Isto significa que Z1 e Z2 tem que ser, necessariamente,

definidos para os mesmos locais, e as informações excedentes não são consideradas no

cálculo.

Um semivariograma cruzado com características que podem ser identificadas como

ideais, teria aparência do semivariograma simples (de uma única variável, ou seja, patamar

definido, semivariância crescente para pequenas distâncias, modelo esférico), porém, com

significados diferentes, pelo simples fato de envolver o produto das diferenças de duas

variáveis diferentes. Por exemplo, ao contrário do semivariograma, não é obvio que o valor

do semivariograma cruzado para h=0, deva ser nulo. Assim, além de espaços menores do que

à distância de amostragem, acumulado no mesmo parâmetro, está à falta de correlação entre as

duas variáveis. O alcance aqui representa apenas o final ou a distância máxima de

dependência espacial entre as variáveis. Já o patamar do semivariograma cruzado, se existir,

deve aproximar-se do valor da covariância entre as duas variáveis. Assim, quando as duas

variáveis forem de correlação inversa, isto é, quando aumenta uma a outra diminui, a

covariância será negativa e, conseqüentemente, o semivariograma cruzado será negativo. Os

modelos utilizados para o semivariograma cruzado são os mesmos já discutidos para o

semivariograma simples.

6.2. Co-krigagem

A krigagem é um caso particular do método co-krigagem. Uma vez que exista a

dependência espacial para cada uma das variáveis Z1 e Z2, e que também exista dependência

espacial entre Z1 e Z2, então é possível utilizar a co-krigagem para estimar valores.

Page 58: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 57

Suponha que se queira estimar valores, Z2*, para qualquer local, t0, e que a estimativa

deva ser uma combinação linear de ambos Z1 e Z2, ou seja,

)t(z2

+ )t(z = )(tz 2j22j

n

1=i1i11i

n

1=i

*2 λλ ∑∑

10 F

onde n1 e n2 são os números de vizinhos de Z1 e Z2, respectivamente, e λ1i e λ2j são os pesos

associados a cada valor de Z1 e Z2. Tomando z1(t1i) e z2(t2i) como sendo uma realização das

funções aleatórias, Z1(t1i) e Z2(t2i), respectivamente, e assumindo estacionaridade de ordem 2,

o estimador pode ser reescrito em:

)( tZ2

+ )t(Z1

= )(tZ 2j22j

n

1=i1i11i

n

1=io

*2 λλ ∑∑ G

Para que o estimador seja ótimo, ele não pode ter tendência e tem que ter variância

mínima. Em outras palavras, para que o estimador seja o melhor possível, é necessário que ele

não superestime nem subestime valores, e que a confiança nas estimativas seja máxima.

O raciocínio básico para dedução do sistema de equações da co-krigagem é idêntico

ao da krigagem, com uma diferença que, neste caso, envolve duas variáveis, e por isto envolve

equações mais longas, com subscritos, complicando um pouco mais a situação. Porém, o

raciocínio e, por conseguinte, a álgebra envolvida, são o mesmo.

Para que a estimativa não tenha tendência, qualquer que seja a distribuição dos pesos,

a soma daqueles associados com a variável estimada deve ser igual a 1, e a soma daquelas

associadas à outra variável, tem que ser nula.

O sistema co-krigagem e a variância da estimativa podem ser escritos em termos de

semivariograma, usando a hipótese de estacionaridade de ordem 2. Assim, o sistema da co-

krigagem, em termos de semivariograma fica:

Page 59: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 58

n1,... = k ),t,t(=

=-)t,t(2

+)t,t(1

101k12

12j1k122j

n

1=j1k1i121i

n

1=i

γ

µγλγλ ∑∑

H

1 =

0 =

2jN

1=j

1iN

1=i

202l22

22l2j222jn

1=j2l1i121i

n

1=i

2

1

n1,... = l ),t,t(=

=-)t,t(2

+)t,t(1

λ

λ

γ

µγλγλ

∑∑

I

e a variância da estimativa fica:

)t,t(2

+)t,t(1

++=)t2( 02j222j

n

1=j01i121i

n

1=i2102

k γλγλµµσ ∑∑ J

A solução do sistema da co-krigagem produzirá n1 pesos λ1i e n2 pesos λ2j e os

multiplicadores Lagrangeanos, µ1 e µ2.

O sistema da co-krigagem pode ser escrito em notação matricial como,

[ ] [ ] = [b]λ γ K

cuja solução é

Page 60: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 59

[ ] = [ ] [b]-1λ γ L

onde [γ]-1 é o inverso da matriz de coeficientes [γ], [λ] é a matriz dos pesos procurados, λ1i e

λ2j, e [b] é o lado direito do sistema de equações (semivariância do ponto a ser estimado (t0) e

o ponto observado (t12 ou t21)).

A variância da estimativa pode ser escrita como:

[b] ][ = )t( t02

k2 λσ M

onde [λ]t é o transposto da matriz [λ].

Suponha então que o número de vizinhos de Z2 usados seja n2=2, e de Z1, n1=4. A

matriz [γ] será então de 8x8 e pode ser escrita como:

00110000

00001111

10)t,t()t,t()t,t()t,t()t,(t)t,t(

10)t,t()t,t()t,t()t,t()t,t()t,t(

01)t,t()t,t()t,t()t,t()t,t()t,t(

01)t,t()t,t()t,t()t,t()t,t()t,t(

01)t,t()t,t()t,t()t,t()t,t()t,t(

01)t,(t)t,t()t,t()t,t()t,t()t,t(

2222222122222214122213122212221112

222122212122211412211312211212211112

221412211412141411141311141211141112

221312211312131411131311131211131111

221212211212121411121311121211121111

2212211112111411111311111211111111

γγγγγγ

γγγγγγ

γγγγγγ

γγγγγγ

γγγγγγ

γγγγγγ

12

11

A matriz [λ] poderá ser escrita como

[ ] =

11

12

13

14

21

22

1

2

λ

λλλλλλµµ

Page 61: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 60

N

A matriz [b] do lado direito fica,

)t,t(

)t,t(

)t,t(

)t,t(

)t,t(

)t,t(

=[b]

02222

02122

01412

01312

01212

01112

γγγγγγ

6.3. Var iância da estimativa

O simples fato de que, através da krigagem ou da co-krigagem, pode-se conhecer

também a variância da estimativa, diferencia-os de qualquer outro método. Esta é uma

propriedade interessantíssima, pois, além de permiti r a estimativa de valores sem tendência

para os locais onde estes não foram medidos, ainda se pode conhecer a confiança associada a

estas estimativas, as quais podem ser chamadas de ótimas.

Quanto menor for o efeito pepita do semivariograma, menor será a variância da

estimativa. Mais precisamente, quanto menor for a proporção do efeito pepita para o patamar

do semivariograma, maior a continuidade do fenômeno, menor a variância da estimativa ou

maior a confiança que se pode ter na estimativa.

Examinando-se as equações relativas aos cálculos das variâncias da estimativa de

krigagem e co-krigagem, respectivamente, nota-se que são apenas indiretamente dependentes

dos valores medidos. Isto porque, o semivariograma e semivariogramas cruzados,

representam a maneira como a variável regionalizada varia de um local para o outro no

espaço, e os pesos são conseqüências deste fato. Porém, uma vez que se conhece o

semivariograma de uma propriedade, qualquer tipo de esquema de amostragem pode ser

desenhado para variâncias da estimativa pré-especificadas. Obviamente, a variância da

estimativa sendo uma função da distância ou distribuição espacial das amostras, será máxima

Page 62: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 61

nos locais mais distantes de valores medidos. Assim, baseado em semivariogramas de

variáveis medidas em caráter de reconhecimento, amostragens definitivas podem ser

desenhadas para satisfazer condições pré-especificadas. A localização ideal de uma rede de

pluviômetros em bacias hidrográficas constitui um exemplo prático desse procedimento. O

mesmo pode também ser utilizado através da co-krigagem, ambos, com algumas complicações

e vantagens. A principal complicação é que neste caso, depende-se de três correlações

espaciais (de cada variável, individualmente, e entre elas), o que não é sempre fácil.

Entretanto, quando as variáveis são amostradas em espaçamentos diferentes, haverão pontos

onde apenas a variável auxiliar foi medida. Para estes pontos, quase sempre a variância da

estimativa da co-krigagem é melhor do que a da krigagem. Com esta vantagem em mente,

pode-se desenhar esquemas de amostragem que envolvam ambas as variáveis, em densidades

de amostragem bem diferentes, de acordo com o grau de dependência espacial encontrado e a

dificuldade de medição.

Qualquer que seja o método, krigagem ou co-krigagem, a variância da estimativa é

extremamente sensível à forma do semivariograma ou semivariograma cruzado. Baseado na

discussão acima, o mapa de isolinhas ou tridimensional de uma variável usando valores

estimados através de um dos métodos geoestatísticos deve ser sempre acompanhado pelo

mapa correspondente da variância da estimativa, para que se possa visualizar os locais onde a

confiança na estimativa é limitada ou é suficiente. Entretanto, uma vez que a variância da

estimativa é uma função indireta da distância dos vizinhos ao redor do local da estimativa,

então em amostragens tomadas em distâncias regulares no reticulado quadrado, o mapa da

variância da estimativa será, simplesmente, uma coleção de círculos, com maiores valores

onde o ponto estimado é mais distante. Nesses casos, o mapa da variância tem pouca utilidade

e o exame de células compostas de vizinhos fechando o primeiro polígono em volta do valor

estimado, mostrando a variância da estimativa, ilustra este ponto suficientemente bem.

Page 63: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 62

6.4 Número de vizinhos das estimativas

A vizinhança usada na estimativa torna-se um ponto de extrema importância na

krigagem. Vários são os métodos que podem ser utilizados para a determinação do número de

vizinhos na estimativa, cada um com vantagens e desvantagens como será discutido em

seguida. Qualquer que seja o critério usado para a escolha do método, deve-se levar em conta

o ganho de precisão em relação ao aumento de tempo de computação.

a) Vizinhança única

Quando o tamanho do conjunto de dados, em termos de número de amostras

disponíveis tiver tamanho razoável, relativo à quantidade de memória e tempo de

processamento disponíveis no computador, pode-se usar o procedimento chamado vizinhança

única. Neste procedimento todos os valores medidos são considerados vizinhos e serão

utilizados na estimativa. Deve-se sempre lembrar que a decisão de se usar vizinhança única

basea-se em sua praticidade relativa ao tamanho do conjunto de dados e não na precisão obtida

na estimativa. A razão para tanto reside no alcance do semivariograma, pois os pesos

associados a vizinhos separados por distâncias maiores do que o alcance, não devem ter

contribuição significativa no valor estimado. Outro ponto importante é que, para se usar

vizinhança única, é necessário que o semivariograma seja definido até a maior distância

existente no espaço.

A vantagem deste método reside no fato que, uma vez invertida a matriz de

coeficientes, então as estimativas podem ser feitas para qualquer espaçamento com um

pequeno consumo de tempo de processamento de computador. Desse modo, a matriz

invertida pode ser arquivada no computador e usada quantas vezes for necessário, desde que

não mude o modelo do semivariograma e distribuição dos pontos amostrados no espaço.

Existem algumas variáveis que, embora mudem as magnitudes de variação, preservam entre si

a maneira como variam no espaço, apresentando semivariogramas que podem ser agrupados

em um único, quando divididos individualmente, pelas respectivas variâncias. Como exemplo

pode-se incluir umidade do solo amostrada em pequenos espaços de tempo. Nesse caso então,

Page 64: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 63

as vantagens da vizinhança única aumentam porque modelos de semivariograma escalonados

podem ser usados para obter pesos comuns a todas as variáveis.

b) Distância constante

Neste método, para cada ponto estimado é selecionada uma vizinhança constando de

todos os vizinhos localizados dentro de um circulo de raio especificado. Conseqüentemente,

nos cantos de um campo retangular ocorre 1/4 de círculo, com 1/4 do número de vizinhos. A

grande vantagem deste método está no fato que se conhece exatamente a distância na qual os

vizinhos para estimativa são procurados. Isto é particularmente importante porque se pode

limitar o uso do semivariograma quanto à distância sobre qual ele será calculado. Por outro

lado, o número de vizinhos pode mudar bastante ao longo do campo, fazendo com que o

tamanho do sistema matricial seja variável. Em termos de programação de computador, isto

pode se tornar um problema se exceder o valor usado na dimensão das matrizes.

c) Número constante de vizinhos

Um outro método bastante usado é o que mantém constante o número de vizinhos em

qualquer posição no campo. Para tanto, vizinhos são procurados, primeiramente dentro de um

raio inicial. Se o número de vizinhos encontrados for menor do que o limite especificado, a

distância é incrementada, e o processo é reiniciado. Se, pôr outro lado, o número encontrado

for maior do que o limite, apenas o número especificado mais próximo será usado.

Conseqüentemente, a distância sobre a qual se procura vizinhos varia sobre o campo.

Obviamente, as vantagens deste método são as desvantagens do anterior (distância constante)

e vice-versa. Porém, em situações em que a amostragem foi efetuada em espaçamentos

regulares, a distância de procura por vizinhos não muda muito e as desvantagens deste método

são minimizadas. Devido as amostragens regulares serem as mais usadas e as facilidades

inerentes deste método, fazem dele o mais comumente usado.

Page 65: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 64

d) Quadrantes

Uma alternativa interessante e bastante fundamentada em termos geoestatísticos é

usar um número especificado de vizinhos em cada quadrante ao redor do valor a ser estimado.

O fundamento reside na distribuição do número de vizinhos ao redor do valor estimado, o que

fará com que a estimativa receba contribuição semelhante em número, de todas as direções.

Muitas vezes quando não se impõe esta restrição, pode-se despercebidamente, utilizar

tendenciosamente sempre um número maior de vizinhos de um lado do que de outro. Porém,

isto ainda apresentaria problemas nos cantos e extremidades da área, e também o problema de

que nunca se sabe qual a distância na qual os vizinhos se localizam. Por estas razões este

método apresenta mais problemas do que vantagens.

6.5. O uso do programa GS+ na determinação do semivar iograma cruzado, da co-

kr igagem e no mapeamento da var iável.

Temos duas variáveis aleatórias Z1 e Z2, suponha que a variável Z1 teve uma

subamostragem em relação a Z2 e que elas apresentam semivariogramas definidos

isoladamente e que também apresentem distribuição espacial conjunta, ou seja, correlação

espacial, então podemos proceder a análise do semivariograma cruzado e da co-krigagem. O

arquivo de dados terá aspecto apresentado na Figura 19.

Os procedimentos gerais da análise de semivariogramas cruzados e de co-krigagem

segue os mesmos procedimentos das análises simples. Deve-se ressaltar que se faz as análises

individuais das variáveis e depois a análise conjunta.

Page 66: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 65

Figura 19. Aspecto geral do arquivo de dados para a co-krigagem.

As Figuras 20, 21 e 22 mostram os procedimentos básicos para se trabalhar com

semivariogramas cruzados e co-krigagem.

Figura 20. Ícones ativos nas análises descritivas, semivariogramas simples, semivariogramas

cruzados, krigagem/co-krigagem e mapas.

Ferramentas de análises descritivas das variáveis Z1, Z2 Semivariograma

da variável 1

Semivariograma da variável 2

Semivariograma Cruzado

Krigagem e co-krigagem

Mapas

Page 67: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 66

Figura 21. Janela para a análise do semivariograma cruzado

Figura 22. Janela para realização da co-krigagem

Page 68: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 67

6.6. Exemplo de aplicação no GS+

Suponha que os seguintes dados represente as observações de macroporosidade e de umidade

de saturação em uma determinada área.

x y macro usat x y macro

Usat

0.00 0.00 16.07 43.19 40.00 0.00 24.66 57.30 0.00 10.00 21.98 48.61 40.00 10.00 13.89 47.39 0.00 20.00 35.50 40.00 20.00 15.45 46.03 0.00 30.00 25.11 56.49 40.00 30.00 24.37 52.26 0.00 40.00 33.89 63.62 40.00 40.00 49.29 0.00 50.00 18.52 47.90 40.00 50.00 30.51 58.55 0.00 60.00 37.32 65.89 40.00 60.00 43.89 0.00 70.00 54.11 40.00 70.00 37.08 10.00 0.00 16.91 47.23 50.00 0.00 23.59 52.84 10.00 10.00 10.44 40.70 50.00 10.00 50.27 10.00 20.00 17.80 45.06 50.00 20.00 29.69 58.20 10.00 30.00 22.34 52.04 50.00 30.00 45.85 10.00 40.00 55.95 50.00 40.00 29.01 59.18 10.00 50.00 13.53 45.72 50.00 50.00 22.16 52.06 10.00 60.00 43.26 50.00 60.00 45.67 10.00 70.00 20.88 49.98 50.00 70.00 46.45 20.00 0.00 45.31 60.00 0.00 14.14 40.65 20.00 10.00 20.67 53.27 60.00 10.00 28.29 56.86 20.00 20.00 24.14 59.00 60.00 20.00 26.38 56.04 20.00 30.00 28.47 61.94 60.00 30.00 28.42 57.23 20.00 40.00 25.16 55.59 60.00 40.00 24.91 57.56 20.00 50.00 25.88 53.81 60.00 50.00 26.90 52.29 20.00 60.00 49.60 60.00 60.00 46.55 20.00 70.00 25.65 54.44 60.00 70.00 44.15 30.00 0.00 54.07 70.00 0.00 25.82 52.15 30.00 10.00 11.40 40.00 70.00 10.00 22.30 50.35 30.00 20.00 40.18 70.00 20.00 25.64 53.94 30.00 30.00 21.01 59.21 70.00 30.00 22.79 51.72 30.00 40.00 14.79 46.62 70.00 40.00 18.20 48.55 30.00 50.00 18.03 49.89 70.00 50.00 27.55 53.65 30.00 60.00 50.14 70.00 60.00 45.91 30.00 70.00 14.39 44.43 70.00 70.00 23.37 51.85

Page 69: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 68

Faça a análise da macroporosidade usando como covariável a umidade de saturação.

Solução:

A análise descriti va geral para as variáveis analisadas é apresentada na Tabela

abaixo.

Verifica-se que a umidade de saturação apresenta maior uniformidade (menor CV)

do que a macroporosidade. Os coeficientes de assimetria e de curtose mostram tendência

simétrica e mesocúrtica das variáveis, portanto, pode-se considerar tais variáveis com

distribuição de probabilidade aproximadamente normal.

Analisando a relação linear entre a macroporosidade e a unidade de saturação,

obteve-se um coeficiente de correlação linear (r) de 0,9132, indicando que existe uma forte

associação positi va entre macroporosidade e umidade de saturação e, portanto, estimativas

da macroporosidade podem ser feitas com base na umidade de saturação.

Análise descriti va dos atributos umidade de saturação do solo (USat) e macroporos

(MACRO).

Atributos Estatísticas

Usat (%) MACRO (%)

n 64 45

Média 50,54 22,50

Desvio Padrão 6,41 5,98

Coef. de Variação 12,68 26,57

Coef. de Assimetria -0,02 -0,02

Coef. de Curtose -0,31 -0,33

As Figuras mostram os semivariogramas individuais para as variáveis umidade de

saturação (USat) e macroporos e o semivariograma cruzado da MACRO, usando como co-

variável a USat.

Page 70: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 69

Semivariograma para a umidade de

saturação do solo (USat).

Semivariograma para a macroporosidade do

solo

Semivariograma cruzado da macro em

função da umidade de saturação.

Para a umidade de saturação ajustou-se o modelo exponencial com alcance da

dependência espacial de 34,20 m, efeito pepita de 9,49 (%)² e patamar de 38,59 (%)². Para a

macroporosidade (MACRO) o modelo adotado foi o esférico, com alcance de 45,0 m,

efeito pepita de 19,70 (%)² e patamar de 38,7 (%)². E para o semivariograma cruzados as

estimativas dos parâmetros do modelo exponencial foram: alcance de 23,40 m; efeito pepita

de 6,97 (%)² e patamar de 34,08 (%)².

Verifica-se que a utilização da umidade de saturação, como uma co-variável para a

estimativa da macroporosidade, provocou alteração no alcance da dependência espacial,

mas ainda assim verifica-se que, a correlação espacial deve ser considerada para a

realização das estimativas. A alteração do alcance pode estar relacionado aos modelos

individuais diferenciados.

Page 71: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 70

As Figuras a seguir mostram os mapas da macroporosidade do solo, construídos a

partir da krigagem e da co-krigagem, ou seja, com base no semivariograma individual e

cruzado.

Mapa da macroporosidade do solo usando

semivariograma individual

Mapa da macroporosidade do solo, usando

semivariograma cruzado

Verifica-se coincidência relativamente alta entre as áreas de ocorrência da

macroporosidade. Devido ao processo de estimativa por co-krigagem algumas regiões são

subestimatadas e outras regiões são superestimadas.

7. VALIDAÇÃO DE MODELOS DE SEMIVARIOGRAMAS

O ajuste do semivariograma, como já comentamos, é um procedimento que fica a

critério do pesquisador, mas geralmente é feito "a sentimento". Para este tipo de ajuste

podemos utilizar algumas técnicas chamadas de validação cruzada ou de auto validação para

selecionar o semivariograma adequadamente. Recomenda-se que se ajuste vários modelos e

que seja selecionado o que melhor se adeque aos seguintes critérios:

a) O gráfico 1:1 - Medido vs Estimado

Se para cada um dos n locais onde se tem um valor medido Z(xi), estima-se um valor

através da krigagem (ou da co-krigagem), Z*(ti), então poder-se-á fazer um gráfico dos valores

pareados de Z(ti), Z*(ti) e calcular a regressão linear entre eles. A regressão será então:

Page 72: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 71

)t Z(b+a = )t(Z ii*

onde a é a intercessão, b é o coeficiente angular da reta e r2 é o coeficiente de correlação entre

Z*(xi) e Z(xi).

Assim, se a estimativa (Z*(xi)) fosse idêntica ao valor medido (Z(xi)), então a seria

nulo, b e r2 seriam iguais à unidade (um), e o gráfico de Z(xi) vs Z*(xi) seria uma série de

pontos na linha 1:1. Na medida em que os valores de a aumentam de 0 (zero) para valores

positivos, isto indica que estimador Z*(xi) está superestimando valores pequenos de Z(xi) e

subestimando valores grandes. À medida que a decresce de 0 (zero) para valores negativos, o

contrário acontece. Este último caso, porém, não é comum.

Desse modo, a qualidade da estimativa pode ser medida pelo julgamento destes

parâmetros.

b) O erro absoluto

Uma vez que se tem o conjunto de n valores medidos e estimados, Z(xi) e Z*(xi),

então pode-se definir o erro absoluto como:

EA( x ) = Z ( x )- Z( x )i*

i i O

Aplicando-se as condições de não tendência e de variância mínima, nos erros

absolutos, pode-se então dizer que:

EA = E {EA( x )} = E { Z ( x )- Z( x )} = 0i*

i i P

e

VAR( EA) = E {( Z ( x )- Z( x ) ) } = mÍnima*i i

2

Q

Se estas condições não forem satisfeitas, então alguma das condições previamente

assumidas estará sendo violada. Porém, a equação é bastante difícil de ser verificada porque o

conceito de ser mínimo torna-se subjetivo quando não se tem uma referência. O procedimento

seguinte pode contribuir nesse sentido.

Page 73: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 72

c) Erro reduzido

Lembrando que no cálculo dos valores estimados, Z*(xi), sempre se tem a variância

da estimativa, σ2k(ti), então pode-se definir o erro reduzido como:

)t())/tZ(-)(tZ( = )tER( ikii*

i σ R

A divisão pela raiz quadrada da variância da estimativa faz com que os ER(ti) sejam

sem dimensão e que, por isso, as condições de não tendência e de variância mínima, requeiram

que:

ER = E {ER( x )} = E {( Z ( x )- Z( x )) / ( x )} = 0i*

i i k iσ S

e

VAR( ER) = E {( Z ( x )- Z( x )) / ( x ) } = 1*i i k 0

2σ T

Estas propriedades fazem deste tipo de erro uma valiosa ferramenta e de fácil uso,

nas aplicações de geoestatística. O fato de terem valores ideais fixos em 0 (zero) e 1 (um), e

de serem sem dimensão, facilita seu julgamento e estudo, e também permite sua comparação

com outras situações expressas em unidades diferentes.

A Figura 23 mostra uma saída da opção de validação cruzada apresentada pelo

programa GS+. A validação cruzada é ativada na janela da Krigagem, conforme mostram a

Figuras 20 e 22.

Page 74: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 73

Figura 23. Validação cruzada.

Note, neste caso, que a reta ajustada está praticamente igual a reta a 45º (Gráfico

1:1), o coeficiente de regressão (coeficiente angular) de 0,944 com erro padrão de 0,105

indica que este é estatisticamente igual a 1 e o y intercept (coeficiente linear) de 0,024

mostra que este pode ser considerado estatisticamente igual a zero, condições estas ótimas

para as estimativas. O coeficiente de determinação (r2) de 0,39 é considerado relativamente

baixo, mas devido ao grande número de observações e sabendo-se que este coeficiente é

altamente influenciado pelo número de pares, podemos considera-lo como satisfatório.

Também pode-se verificar, pelo gráfico, que os valores extremos é que estão mais afastados

da reta e podemos associar isto ao fato do semivariograma geralmente apresentar melhores

estimativas para distâncias curtas.

A análise da validação cruzada deve ser feita com base em todos os parâmetros e

não com base em parâmetros isolados.

Page 75: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 74

8. BIBLIOGRAFIA RECOMENDADA

BARTLETT, M.S. Nearest neighbour models in the analysis for field experiments (with discussion). Journal of the Royal Statistical Society. B, London, v.40, n.2, p.147-174, 1978. BRAGA, L. P. V. Geoestatística e aplicações. Minicurso do 9o Simpósio Brasileiro de Probabilidades e Estatística. IME. USP. São Paulo, 1990. 36 p. BURROUGH, P. A.; McDONNELL, R. A. Principles of geographical information systems. Oxford University Press, 331 p., 1998. BUSSAB, W. O.; MORETTIN, P. A . Estatística básica. 4a ed.. São Paulo : Atual, 1987. 321 p. CADIMA, Z. A.; LIBARDI, P. L.; REICHARDT, K. Variabilidade espacial da condutividade hidráulica em latossolo Vermelho Amarelo textura média, no campo. Revista Brasileira de Ciência do Solo, Campinas, v. 4, n. 2, p. 63-66, 1980. CAMERON, D. R. Variability of soil water retention curves and prepicted hydraulic conductives on a small plot. Soil Science. Baltimore, v.126, n.6, p. 364-71, 1978. COSTA NETO, P. L. Estatística. São Paulo: Edgard Blucher, 264 p., 1979. CRESSIE, N.; HARTFIELD, M.N. Conditionally specified gaussian model for spatial statistical analysis of field traits. Journal of Agricultural, Biological, and Environmental Statistics, Washington, v.1, n.1, p.60-77, Mar. 1996. DAVID, M. Geostatistical ore reserve estimation. Elsevier. New York, v. 8, 364 p., 1977. DUARTE, J.B. Sobre o emprego e a análise estatística do delineamento em blocos aumentados no melhoramento genético vegetal. 2000 293p. (Tese - Doutorado em Genética e Melhoramento de Plantas) – ESALQ-USP, Piracicaba. FREITAS, V. A. de. Análise de dados espaciais por meio de semivariogramas. Uberlândia. Monografia (Graduação em Matemática) – Universidade Federal de Uberlândia, 2000. 30p. GOMES, B. M. Comportamento espacial do percentil 75 da precipitação decendial do estado de São Paulo. Botucatu. Tese (Doutorado em Agronomia) – Universidade Estadual Paulista “Júlio de Mesquita Filho” , Faculdade de Ciências Agronômicas Campus de Botucatu, 2001. 101p. GOTWAY, C. A.; FERGUSON, R. B.; HERGERT, G. W.; PETERSON, T. A. Comparasion of kriging and inverse-distance methods for mapping soil parameters. Soil Science Society America Journal. v. 60, p. 1237 – 1247, 1996.

Page 76: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 75

GUIMARÃES, E. C. Variabilidade espacial da umidade e da densidade do solo em um Latossolo Roxo. Campinas, SP, 1993. 135 p. Dissertação (Mestrado em Engenharia Agrícola - Área de concentração: Água e Solo) - Faculdade de Engenharia Agrícola, Universidade Estadual de Campinas. GUIMARÃES, E. C. Variabilidade espacial de atributos de um Latossolo Vermelho Escuro textura argilosa da região do cerrado, submetido ao plantio direto e ao plantio convencional. Tese (Doutorado). FEAGRI/UNICAMP. Campinas, 2000. 85 p. GUIMARÃES, E. C.; AQUINO, L. H. de; OLIVEIRA, M. S. Variabilidade espacial do pH em água e da argila dispersa em água. Revista Ciência e Prática. Lavras, v. 19, n.1, p. 12-17, 1992. ISAAKS, E. H.; SRIVASTAVA, R. M. Applied Geostatistics. New York : Oxford University Press, 1989. LOPES, P. A. Probabilidades e Estatística. Rio de Janeiro: Reichmann & Affonso Editores, 1999. MARTINEZ, R.B. Control de la correlation especial en experiments de campo em el sector agricola. Agronomia Colombiana. v.11, n.1, p.83-89, 1994. MATHERON, G. Principles of geostatistics. Economic Geology. El Paso, V. 58, p. 11246-66,

1963. MATHERON, G. The theory of regionalized variables and its applications. Les Cahiers du Centre de Moffologie mathemathique. Fas. 5. C. G. Fontainebleau, 1971. McBRATNEY, A. B.; WEBSTER, R. Choosing functions for semivariograms of soil proprierties and fitting them to sampling estimates. Journal of Soil Science, v. 37, p.617-639, 1986. PANNATIER, Y. Variowin – Software for spatial data analysis in 2D. New York: Springer-Verlag, 1996. 90 p.. PAPADAKIS, J. Method statistique pour des expériences sur champ. Bull . Inst. Amélior. Plantes à Salonique. n.23, 1937. PIMENTEL GOMES, F. Curso de estatística experimental. Piracicaba: Nobel, 1995. REICHARDT, K.; VIEIRA, S. R.; LIBARDI, P. L. Variabilidade espacial de solos e experimentação de campo. R. bras. Ci. Solo. Campinas, v. 10, n. 1, p. 1-6, 1986. ROBERTSON, G. P. GS+: geostatistics for the environmental sciences. Plainwell: Gamma Design Software,1998, 152 p..

Page 77: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 76

TEIXEIRA, F. das C. Analise estatística espacial aplicada a um ensaio florestal. Dissertação de mestrado. UFLA. 73 p. 2001. TRAGMAR, B. B.; YOST, R. S.; UEHARA, G. Application of geostatistics to spatial studies of soil properties. Advances in Agronomy. v. 38, p. 45-93, 1985. TRIOLA, M. F. Introdução à estatística. Rio de Janeiro: LTC. 7a edição, 1999. VIEIRA, S. R. Curso de atualização em conservação do solo - Uso de geoestatística. Campinas, IAC, v. 1 e 2, 1995. VIEIRA, S. R. Variabilidade espacial de argila, silte e atributos químicos em parcela experimental de um Latossolo Roxo de Campinas (SP). Bragantia. Campinas, v. 56, n.1, 1997. VIEIRA, S. R.; GUIMARÃES, E. C.; DECHEN, S. C. F.; DE MARIA, I. C.; ROCHETE, P.; TOPP, G. C.; ZEBCHUK, W. Analisando simultaneamente variabilidade espacial e temporal usando variogramas tridimensionais. In: XIII Congresso Latino-Amaericano de Ciência do Solo - Resumos expandidos em CD-ROOM. T01-053. Águas de Lindoia, SP: SBCS/ESALQ-USP, 1996. VIEIRA, S. R.; HATFIELD, J. L.; NIELSEN, D. R.; BIGGAR, J. W. Geostatistical theory and application to variability of some agronomical properties. Hilgardia. Berkeley, v. 31, n. 3, 1983. 75 p. VIEIRA, S. R.; LOMBARDI NETO, F.; BURROWS, I. T. Mapeamento da chuva diária máxima provável para o estado de São Paulo. R. bras. Ci. Solo. Campinas, v.15, n.1, p. 93-98, 1991. VIEIRA, S. R.; TILLOTSON, P. M.; BIGGAR, J. W.; NIELSEN, D. R. Scaling of semivariograms and the kriging estimation of field-measured prorperties. Revista Brasileira de Ciência do Solo. Viçosa, v.21, n. 4, 1997. WARRICK, A. W.; MYERS, D. E.; NIELSEN, D. R. Geostatistical methods applied to soil science. In: Methods of soil analysis: part 1 – Physical and mineralogical methods. Soil Science Society of America, p. 53-82, 1986. ZIMMERMAN, D.I.; HARVILLE, D.A. A random field approach to the analysis of field-plot experiments and other special experiments. Biometrics, Raleigh, v.47, n.1, p.233-239, mar. 1991

Page 78: Apostila de Geoestatistica

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 77

OBSERVAÇÃ O: Página na internet para busca de artigos, programas, livros e outros assuntos de geoestatística: http://www.famat.ufu.br/ednaldo/ednaldo.htm http://www.rc.unesp.br/igce/aplicada/landim.html http://musis.sites.uol.com.br/geo1.htm http://sc-terre-218.unil.ch/ http://www.ai-geostats.org/