Apresentação do PowerPointluciene/files/2019_GA126_aula5.pdf1. Calcular a média 𝜇= σ𝑖=1 𝑛𝑥 𝑖 2. Calcular o desvio padrão 𝜗= σ𝑖=1 𝑛 𝑥 𝑖−𝜇2 𝑛

CARTOGRAFIA TEMÁTICAProf. Luciene S. Delazari

Departamento de Geomática

Curso de Engenharia Cartográfica e de Agrimensura - 2019

Classificação de dados

Desvio Padrão

Considera como os dados estão distribuídos linearmente. Asclasses são formadas pela soma ou subtração repetitiva dos valoresdo desvio padrão da média dos dados.

Enquanto a média é uma medida de posição, o desvio-padrão éuma medida de distância (ou dispersão).

O cálculo dos limites é feito considerando a média e o desviopadrão, para uma distribuição normal. Para criar a legenda oslimites calculados são ajustados de modo que valores iguais nãocaiam em classes diferentes e que o limite superior da classe maisalta reflita o mais alto valor dos dados.


Desvio Padrão


Desvio Padrão

O método é bom para ver quais feições estão acima ou abaixo damédia da distribuição. Aplicado quando os dados seguem adistribuição normal.

Desvantagens: o mapa não apresenta os valores, somente adistância dos valores em torno da média.

Valores altos muito discrepantes podem mascara o valor da médiada distribuição.


Desvio Padrão

1. Calcular a média

𝜇 =σ𝑖=1𝑛 𝑥𝑖

𝑁

2. Calcular o desvio padrão

𝜗 =σ𝑖=1𝑛 𝑥𝑖−𝜇

2

𝑛

3. Definir as classes: 1 < 𝜇 - 2𝜗

2 𝜇 - 2𝜗 a 𝜇- 1𝜗

3 𝜇 - 1𝜗 a 𝜇+ 1𝜗

4 𝜇 + 1𝜗 a 𝜇+ 2𝜗

5 >𝜇 + 2𝜗


Quebras máximas

Os valores são agrupados por sua similaridade aos outros. Osdados são ordenados do menor ao maior, as diferenças entre osvalores adjacentes são calculadas e as maiores diferenças servemcomo quebras das classes.

O gráfico de dispersão provê um a forma visual de realizar asquebras, pois as maiores diferenças numéricas criam maioresespaços em branco.

Vantagem: considera como os dados são distribuídos

relativamente fácil de calcular

Desvantagem: o método pode mascarar agrupamentos naturais, visto que as

diferenças entre os valores podem ser maiores.


Quebras naturais

Quebras naturais (Natural breaks) é um método que tentaminimizar a variância dentro da classe e maximizar as diferençasentre classes.

Deve ser construído o histograma de frequências e o gráfico dedispersão


Método Ótimo

Desenvolvido por George Jenks

Tem por objetivo formar grupos que sejam homogêneosinternamente e assegurar a heterogeneidade entre as classes

Utiliza uma medida para avaliar a classificação, que se baseia emencontrar a menor soma dos desvios quadrados das médias dasclasses


Método Ótimo

1. Calcular a média de todo conjunto e calcular a soma dos desviosquadrados de cada observação (SDAM – square deviations, arraymean);

2. Definir os limites das classes para a primeira iteração. Calcular a média das classes (Zc). Calcular os desvios para cada valor

da classes (xi-Zc), elevar ao quadrado e somar todos (SDCM –squared deviations, class means).

3. Calcular GVF (goodness of variance fit):

𝐺𝑉𝐹 =𝑆𝐷𝐴𝑀−𝑆𝐶𝐷𝑀

𝑆𝐷𝐴𝑀

4. O objetivo é maximizar o valor de GVF.

5. Repetir o procedimento até que GVF seja máximo.

Intervalos iguais

QuantisDesvio-padrão

Quebras máximas

Quebras naturais

Ótimo

Considera a distribuição dos dados P P B (a) B MB (b) MB

Fácil de entender MB MB MB MB MB B (c)

Fácil de calcular MB MB MB MB MB P (d)

Fácil de entender a legenda MB (e) P B P P P

Valores das legendas combinam com o intervalos dos dados nas classes

B MB B MB MB MB

Aceitável para dados ordinais NA A NA NA NA NA

Auxilia na seleção do numero de classes P P P P B MB

P – pobre B – Bom MB – Muito bom A –Aceitável NA – Não aceitável

(a) - Pobre se os dados não são normais(b) – embora as quebras sejam definidas subjetivamente os resultados são similares ao método ótimo(c) – algoritmo muito complexo de entender(d) – depende do algoritmo utilizado(e) – apropriado se números inteiros não são utilizados

Legenda(sem relação

entre os mapas)

Legenda(com relação

entre os mapas)

Documents

Apresentação do PowerPointluciene/files/2019_GA126_aula5.pdf1. Calcular a média 𝜇= σ𝑖=1 𝑛𝑥 𝑖 2. Calcular o desvio padrão 𝜗= σ𝑖=1 𝑛 𝑥 𝑖−𝜇2 𝑛