Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
CARTOGRAFIA TEMÁTICAProf. Luciene S. Delazari
Departamento de Geomática
Curso de Engenharia Cartográfica e de Agrimensura - 2019
Classificação de dados
Desvio Padrão
Considera como os dados estão distribuídos linearmente. Asclasses são formadas pela soma ou subtração repetitiva dos valoresdo desvio padrão da média dos dados.
Enquanto a média é uma medida de posição, o desvio-padrão éuma medida de distância (ou dispersão).
O cálculo dos limites é feito considerando a média e o desviopadrão, para uma distribuição normal. Para criar a legenda oslimites calculados são ajustados de modo que valores iguais nãocaiam em classes diferentes e que o limite superior da classe maisalta reflita o mais alto valor dos dados.
Classificação de dados
Desvio Padrão
Classificação de dados
Desvio Padrão
O método é bom para ver quais feições estão acima ou abaixo damédia da distribuição. Aplicado quando os dados seguem adistribuição normal.
Desvantagens: o mapa não apresenta os valores, somente adistância dos valores em torno da média.
Valores altos muito discrepantes podem mascara o valor da médiada distribuição.
Classificação de dados
Desvio Padrão
1. Calcular a média
𝜇 =σ𝑖=1𝑛 𝑥𝑖
𝑁
2. Calcular o desvio padrão
𝜗 =σ𝑖=1𝑛 𝑥𝑖−𝜇
2
𝑛
3. Definir as classes: 1 < 𝜇 - 2𝜗
2 𝜇 - 2𝜗 a 𝜇- 1𝜗
3 𝜇 - 1𝜗 a 𝜇+ 1𝜗
4 𝜇 + 1𝜗 a 𝜇+ 2𝜗
5 >𝜇 + 2𝜗
Classificação de dados
Quebras máximas
Os valores são agrupados por sua similaridade aos outros. Osdados são ordenados do menor ao maior, as diferenças entre osvalores adjacentes são calculadas e as maiores diferenças servemcomo quebras das classes.
O gráfico de dispersão provê um a forma visual de realizar asquebras, pois as maiores diferenças numéricas criam maioresespaços em branco.
Vantagem: considera como os dados são distribuídos
relativamente fácil de calcular
Desvantagem: o método pode mascarar agrupamentos naturais, visto que as
diferenças entre os valores podem ser maiores.
Classificação de dados
Quebras naturais
Quebras naturais (Natural breaks) é um método que tentaminimizar a variância dentro da classe e maximizar as diferençasentre classes.
Deve ser construído o histograma de frequências e o gráfico dedispersão
Classificação de dados
Método Ótimo
Desenvolvido por George Jenks
Tem por objetivo formar grupos que sejam homogêneosinternamente e assegurar a heterogeneidade entre as classes
Utiliza uma medida para avaliar a classificação, que se baseia emencontrar a menor soma dos desvios quadrados das médias dasclasses
Classificação de dados
Método Ótimo
1. Calcular a média de todo conjunto e calcular a soma dos desviosquadrados de cada observação (SDAM – square deviations, arraymean);
2. Definir os limites das classes para a primeira iteração. Calcular a média das classes (Zc). Calcular os desvios para cada valor
da classes (xi-Zc), elevar ao quadrado e somar todos (SDCM –squared deviations, class means).
3. Calcular GVF (goodness of variance fit):
𝐺𝑉𝐹 =𝑆𝐷𝐴𝑀−𝑆𝐶𝐷𝑀
𝑆𝐷𝐴𝑀
4. O objetivo é maximizar o valor de GVF.
5. Repetir o procedimento até que GVF seja máximo.
Intervalos iguais
QuantisDesvio-padrão
Quebras máximas
Quebras naturais
Ótimo
Considera a distribuição dos dados P P B (a) B MB (b) MB
Fácil de entender MB MB MB MB MB B (c)
Fácil de calcular MB MB MB MB MB P (d)
Fácil de entender a legenda MB (e) P B P P P
Valores das legendas combinam com o intervalos dos dados nas classes
B MB B MB MB MB
Aceitável para dados ordinais NA A NA NA NA NA
Auxilia na seleção do numero de classes P P P P B MB
P – pobre B – Bom MB – Muito bom A –Aceitável NA – Não aceitável
(a) - Pobre se os dados não são normais(b) – embora as quebras sejam definidas subjetivamente os resultados são similares ao método ótimo(c) – algoritmo muito complexo de entender(d) – depende do algoritmo utilizado(e) – apropriado se números inteiros não são utilizados
Legenda(sem relação
entre os mapas)
Legenda(com relação
entre os mapas)