89
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICPAL NO BRASIL Focando principalmente indicadores relacionados a Habitação, Educação, Trabalho e muito particularmente EMPREGO e RENDA. MÉTODOS QUANTITATIVOS DA PESQUISA EMPÍRICA Professor: Dr. Arnoldo José de Hoyos José Felipe Ferreira de Souza

Artigo de Teoria das Organizações - ADMINISTRAÇÃO | Programa de … · 10.1.5 ANOVA de H6 por Estado ..... 67 10.1.6 ANOVA de Educação por Estado ..... 68 10.1.7 ANOVA de E2_4

  • Upload
    dodat

  • View
    222

  • Download
    0

Embed Size (px)

Citation preview

PONTIFCIA UNIVERSIDADE CATLICA DE SO PAULO

FEA - FACULDADE DE ECONOMIA E ADMINISTRAO

PROGRAMA DE ESTUDOS PS-GRADUADOS EM

ADMINISTRAO

PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICPAL NO BRASIL Focando principalmente indicadores relacionados a Habitao, Educao, Trabalho e muito particularmente EMPREGO e RENDA.

MTODOS QUANTITATIVOS DA PESQUISA EMPRICA

Professor: Dr. Arnoldo Jos de Hoyos

Jos Felipe Ferreira de Souza

2

SUMRIO

1 INTRODUO .................................................................................................................... 5

2 OS DADOS .......................................................................................................................... 5

2.1 Os Indivduos .................................................................................................................... 5

2.2 As Variveis ..................................................................................................................... 6

3. ANLISE DAS VARIVEIS................................................................................................ 8

3.1 Variveis Categricas ....................................................................................................... 8

3.1.1 Varivel: Estados ................................................................................................... 8

4. ANLISE EXPLORATRIA DE DADOS ........................................................................ 11

4.1 Histograma ..................................................................................................................... 11

4.1.1 ISDM ....................................................................................................................... 11

4.1.2 EMPREGO E RENDA ............................................................................................ 13

4.1.3 R1 ............................................................................................................................ 14

4.1.4 T1_2 ......................................................................................................................... 15

4.1.5 H6 ............................................................................................................................ 16

4.1.6 EDUCAO ........................................................................................................... 17

4.1.7 E2_4 ......................................................................................................................... 18

4.1.8 SADE .................................................................................................................... 19

4.1.9 S1_1 ......................................................................................................................... 20

4.1.10 LIQUIDEZ ............................................................................................................ 21

5. RELAO ENTRE AS VARIVEIS ................................................................................. 22

5.1 Correlaes ..................................................................................................................... 22

5.2 Dendograma ................................................................................................................... 23

5.3 Grficos Scaterplot e Regresso de mnimos quadrados................................................ 24

5.3.1 ISDM versus EMPREGO E RENDA ...................................................................... 24

5.3.2 ISDM versus R1 ...................................................................................................... 26

5.3.3 ISDM versus T1_2 .................................................................................................. 27

5.3.4 ISDM versus H6 ...................................................................................................... 28

5.3.5 ISDM versus EDUCAO ..................................................................................... 29

5.3.6 ISDM versus E2_4 .................................................................................................. 31

5.3.7 ISDM versus SADE .............................................................................................. 32

5.3.8 ISDM versus S1_1 ................................................................................................... 33

3

5.3.9 ISDM versus LIQUIDEZ ........................................................................................ 34

6. MODELO DE REGRESSO LINEAR ............................................................................... 35

6.1 ISDM versus Emprego e Renda; Educao; e Sade ..................................................... 35

6.2 ISDM versus E2_4; T1_2; S1_1; R1; H6; e Liquidez .................................................... 36

7. TESTE DE COMPARAES ............................................................................................. 37

7.1 Varivel ISDM ............................................................................................................... 37

7.2 Varivel Emprego e Renda ............................................................................................. 38

7.3 Varivel Educao .......................................................................................................... 40

7.4 Varivel Sade ................................................................................................................ 41

7.5 Varivel E2_4 ................................................................................................................. 43

7.6 Varivel T1_2 ................................................................................................................. 44

7.7 Varivel S1_1 ................................................................................................................. 46

7.8 Varivel R1 ..................................................................................................................... 47

7.9 Varivel H6 .................................................................................................................... 49

7.10 Varivel Liquidez ......................................................................................................... 50

8. AMOSTRAGEM .................................................................................................................. 52

8.1 VARIVEL ISDM ......................................................................................................... 52

8.2 VARIVEL EMPREGO E RENDA ............................................................................. 54

8.3 VARIVEL EDUCAO............................................................................................. 57

9. ANLISE MULTIVARIADA ............................................................................................. 59

9.1 Dendograma dos agrupamentos das variveis por similaridade ..................................... 59

9.2 Principais Componentes ................................................................................................. 60

10. ANLISE DE CONGLOMERADOS ............................................................................... 62

10.1 ANOVA ........................................................................................................................ 62

10.1.1 ANOVA de ISDM por Estado ............................................................................... 62

10.1.2 ANOVA de Emprego e Renda por Estado ............................................................ 64

10.1.3 ANOVA de R1 por Estado .................................................................................... 65

10.1.4 ANOVA de T1_2 por Estado ................................................................................ 66

10.1.5 ANOVA de H6 por Estado .................................................................................... 67

10.1.6 ANOVA de Educao por Estado ......................................................................... 68

10.1.7 ANOVA de E2_4 por Estado ................................................................................ 69

10.1.8 ANOVA de Sade por Estado ............................................................................... 71

10.1.9 ANOVA de S1_1 por Estado ................................................................................ 72

10.1.10 ANOVA de Liquidez por Estado......................................................................... 73

4

10.2 DENDOGRAMA DOS DADOS AGRUPADOS PELO RESULTADO DAS

MDIAS ............................................................................................................................... 75

11. ANLISE DISCRIMINANTE .......................................................................................... 77

11.1 DENDOGRAMA DAS REGIES BRASILEIRAS .................................................... 77

11.2 ANLISE DESCRIMINANTE DAS CINCO REGIES VERSUS ISDM, EMPREGO

E RENDA, EDUCAO E SADE ................................................................................... 77

12. REGRESSO LOGSTICA ............................................................................................... 79

13. RVORES DE CLASSIFICAO ................................................................................... 80

13.1 Os trs brasis ................................................................................................................. 80

13.2 rvore de classificao das variveis: ISDM, Educao, E2_4, Sade, H6, T1_2,

Emprego e Renda, Liquidez, R1 e S1_1 ............................................................................... 81

13.3 rvore de classificao das mdias Variveis ISDM, Educao, E2_4, Sade, H6,

T1_2, Emprego e Renda, Liquidez, R1 e S1_1 x Trs Brasis .............................................. 82

13.4 rvore de classificao dos desvios padres Variveis ISDM, Educao, E2_4,

Sade, H6, T1_2, Emprego e Renda, Liquidez, R1 e S1_1 x Trs Brasis ........................... 83

13.5 rvore de classificao das mdias Variveis ISDM, Educao, E2_4, Sade, H6,

T1_2, Emprego e Renda, Liquidez, R1 e S1_1 x Regio ..................................................... 85

13.6 rvore de classificao dos desvios padres Variveis ISDM, Educao, E2_4,

Sade, H6, T1_2, Emprego e Renda, Liquidez, R1 e S1_1 x Regio .................................. 87

14. CONSIDERAES FINAIS ............................................................................................. 89

5

1 INTRODUO

O presente trabalho prope trabalhar com os 12 exerccios que foram realizados ao

longo da disciplina, com a incrementao de seis novas variveis: E2_4 (Proporo de

crianas de 7 a 14 anos na srie adequada para sua idade); T1_2 (Taxa de formalizao entre

os empregados); S1_1 (Taxa de mortalidade infantil, por mil nascidos vivos); R1 (Proporo

de pessoas com renda domiciliar per capita abaixo da linha de pobreza); H6 (Proporo de

pessoas que vivem em domiclio que tem densidade de moradores por dormitrio inferior a

2); e Liquidez. Somam-se a essas 6 variveis as outras 5 variveis que vem sido trabalhadas

ao longo da disciplina: ISDM; Emprego e Renda; Educao; e Sade mais as cinco regies

brasileiras: Norte, Nordeste, Centro-Oeste, Sul e Sudeste.

Neste novo momento as 16 variveis foram trabalhadas com os exerccios de: Anlise

exploratria de dados; relao entre variveis, correlao, regresso linear, teste de

comparao, anlise multivariada, analise de conglomerados, anlise discriminante, regresso

logstica, anlise de correspondncia e rvore de classificao.

Para tanto sero utilizados os dados da Pesquisa Firjan/FGV sobre o Desenvolvimento

dos Municpios nos perodos de 2000 e 2010 e utilizar a classificao por regies brasileiras:

Norte, Nordeste, Centro-Oeste, Sudeste e Sul.

O software estatstico a ser utilizado o MINITAB16 e o SPSS.

2 OS DADOS

2.1 Os Indivduos

Os indivduos desta anlise so os 5565 Municpios brasileiros classificados em suas

regies cujas prefeituras disponibilizaram os dados referentes ao ISDM, IFDM, IFGF,

Emprego e Renda, Educao e Sade.

Fonte: Tabela ISDM, IFDM e IFGF por municpios brasileiros; e

http://www.firjan.org.br

6

2.2 As Variveis

Para o objetivo do presente trabalho, foram trabalhados os dados de 16 variveis:

ISDM, Emprego e Renda, Educao, Sade, E2_4 (Proporo de crianas de 7 a 14 anos na

srie adequada para sua idade); T1_2 (Taxa de formalizao entre os empregados); S1_1

(Taxa de mortalidade infantil, por mil nascidos vivos); R1 (Proporo de pessoas com renda

domiciliar per capita abaixo da linha de pobreza); H6 (Proporo de pessoas que vivem em

domiclio que tem densidade de moradores por dormitrio inferior a 2); e Liquidez, e as

regies Norte, Nordeste, Centro-Oeste, Sudeste e Sul.

Varivel Significado Tipo Unidade

de Medida

ISDM Indicador Social de Desenvolvimento dos

Municpios (ISDM). Consiste na mdia

ponderada dos indicadores das dimenses

Habitao, Renda, Trabalho, Sade e Segurana

e Educao (H, R, T, S e E) padronizada pela

mdia do Brasil.

Varivel

Quantitativa

Numrico

Renda

(R)

Mdia ponderada dos indicadores da dimenso

Renda (R1 e R2) padronizada pela mdia do

Brasil.

Varivel

Quantitativa

Numrico

R1 Proporo de pessoas com renda domiciliar per

capita abaixo da linha de pobreza

Varivel

Quantitativa

Numrico

Emprego/Trabalho

(T)

Mdia ponderada dos indicadores da dimenso

Trabalho (T1_1, T1_2 e T2_1) padronizada pela

mdia do Brasil.

Varivel

Quantitativa

Numrico

T1_2 Taxa de formalizao entre os empregados. Varivel

Quantitativa

Numrico

H6 Proporo de pessoas que vivem em domiclio

que tem densidade de moradores por dormitrio

inferior a 2.

Varivel

Quantitativa

Numrico

Educao

(E)

Mdia ponderada dos indicadores da dimenso

Educao (E1_1, E1_2, E2_1, E2_2, E2_3,

E2_4, E2_5, E2_6, E3_1, E3_2 e E3_3)

Varivel

Quantitativa

Numrico

7

padronizada pela mdia do Brasil.

E2_4 Proporo de crianas de 7 a 14 anos na srie

adequada para sua idade.

Varivel

Quantitativa

Numrico

Sade Mdia ponderada dos indicadores da dimenso

Sade e Segurana (S1_1, S1_2, S1_3, S2_1,

S2_2 e S3_1) padronizada pela mdia do Brasil.

Varivel

Quantitativa

Numrico

S1_1 Taxa de mortalidade infantil, por mil nascidos

vivos.

Varivel

Quantitativa

Numrico

Liquidez Refere-se velocidade e facilidade com a qual

um ativo pode ser convertido em caixa. O

indicador procura verificar se o municpio

possui recursos financeiros suficientes para

fazer frente ao montante de restos a pagar. Se o

municpio apresentar mais restos a pagar do que

ativos financeiros disponveis a pontuao ser

zero. Na leitura dos resultados, quanto mais

prximo de 1,00, menos o municpio est

postergando pagamentos para o exerccio

seguinte sem a devida cobertura.

Varivel

Quantitativa

Numrico

Norte A Regio Norte a regio que possui a maior

rea (3 869 637,9 km, ou 45% do territrio

nacional) e com populao de 16,3 milhes de

habitantes. a regio com a menor densidade

demogrfica (3,77 hab./km, segundo o

censo IBGE 2010). A cidade mais populosa da

regio, Manaus, com 1,8 milho de habitantes,

a stima mais populosa do Brasil.

Varivel

Quantitativa

Numrico

Nordeste A Regio Nordeste possui um territrio de 1

556 001 km (18,2% do territrio nacional),

dentro dos quais est localizado o Polgono das

secas. Sua populao pouco superior a 50

milhes de habitantes. A regio possui nove

estados.

Varivel

Quantitativa

Numrico

8

Centro-Oeste Ocupa 18,86% do territrio brasileiro, com uma

rea de 2.612.077,2 km2. Sua populao de

cerca de 12 milhes de habitantes. A regio

possui trs estados mais um distrito federal.

Varivel

Quantitativa

Numrico

Sudeste Possui um territrio de 927 286 km (10,6% do

territrio nacional). Sua populao de cerca de

77 milhes de habitantes. Possui o

maior PIB bem como as duas cidades mais

populosas do Brasil: So Paulo, com pouco

mais de 11 milhes de habitantes e Rio de

Janeiro com cerca de 6 milhes.

Varivel

Quantitativa

Numrico

Sul A Regio Sul a que possui a menor rea (575

316 km, ou 6,8% do territrio nacional) e sua

populao de mais de 26 milhes de

habitantes, a segunda regio mais rica do pas,

depois da Regio Sudeste, e a que possui o

maior IDH, a maior taxa de alfabetizao e os

melhores nveis de educao, sade e bem estar

social do pas. A regio possui trs estados.

Varivel

Quantitativa

Numrico

3. ANLISE DAS VARIVEIS

3.1 Variveis Categricas

Este tipo de varivel indica que o foco de concentrao deve ser a anlise de grficos

do tipo pie chart e barras.

3.1.1 Varivel: Estados

Fazem parte desta pesquisa os 27 Estados brasileiros e seus 5565 municpios

classificados em 5 regies brasileiras. Nos grficos abaixo possvel visualizar a distribuio

de municpios por Estado brasileiro e as cinco regies brasileiras.

9

MGMSMTPAPBPEPIPRRJRN

A C

RORRRSSCSESPTOO ther

A LA MA PBAC EESGOMA

EstadoDistribuio dos Estados brasileiros com Municpios participantes

10

DFRRAPACROAMSEMSESRJALTOPAMTRNCEPEMAP

BPIGOSCPRBARSSPMG

900

800

700

600

500

400

300

200

100

0

Estados

Num

ero

de M

unic

pio

s

Municpios por Estado brasileiro

Os dados dos grficos nos permite visualizar que, os Estados com maior participao

de municpios so: Minas Gerais (852 cidades), So Paulo (647 cidades), Rio Grande do Sul

(497 cidades), Bahia (416 cidades) e Paran (399 cidades).

11

J entre os Estados com menor nmero de cidades participantes, temos: Distrito

Federal (1 cidade), Roraima (15 cidades), Amap (16 cidades) e Acre (22 cidades).

4. ANLISE EXPLORATRIA DE DADOS

Para iniciar a anlise exploratria dos dados, foi realizada a analise descritiva das

variveis para verificar se existem lacunas, como resultado foi obtido o seguinte:

Descriptive Statistics: ISDM; Emprego e Re; R1; T1_2; H6; Educao; E2_4; ... Total Variable Count N* Minimum Q1 Median Q3 Maximum ISDM 5565 0 0,5476 3,5973 4,6446 5,3454 6,2778 Emprego e Renda 5565 0 0,00000 0,30631 0,37576 0,47111 1,00000 R1 5565 0 0,073 8,618 19,990 39,479 78,801 T1_2 5565 0 6,400 41,272 57,421 71,384 94,914 H6 5565 0 4,735 45,035 55,297 64,616 89,335 Educao 5565 0 0,37456 0,66324 0,74595 0,82305 1,00000 E2_4 5565 0 45,722 79,528 87,510 92,529 100,000 Sade 5565 0 0,44212 0,72978 0,81027 0,87642 1,00000 S1_1 5567 1 0,000 4,294 12,579 20,059 333,333 Liquidez 5565 304 0,00000 0,19358 0,69333 0,91435 1,00000

possvel observar que as variveis S1_1 e a Liquidez apresentaram lacunas, para

preenche-las, foram utilizados os valores do primeiro quartil (Q1), o resultado foi:

Descriptive Statistics: ISDM; Emprego e Re; R1; T1_2; H6; Educao; E2_4; ... Total Variable Count N* Minimum Q1 Median Q3 Maximum ISDM 5565 0 0,5476 3,5973 4,6446 5,3454 6,2778 Emprego e Renda 5565 0 0,00000 0,30631 0,37576 0,47111 1,00000 R1 5565 0 0,073 8,618 19,990 39,479 78,801 T1_2 5565 0 6,400 41,272 57,421 71,384 94,914 H6 5565 0 4,735 45,035 55,297 64,616 89,335 Educao 5565 0 0,37456 0,66324 0,74595 0,82305 1,00000 E2_4 5565 0 45,722 79,528 87,510 92,529 100,000 Sade 5565 0 0,44212 0,72978 0,81027 0,87642 1,00000 S1_1 5567 0 0,000 4,294 12,579 20,050 333,333 Liquidez 5565 0 0,00000 0,19358 0,65578 0,90601 1,00000

Uma vez que todas as lacunas foram preenchidas foi feito o histograma de todas as

variveis.

4.1 Histograma

4.1.1 ISDM

12

5,64,84,03,22,41,60,8

Median

Mean

4,704,654,604,554,504,454,40

1st Q uartile 3,5973Median 4,64463rd Q uartile 5,3454Maximum 6,2778

4,4037 4,4612

4,5898 4,7046

1,0730 1,1136

A -Squared 75,76P-V alue < 0,005

Mean 4,4324StDev 1,0929V ariance 1,1945Skewness -0,541209Kurtosis -0,522196N 5565

Minimum 0,5476

A nderson-Darling Normality Test

95% C onfidence Interv al for Mean

95% C onfidence Interv al for Median

95% C onfidence Interv al for StDev95% Confidence Intervals

Summary for ISDM

Observaes:

Forma: O Histograma nos permite verificar que trata-se de uma distribuio

visivelmente assimtrica para a direita, o que comum para variveis que indiquem

ganhos, receitas, salrios, etc.

Valores Atpicos: H 3 valores de ISDM atpicos, que apresentam resultados

abaixo de 0,8, que so os municpios de Chaves, PA; Amajari, RR e Melgao, PA.

Centro e Disperso: A mediana nos indica que aproximadamente metade dos

municpios tem ISDM menor do que 4,64446. O ISDM mdio de 4,4324, mas o desvio-

padro (medida de disperso) de 1,0929, que implica em uma disperso grande da

populao e uma variao grande entre os diversos municpios do Brasil.

13

4.1.2 EMPREGO E RENDA

0,980,840,700,560,420,280,140,00

Median

Mean

0,410,400,390,380,37

1st Q uartile 0,30631Median 0,375763rd Q uartile 0,47111Maximum 1,00000

0,39967 0,40783

0,37169 0,37957

0,15241 0,15818

A -Squared 105,84P-V alue < 0,005

Mean 0,40375StDev 0,15524V ariance 0,02410Skewness 0,88857Kurtosis 1,32253N 5565

Minimum 0,00000

A nderson-Darling Normality Test

95% C onfidence Interv al for Mean

95% C onfidence Interv al for Median

95% C onfidence Interv al for StDev95% Confidence Intervals

Summary for Emprego e Renda

Observaes:

Forma: O Histograma nos permite verificar que trata-se de uma distribuio

visivelmente assimtrica para a esquerda.

Centro e Disperso: A mediana nos indica que muitos municpios apresentam

Emprego e Renda menor do que 0,37576. A mdia de 0,40375, e o desvio-padro

(medida de disperso) de 0,15524.

14

4.1.3 R1

7260483624120

Median

Mean

25242322212019

1st Q uartile 8,618Median 19,9903rd Q uartile 39,479Maximum 78,801

24,060 24,990

19,062 20,991

17,375 18,033

A -Squared 154,22P-V alue < 0,005

Mean 24,525StDev 17,698V ariance 313,215Skewness 0,512744Kurtosis -0,931901N 5565

Minimum 0,073

A nderson-Darling Normality Test

95% C onfidence Interv al for Mean

95% C onfidence Interv al for Median

95% C onfidence Interv al for StDev95% Confidence Intervals

Summary for R1

Observaes:

Forma: O Histograma nos permite verificar que trata-se de uma distribuio

visivelmente assimtrica para a esquerda.

Centro e Disperso: A mediana nos indica que muitos municpios apresentam

R1 menor do que 19,990. A mdia de 24,525, e o desvio-padro (medida de disperso)

de 17,698.

15

4.1.4 T1_2

9684726048362412

Median

Mean

58,558,057,557,056,556,0

1st Q uartile 41,272Median 57,4213rd Q uartile 71,384Maximum 94,914

55,824 56,783

56,580 58,208

17,901 18,579

A -Squared 41,12P-V alue < 0,005

Mean 56,304StDev 18,234V ariance 332,476Skewness -0,132478Kurtosis -0,993222N 5565

Minimum 6,400

A nderson-Darling Normality Test

95% C onfidence Interv al for Mean

95% C onfidence Interv al for Median

95% C onfidence Interv al for StDev95% Confidence Intervals

Summary for T1_2

Observaes:

Forma: O Histograma nos permite verificar que trata-se de uma distribuio

visivelmente simtrica.

Centro e Disperso: A mediana nos indica que aproximadamente metade dos

municpios apresentam T1_2 menor do que 57,421. A mdia de 56,304, e o desvio-

padro (medida de disperso) de 18,234.

16

4.1.5 H6

84726048362412

Median

Mean

56,055,555,054,554,0

1st Q uartile 45,035Median 55,2973rd Q uartile 64,616Maximum 89,335

53,963 54,675

54,880 55,797

13,306 13,810

A -Squared 15,83P-V alue < 0,005

Mean 54,319StDev 13,553V ariance 183,682Skewness -0,400642Kurtosis -0,053800N 5565

Minimum 4,735

A nderson-Darling Normality Test

95% C onfidence Interv al for Mean

95% C onfidence Interv al for Median

95% C onfidence Interv al for StDev95% Confidence Intervals

Summary for H6

Observaes:

Forma: O Histograma nos permite verificar que trata-se de uma distribuio

visivelmente assimtrica.

Centro e Disperso: A mediana nos indica que uma quantidade significativa dos

municpios apresentam H6 maior do que 55,297. A mdia de 54,319, e o desvio-padro

(medida de disperso) de 13,553.

17

4.1.6 EDUCAO

0,990,900,810,720,630,540,45

Median

Mean

0,75000,74750,74500,74250,7400

1st Q uartile 0,66324Median 0,745953rd Q uartile 0,82305Maximum 1,00000

0,73830 0,74420

0,74212 0,75047

0,11032 0,11449

A -Squared 7,27P-V alue < 0,005

Mean 0,74125StDev 0,11237V ariance 0,01263Skewness -0,172334Kurtosis -0,489371N 5565

Minimum 0,37456

A nderson-Darling Normality Test

95% C onfidence Interv al for Mean

95% C onfidence Interv al for Median

95% C onfidence Interv al for StDev95% Confidence Intervals

Summary for Educao

Observaes:

Forma: O Histograma permite verificar que se trata de uma distribuio

assimtrica. A posio da linha da mediana mais a direita do quadrado principal do Box-

Plot tambm indica esta assimetria. Considerando que o valor mnimo apresentado de 0

em alguns municpios e o valor mximo de 1 nos municpios de Araucria (PR) e

Ipojuca (PE), e a mediana ser apresentada pelo valor 0,74595, pode-se dizer que a maior

parte dos Estados brasileiros possuem um bom ndice de educao por municpio.

Centro e Disperso: A mediana nos indica que grande parte dos municpios

brasileiros apresentam os valores de sua distribuio de Educao acima da mdia

ponderada brasileira. Isso bom, pois indica que h boa frequncia de crianas do ensino

infantil, fundamental e mdio/geral indo a escola e uma pequena proporo de crianas

do ensino fundamental e mdio sofrem de analfabetismo. Na pesquisa no foram

apurados os dados referentes a educao superior.

18

4.1.7 E2_4

96888072645648

Median

Mean

88,087,587,086,586,085,585,0

1st Q uartile 79,528Median 87,5103rd Q uartile 92,529Maximum 100,000

85,247 85,714

87,165 87,883

8,719 9,050

A -Squared 95,44P-V alue < 0,005

Mean 85,481StDev 8,881V ariance 78,880Skewness -0,835199Kurtosis 0,263592N 5565

Minimum 45,722

A nderson-Darling Normality Test

95% C onfidence Interv al for Mean

95% C onfidence Interv al for Median

95% C onfidence Interv al for StDev95% Confidence Intervals

Summary for E2_4

Observaes:

Forma: O Histograma nos permite verificar que trata-se de uma distribuio

visivelmente assimtrica para a direita.

Centro e Disperso: A mediana nos indica que mais da metade dos municpios

apresentam E2_4 maior do que 87,510. A mdia de 85,481, e o desvio-padro (medida

de disperso) de 8,881.

19

4.1.8 SADE

0,960,880,800,720,640,560,48

Median

Mean

0,8150,8100,8050,8000,795

1st Q uartile 0,72978Median 0,810273rd Q uartile 0,87642Maximum 1,00000

0,79564 0,80092

0,80620 0,81410

0,09853 0,10226

A -Squared 34,12P-V alue < 0,005

Mean 0,79828StDev 0,10036V ariance 0,01007Skewness -0,460218Kurtosis -0,367873N 5565

Minimum 0,44212

A nderson-Darling Normality Test

95% C onfidence Interv al for Mean

95% C onfidence Interv al for Median

95% C onfidence Interv al for StDev95% Confidence Intervals

Summary for Sade

Observaes:

Forma: O Histograma nos permite verificar que trata-se de uma distribuio

visivelmente assimtrica para a direita.

Centro e Disperso: A mediana nos indica que mais da metade dos municpios

apresentam SADE maior do que 0,81027. A mdia de 0,79828, e o desvio-padro

(medida de disperso) de 0,10036.

20

4.1.9 S1_1

31527022518013590450

Median

Mean

14,514,013,513,012,512,0

1st Q uartile 4,294Median 12,5793rd Q uartile 20,050Maximum 333,333

13,883 14,634

12,295 12,912

14,020 14,550

A -Squared 160,67P-V alue < 0,005

Mean 14,259StDev 14,280V ariance 203,915Skewness 4,2583Kurtosis 59,4424N 5567

Minimum 0,000

A nderson-Darling Normality Test

95% C onfidence Interv al for Mean

95% C onfidence Interv al for Median

95% C onfidence Interv al for StDev95% Confidence Intervals

Summary for S1_1

Observaes:

Forma: O Histograma nos permite verificar que trata-se de uma distribuio

visivelmente assimtrica para a esquerda.

Centro e Disperso: A mediana nos indica que mais da metade dos municpios

apresentam S1_1 menor do que 12,579. A mdia de 14,259, e o desvio-padro (medida

de disperso) de 14,280.

21

4.1.10 LIQUIDEZ

0,980,840,700,560,420,280,140,00

Median

Mean

0,6750,6500,6250,6000,5750,550

1st Q uartile 0,19358Median 0,655783rd Q uartile 0,90601Maximum 1,00000

0,54165 0,56127

0,63410 0,67418

0,36648 0,38035

A -Squared 257,10P-V alue < 0,005

Mean 0,55146StDev 0,37328V ariance 0,13934Skewness -0,32363Kurtosis -1,46781N 5565

Minimum 0,00000

A nderson-Darling Normality Test

95% C onfidence Interv al for Mean

95% C onfidence Interv al for Median

95% C onfidence Interv al for StDev95% Confidence Intervals

Summary for Liquidez

Observaes:

Forma: O Histograma nos permite verificar que trata-se de uma distribuio

visivelmente assimtrica.

Centro e Disperso: A mediana nos indica que mais da metade dos municpios

apresentam LIQUIDEZ maior do que 0,65578. A mdia de 0,55146, e o desvio-padro

(medida de disperso) de 0,37328. Esse dado indica que ao menos metade dos

municpio esto postergando pagamentos para o exerccio seguinte sem a devida

cobertura.

22

5. RELAO ENTRE AS VARIVEIS

O presente captulo fez uma analise das variveis com relao ao ISDM. Abaixo segue

os resultados obtidos.

5.1 Correlaes

Sobre as correlaes das variveis estudadas, obteve-se o seguinte:

Correlations: ISDM; Emprego e Re; R1; T1_2; H6; Educao; E2_4; Sade; ... ISDM Emprego e Renda R1 Emprego e Renda 0,525 0,000 R1 -0,951 -0,509 0,000 0,000 T1_2 0,806 0,586 -0,782 0,000 0,000 0,000 H6 0,695 0,211 -0,709 0,000 0,000 0,000 Educao 0,782 0,377 -0,753 0,000 0,000 0,000 E2_4 0,764 0,363 -0,768 0,000 0,000 0,000 Sade 0,697 0,345 -0,713 0,000 0,000 0,000 S1_1 -0,147 -0,077 0,140 0,000 0,000 0,000 Liquidez 0,276 0,197 -0,308 0,000 0,000 0,000 T1_2 H6 Educao H6 0,449 0,000 Educao 0,609 0,552 0,000 0,000 E2_4 0,599 0,613 0,765 0,000 0,000 0,000 Sade 0,559 0,590 0,654 0,000 0,000 0,000 S1_1 -0,112 -0,115 -0,122 0,000 0,000 0,000 Liquidez 0,302 0,260 0,233 0,000 0,000 0,000

23

E2_4 Sade S1_1 Sade 0,640 0,000 S1_1 -0,128 -0,268 0,000 0,000 Liquidez 0,263 0,259 -0,049 0,000 0,000 0,000 Cell Contents: Pearson correlation P-Value

Sobre os resultados obtidos, possvel notar que ISDM x T1_2, ISDM x Educao,

ISDM x E2_4, ISDM x Sade, T1_2 x Educao, E2_4 x Sade, H6 x E2_4, Educao x

E2_4, e Educao x Sade so as variveis que apresentam as maiores correlaes, enquanto

ISDM x R1, T1_2 x R1, Educao x R1, e E2_4 x R1 apresentam as menores correlaes.

Na prxima etapa foram retiradas, do total de 5565 municpios, 50 amostras para a

elaborao dos grficos de Scatterplot. Foi realizado o dendograma e o cruzamentos entre

ISDM com as demais variveis para verificar o grau de proximidade entre elas.

5.2 Dendograma

O dendograma permite uma melhor visualizao sobre a proximidade das variveis

estudadas. Abaixo segue o resultado do dendograma:

S1_1

_A50

R1_A

50

Liquid

ez_A

50

Empr

ego e

Ren

da_A

50

T1_2

_A50

H6_A

50

Sad

e_A5

0

E2_4

_A50

Educ

ao

_A50

ISDM_

A50

47,80

65,20

82,60

100,00

Variables

Sim

ilari

ty

DendrogramSingle Linkage; Correlation Coefficient Distance

24

Nesta amostra possvel observar a existncia de 3 grupos principais, sendo um

primeiro grupo: ISDM, Educao, E2_4, Sade, H6 e T1_2 um grupo com similaridade acima

de 85%. Um segundo grupo composto por Emprego e renda e Liquidez, com um grau de

similaridade acima de 65% e um terceiro grupo com baixo grau de similaridade com os

demais composto por R1 e S1_1 que possuem similaridade acima de 45%

Cluster Analysis of Variables: ISDM_A50; Emprego e Re; R1_A50; T1_2_A50; ... Correlation Coefficient Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster 1 9 92,8941 0,14212 1 6 1 2 2 8 91,6434 0,16713 1 7 1 3 3 7 88,2285 0,23543 1 8 1 4 4 6 86,6548 0,26690 1 5 1 5 5 5 85,7641 0,28472 1 4 1 6 6 4 79,0191 0,41962 1 2 1 7 7 3 64,1737 0,71653 1 10 1 8 8 2 59,7530 0,80494 3 9 3 2 9 1 47,7985 1,04403 1 3 1 10

5.3 Grficos Scaterplot e Regresso de mnimos quadrados

5.3.1 ISDM versus EMPREGO E RENDA

0,90,80,70,60,50,40,30,20,10,0

6

5

4

3

2

Emprego e Renda_A50

ISD

M_A

50

Scatterplot of ISDM_A50 vs Emprego e Renda_A50

25

Observaes:

Direo: Da anlise das correlaes acima percebemos que algumas possuem

associaes positivas, ou seja, o crescimento de uma varivel acompanhado do crescimento

da outra.

Intensidade: O grfico acima parece indicar pouca existncia de relaes lineares,

sendo que h grande disparidade entre os pontos.

Forma: O grfico apresenta conglomerados que sugerem relaes pouco lineares.

Regression Analysis: ISDM_A50 versus Emprego e Renda_A50

The regression equation is ISDM_A50 = 3,67 + 2,82 Emprego e Renda_A50

Predictor Coef SE Coef T P Constant 3,6671 0,3896 9,41 0,000 Emprego e Renda_A50 2,8192 0,9048 3,12 0,003 S = 0,924961 R-Sq = 16,8% R-Sq(adj) = 15,1% Analysis of Variance Source DF SS MS F P Regression 1 8,3066 8,3066 9,71 0,003 Residual Error 48 41,0666 0,8556 Total 49 49,3731 Unusual Observations Emprego e Obs Renda_A50 ISDM_A50 Fit SE Fit Residual St Resid 4 0,817 6,026 5,972 0,395 0,054 0,06 X 9 0,932 6,157 6,294 0,494 -0,137 -0,18 X 16 0,896 5,942 6,194 0,463 -0,252 -0,31 X 23 0,360 2,557 4,682 0,137 -2,126 -2,32R 34 0,337 2,259 4,617 0,145 -2,358 -2,58R R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.

26

5.3.2 ISDM versus R1

6050403020100

6

5

4

3

2

R1_A50

ISD

M_A

50Scatterplot of ISDM_A50 vs R1_A50

Observaes:

Direo: Da anlise das correlaes acima percebemos que possuem associaes

negativas, apesar de manter caractersticas de linearidade.

Intensidade: O grfico acima parece indicar a existncia de relaes lineares, apesar de

sua relao negativa.

Forma: O grfico apresenta conglomerados que sugerem relaes lineares.

Regression Analysis: ISDM_A50 versus R1_A50

The regression equation is ISDM_A50 = 6,03 - 0,0648 R1_A50

Predictor Coef SE Coef T P Constant 6,03305 0,08826 68,35 0,000 R1_A50 -0,064837 0,003736 -17,35 0,000 S = 0,376050 R-Sq = 86,3% R-Sq(adj) = 86,0% Analysis of Variance Source DF SS MS F P Regression 1 42,585 42,585 301,14 0,000 Residual Error 48 6,788 0,141 Total 49 49,373 Unusual Observations

27

Obs R1_A50 ISDM_A50 Fit SE Fit Residual St Resid 10 26,3 5,1375 4,3283 0,0600 0,8092 2,18R 23 37,9 2,5568 3,5766 0,0888 -1,0198 -2,79R 31 59,4 2,9181 2,1844 0,1604 0,7337 2,16RX 34 55,1 2,2589 2,4630 0,1454 -0,2040 -0,59 X 45 28,0 5,0099 4,2207 0,0631 0,7892 2,13R R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.

5.3.3 ISDM versus T1_2

90807060504030

6

5

4

3

2

T1_2_A50

ISD

M_A

50

Scatterplot of ISDM_A50 vs T1_2_A50

Observaes:

Direo: Da anlise das correlaes acima percebemos que possuem associaes

positivas, e caractersticas pouco lineares.

Intensidade: O grfico acima parece indicar pouca existncia de relaes lineares,

apesar de sua relao positiva.

Forma: O grfico apresenta conglomerados que sugerem relaes pouco lineares, com

bastante disparidade entre os pontos.

Regression Analysis: ISDM_A50 versus T1_2_A50

The regression equation is ISDM_A50 = 1,98 + 0,0464 T1_2_A50

Predictor Coef SE Coef T P Constant 1,9792 0,4117 4,81 0,000 T1_2_A50 0,046395 0,006543 7,09 0,000

28

S = 0,708762 R-Sq = 51,2% R-Sq(adj) = 50,1% Analysis of Variance Source DF SS MS F P Regression 1 25,261 25,261 50,29 0,000 Residual Error 48 24,112 0,502 Total 49 49,373 Unusual Observations Obs T1_2_A50 ISDM_A50 Fit SE Fit Residual St Resid 23 62,1 2,557 4,861 0,100 -2,304 -3,28R 34 44,4 2,259 4,038 0,148 -1,779 -2,57R 40 42,8 5,467 3,964 0,156 1,504 2,17R R denotes an observation with a large standardized residual.

5.3.4 ISDM versus H6

80706050403020

6

5

4

3

2

H6_A50

ISD

M_A

50

Scatterplot of ISDM_A50 vs H6_A50

Observaes:

Direo: Da anlise das correlaes acima percebemos que possuem associaes

positivas, apesar de manter poucas caractersticas de linearidade.

Intensidade: O grfico acima parece indicar a existncia de pequenas relaes lineares.

29

Forma: O grfico apresenta conglomerados que sugerem relaes no lineares devido

a sua alta disparidade entre os pontos.

Regression Analysis: ISDM_A50 versus H6_A50

The regression equation is ISDM_A50 = 1,57 + 0,0565 H6_A50

Predictor Coef SE Coef T P Constant 1,5724 0,4445 3,54 0,001 H6_A50 0,056548 0,007572 7,47 0,000 S = 0,689784 R-Sq = 53,7% R-Sq(adj) = 52,8% Analysis of Variance Source DF SS MS F P Regression 1 26,535 26,535 55,77 0,000 Residual Error 48 22,838 0,476 Total 49 49,373 Unusual Observations Obs H6_A50 ISDM_A50 Fit SE Fit Residual St Resid 15 55,4 6,1445 4,7031 0,0986 1,4414 2,11R 21 27,1 3,3845 3,1024 0,2487 0,2822 0,44 X 34 21,8 2,2589 2,8026 0,2860 -0,5437 -0,87 X R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.

5.3.5 ISDM versus EDUCAO

1,00,90,80,70,60,5

6

5

4

3

2

Educao_A50

ISD

M_A

50

Scatterplot of ISDM_A50 vs Educao_A50

30

Observaes:

Direo: Da anlise das correlaes acima percebemos que possuem associaes

positivas, e apesar da baixa relao linear, possvel observar certa linearidade.

Intensidade: O grfico acima parece indicar um pouco da existncia de relaes

lineares, e associao positiva.

Forma: O grfico apresenta conglomerados que sugerem relaes lineares.

Regression Analysis: ISDM_A50 versus Educao_A50

The regression equation is ISDM_A50 = - 0,821 + 7,12 Educao_A50

Predictor Coef SE Coef T P Constant -0,8208 0,4924 -1,67 0,102 Educao_A50 7,1174 0,6153 11,57 0,000 S = 0,521144 R-Sq = 73,6% R-Sq(adj) = 73,0% Analysis of Variance Source DF SS MS F P Regression 1 36,337 36,337 133,79 0,000 Residual Error 48 13,036 0,272 Total 49 49,373 Unusual Observations Obs Educao_A50 ISDM_A50 Fit SE Fit Residual St Resid 8 0,750 5,8617 4,5138 0,0780 1,3479 2,62R 11 0,730 5,7514 4,3758 0,0827 1,3756 2,67R 23 0,520 2,5568 2,8806 0,1824 -0,3238 -0,66 X 31 0,674 2,9181 3,9765 0,1031 -1,0584 -2,07R 34 0,521 2,2589 2,8840 0,1821 -0,6250 -1,28 X R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.

31

5.3.6 ISDM versus E2_4

10095908580757065

6

5

4

3

2

E2_4_A50

ISD

M_A

50Scatterplot of ISDM_A50 vs E2_4_A50

Observaes:

Direo: Da anlise das correlaes acima percebemos que possuem associaes

positivas, e poucas caractersticas lineares.

Intensidade: O grfico acima parece indicar pequena existncia de linearidade e alta

disparidade.

Forma: O grfico apresenta alta disperso com pouco conglomerado.

Regression Analysis: ISDM_A50 versus E2_4_A50

The regression equation is ISDM_A50 = - 3,86 + 0,0991 E2_4_A50

Predictor Coef SE Coef T P Constant -3,8612 0,8356 -4,62 0,000 E2_4_A50 0,099120 0,009507 10,43 0,000 S = 0,561333 R-Sq = 69,4% R-Sq(adj) = 68,7% Analysis of Variance Source DF SS MS F P Regression 1 34,249 34,249 108,69 0,000 Residual Error 48 15,125 0,315 Total 49 49,373 Unusual Observations Obs E2_4_A50 ISDM_A50 Fit SE Fit Residual St Resid 19 84,8 2,9811 4,5452 0,0834 -1,5642 -2,82R 21 65,1 3,3845 2,5947 0,2269 0,7899 1,54 X

32

31 82,5 2,9181 4,3127 0,0926 -1,3946 -2,52R 34 65,1 2,2589 2,5926 0,2271 -0,3337 -0,65 X 36 66,4 3,3779 2,7239 0,2153 0,6540 1,26 X R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.

5.3.7 ISDM versus SADE

1,00,90,80,70,60,5

6

5

4

3

2

Sade_A50

ISD

M_A

50

Scatterplot of ISDM_A50 vs Sade_A50

Observaes:

Direo: Da anlise das correlaes acima percebemos que possuem associaes

positivas, e pouca linearidade.

Intensidade: O grfico acima parece indicar baixa linearidade, apesar de um pouco de

conglomerado do lado direito superior.

Forma: O grfico apresenta conglomerados, porm baixa linearidade.

Regression Analysis: ISDM_A50 versus Sade_A50

The regression equation is ISDM_A50 = - 1,53 + 7,73 Sade_A50

Predictor Coef SE Coef T P Constant -1,5349 0,7776 -1,97 0,054 Sade_A50 7,7335 0,9410 8,22 0,000 S = 0,653696 R-Sq = 58,5% R-Sq(adj) = 57,6%

33

Analysis of Variance Source DF SS MS F P Regression 1 28,862 28,862 67,54 0,000 Residual Error 48 20,511 0,427 Total 49 49,373 Unusual Observations Obs Sade_A50 ISDM_A50 Fit SE Fit Residual St Resid 23 0,552 2,5568 2,7311 0,2694 -0,1743 -0,29 X 34 0,532 2,2589 2,5809 0,2866 -0,3220 -0,55 X 42 0,744 2,8790 4,2198 0,1171 -1,3408 -2,08R R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.

5.3.8 ISDM versus S1_1

50403020100

6

5

4

3

2

S1_1_A50

ISD

M_A

50

Scatterplot of ISDM_A50 vs S1_1_A50

Observaes:

Direo: Da anlise das correlaes acima percebemos que possuem associaes

negativas, e praticamente nenhuma linearidade.

Intensidade: O grfico acima parece indicar baixa linearidade, e alta disperso.

Forma: O grfico no apresenta conglomerados e linearidade.

Regression Analysis: ISDM_A50 versus S1_1_A50

The regression equation is ISDM_A50 = 5,00 - 0,0136 S1_1_A50

34

Predictor Coef SE Coef T P Constant 4,9967 0,2123 23,54 0,000 S1_1_A50 -0,01365 0,01161 -1,18 0,246 S = 0,999920 R-Sq = 2,8% R-Sq(adj) = 0,8% Analysis of Variance Source DF SS MS F P Regression 1 1,3808 1,3808 1,38 0,246 Residual Error 48 47,9923 0,9998 Total 49 49,3731 Unusual Observations Obs S1_1_A50 ISDM_A50 Fit SE Fit Residual St Resid 23 22,9 2,557 4,684 0,178 -2,127 -2,16R 34 18,1 2,259 4,749 0,151 -2,490 -2,52R 38 43,5 5,487 4,403 0,374 1,084 1,17 X 42 50,8 2,879 4,303 0,455 -1,424 -1,60 X 47 44,4 4,874 4,390 0,385 0,484 0,52 X R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.

5.3.9 ISDM versus LIQUIDEZ

1,00,80,60,40,20,0

6

5

4

3

2

Liquidez_A50

ISD

M_A

50

Scatterplot of ISDM_A50 vs Liquidez_A50

Observaes:

Direo: Da anlise das correlaes acima visvel que possuem associaes

positivas, e praticamente nenhuma linearidade.

Intensidade: O grfico acima parece indicar baixa linearidade, e alta disperso, apesar

de apresentar indcios de conglomerados no final do lado direito.

35

Forma: O grfico apresenta vestgios de conglomerado e no apresenta linearidade.

Regression Analysis: ISDM_A50 versus Liquidez_A50

The regression equation is ISDM_A50 = 4,49 + 0,517 Liquidez_A50

Predictor Coef SE Coef T P Constant 4,4870 0,2772 16,19 0,000 Liquidez_A50 0,5171 0,3816 1,36 0,182 S = 0,995343 R-Sq = 3,7% R-Sq(adj) = 1,7% Analysis of Variance Source DF SS MS F P Regression 1 1,8192 1,8192 1,84 0,182 Residual Error 48 47,5540 0,9907 Total 49 49,3731 Unusual Observations Obs Liquidez_A50 ISDM_A50 Fit SE Fit Residual St Resid 23 0,00 2,557 4,487 0,277 -1,930 -2,02R 31 0,98 2,918 4,995 0,196 -2,076 -2,13R 34 0,80 2,259 4,901 0,156 -2,642 -2,69R 42 0,94 2,879 4,972 0,184 -2,093 -2,14R R denotes an observation with a large standardized residual.

6. MODELO DE REGRESSO LINEAR

Nesta etapa foi realizada a Stepwise Regression da seguinte maneira:

ISDM versus Emprego e Renda; Educao; e Sade.

ISDM versus E2_4; T1_2; S1_1; R1; H6; e Liquidez.

6.1 ISDM versus Emprego e Renda; Educao; e Sade

Stepwise Regression: ISDM versus Emprego e Renda; Educao; Sade Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15 Response is ISDM on 3 predictors, with N = 5565

36

Step 1 2 3 Constant -1,203 -1,236 -2,363 Educao 7,602 6,618 4,926 T-Value 93,46 82,17 52,55 P-Value 0,000 0,000 0,000 Emprego e Renda 1,891 1,662 T-Value 32,45 30,41 P-Value 0,000 0,000 Sade 3,10 T-Value 29,92 P-Value 0,000 S 0,682 0,625 0,580 R-Sq 61,09 67,28 71,82 R-Sq(adj) 61,08 67,27 71,81 Mallows Cp 2117,5 897,5 4,0

Com relao ao ISDM nota-se, atravs dos dados acima, que Emprego e Renda,

Educao e Sade representam 71,82% do ISDM. Sendo que Emprego e Renda representa

61,09%, Educao 6,19% e Sade 4,54%.

Para o ISDM tem-se a seguinte equao:

-2,363 + 4,926 + 1,662 + 3,10

6.2 ISDM versus E2_4; T1_2; S1_1; R1; H6; e Liquidez

Stepwise Regression: ISDM versus R1; T1_2; H6; E2_4; S1_1; Liquidez Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15 Response is ISDM on 6 predictors, with N = 5565 Step 1 2 3 4 5 6 Constant 5,873 5,132 4,586 3,813 3,814 3,832 R1 -0,05872 -0,05089 -0,04624 -0,04342 -0,04351 -0,04346 T-Value -229,28 -131,18 -93,10 -79,85 -80,62 -80,53 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 T1_2 0,00973 0,01106 0,01089 0,01132 0,01131 T-Value 25,85 29,06 28,97 30,10 30,10 P-Value 0,000 0,000 0,000 0,000 0,000 H6 0,00660 0,00574 0,00610 0,00607 T-Value 14,57 12,69 13,53 13,48 P-Value 0,000 0,000 0,000 0,000 E2_4 0,00888 0,00908 0,00902 T-Value 12,02 12,39 12,31 P-Value 0,000 0,000 0,000 Liquidez -0,109 -0,109 T-Value -9,29 -9,30 P-Value 0,000 0,000

37

S1_1 -0,00085 T-Value -2,92 P-Value 0,004 S 0,338 0,319 0,314 0,310 0,307 0,307 R-Sq 90,43 91,46 91,77 91,98 92,10 92,11 R-Sq(adj) 90,43 91,45 91,77 91,97 92,10 92,11 Mallows Cp 1183,7 462,1 242,8 97,9 13,5 7,0

Com relao ao ISDM nota-se, atravs dos dados acima, que R1; T1_2; H6; E2_4;

S1_1 e Liquidez representam 92,11% do ISDM.

7. TESTE DE COMPARAES

7.1 Varivel ISDM

Os pontos que aparecem abaixo

da linha representam os dados que esto fora da curva, e

abaixo da mdia .

A Regio Sudeste possui o maior ISDM do pas, o que indica que esta a Regio mais

desenvolvida do Brasil, segundo a pesquisa. A regio Sul encontra-se prxima a Regio

Sudeste, e ocupa o segundo lugar.

A Regio que apresenta o ISDM mdio mais baixo do Pas a Norte, seguida da

Nordeste. Pelo tamanho da caixa do BloxPlot pode-se visualizar a amplitude da varincia.

possvel afirmar que os dados da Regio Norte possuem maior variabilidade que os dados das

demais regies. As Regies que possuem menor variabilidade dos dados so Centro-Oeste e

Sul.

38

One-way ANOVA: ISDM versus Regio

Source DF SS MS F PRegio 4 4188,435 1047,109 0,000Error 5560 2457,544 0,442Total 5564 6645,979

S = 0,6648 R-Sq = 63,02% R-Sq(adj) = 63,00%

Individual 95% CIs For Mean Based onPooled StDev

Level N Mean StDev ------+---------+---------+---------+---Centro-Oeste 468 4,6956 0,5252 (*)Nordeste 1790 3,4112 0,7136 (*Norte 447 0,9794 (*)Sudeste 1669 0,6436 (*Sul 1191 5,1271 0,5012 *)

------+---------+---------+---------+---

3,60 4,20 4,80 5,40

Pooled StDev = 0,6648

O grau de variao entre as Regies muito alto (2369), e o P-value nos indica que a

informao confivel e no existe chance deste valor ser diferente.

Com base nos dados acima possvel afirmar que a regio que apresenta melhores

nveis de ISDM a regio Sudeste enquanto a regio com os piores nveis o Norte.

7.2 Varivel Emprego e Renda

Grau de diferena

entre as variveis

Chance de no ser

diferente.

39

One-way ANOVA: Emprego e Renda versus Regio Source DF SS MS F P Regio 4 17,7959 4,4490 212,70 0,000 Error 5560 116,2990 0,0209 Total 5564 134,0949 S = 0,1446 R-Sq = 13,27% R-Sq(adj) = 13,21% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+---------+- Centro-Oeste 468 0,4173 0,1389 (--*---) Nordeste 1790 0,3348 0,1288 (-*) Norte 447 0,3415 0,1419 (--*---) Sudeste 1669 0,4490 0,1681 (*-) Sul 1191 0,4620 0,1345 (-*--) --------+---------+---------+---------+- 0,360 0,400 0,440 0,480 Pooled StDev = 0,1446

Com base nos dados acima possvel afirmar que a regio que apresenta maiores

nveis de Emprego e Renda a regio Sul, seguida de perto pelo Sudeste enquanto a regio

com os menores nveis de emprego e renda o Nordeste.

Grau de diferena

entre as variveis

Chance de no ser

diferente.

40

7.3 Varivel Educao

41

One-way ANOVA: Educao versus Regio Source DF SS MS F P Regio 4 35,82737 8,95684 1446,69 0,000 Error 5560 34,42333 0,00619 Total 5564 70,25070 S = 0,07868 R-Sq = 51,00% R-Sq(adj) = 50,96% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- Centro-Oeste 468 0,75299 0,07162 (*-) Nordeste 1790 0,65090 0,08127 *) Norte 447 0,63739 0,08599 (*) Sudeste 1669 0,83427 0,08138 (*) Sul 1191 0,78106 0,07021 (*) -----+---------+---------+---------+---- 0,660 0,720 0,780 0,840 Pooled StDev = 0,07868

Com base nos dados acima possvel afirmar que a regio que apresenta maiores

nveis de Educao a regio Sudeste enquanto a regio com os menores nveis o Norte.

7.4 Varivel Sade

Grau de diferena

entre as variveis

Chance de no ser

diferente.

42

One-way ANOVA: Sade versus Regio Source DF SS MS F P Regio 4 23,23275 5,80819 984,38 0,000 Error 5560 32,80603 0,00590 Total 5564 56,03879 S = 0,07681 R-Sq = 41,46% R-Sq(adj) = 41,42% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -------+---------+---------+---------+-- Centro-Oeste 468 0,83036 0,07475 (*-) Nordeste 1790 0,73510 0,08148 (* Norte 447 0,68231 0,08605 (*) Sudeste 1669 0,82988 0,07713 *) Sul 1191 0,87987 0,06543 (* -------+---------+---------+---------+-- 0,720 0,780 0,840 0,900 Pooled StDev = 0,07681

Com base nos dados acima possvel afirmar que a regio que apresenta maiores

nveis de Sade a regio Sul enquanto a regio com os menores nveis o Norte.

Grau de diferena

entre as variveis

Chance de no ser

diferente.

43

7.5 Varivel E2_4

SulSudesteNorteNordesteCentro-Oeste

80

70

60

50

40

30

20

10

0

Regio

R1

Individual Value Plot of R1 vs Regio

50250-25-50

99,99

99

90

50

10

1

0,01

Residual

Per

cent

40302010

50

25

0

-25

-50

Fitted Value

Res

idua

l

483624120-12-24-36

600

450

300

150

0

Residual

Freq

uenc

y

5500

5000

4500

4000

3500

3000

2500

2000

1500

100050

01

50

25

0

-25

-50

Observation Order

Res

idua

l

Normal Probability Plot Versus Fits

Histogram Versus Order

Residual Plots for R1

44

One-way ANOVA: R1 versus Regio Source DF SS MS F P Regio 4 1148763 287191 2688,34 0,000 Error 5560 593965 107 Total 5564 1742729 S = 10,34 R-Sq = 65,92% R-Sq(adj) = 65,89% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev +---------+---------+---------+--------- Centro-Oeste 468 15,23 9,22 (*) Nordeste 1790 42,49 10,60 *) Norte 447 39,65 15,18 (*) Sudeste 1669 14,07 10,54 *) Sul 1191 10,16 7,40 *) +---------+---------+---------+--------- 10 20 30 40 Pooled StDev = 10,34

Com base nos dados acima possvel afirmar que a regio que apresenta os maiores

nveis de R1 a regio Nordeste enquanto a regio com os menores nveis o Sul.

7.6 Varivel T1_2

SulSudesteNorteNordesteCentro-Oeste

100

80

60

40

20

0

Regio

T1_2

Individual Value Plot of T1_2 vs Regio

Grau de diferena

entre as variveis

Chance de no ser

diferente.

45

50250-25-50

99,99

99

90

50

10

1

0,01

Residual

Per

cent

70605040

50

25

0

-25

-50

Fitted Value

Res

idua

l

3624120-12-24-36

300

200

100

0

Residual

Freq

uenc

y

5500

5000

4500

4000

3500

3000

2500

2000

1500

100050

01

50

25

0

-25

-50

Observation OrderR

esid

ual

Normal Probability Plot Versus Fits

Histogram Versus Order

Residual Plots for T1_2

One-way ANOVA: T1_2 versus Regio Source DF SS MS F P Regio 4 804491 201123 1069,67 0,000 Error 5560 1045407 188 Total 5564 1849898 S = 13,71 R-Sq = 43,49% R-Sq(adj) = 43,45% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---------+---------+---------+---------+ Centro-Oeste 468 58,89 11,83 (-*) Nordeste 1790 41,17 13,36 *) Norte 447 46,10 13,65 (-*) Sudeste 1669 64,65 15,77 (*) Sul 1191 70,16 11,69 (*) ---------+---------+---------+---------+ 48,0 56,0 64,0 72,0 Pooled StDev = 13,71

Com base nos dados acima possvel afirmar que a regio que apresenta maiores

nveis de T1_2 a regio Sul enquanto a regio com os menores nveis o Nordeste.

Grau de diferena

entre as variveis

Chance de no ser

diferente.

46

7.7 Varivel S1_1

SulSudesteNorteNordesteCentro-Oeste

350

300

250

200

150

100

50

0

Regio

S1_1

Individual Value Plot of S1_1 vs Regio

3002001000-100

99,99

99

90

50

10

1

0,01

Residual

Per

cent

18,016,515,013,512,0

300

200

100

0

Fitted Value

Res

idua

l

28824019214496480

1200

900

600

300

0

Residual

Freq

uenc

y

5500

5000

4500

4000

3500

3000

2500

2000

1500

100050

01

300

200

100

0

Observation Order

Res

idua

l

Normal Probability Plot Versus Fits

Histogram Versus Order

Residual Plots for S1_1

47

One-way ANOVA: S1_1 versus Regio Source DF SS MS F P Regio 4 19369 4842 24,14 0,000 Error 5560 1115524 201 Total 5564 1134894 S = 14,16 R-Sq = 1,71% R-Sq(adj) = 1,64% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -------+---------+---------+---------+-- Centro-Oeste 468 14,19 16,91 (----*----) Nordeste 1790 15,80 10,90 (-*--) Norte 447 17,82 15,13 (----*-----) Sudeste 1669 13,60 13,91 (-*--) Sul 1191 11,56 17,01 (--*--) -------+---------+---------+---------+-- 12,5 15,0 17,5 20,0 Pooled StDev = 14,16

Com base nos dados acima possvel afirmar que a regio que apresenta maiores

nveis de S1_1 a regio Norte enquanto a regio com os menores nveis o Sul.

7.8 Varivel R1

SulSudesteNorteNordesteCentro-Oeste

80

70

60

50

40

30

20

10

0

Regio

R1

Individual Value Plot of R1 vs Regio

Grau de diferena

entre as variveis

Chance de no ser

diferente.

48

50250-25-50

99,99

99

90

50

10

1

0,01

Residual

Per

cent

40302010

50

25

0

-25

-50

Fitted Value

Res

idua

l483624120-12-24-36

600

450

300

150

0

Residual

Freq

uenc

y

5500

5000

4500

4000

3500

3000

2500

2000

1500

100050

01

50

25

0

-25

-50

Observation Order

Res

idua

l

Normal Probability Plot Versus Fits

Histogram Versus Order

Residual Plots for R1

One-way ANOVA: R1 versus Regio Source DF SS MS F P Regio 4 1148763 287191 2688,34 0,000 Error 5560 593965 107 Total 5564 1742729 S = 10,34 R-Sq = 65,92% R-Sq(adj) = 65,89% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev +---------+---------+---------+--------- Centro-Oeste 468 15,23 9,22 (*) Nordeste 1790 42,49 10,60 *) Norte 447 39,65 15,18 (*) Sudeste 1669 14,07 10,54 *) Sul 1191 10,16 7,40 *) +---------+---------+---------+--------- 10 20 30 40 Pooled StDev = 10,34

Com base nos dados acima possvel afirmar que a regio que apresenta maiores

nveis de R1 a regio Nordeste enquanto a regio com os menores nveis o Sul.

Grau de diferena

entre as variveis

Chance de no ser

diferente.

49

7.9 Varivel H6

SulSudesteNorteNordesteCentro-Oeste

90

80

70

60

50

40

30

20

10

0

Regio

H6

Individual Value Plot of H6 vs Regio

50250-25-50

99,99

99

90

50

10

1

0,01

Residual

Per

cent

70605040

40

20

0

-20

-40

Fitted Value

Res

idua

l

271890-9-18-27

240

180

120

60

0

Residual

Freq

uenc

y

5500

5000

4500

4000

3500

3000

2500

2000

1500

100050

01

40

20

0

-20

-40

Observation Order

Res

idua

l

Normal Probability Plot Versus Fits

Histogram Versus Order

Residual Plots for H6

50

One-way ANOVA: H6 versus Regio Source DF SS MS F P Regio 4 525704 131426 1472,35 0,000 Error 5560 496300 89 Total 5564 1022005 S = 9,448 R-Sq = 51,44% R-Sq(adj) = 51,40% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ------+---------+---------+---------+--- Centro-Oeste 468 58,213 9,699 (*) Nordeste 1790 45,127 8,829 *) Norte 447 36,253 14,618 (*) Sudeste 1669 59,053 9,008 (* Sul 1191 66,750 8,314 *) ------+---------+---------+---------+--- 40,0 48,0 56,0 64,0 Pooled StDev = 9,448

Com base nos dados acima possvel afirmar que a regio que apresenta maiores

nveis de H6 a regio Sul enquanto a regio com os menores nveis o Norte.

7.10 Varivel Liquidez

SulSudesteNorteNordesteCentro-Oeste

1,0

0,8

0,6

0,4

0,2

0,0

Regio

Liqu

idez

Individual Value Plot of Liquidez vs Regio

Grau de diferena

entre as variveis

Chance de no ser

diferente.

51

10-1

99,99

99

90

50

10

1

0,01

Residual

Per

cent

0,70,60,50,4

0,8

0,4

0,0

-0,4

-0,8

Fitted Value

Res

idua

l

0,5250,3500,1750,000-0,175-0,350-0,525-0,700

600

450

300

150

0

Residual

Freq

uenc

y

5500

5000

4500

4000

3500

3000

2500

2000

1500

100050

01

0,8

0,4

0,0

-0,4

-0,8

Observation Order

Res

idua

l

Normal Probability Plot Versus Fits

Histogram Versus Order

Residual Plots for Liquidez

One-way ANOVA: Liquidez versus Regio Source DF SS MS F P Regio 4 99,198 24,799 203,94 0,000 Error 5560 676,095 0,122 Total 5564 775,293 S = 0,3487 R-Sq = 12,79% R-Sq(adj) = 12,73% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---+---------+---------+---------+------ Centro-Oeste 468 0,6541 0,3415 (--*---) Nordeste 1790 0,3825 0,3591 (*-) Norte 447 0,5411 0,3846 (--*--) Sudeste 1669 0,5719 0,3564 (*-) Sul 1191 0,7402 0,3084 (-*-) ---+---------+---------+---------+------ 0,40 0,50 0,60 0,70 Pooled StDev = 0,3487

Com base nos dados acima possvel afirmar que a regio que apresenta maiores

nveis de Liquidez a regio Sul enquanto a regio com os menores nveis o Nordeste.

Grau de diferena

entre as variveis

Chance de no ser

diferente.

52

8. AMOSTRAGEM

8.1 VARIVEL ISDM

ISDM para amostra com 50 linhas:

possvel observar que a mdia dos dados de 4,25 e o desvio padro 1,27. Existe

95% de confiana de que a mdia est entre o intervalo de 3,89 e 4,61.

ISDM para amostra com 100 linhas:

possvel observar que a mdia dos dados de 4,48 e o desvio padro 1,04. Existe

95% de confiana de que a mdia est entre o intervalo de 4,28 e 4,69.

53

ISDM para toda a populao (5565 linhas)

possvel observar que a mdia dos dados de 4,43 e o desvio padro 1,09. Existe

95% de confiana de que a mdia est entre o intervalo de 4,40 e 4,46.

Boxplot de ISDM para amostras de 50, 100 e populao:

O Boxplot confirma a semelhana dos resultados das duas amostras comparados com a

populao total. Existe uma variabilidade dos dados em todas as trs variveis.

One-way ANOVA: ISDM; ISDM_50; ISDM_100

Source DF SS MS F P

Factor 2 1,90 0,95 0,79 0,453

Error 5712 6834,27 1,20

Total 5714 6836,17

54

S = 1,094 R-Sq = 0,03% R-Sq(adj) = 0,00%

Individual 95% CIs For Mean Based on

Pooled StDev

Level N Mean StDev --+---------+---------+---------+-------

ISDM 5565 4,432 1,093 (-*)

ISDM_50 50 4,255 1,277 (--------------*--------------)

ISDM_100 100 4,489 1,046 (---------*----------)

--+---------+---------+---------+-------

4,00 4,20 4,40 4,60

Pooled StDev = 1,094

A anlise de varincia entre as amostras e a populao nos indica que a variao de

0,79; e o P-Value: 0,453

8.2 VARIVEL EMPREGO E RENDA

EMPREGO E RENDA para amostra com 50 linhas:

possvel observar que a mdia dos dados de 4,40 e o desvio padro 1,44. Existe

95% de confiana de que a mdia est entre o intervalo de 0,36 e 0,44.

55

EMPREGO E RENDA para amostra com 100 linhas:

possvel observar que a mdia dos dados de 0,41 e o desvio padro 0,17. Existe

95% de confiana de que a mdia est entre o intervalo de 0,38 e 0,45.

EMPREGO E RENDA para toda a populao (5565 linhas)

possvel observar que a mdia dos dados de 0,40 e o desvio padro 0,15. Existe

95% de confiana de que a mdia est entre o intervalo de 0,39 e 0,40.

56

Boxplot de EMPREGO E RENDA para amostras de 50, 100 e populao:

O Boxplot confirma a semelhana dos resultados das duas amostras comparados com a

populao total. Existe uma variabilidade dos dados em todas as trs variveis.

One-way ANOVA: Emprego e Renda; Emprego e Renda_50; Emprego e Renda_100

Source DF SS MS F P

Factor 2 0,0240 0,0120 0,50 0,608

Error 5712 138,0660 0,0242

Total 5714 138,0900

S = 0,1555 R-Sq = 0,02% R-Sq(adj) = 0,00%

Level N Mean StDev

Emprego e Renda 5565 0,4038 0,1552

Emprego e Renda_50 50 0,4039 0,1448

Emprego e Renda_100 100 0,4194 0,1724

Individual 95% CIs For Mean Based on

Pooled StDev

Level ------+---------+---------+---------+---

Emprego e Renda (-*)

Emprego e Renda_50 (-----------------*----------------)

Emprego e Renda_100 (-----------*-----------)

------+---------+---------+---------+---

57

0,375 0,400 0,425 0,450

Pooled StDev = 0,1555

A anlise de varincia entre as amostras e a populao indica que a variao de 0,50;

e o P-Value: 0,608.

8.3 VARIVEL EDUCAO

EDUCAO para amostra com 50 linhas:

possvel observar que a mdia dos dados de 0,74 e o desvio padro 0,11. Existe

95% de confiana de que a mdia est entre o intervalo de 0,71 e 0,78.

EDUCAO para amostra com 100 linhas:

58

possvel observar que a mdia dos dados de 0,74 e o desvio padro 0,10. Existe

95% de confiana de que a mdia est entre o intervalo de 0,72 e 0,76.

EDUCAO para toda a populao (5565 linhas)

possvel observar que a mdia dos dados de 0,74 e o desvio padro 0,11. Existe

95% de confiana de que a mdia est entre o intervalo de 0,73 e 0,74.

Boxplot de EDUCAO para amostras de 50, 100 e populao:

O Boxplot confirma a semelhana dos resultados das duas amostras comparados com a

populao total. Existe uma variabilidade dos dados em todas as trs variveis.

One-way ANOVA: Educao; Educao_50; Educao_100

Source DF SS MS F P

Factor 2 0,0051 0,0026 0,20 0,816

59

Error 5712 72,0111 0,0126

Total 5714 72,0163

S = 0,1123 R-Sq = 0,01% R-Sq(adj) = 0,00%

Individual 95% CIs For Mean Based on

Pooled StDev

Level N Mean StDev -+---------+---------+---------+--------

Educao 5565 0,7413 0,1124 (-*-)

Educao_50 50 0,7497 0,1138 (-------------------*------------------)

Educao_100 100 0,7453 0,1066 (-------------*-------------)

-+---------+---------+---------+--------

0,720 0,736 0,752 0,768

Pooled StDev = 0,1123

A anlise de varincia entre as amostras e a populao indica que a variao de 0,20;

e o P-Value: 0,816.

9. ANLISE MULTIVARIADA

9.1 Dendograma dos agrupamentos das variveis por similaridade

S1_1

_A50

R1_A

50

Liquid

ez_A

50

Empr

ego e

Ren

da_A

50

T1_2

_A50

H6_A

50

Sad

e_A5

0

E2_4

_A50

Educ

ao

_A50

ISDM_

A50

47,80

65,20

82,60

100,00

Variables

Sim

ilari

ty

DendrogramSingle Linkage; Correlation Coefficient Distance

60

O dendograma acima permite que sejam visualizadas as variveis que possuem um

percentual de similaridade forte, na faixa de 85% so ISDM, Educao, E2_4, Sade, H6 e

T1_2. As variveis Emprego e Renda, Liquidez, R1 e S1_1 tem nvel de similaridade abaixo

de 80%.

9.2 Principais Componentes

A anlise de componentes principais uma tcnica estatstica poderosa que pode ser

utilizada para reduo do nmero de variveis e para fornecer uma viso estatisticamente

privilegiada do conjunto de dados. A anlise de componentes principais fornece as

ferramentas adequadas para identificar as variveis mais importantes no espao das

componentes principais.

0,50,40,30,20,10,0-0,1-0,2-0,3-0,4

0,75

0,50

0,25

0,00

-0,25

-0,50

First Component

Seco

nd C

ompo

nent

Liquidez_A50

S1_1_A50

Sade_A50E2_4_A50

Educao_A50

H6_A50

T1_2_A50

R1_A50

Emprego e Renda_A50

ISDM_A50

Loading Plot of ISDM_A50; ...; Liquidez_A50

possvel observar a existncia de trs grupos principais, sendo o primeiro composto

pelas variveis ISDM, Educao, E2_4, Sade, Liquidez e H6. O segundo composto por

Emprego e Renda e T1_2 e o terceiro composto por S1_1 e R1.

61

10987654321

6

5

4

3

2

1

0

Component Number

Eige

nval

ueScree Plot of ISDM_A50; ...; Liquidez_A50

notvel um peso superior da primeira varivel enquanto as outras variveis

aparecem com bastante distncia. As variveis 2, 3 e 4 podem ser aproveitadas, por

apresentarem valores superiores a 1, entretanto as demais variveis (5 a 10) no sero

utilizadas por apresentarem valores inferiores a 1.

Principal Component Analysis: ISDM_A50; Emprego e Re; R1_A50; T1_2_A50; H6_A50; Eigenanalysis of the Correlation Matrix Eigenvalue 5,5664 1,1561 0,9927 0,9407 0,4112 0,3563 0,2870 0,1583 Proportion 0,557 0,116 0,099 0,094 0,041 0,036 0,029 0,016 Cumulative 0,557 0,672 0,772 0,866 0,907 0,942 0,971 0,987 Eigenvalue 0,0751 0,0563 Proportion 0,008 0,006 Cumulative 0,994 1,000 Variable PC1 PC2 PC3 PC4 PC5 PC6 PC7 ISDM_A50 0,407 0,017 0,039 -0,115 -0,094 -0,103 0,049 Emprego e Renda_A50 0,197 0,719 -0,123 0,097 0,519 0,365 -0,127 R1_A50 -0,404 0,031 -0,006 0,112 0,011 0,219 0,227 T1_2_A50 0,305 0,494 0,091 0,026 -0,439 -0,500 -0,109 H6_A50 0,335 -0,399 0,006 -0,123 0,282 0,028 -0,683 Educao_A50 0,377 -0,030 0,160 -0,050 -0,279 0,427 0,228 E2_4_A50 0,373 -0,141 -0,022 -0,119 -0,200 0,462 0,229 Sade_A50 0,348 -0,190 -0,062 0,080 0,535 -0,399 0,581 S1_1_A50 -0,099 0,079 0,925 -0,272 0,208 -0,004 0,033 Liquidez_A50 0,124 -0,125 0,301 0,923 -0,044 0,056 -0,095 Variable PC8 PC9 PC10 ISDM_A50 0,134 0,645 0,602

62

Emprego e Renda_A50 0,001 0,027 -0,002 R1_A50 -0,222 -0,353 0,742 T1_2_A50 -0,237 -0,370 0,083 H6_A50 -0,089 -0,325 0,233 Educao_A50 0,604 -0,389 0,020 E2_4_A50 -0,701 0,066 -0,156 Sade_A50 -0,035 -0,221 0,001 S1_1_A50 -0,092 0,033 -0,032 Liquidez_A50 -0,043 0,104 -0,015

Com base nos grficos trabalhados neste captulo perceptvel que os dados podem

ser reduzidos em 3 variveis, o que facilita o trabalho por gerarem nmeros mais fceis e

prticos de serem manuseados.

10. ANLISE DE CONGLOMERADOS

Neste captulo foram geradas anlises comparativas dos dados de ISDM, Educao,

Emprego e Renda e Sade agrupado por Estado, excluindo o Distrito Federal por ter apenas

um Municpio. Tambm foi calculada a Anova do ISDM com relao a Educao, Emprego e

Renda e Sade por Estado, foram gerados diversos grficos com as diversas variveis citadas.

Comparando-se os resultados das mdias por estado, poderemos agrupar as linhas de dados

pelo nvel de desigualdade dos fatores de ISDM, Educao, Emprego e Renda e Sade.

10.1 ANOVA

10.1.1 ANOVA de ISDM por Estado

TOSPSESCRSRRRORNRJPRPIPEPBPAMTMSMGMAGOESCEBAAPAMALAC

7

6

5

4

3

2

1

0

UF2

ISD

M

Individual Value Plot of ISDM vs UF2

63

O grfico acima possibilita visualizar que a mdia do ISDM varia bastante entre os

Estados brasileiros. So Paulo o Estado que apresenta o maior valor de ISDM, passando de

6, enquanto o Amazonas apresenta o menor ISDM, ficando abaixo de 1.

One-way ANOVA: ISDM versus UF2 Source DF SS MS F P UF2 25 4757,770 190,311 558,65 0,000 Error 5538 1886,584 0,341 Total 5563 6644,353 S = 0,5837 R-Sq = 71,61% R-Sq(adj) = 71,48% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+---------+- AC 22 2,8837 1,0103 (--*-) AL 101 3,1996 0,6982 (*) AM 62 2,3550 0,7750 (-*) AP 16 3,4060 0,6679 (--*--) BA 416 3,6024 0,6378 (*) CE 184 3,4534 0,5689 (* ES 78 4,9080 0,4716 (*) GO 247 4,7989 0,4546 (*) MA 217 2,7076 0,7130 (*) MG 852 4,9973 0,7056 * MS 78 4,6714 0,5353 (-*) MT 142 4,5219 0,5831 (*) PA 142 2,9406 0,8605 (*) PB 222 3,5758 0,5246 (*) PE 185 3,6533 0,6738 (* PI 223 3,0103 0,6091 (*) PR 399 5,0427 0,4915 *) RJ 92 5,2888 0,3299 (*) RN 167 3,7924 0,5833 (*) RO 52 4,2359 0,4502 (*-) RR 15 2,6668 1,2718 (--*--) RS 497 5,1373 0,5099 *) SC 295 5,2241 0,4816 *) SE 75 3,8260 0,5672 (*-) SP 647 5,6458 0,3415 *) TO 138 3,8761 0,6077 (*) --------+---------+---------+---------+- 3,0 4,0 5,0 6,0 Pooled StDev = 0,5837

possvel notar que existe uma variao grande entre as mdias de ISDM por Estado,

por exemplo o Estado que apresenta a maior mdia So Paulo, com 5,6458, e a menor mdia

est no Amazonas, com 2,3550.

64

10.1.2 ANOVA de Emprego e Renda por Estado

TOSPSESCRSRRRORNRJPRPIPEPBPAMTMSMGMAGOESCEBAAPAMALAC

1,0

0,8

0,6

0,4

0,2

0,0

UF2

Empr

ego

e R

enda

Individual Value Plot of Emprego e Renda vs UF2

One-way ANOVA: Emprego e Renda versus UF2 Source DF SS MS F P UF2 25 28,6670 1,1467 60,24 0,000 Error 5538 105,4184 0,0190 Total 5563 134,0854 S = 0,1380 R-Sq = 21,38% R-Sq(adj) = 21,02% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ------+---------+---------+---------+--- AC 22 0,3718 0,1183 (------*-------) AL 101 0,3174 0,1295 (---*--) AM 62 0,3027 0,1306 (---*---) AP 16 0,3807 0,1789 (--------*-------) BA 416 0,3515 0,1283 (-*-) CE 184 0,3189 0,1271 (--*-) ES 78 0,4520 0,1380 (--*---) GO 247 0,4052 0,1432 (-*-) MA 217 0,2890 0,1309 (-*-) MG 852 0,3844 0,1394 (*) MS 78 0,4369 0,1334 (---*--) MT 142 0,4284 0,1333 (--*-) PA 142 0,3741 0,1506 (--*--) PB 222 0,3211 0,1101 (-*-) PE 185 0,3862 0,1366 (-*--) PI 223 0,3064 0,1167 (-*--) PR 399 0,4383 0,1268 (-*) RJ 92 0,5317 0,1923 (--*---) RN 167 0,3391 0,1088 (-*--) RO 52 0,3976 0,1289 (----*---) RR 15 0,3471 0,1740 (-------*--------) RS 497 0,4664 0,1344 (*-) SC 295 0,4865 0,1398 (-*-) SE 75 0,4251 0,1385 (---*---)

65

SP 647 0,5220 0,1675 (*-) TO 138 0,2941 0,1188 (--*--) ------+---------+---------+---------+--- 0,320 0,400 0,480 0,560 Pooled StDev = 0,1380

possvel notar que existe uma variao grande entre as mdias de Emprego e Renda

por Estado, por exemplo o Estado que apresenta a maior mdia Rio de Janeiro, e a menor

mdia est no Maranho.

10.1.3 ANOVA de R1 por Estado

TOSPSESCRSRRRORNRJPRPIPEPBPAMTMSMGMAGOESCEBAAPAMALAC

80

70

60

50

40

30

20

10

0

UF2

R1

Individual Value Plot of R1 vs UF2

One-way ANOVA: R1 versus UF2 Source DF SS MS F P UF2 25 1271842 50874 598,69 0,000 Error 5538 470592 85 Total 5563 1742434 S = 9,218 R-Sq = 72,99% R-Sq(adj) = 72,87% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- AC 22 44,640 14,190 (--*-) AL 101 46,940 9,556 (*) AM 62 54,113 11,654 (*-) AP 16 40,595 11,928 (--*--) BA 416 40,141 9,530 (* CE 184 43,530 9,440 (*) ES 78 16,215 6,082 (-*) GO 247 13,654 8,626 (*) MA 217 51,013 11,804 (*) MG 852 18,894 11,638 (* MS 78 15,912 10,111 (-*) MT 142 17,655 9,224 (*) PA 142 44,129 13,