Upload
dodat
View
222
Download
0
Embed Size (px)
Citation preview
PONTIFCIA UNIVERSIDADE CATLICA DE SO PAULO
FEA - FACULDADE DE ECONOMIA E ADMINISTRAO
PROGRAMA DE ESTUDOS PS-GRADUADOS EM
ADMINISTRAO
PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICPAL NO BRASIL Focando principalmente indicadores relacionados a Habitao, Educao, Trabalho e muito particularmente EMPREGO e RENDA.
MTODOS QUANTITATIVOS DA PESQUISA EMPRICA
Professor: Dr. Arnoldo Jos de Hoyos
Jos Felipe Ferreira de Souza
2
SUMRIO
1 INTRODUO .................................................................................................................... 5
2 OS DADOS .......................................................................................................................... 5
2.1 Os Indivduos .................................................................................................................... 5
2.2 As Variveis ..................................................................................................................... 6
3. ANLISE DAS VARIVEIS................................................................................................ 8
3.1 Variveis Categricas ....................................................................................................... 8
3.1.1 Varivel: Estados ................................................................................................... 8
4. ANLISE EXPLORATRIA DE DADOS ........................................................................ 11
4.1 Histograma ..................................................................................................................... 11
4.1.1 ISDM ....................................................................................................................... 11
4.1.2 EMPREGO E RENDA ............................................................................................ 13
4.1.3 R1 ............................................................................................................................ 14
4.1.4 T1_2 ......................................................................................................................... 15
4.1.5 H6 ............................................................................................................................ 16
4.1.6 EDUCAO ........................................................................................................... 17
4.1.7 E2_4 ......................................................................................................................... 18
4.1.8 SADE .................................................................................................................... 19
4.1.9 S1_1 ......................................................................................................................... 20
4.1.10 LIQUIDEZ ............................................................................................................ 21
5. RELAO ENTRE AS VARIVEIS ................................................................................. 22
5.1 Correlaes ..................................................................................................................... 22
5.2 Dendograma ................................................................................................................... 23
5.3 Grficos Scaterplot e Regresso de mnimos quadrados................................................ 24
5.3.1 ISDM versus EMPREGO E RENDA ...................................................................... 24
5.3.2 ISDM versus R1 ...................................................................................................... 26
5.3.3 ISDM versus T1_2 .................................................................................................. 27
5.3.4 ISDM versus H6 ...................................................................................................... 28
5.3.5 ISDM versus EDUCAO ..................................................................................... 29
5.3.6 ISDM versus E2_4 .................................................................................................. 31
5.3.7 ISDM versus SADE .............................................................................................. 32
5.3.8 ISDM versus S1_1 ................................................................................................... 33
3
5.3.9 ISDM versus LIQUIDEZ ........................................................................................ 34
6. MODELO DE REGRESSO LINEAR ............................................................................... 35
6.1 ISDM versus Emprego e Renda; Educao; e Sade ..................................................... 35
6.2 ISDM versus E2_4; T1_2; S1_1; R1; H6; e Liquidez .................................................... 36
7. TESTE DE COMPARAES ............................................................................................. 37
7.1 Varivel ISDM ............................................................................................................... 37
7.2 Varivel Emprego e Renda ............................................................................................. 38
7.3 Varivel Educao .......................................................................................................... 40
7.4 Varivel Sade ................................................................................................................ 41
7.5 Varivel E2_4 ................................................................................................................. 43
7.6 Varivel T1_2 ................................................................................................................. 44
7.7 Varivel S1_1 ................................................................................................................. 46
7.8 Varivel R1 ..................................................................................................................... 47
7.9 Varivel H6 .................................................................................................................... 49
7.10 Varivel Liquidez ......................................................................................................... 50
8. AMOSTRAGEM .................................................................................................................. 52
8.1 VARIVEL ISDM ......................................................................................................... 52
8.2 VARIVEL EMPREGO E RENDA ............................................................................. 54
8.3 VARIVEL EDUCAO............................................................................................. 57
9. ANLISE MULTIVARIADA ............................................................................................. 59
9.1 Dendograma dos agrupamentos das variveis por similaridade ..................................... 59
9.2 Principais Componentes ................................................................................................. 60
10. ANLISE DE CONGLOMERADOS ............................................................................... 62
10.1 ANOVA ........................................................................................................................ 62
10.1.1 ANOVA de ISDM por Estado ............................................................................... 62
10.1.2 ANOVA de Emprego e Renda por Estado ............................................................ 64
10.1.3 ANOVA de R1 por Estado .................................................................................... 65
10.1.4 ANOVA de T1_2 por Estado ................................................................................ 66
10.1.5 ANOVA de H6 por Estado .................................................................................... 67
10.1.6 ANOVA de Educao por Estado ......................................................................... 68
10.1.7 ANOVA de E2_4 por Estado ................................................................................ 69
10.1.8 ANOVA de Sade por Estado ............................................................................... 71
10.1.9 ANOVA de S1_1 por Estado ................................................................................ 72
10.1.10 ANOVA de Liquidez por Estado......................................................................... 73
4
10.2 DENDOGRAMA DOS DADOS AGRUPADOS PELO RESULTADO DAS
MDIAS ............................................................................................................................... 75
11. ANLISE DISCRIMINANTE .......................................................................................... 77
11.1 DENDOGRAMA DAS REGIES BRASILEIRAS .................................................... 77
11.2 ANLISE DESCRIMINANTE DAS CINCO REGIES VERSUS ISDM, EMPREGO
E RENDA, EDUCAO E SADE ................................................................................... 77
12. REGRESSO LOGSTICA ............................................................................................... 79
13. RVORES DE CLASSIFICAO ................................................................................... 80
13.1 Os trs brasis ................................................................................................................. 80
13.2 rvore de classificao das variveis: ISDM, Educao, E2_4, Sade, H6, T1_2,
Emprego e Renda, Liquidez, R1 e S1_1 ............................................................................... 81
13.3 rvore de classificao das mdias Variveis ISDM, Educao, E2_4, Sade, H6,
T1_2, Emprego e Renda, Liquidez, R1 e S1_1 x Trs Brasis .............................................. 82
13.4 rvore de classificao dos desvios padres Variveis ISDM, Educao, E2_4,
Sade, H6, T1_2, Emprego e Renda, Liquidez, R1 e S1_1 x Trs Brasis ........................... 83
13.5 rvore de classificao das mdias Variveis ISDM, Educao, E2_4, Sade, H6,
T1_2, Emprego e Renda, Liquidez, R1 e S1_1 x Regio ..................................................... 85
13.6 rvore de classificao dos desvios padres Variveis ISDM, Educao, E2_4,
Sade, H6, T1_2, Emprego e Renda, Liquidez, R1 e S1_1 x Regio .................................. 87
14. CONSIDERAES FINAIS ............................................................................................. 89
5
1 INTRODUO
O presente trabalho prope trabalhar com os 12 exerccios que foram realizados ao
longo da disciplina, com a incrementao de seis novas variveis: E2_4 (Proporo de
crianas de 7 a 14 anos na srie adequada para sua idade); T1_2 (Taxa de formalizao entre
os empregados); S1_1 (Taxa de mortalidade infantil, por mil nascidos vivos); R1 (Proporo
de pessoas com renda domiciliar per capita abaixo da linha de pobreza); H6 (Proporo de
pessoas que vivem em domiclio que tem densidade de moradores por dormitrio inferior a
2); e Liquidez. Somam-se a essas 6 variveis as outras 5 variveis que vem sido trabalhadas
ao longo da disciplina: ISDM; Emprego e Renda; Educao; e Sade mais as cinco regies
brasileiras: Norte, Nordeste, Centro-Oeste, Sul e Sudeste.
Neste novo momento as 16 variveis foram trabalhadas com os exerccios de: Anlise
exploratria de dados; relao entre variveis, correlao, regresso linear, teste de
comparao, anlise multivariada, analise de conglomerados, anlise discriminante, regresso
logstica, anlise de correspondncia e rvore de classificao.
Para tanto sero utilizados os dados da Pesquisa Firjan/FGV sobre o Desenvolvimento
dos Municpios nos perodos de 2000 e 2010 e utilizar a classificao por regies brasileiras:
Norte, Nordeste, Centro-Oeste, Sudeste e Sul.
O software estatstico a ser utilizado o MINITAB16 e o SPSS.
2 OS DADOS
2.1 Os Indivduos
Os indivduos desta anlise so os 5565 Municpios brasileiros classificados em suas
regies cujas prefeituras disponibilizaram os dados referentes ao ISDM, IFDM, IFGF,
Emprego e Renda, Educao e Sade.
Fonte: Tabela ISDM, IFDM e IFGF por municpios brasileiros; e
http://www.firjan.org.br
6
2.2 As Variveis
Para o objetivo do presente trabalho, foram trabalhados os dados de 16 variveis:
ISDM, Emprego e Renda, Educao, Sade, E2_4 (Proporo de crianas de 7 a 14 anos na
srie adequada para sua idade); T1_2 (Taxa de formalizao entre os empregados); S1_1
(Taxa de mortalidade infantil, por mil nascidos vivos); R1 (Proporo de pessoas com renda
domiciliar per capita abaixo da linha de pobreza); H6 (Proporo de pessoas que vivem em
domiclio que tem densidade de moradores por dormitrio inferior a 2); e Liquidez, e as
regies Norte, Nordeste, Centro-Oeste, Sudeste e Sul.
Varivel Significado Tipo Unidade
de Medida
ISDM Indicador Social de Desenvolvimento dos
Municpios (ISDM). Consiste na mdia
ponderada dos indicadores das dimenses
Habitao, Renda, Trabalho, Sade e Segurana
e Educao (H, R, T, S e E) padronizada pela
mdia do Brasil.
Varivel
Quantitativa
Numrico
Renda
(R)
Mdia ponderada dos indicadores da dimenso
Renda (R1 e R2) padronizada pela mdia do
Brasil.
Varivel
Quantitativa
Numrico
R1 Proporo de pessoas com renda domiciliar per
capita abaixo da linha de pobreza
Varivel
Quantitativa
Numrico
Emprego/Trabalho
(T)
Mdia ponderada dos indicadores da dimenso
Trabalho (T1_1, T1_2 e T2_1) padronizada pela
mdia do Brasil.
Varivel
Quantitativa
Numrico
T1_2 Taxa de formalizao entre os empregados. Varivel
Quantitativa
Numrico
H6 Proporo de pessoas que vivem em domiclio
que tem densidade de moradores por dormitrio
inferior a 2.
Varivel
Quantitativa
Numrico
Educao
(E)
Mdia ponderada dos indicadores da dimenso
Educao (E1_1, E1_2, E2_1, E2_2, E2_3,
E2_4, E2_5, E2_6, E3_1, E3_2 e E3_3)
Varivel
Quantitativa
Numrico
7
padronizada pela mdia do Brasil.
E2_4 Proporo de crianas de 7 a 14 anos na srie
adequada para sua idade.
Varivel
Quantitativa
Numrico
Sade Mdia ponderada dos indicadores da dimenso
Sade e Segurana (S1_1, S1_2, S1_3, S2_1,
S2_2 e S3_1) padronizada pela mdia do Brasil.
Varivel
Quantitativa
Numrico
S1_1 Taxa de mortalidade infantil, por mil nascidos
vivos.
Varivel
Quantitativa
Numrico
Liquidez Refere-se velocidade e facilidade com a qual
um ativo pode ser convertido em caixa. O
indicador procura verificar se o municpio
possui recursos financeiros suficientes para
fazer frente ao montante de restos a pagar. Se o
municpio apresentar mais restos a pagar do que
ativos financeiros disponveis a pontuao ser
zero. Na leitura dos resultados, quanto mais
prximo de 1,00, menos o municpio est
postergando pagamentos para o exerccio
seguinte sem a devida cobertura.
Varivel
Quantitativa
Numrico
Norte A Regio Norte a regio que possui a maior
rea (3 869 637,9 km, ou 45% do territrio
nacional) e com populao de 16,3 milhes de
habitantes. a regio com a menor densidade
demogrfica (3,77 hab./km, segundo o
censo IBGE 2010). A cidade mais populosa da
regio, Manaus, com 1,8 milho de habitantes,
a stima mais populosa do Brasil.
Varivel
Quantitativa
Numrico
Nordeste A Regio Nordeste possui um territrio de 1
556 001 km (18,2% do territrio nacional),
dentro dos quais est localizado o Polgono das
secas. Sua populao pouco superior a 50
milhes de habitantes. A regio possui nove
estados.
Varivel
Quantitativa
Numrico
8
Centro-Oeste Ocupa 18,86% do territrio brasileiro, com uma
rea de 2.612.077,2 km2. Sua populao de
cerca de 12 milhes de habitantes. A regio
possui trs estados mais um distrito federal.
Varivel
Quantitativa
Numrico
Sudeste Possui um territrio de 927 286 km (10,6% do
territrio nacional). Sua populao de cerca de
77 milhes de habitantes. Possui o
maior PIB bem como as duas cidades mais
populosas do Brasil: So Paulo, com pouco
mais de 11 milhes de habitantes e Rio de
Janeiro com cerca de 6 milhes.
Varivel
Quantitativa
Numrico
Sul A Regio Sul a que possui a menor rea (575
316 km, ou 6,8% do territrio nacional) e sua
populao de mais de 26 milhes de
habitantes, a segunda regio mais rica do pas,
depois da Regio Sudeste, e a que possui o
maior IDH, a maior taxa de alfabetizao e os
melhores nveis de educao, sade e bem estar
social do pas. A regio possui trs estados.
Varivel
Quantitativa
Numrico
3. ANLISE DAS VARIVEIS
3.1 Variveis Categricas
Este tipo de varivel indica que o foco de concentrao deve ser a anlise de grficos
do tipo pie chart e barras.
3.1.1 Varivel: Estados
Fazem parte desta pesquisa os 27 Estados brasileiros e seus 5565 municpios
classificados em 5 regies brasileiras. Nos grficos abaixo possvel visualizar a distribuio
de municpios por Estado brasileiro e as cinco regies brasileiras.
9
MGMSMTPAPBPEPIPRRJRN
A C
RORRRSSCSESPTOO ther
A LA MA PBAC EESGOMA
EstadoDistribuio dos Estados brasileiros com Municpios participantes
10
DFRRAPACROAMSEMSESRJALTOPAMTRNCEPEMAP
BPIGOSCPRBARSSPMG
900
800
700
600
500
400
300
200
100
0
Estados
Num
ero
de M
unic
pio
s
Municpios por Estado brasileiro
Os dados dos grficos nos permite visualizar que, os Estados com maior participao
de municpios so: Minas Gerais (852 cidades), So Paulo (647 cidades), Rio Grande do Sul
(497 cidades), Bahia (416 cidades) e Paran (399 cidades).
11
J entre os Estados com menor nmero de cidades participantes, temos: Distrito
Federal (1 cidade), Roraima (15 cidades), Amap (16 cidades) e Acre (22 cidades).
4. ANLISE EXPLORATRIA DE DADOS
Para iniciar a anlise exploratria dos dados, foi realizada a analise descritiva das
variveis para verificar se existem lacunas, como resultado foi obtido o seguinte:
Descriptive Statistics: ISDM; Emprego e Re; R1; T1_2; H6; Educao; E2_4; ... Total Variable Count N* Minimum Q1 Median Q3 Maximum ISDM 5565 0 0,5476 3,5973 4,6446 5,3454 6,2778 Emprego e Renda 5565 0 0,00000 0,30631 0,37576 0,47111 1,00000 R1 5565 0 0,073 8,618 19,990 39,479 78,801 T1_2 5565 0 6,400 41,272 57,421 71,384 94,914 H6 5565 0 4,735 45,035 55,297 64,616 89,335 Educao 5565 0 0,37456 0,66324 0,74595 0,82305 1,00000 E2_4 5565 0 45,722 79,528 87,510 92,529 100,000 Sade 5565 0 0,44212 0,72978 0,81027 0,87642 1,00000 S1_1 5567 1 0,000 4,294 12,579 20,059 333,333 Liquidez 5565 304 0,00000 0,19358 0,69333 0,91435 1,00000
possvel observar que as variveis S1_1 e a Liquidez apresentaram lacunas, para
preenche-las, foram utilizados os valores do primeiro quartil (Q1), o resultado foi:
Descriptive Statistics: ISDM; Emprego e Re; R1; T1_2; H6; Educao; E2_4; ... Total Variable Count N* Minimum Q1 Median Q3 Maximum ISDM 5565 0 0,5476 3,5973 4,6446 5,3454 6,2778 Emprego e Renda 5565 0 0,00000 0,30631 0,37576 0,47111 1,00000 R1 5565 0 0,073 8,618 19,990 39,479 78,801 T1_2 5565 0 6,400 41,272 57,421 71,384 94,914 H6 5565 0 4,735 45,035 55,297 64,616 89,335 Educao 5565 0 0,37456 0,66324 0,74595 0,82305 1,00000 E2_4 5565 0 45,722 79,528 87,510 92,529 100,000 Sade 5565 0 0,44212 0,72978 0,81027 0,87642 1,00000 S1_1 5567 0 0,000 4,294 12,579 20,050 333,333 Liquidez 5565 0 0,00000 0,19358 0,65578 0,90601 1,00000
Uma vez que todas as lacunas foram preenchidas foi feito o histograma de todas as
variveis.
4.1 Histograma
4.1.1 ISDM
12
5,64,84,03,22,41,60,8
Median
Mean
4,704,654,604,554,504,454,40
1st Q uartile 3,5973Median 4,64463rd Q uartile 5,3454Maximum 6,2778
4,4037 4,4612
4,5898 4,7046
1,0730 1,1136
A -Squared 75,76P-V alue < 0,005
Mean 4,4324StDev 1,0929V ariance 1,1945Skewness -0,541209Kurtosis -0,522196N 5565
Minimum 0,5476
A nderson-Darling Normality Test
95% C onfidence Interv al for Mean
95% C onfidence Interv al for Median
95% C onfidence Interv al for StDev95% Confidence Intervals
Summary for ISDM
Observaes:
Forma: O Histograma nos permite verificar que trata-se de uma distribuio
visivelmente assimtrica para a direita, o que comum para variveis que indiquem
ganhos, receitas, salrios, etc.
Valores Atpicos: H 3 valores de ISDM atpicos, que apresentam resultados
abaixo de 0,8, que so os municpios de Chaves, PA; Amajari, RR e Melgao, PA.
Centro e Disperso: A mediana nos indica que aproximadamente metade dos
municpios tem ISDM menor do que 4,64446. O ISDM mdio de 4,4324, mas o desvio-
padro (medida de disperso) de 1,0929, que implica em uma disperso grande da
populao e uma variao grande entre os diversos municpios do Brasil.
13
4.1.2 EMPREGO E RENDA
0,980,840,700,560,420,280,140,00
Median
Mean
0,410,400,390,380,37
1st Q uartile 0,30631Median 0,375763rd Q uartile 0,47111Maximum 1,00000
0,39967 0,40783
0,37169 0,37957
0,15241 0,15818
A -Squared 105,84P-V alue < 0,005
Mean 0,40375StDev 0,15524V ariance 0,02410Skewness 0,88857Kurtosis 1,32253N 5565
Minimum 0,00000
A nderson-Darling Normality Test
95% C onfidence Interv al for Mean
95% C onfidence Interv al for Median
95% C onfidence Interv al for StDev95% Confidence Intervals
Summary for Emprego e Renda
Observaes:
Forma: O Histograma nos permite verificar que trata-se de uma distribuio
visivelmente assimtrica para a esquerda.
Centro e Disperso: A mediana nos indica que muitos municpios apresentam
Emprego e Renda menor do que 0,37576. A mdia de 0,40375, e o desvio-padro
(medida de disperso) de 0,15524.
14
4.1.3 R1
7260483624120
Median
Mean
25242322212019
1st Q uartile 8,618Median 19,9903rd Q uartile 39,479Maximum 78,801
24,060 24,990
19,062 20,991
17,375 18,033
A -Squared 154,22P-V alue < 0,005
Mean 24,525StDev 17,698V ariance 313,215Skewness 0,512744Kurtosis -0,931901N 5565
Minimum 0,073
A nderson-Darling Normality Test
95% C onfidence Interv al for Mean
95% C onfidence Interv al for Median
95% C onfidence Interv al for StDev95% Confidence Intervals
Summary for R1
Observaes:
Forma: O Histograma nos permite verificar que trata-se de uma distribuio
visivelmente assimtrica para a esquerda.
Centro e Disperso: A mediana nos indica que muitos municpios apresentam
R1 menor do que 19,990. A mdia de 24,525, e o desvio-padro (medida de disperso)
de 17,698.
15
4.1.4 T1_2
9684726048362412
Median
Mean
58,558,057,557,056,556,0
1st Q uartile 41,272Median 57,4213rd Q uartile 71,384Maximum 94,914
55,824 56,783
56,580 58,208
17,901 18,579
A -Squared 41,12P-V alue < 0,005
Mean 56,304StDev 18,234V ariance 332,476Skewness -0,132478Kurtosis -0,993222N 5565
Minimum 6,400
A nderson-Darling Normality Test
95% C onfidence Interv al for Mean
95% C onfidence Interv al for Median
95% C onfidence Interv al for StDev95% Confidence Intervals
Summary for T1_2
Observaes:
Forma: O Histograma nos permite verificar que trata-se de uma distribuio
visivelmente simtrica.
Centro e Disperso: A mediana nos indica que aproximadamente metade dos
municpios apresentam T1_2 menor do que 57,421. A mdia de 56,304, e o desvio-
padro (medida de disperso) de 18,234.
16
4.1.5 H6
84726048362412
Median
Mean
56,055,555,054,554,0
1st Q uartile 45,035Median 55,2973rd Q uartile 64,616Maximum 89,335
53,963 54,675
54,880 55,797
13,306 13,810
A -Squared 15,83P-V alue < 0,005
Mean 54,319StDev 13,553V ariance 183,682Skewness -0,400642Kurtosis -0,053800N 5565
Minimum 4,735
A nderson-Darling Normality Test
95% C onfidence Interv al for Mean
95% C onfidence Interv al for Median
95% C onfidence Interv al for StDev95% Confidence Intervals
Summary for H6
Observaes:
Forma: O Histograma nos permite verificar que trata-se de uma distribuio
visivelmente assimtrica.
Centro e Disperso: A mediana nos indica que uma quantidade significativa dos
municpios apresentam H6 maior do que 55,297. A mdia de 54,319, e o desvio-padro
(medida de disperso) de 13,553.
17
4.1.6 EDUCAO
0,990,900,810,720,630,540,45
Median
Mean
0,75000,74750,74500,74250,7400
1st Q uartile 0,66324Median 0,745953rd Q uartile 0,82305Maximum 1,00000
0,73830 0,74420
0,74212 0,75047
0,11032 0,11449
A -Squared 7,27P-V alue < 0,005
Mean 0,74125StDev 0,11237V ariance 0,01263Skewness -0,172334Kurtosis -0,489371N 5565
Minimum 0,37456
A nderson-Darling Normality Test
95% C onfidence Interv al for Mean
95% C onfidence Interv al for Median
95% C onfidence Interv al for StDev95% Confidence Intervals
Summary for Educao
Observaes:
Forma: O Histograma permite verificar que se trata de uma distribuio
assimtrica. A posio da linha da mediana mais a direita do quadrado principal do Box-
Plot tambm indica esta assimetria. Considerando que o valor mnimo apresentado de 0
em alguns municpios e o valor mximo de 1 nos municpios de Araucria (PR) e
Ipojuca (PE), e a mediana ser apresentada pelo valor 0,74595, pode-se dizer que a maior
parte dos Estados brasileiros possuem um bom ndice de educao por municpio.
Centro e Disperso: A mediana nos indica que grande parte dos municpios
brasileiros apresentam os valores de sua distribuio de Educao acima da mdia
ponderada brasileira. Isso bom, pois indica que h boa frequncia de crianas do ensino
infantil, fundamental e mdio/geral indo a escola e uma pequena proporo de crianas
do ensino fundamental e mdio sofrem de analfabetismo. Na pesquisa no foram
apurados os dados referentes a educao superior.
18
4.1.7 E2_4
96888072645648
Median
Mean
88,087,587,086,586,085,585,0
1st Q uartile 79,528Median 87,5103rd Q uartile 92,529Maximum 100,000
85,247 85,714
87,165 87,883
8,719 9,050
A -Squared 95,44P-V alue < 0,005
Mean 85,481StDev 8,881V ariance 78,880Skewness -0,835199Kurtosis 0,263592N 5565
Minimum 45,722
A nderson-Darling Normality Test
95% C onfidence Interv al for Mean
95% C onfidence Interv al for Median
95% C onfidence Interv al for StDev95% Confidence Intervals
Summary for E2_4
Observaes:
Forma: O Histograma nos permite verificar que trata-se de uma distribuio
visivelmente assimtrica para a direita.
Centro e Disperso: A mediana nos indica que mais da metade dos municpios
apresentam E2_4 maior do que 87,510. A mdia de 85,481, e o desvio-padro (medida
de disperso) de 8,881.
19
4.1.8 SADE
0,960,880,800,720,640,560,48
Median
Mean
0,8150,8100,8050,8000,795
1st Q uartile 0,72978Median 0,810273rd Q uartile 0,87642Maximum 1,00000
0,79564 0,80092
0,80620 0,81410
0,09853 0,10226
A -Squared 34,12P-V alue < 0,005
Mean 0,79828StDev 0,10036V ariance 0,01007Skewness -0,460218Kurtosis -0,367873N 5565
Minimum 0,44212
A nderson-Darling Normality Test
95% C onfidence Interv al for Mean
95% C onfidence Interv al for Median
95% C onfidence Interv al for StDev95% Confidence Intervals
Summary for Sade
Observaes:
Forma: O Histograma nos permite verificar que trata-se de uma distribuio
visivelmente assimtrica para a direita.
Centro e Disperso: A mediana nos indica que mais da metade dos municpios
apresentam SADE maior do que 0,81027. A mdia de 0,79828, e o desvio-padro
(medida de disperso) de 0,10036.
20
4.1.9 S1_1
31527022518013590450
Median
Mean
14,514,013,513,012,512,0
1st Q uartile 4,294Median 12,5793rd Q uartile 20,050Maximum 333,333
13,883 14,634
12,295 12,912
14,020 14,550
A -Squared 160,67P-V alue < 0,005
Mean 14,259StDev 14,280V ariance 203,915Skewness 4,2583Kurtosis 59,4424N 5567
Minimum 0,000
A nderson-Darling Normality Test
95% C onfidence Interv al for Mean
95% C onfidence Interv al for Median
95% C onfidence Interv al for StDev95% Confidence Intervals
Summary for S1_1
Observaes:
Forma: O Histograma nos permite verificar que trata-se de uma distribuio
visivelmente assimtrica para a esquerda.
Centro e Disperso: A mediana nos indica que mais da metade dos municpios
apresentam S1_1 menor do que 12,579. A mdia de 14,259, e o desvio-padro (medida
de disperso) de 14,280.
21
4.1.10 LIQUIDEZ
0,980,840,700,560,420,280,140,00
Median
Mean
0,6750,6500,6250,6000,5750,550
1st Q uartile 0,19358Median 0,655783rd Q uartile 0,90601Maximum 1,00000
0,54165 0,56127
0,63410 0,67418
0,36648 0,38035
A -Squared 257,10P-V alue < 0,005
Mean 0,55146StDev 0,37328V ariance 0,13934Skewness -0,32363Kurtosis -1,46781N 5565
Minimum 0,00000
A nderson-Darling Normality Test
95% C onfidence Interv al for Mean
95% C onfidence Interv al for Median
95% C onfidence Interv al for StDev95% Confidence Intervals
Summary for Liquidez
Observaes:
Forma: O Histograma nos permite verificar que trata-se de uma distribuio
visivelmente assimtrica.
Centro e Disperso: A mediana nos indica que mais da metade dos municpios
apresentam LIQUIDEZ maior do que 0,65578. A mdia de 0,55146, e o desvio-padro
(medida de disperso) de 0,37328. Esse dado indica que ao menos metade dos
municpio esto postergando pagamentos para o exerccio seguinte sem a devida
cobertura.
22
5. RELAO ENTRE AS VARIVEIS
O presente captulo fez uma analise das variveis com relao ao ISDM. Abaixo segue
os resultados obtidos.
5.1 Correlaes
Sobre as correlaes das variveis estudadas, obteve-se o seguinte:
Correlations: ISDM; Emprego e Re; R1; T1_2; H6; Educao; E2_4; Sade; ... ISDM Emprego e Renda R1 Emprego e Renda 0,525 0,000 R1 -0,951 -0,509 0,000 0,000 T1_2 0,806 0,586 -0,782 0,000 0,000 0,000 H6 0,695 0,211 -0,709 0,000 0,000 0,000 Educao 0,782 0,377 -0,753 0,000 0,000 0,000 E2_4 0,764 0,363 -0,768 0,000 0,000 0,000 Sade 0,697 0,345 -0,713 0,000 0,000 0,000 S1_1 -0,147 -0,077 0,140 0,000 0,000 0,000 Liquidez 0,276 0,197 -0,308 0,000 0,000 0,000 T1_2 H6 Educao H6 0,449 0,000 Educao 0,609 0,552 0,000 0,000 E2_4 0,599 0,613 0,765 0,000 0,000 0,000 Sade 0,559 0,590 0,654 0,000 0,000 0,000 S1_1 -0,112 -0,115 -0,122 0,000 0,000 0,000 Liquidez 0,302 0,260 0,233 0,000 0,000 0,000
23
E2_4 Sade S1_1 Sade 0,640 0,000 S1_1 -0,128 -0,268 0,000 0,000 Liquidez 0,263 0,259 -0,049 0,000 0,000 0,000 Cell Contents: Pearson correlation P-Value
Sobre os resultados obtidos, possvel notar que ISDM x T1_2, ISDM x Educao,
ISDM x E2_4, ISDM x Sade, T1_2 x Educao, E2_4 x Sade, H6 x E2_4, Educao x
E2_4, e Educao x Sade so as variveis que apresentam as maiores correlaes, enquanto
ISDM x R1, T1_2 x R1, Educao x R1, e E2_4 x R1 apresentam as menores correlaes.
Na prxima etapa foram retiradas, do total de 5565 municpios, 50 amostras para a
elaborao dos grficos de Scatterplot. Foi realizado o dendograma e o cruzamentos entre
ISDM com as demais variveis para verificar o grau de proximidade entre elas.
5.2 Dendograma
O dendograma permite uma melhor visualizao sobre a proximidade das variveis
estudadas. Abaixo segue o resultado do dendograma:
S1_1
_A50
R1_A
50
Liquid
ez_A
50
Empr
ego e
Ren
da_A
50
T1_2
_A50
H6_A
50
Sad
e_A5
0
E2_4
_A50
Educ
ao
_A50
ISDM_
A50
47,80
65,20
82,60
100,00
Variables
Sim
ilari
ty
DendrogramSingle Linkage; Correlation Coefficient Distance
24
Nesta amostra possvel observar a existncia de 3 grupos principais, sendo um
primeiro grupo: ISDM, Educao, E2_4, Sade, H6 e T1_2 um grupo com similaridade acima
de 85%. Um segundo grupo composto por Emprego e renda e Liquidez, com um grau de
similaridade acima de 65% e um terceiro grupo com baixo grau de similaridade com os
demais composto por R1 e S1_1 que possuem similaridade acima de 45%
Cluster Analysis of Variables: ISDM_A50; Emprego e Re; R1_A50; T1_2_A50; ... Correlation Coefficient Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster 1 9 92,8941 0,14212 1 6 1 2 2 8 91,6434 0,16713 1 7 1 3 3 7 88,2285 0,23543 1 8 1 4 4 6 86,6548 0,26690 1 5 1 5 5 5 85,7641 0,28472 1 4 1 6 6 4 79,0191 0,41962 1 2 1 7 7 3 64,1737 0,71653 1 10 1 8 8 2 59,7530 0,80494 3 9 3 2 9 1 47,7985 1,04403 1 3 1 10
5.3 Grficos Scaterplot e Regresso de mnimos quadrados
5.3.1 ISDM versus EMPREGO E RENDA
0,90,80,70,60,50,40,30,20,10,0
6
5
4
3
2
Emprego e Renda_A50
ISD
M_A
50
Scatterplot of ISDM_A50 vs Emprego e Renda_A50
25
Observaes:
Direo: Da anlise das correlaes acima percebemos que algumas possuem
associaes positivas, ou seja, o crescimento de uma varivel acompanhado do crescimento
da outra.
Intensidade: O grfico acima parece indicar pouca existncia de relaes lineares,
sendo que h grande disparidade entre os pontos.
Forma: O grfico apresenta conglomerados que sugerem relaes pouco lineares.
Regression Analysis: ISDM_A50 versus Emprego e Renda_A50
The regression equation is ISDM_A50 = 3,67 + 2,82 Emprego e Renda_A50
Predictor Coef SE Coef T P Constant 3,6671 0,3896 9,41 0,000 Emprego e Renda_A50 2,8192 0,9048 3,12 0,003 S = 0,924961 R-Sq = 16,8% R-Sq(adj) = 15,1% Analysis of Variance Source DF SS MS F P Regression 1 8,3066 8,3066 9,71 0,003 Residual Error 48 41,0666 0,8556 Total 49 49,3731 Unusual Observations Emprego e Obs Renda_A50 ISDM_A50 Fit SE Fit Residual St Resid 4 0,817 6,026 5,972 0,395 0,054 0,06 X 9 0,932 6,157 6,294 0,494 -0,137 -0,18 X 16 0,896 5,942 6,194 0,463 -0,252 -0,31 X 23 0,360 2,557 4,682 0,137 -2,126 -2,32R 34 0,337 2,259 4,617 0,145 -2,358 -2,58R R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.
26
5.3.2 ISDM versus R1
6050403020100
6
5
4
3
2
R1_A50
ISD
M_A
50Scatterplot of ISDM_A50 vs R1_A50
Observaes:
Direo: Da anlise das correlaes acima percebemos que possuem associaes
negativas, apesar de manter caractersticas de linearidade.
Intensidade: O grfico acima parece indicar a existncia de relaes lineares, apesar de
sua relao negativa.
Forma: O grfico apresenta conglomerados que sugerem relaes lineares.
Regression Analysis: ISDM_A50 versus R1_A50
The regression equation is ISDM_A50 = 6,03 - 0,0648 R1_A50
Predictor Coef SE Coef T P Constant 6,03305 0,08826 68,35 0,000 R1_A50 -0,064837 0,003736 -17,35 0,000 S = 0,376050 R-Sq = 86,3% R-Sq(adj) = 86,0% Analysis of Variance Source DF SS MS F P Regression 1 42,585 42,585 301,14 0,000 Residual Error 48 6,788 0,141 Total 49 49,373 Unusual Observations
27
Obs R1_A50 ISDM_A50 Fit SE Fit Residual St Resid 10 26,3 5,1375 4,3283 0,0600 0,8092 2,18R 23 37,9 2,5568 3,5766 0,0888 -1,0198 -2,79R 31 59,4 2,9181 2,1844 0,1604 0,7337 2,16RX 34 55,1 2,2589 2,4630 0,1454 -0,2040 -0,59 X 45 28,0 5,0099 4,2207 0,0631 0,7892 2,13R R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.
5.3.3 ISDM versus T1_2
90807060504030
6
5
4
3
2
T1_2_A50
ISD
M_A
50
Scatterplot of ISDM_A50 vs T1_2_A50
Observaes:
Direo: Da anlise das correlaes acima percebemos que possuem associaes
positivas, e caractersticas pouco lineares.
Intensidade: O grfico acima parece indicar pouca existncia de relaes lineares,
apesar de sua relao positiva.
Forma: O grfico apresenta conglomerados que sugerem relaes pouco lineares, com
bastante disparidade entre os pontos.
Regression Analysis: ISDM_A50 versus T1_2_A50
The regression equation is ISDM_A50 = 1,98 + 0,0464 T1_2_A50
Predictor Coef SE Coef T P Constant 1,9792 0,4117 4,81 0,000 T1_2_A50 0,046395 0,006543 7,09 0,000
28
S = 0,708762 R-Sq = 51,2% R-Sq(adj) = 50,1% Analysis of Variance Source DF SS MS F P Regression 1 25,261 25,261 50,29 0,000 Residual Error 48 24,112 0,502 Total 49 49,373 Unusual Observations Obs T1_2_A50 ISDM_A50 Fit SE Fit Residual St Resid 23 62,1 2,557 4,861 0,100 -2,304 -3,28R 34 44,4 2,259 4,038 0,148 -1,779 -2,57R 40 42,8 5,467 3,964 0,156 1,504 2,17R R denotes an observation with a large standardized residual.
5.3.4 ISDM versus H6
80706050403020
6
5
4
3
2
H6_A50
ISD
M_A
50
Scatterplot of ISDM_A50 vs H6_A50
Observaes:
Direo: Da anlise das correlaes acima percebemos que possuem associaes
positivas, apesar de manter poucas caractersticas de linearidade.
Intensidade: O grfico acima parece indicar a existncia de pequenas relaes lineares.
29
Forma: O grfico apresenta conglomerados que sugerem relaes no lineares devido
a sua alta disparidade entre os pontos.
Regression Analysis: ISDM_A50 versus H6_A50
The regression equation is ISDM_A50 = 1,57 + 0,0565 H6_A50
Predictor Coef SE Coef T P Constant 1,5724 0,4445 3,54 0,001 H6_A50 0,056548 0,007572 7,47 0,000 S = 0,689784 R-Sq = 53,7% R-Sq(adj) = 52,8% Analysis of Variance Source DF SS MS F P Regression 1 26,535 26,535 55,77 0,000 Residual Error 48 22,838 0,476 Total 49 49,373 Unusual Observations Obs H6_A50 ISDM_A50 Fit SE Fit Residual St Resid 15 55,4 6,1445 4,7031 0,0986 1,4414 2,11R 21 27,1 3,3845 3,1024 0,2487 0,2822 0,44 X 34 21,8 2,2589 2,8026 0,2860 -0,5437 -0,87 X R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.
5.3.5 ISDM versus EDUCAO
1,00,90,80,70,60,5
6
5
4
3
2
Educao_A50
ISD
M_A
50
Scatterplot of ISDM_A50 vs Educao_A50
30
Observaes:
Direo: Da anlise das correlaes acima percebemos que possuem associaes
positivas, e apesar da baixa relao linear, possvel observar certa linearidade.
Intensidade: O grfico acima parece indicar um pouco da existncia de relaes
lineares, e associao positiva.
Forma: O grfico apresenta conglomerados que sugerem relaes lineares.
Regression Analysis: ISDM_A50 versus Educao_A50
The regression equation is ISDM_A50 = - 0,821 + 7,12 Educao_A50
Predictor Coef SE Coef T P Constant -0,8208 0,4924 -1,67 0,102 Educao_A50 7,1174 0,6153 11,57 0,000 S = 0,521144 R-Sq = 73,6% R-Sq(adj) = 73,0% Analysis of Variance Source DF SS MS F P Regression 1 36,337 36,337 133,79 0,000 Residual Error 48 13,036 0,272 Total 49 49,373 Unusual Observations Obs Educao_A50 ISDM_A50 Fit SE Fit Residual St Resid 8 0,750 5,8617 4,5138 0,0780 1,3479 2,62R 11 0,730 5,7514 4,3758 0,0827 1,3756 2,67R 23 0,520 2,5568 2,8806 0,1824 -0,3238 -0,66 X 31 0,674 2,9181 3,9765 0,1031 -1,0584 -2,07R 34 0,521 2,2589 2,8840 0,1821 -0,6250 -1,28 X R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.
31
5.3.6 ISDM versus E2_4
10095908580757065
6
5
4
3
2
E2_4_A50
ISD
M_A
50Scatterplot of ISDM_A50 vs E2_4_A50
Observaes:
Direo: Da anlise das correlaes acima percebemos que possuem associaes
positivas, e poucas caractersticas lineares.
Intensidade: O grfico acima parece indicar pequena existncia de linearidade e alta
disparidade.
Forma: O grfico apresenta alta disperso com pouco conglomerado.
Regression Analysis: ISDM_A50 versus E2_4_A50
The regression equation is ISDM_A50 = - 3,86 + 0,0991 E2_4_A50
Predictor Coef SE Coef T P Constant -3,8612 0,8356 -4,62 0,000 E2_4_A50 0,099120 0,009507 10,43 0,000 S = 0,561333 R-Sq = 69,4% R-Sq(adj) = 68,7% Analysis of Variance Source DF SS MS F P Regression 1 34,249 34,249 108,69 0,000 Residual Error 48 15,125 0,315 Total 49 49,373 Unusual Observations Obs E2_4_A50 ISDM_A50 Fit SE Fit Residual St Resid 19 84,8 2,9811 4,5452 0,0834 -1,5642 -2,82R 21 65,1 3,3845 2,5947 0,2269 0,7899 1,54 X
32
31 82,5 2,9181 4,3127 0,0926 -1,3946 -2,52R 34 65,1 2,2589 2,5926 0,2271 -0,3337 -0,65 X 36 66,4 3,3779 2,7239 0,2153 0,6540 1,26 X R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.
5.3.7 ISDM versus SADE
1,00,90,80,70,60,5
6
5
4
3
2
Sade_A50
ISD
M_A
50
Scatterplot of ISDM_A50 vs Sade_A50
Observaes:
Direo: Da anlise das correlaes acima percebemos que possuem associaes
positivas, e pouca linearidade.
Intensidade: O grfico acima parece indicar baixa linearidade, apesar de um pouco de
conglomerado do lado direito superior.
Forma: O grfico apresenta conglomerados, porm baixa linearidade.
Regression Analysis: ISDM_A50 versus Sade_A50
The regression equation is ISDM_A50 = - 1,53 + 7,73 Sade_A50
Predictor Coef SE Coef T P Constant -1,5349 0,7776 -1,97 0,054 Sade_A50 7,7335 0,9410 8,22 0,000 S = 0,653696 R-Sq = 58,5% R-Sq(adj) = 57,6%
33
Analysis of Variance Source DF SS MS F P Regression 1 28,862 28,862 67,54 0,000 Residual Error 48 20,511 0,427 Total 49 49,373 Unusual Observations Obs Sade_A50 ISDM_A50 Fit SE Fit Residual St Resid 23 0,552 2,5568 2,7311 0,2694 -0,1743 -0,29 X 34 0,532 2,2589 2,5809 0,2866 -0,3220 -0,55 X 42 0,744 2,8790 4,2198 0,1171 -1,3408 -2,08R R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.
5.3.8 ISDM versus S1_1
50403020100
6
5
4
3
2
S1_1_A50
ISD
M_A
50
Scatterplot of ISDM_A50 vs S1_1_A50
Observaes:
Direo: Da anlise das correlaes acima percebemos que possuem associaes
negativas, e praticamente nenhuma linearidade.
Intensidade: O grfico acima parece indicar baixa linearidade, e alta disperso.
Forma: O grfico no apresenta conglomerados e linearidade.
Regression Analysis: ISDM_A50 versus S1_1_A50
The regression equation is ISDM_A50 = 5,00 - 0,0136 S1_1_A50
34
Predictor Coef SE Coef T P Constant 4,9967 0,2123 23,54 0,000 S1_1_A50 -0,01365 0,01161 -1,18 0,246 S = 0,999920 R-Sq = 2,8% R-Sq(adj) = 0,8% Analysis of Variance Source DF SS MS F P Regression 1 1,3808 1,3808 1,38 0,246 Residual Error 48 47,9923 0,9998 Total 49 49,3731 Unusual Observations Obs S1_1_A50 ISDM_A50 Fit SE Fit Residual St Resid 23 22,9 2,557 4,684 0,178 -2,127 -2,16R 34 18,1 2,259 4,749 0,151 -2,490 -2,52R 38 43,5 5,487 4,403 0,374 1,084 1,17 X 42 50,8 2,879 4,303 0,455 -1,424 -1,60 X 47 44,4 4,874 4,390 0,385 0,484 0,52 X R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.
5.3.9 ISDM versus LIQUIDEZ
1,00,80,60,40,20,0
6
5
4
3
2
Liquidez_A50
ISD
M_A
50
Scatterplot of ISDM_A50 vs Liquidez_A50
Observaes:
Direo: Da anlise das correlaes acima visvel que possuem associaes
positivas, e praticamente nenhuma linearidade.
Intensidade: O grfico acima parece indicar baixa linearidade, e alta disperso, apesar
de apresentar indcios de conglomerados no final do lado direito.
35
Forma: O grfico apresenta vestgios de conglomerado e no apresenta linearidade.
Regression Analysis: ISDM_A50 versus Liquidez_A50
The regression equation is ISDM_A50 = 4,49 + 0,517 Liquidez_A50
Predictor Coef SE Coef T P Constant 4,4870 0,2772 16,19 0,000 Liquidez_A50 0,5171 0,3816 1,36 0,182 S = 0,995343 R-Sq = 3,7% R-Sq(adj) = 1,7% Analysis of Variance Source DF SS MS F P Regression 1 1,8192 1,8192 1,84 0,182 Residual Error 48 47,5540 0,9907 Total 49 49,3731 Unusual Observations Obs Liquidez_A50 ISDM_A50 Fit SE Fit Residual St Resid 23 0,00 2,557 4,487 0,277 -1,930 -2,02R 31 0,98 2,918 4,995 0,196 -2,076 -2,13R 34 0,80 2,259 4,901 0,156 -2,642 -2,69R 42 0,94 2,879 4,972 0,184 -2,093 -2,14R R denotes an observation with a large standardized residual.
6. MODELO DE REGRESSO LINEAR
Nesta etapa foi realizada a Stepwise Regression da seguinte maneira:
ISDM versus Emprego e Renda; Educao; e Sade.
ISDM versus E2_4; T1_2; S1_1; R1; H6; e Liquidez.
6.1 ISDM versus Emprego e Renda; Educao; e Sade
Stepwise Regression: ISDM versus Emprego e Renda; Educao; Sade Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15 Response is ISDM on 3 predictors, with N = 5565
36
Step 1 2 3 Constant -1,203 -1,236 -2,363 Educao 7,602 6,618 4,926 T-Value 93,46 82,17 52,55 P-Value 0,000 0,000 0,000 Emprego e Renda 1,891 1,662 T-Value 32,45 30,41 P-Value 0,000 0,000 Sade 3,10 T-Value 29,92 P-Value 0,000 S 0,682 0,625 0,580 R-Sq 61,09 67,28 71,82 R-Sq(adj) 61,08 67,27 71,81 Mallows Cp 2117,5 897,5 4,0
Com relao ao ISDM nota-se, atravs dos dados acima, que Emprego e Renda,
Educao e Sade representam 71,82% do ISDM. Sendo que Emprego e Renda representa
61,09%, Educao 6,19% e Sade 4,54%.
Para o ISDM tem-se a seguinte equao:
-2,363 + 4,926 + 1,662 + 3,10
6.2 ISDM versus E2_4; T1_2; S1_1; R1; H6; e Liquidez
Stepwise Regression: ISDM versus R1; T1_2; H6; E2_4; S1_1; Liquidez Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15 Response is ISDM on 6 predictors, with N = 5565 Step 1 2 3 4 5 6 Constant 5,873 5,132 4,586 3,813 3,814 3,832 R1 -0,05872 -0,05089 -0,04624 -0,04342 -0,04351 -0,04346 T-Value -229,28 -131,18 -93,10 -79,85 -80,62 -80,53 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 T1_2 0,00973 0,01106 0,01089 0,01132 0,01131 T-Value 25,85 29,06 28,97 30,10 30,10 P-Value 0,000 0,000 0,000 0,000 0,000 H6 0,00660 0,00574 0,00610 0,00607 T-Value 14,57 12,69 13,53 13,48 P-Value 0,000 0,000 0,000 0,000 E2_4 0,00888 0,00908 0,00902 T-Value 12,02 12,39 12,31 P-Value 0,000 0,000 0,000 Liquidez -0,109 -0,109 T-Value -9,29 -9,30 P-Value 0,000 0,000
37
S1_1 -0,00085 T-Value -2,92 P-Value 0,004 S 0,338 0,319 0,314 0,310 0,307 0,307 R-Sq 90,43 91,46 91,77 91,98 92,10 92,11 R-Sq(adj) 90,43 91,45 91,77 91,97 92,10 92,11 Mallows Cp 1183,7 462,1 242,8 97,9 13,5 7,0
Com relao ao ISDM nota-se, atravs dos dados acima, que R1; T1_2; H6; E2_4;
S1_1 e Liquidez representam 92,11% do ISDM.
7. TESTE DE COMPARAES
7.1 Varivel ISDM
Os pontos que aparecem abaixo
da linha representam os dados que esto fora da curva, e
abaixo da mdia .
A Regio Sudeste possui o maior ISDM do pas, o que indica que esta a Regio mais
desenvolvida do Brasil, segundo a pesquisa. A regio Sul encontra-se prxima a Regio
Sudeste, e ocupa o segundo lugar.
A Regio que apresenta o ISDM mdio mais baixo do Pas a Norte, seguida da
Nordeste. Pelo tamanho da caixa do BloxPlot pode-se visualizar a amplitude da varincia.
possvel afirmar que os dados da Regio Norte possuem maior variabilidade que os dados das
demais regies. As Regies que possuem menor variabilidade dos dados so Centro-Oeste e
Sul.
38
One-way ANOVA: ISDM versus Regio
Source DF SS MS F PRegio 4 4188,435 1047,109 0,000Error 5560 2457,544 0,442Total 5564 6645,979
S = 0,6648 R-Sq = 63,02% R-Sq(adj) = 63,00%
Individual 95% CIs For Mean Based onPooled StDev
Level N Mean StDev ------+---------+---------+---------+---Centro-Oeste 468 4,6956 0,5252 (*)Nordeste 1790 3,4112 0,7136 (*Norte 447 0,9794 (*)Sudeste 1669 0,6436 (*Sul 1191 5,1271 0,5012 *)
------+---------+---------+---------+---
3,60 4,20 4,80 5,40
Pooled StDev = 0,6648
O grau de variao entre as Regies muito alto (2369), e o P-value nos indica que a
informao confivel e no existe chance deste valor ser diferente.
Com base nos dados acima possvel afirmar que a regio que apresenta melhores
nveis de ISDM a regio Sudeste enquanto a regio com os piores nveis o Norte.
7.2 Varivel Emprego e Renda
Grau de diferena
entre as variveis
Chance de no ser
diferente.
39
One-way ANOVA: Emprego e Renda versus Regio Source DF SS MS F P Regio 4 17,7959 4,4490 212,70 0,000 Error 5560 116,2990 0,0209 Total 5564 134,0949 S = 0,1446 R-Sq = 13,27% R-Sq(adj) = 13,21% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+---------+- Centro-Oeste 468 0,4173 0,1389 (--*---) Nordeste 1790 0,3348 0,1288 (-*) Norte 447 0,3415 0,1419 (--*---) Sudeste 1669 0,4490 0,1681 (*-) Sul 1191 0,4620 0,1345 (-*--) --------+---------+---------+---------+- 0,360 0,400 0,440 0,480 Pooled StDev = 0,1446
Com base nos dados acima possvel afirmar que a regio que apresenta maiores
nveis de Emprego e Renda a regio Sul, seguida de perto pelo Sudeste enquanto a regio
com os menores nveis de emprego e renda o Nordeste.
Grau de diferena
entre as variveis
Chance de no ser
diferente.
40
7.3 Varivel Educao
41
One-way ANOVA: Educao versus Regio Source DF SS MS F P Regio 4 35,82737 8,95684 1446,69 0,000 Error 5560 34,42333 0,00619 Total 5564 70,25070 S = 0,07868 R-Sq = 51,00% R-Sq(adj) = 50,96% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- Centro-Oeste 468 0,75299 0,07162 (*-) Nordeste 1790 0,65090 0,08127 *) Norte 447 0,63739 0,08599 (*) Sudeste 1669 0,83427 0,08138 (*) Sul 1191 0,78106 0,07021 (*) -----+---------+---------+---------+---- 0,660 0,720 0,780 0,840 Pooled StDev = 0,07868
Com base nos dados acima possvel afirmar que a regio que apresenta maiores
nveis de Educao a regio Sudeste enquanto a regio com os menores nveis o Norte.
7.4 Varivel Sade
Grau de diferena
entre as variveis
Chance de no ser
diferente.
42
One-way ANOVA: Sade versus Regio Source DF SS MS F P Regio 4 23,23275 5,80819 984,38 0,000 Error 5560 32,80603 0,00590 Total 5564 56,03879 S = 0,07681 R-Sq = 41,46% R-Sq(adj) = 41,42% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -------+---------+---------+---------+-- Centro-Oeste 468 0,83036 0,07475 (*-) Nordeste 1790 0,73510 0,08148 (* Norte 447 0,68231 0,08605 (*) Sudeste 1669 0,82988 0,07713 *) Sul 1191 0,87987 0,06543 (* -------+---------+---------+---------+-- 0,720 0,780 0,840 0,900 Pooled StDev = 0,07681
Com base nos dados acima possvel afirmar que a regio que apresenta maiores
nveis de Sade a regio Sul enquanto a regio com os menores nveis o Norte.
Grau de diferena
entre as variveis
Chance de no ser
diferente.
43
7.5 Varivel E2_4
SulSudesteNorteNordesteCentro-Oeste
80
70
60
50
40
30
20
10
0
Regio
R1
Individual Value Plot of R1 vs Regio
50250-25-50
99,99
99
90
50
10
1
0,01
Residual
Per
cent
40302010
50
25
0
-25
-50
Fitted Value
Res
idua
l
483624120-12-24-36
600
450
300
150
0
Residual
Freq
uenc
y
5500
5000
4500
4000
3500
3000
2500
2000
1500
100050
01
50
25
0
-25
-50
Observation Order
Res
idua
l
Normal Probability Plot Versus Fits
Histogram Versus Order
Residual Plots for R1
44
One-way ANOVA: R1 versus Regio Source DF SS MS F P Regio 4 1148763 287191 2688,34 0,000 Error 5560 593965 107 Total 5564 1742729 S = 10,34 R-Sq = 65,92% R-Sq(adj) = 65,89% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev +---------+---------+---------+--------- Centro-Oeste 468 15,23 9,22 (*) Nordeste 1790 42,49 10,60 *) Norte 447 39,65 15,18 (*) Sudeste 1669 14,07 10,54 *) Sul 1191 10,16 7,40 *) +---------+---------+---------+--------- 10 20 30 40 Pooled StDev = 10,34
Com base nos dados acima possvel afirmar que a regio que apresenta os maiores
nveis de R1 a regio Nordeste enquanto a regio com os menores nveis o Sul.
7.6 Varivel T1_2
SulSudesteNorteNordesteCentro-Oeste
100
80
60
40
20
0
Regio
T1_2
Individual Value Plot of T1_2 vs Regio
Grau de diferena
entre as variveis
Chance de no ser
diferente.
45
50250-25-50
99,99
99
90
50
10
1
0,01
Residual
Per
cent
70605040
50
25
0
-25
-50
Fitted Value
Res
idua
l
3624120-12-24-36
300
200
100
0
Residual
Freq
uenc
y
5500
5000
4500
4000
3500
3000
2500
2000
1500
100050
01
50
25
0
-25
-50
Observation OrderR
esid
ual
Normal Probability Plot Versus Fits
Histogram Versus Order
Residual Plots for T1_2
One-way ANOVA: T1_2 versus Regio Source DF SS MS F P Regio 4 804491 201123 1069,67 0,000 Error 5560 1045407 188 Total 5564 1849898 S = 13,71 R-Sq = 43,49% R-Sq(adj) = 43,45% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---------+---------+---------+---------+ Centro-Oeste 468 58,89 11,83 (-*) Nordeste 1790 41,17 13,36 *) Norte 447 46,10 13,65 (-*) Sudeste 1669 64,65 15,77 (*) Sul 1191 70,16 11,69 (*) ---------+---------+---------+---------+ 48,0 56,0 64,0 72,0 Pooled StDev = 13,71
Com base nos dados acima possvel afirmar que a regio que apresenta maiores
nveis de T1_2 a regio Sul enquanto a regio com os menores nveis o Nordeste.
Grau de diferena
entre as variveis
Chance de no ser
diferente.
46
7.7 Varivel S1_1
SulSudesteNorteNordesteCentro-Oeste
350
300
250
200
150
100
50
0
Regio
S1_1
Individual Value Plot of S1_1 vs Regio
3002001000-100
99,99
99
90
50
10
1
0,01
Residual
Per
cent
18,016,515,013,512,0
300
200
100
0
Fitted Value
Res
idua
l
28824019214496480
1200
900
600
300
0
Residual
Freq
uenc
y
5500
5000
4500
4000
3500
3000
2500
2000
1500
100050
01
300
200
100
0
Observation Order
Res
idua
l
Normal Probability Plot Versus Fits
Histogram Versus Order
Residual Plots for S1_1
47
One-way ANOVA: S1_1 versus Regio Source DF SS MS F P Regio 4 19369 4842 24,14 0,000 Error 5560 1115524 201 Total 5564 1134894 S = 14,16 R-Sq = 1,71% R-Sq(adj) = 1,64% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -------+---------+---------+---------+-- Centro-Oeste 468 14,19 16,91 (----*----) Nordeste 1790 15,80 10,90 (-*--) Norte 447 17,82 15,13 (----*-----) Sudeste 1669 13,60 13,91 (-*--) Sul 1191 11,56 17,01 (--*--) -------+---------+---------+---------+-- 12,5 15,0 17,5 20,0 Pooled StDev = 14,16
Com base nos dados acima possvel afirmar que a regio que apresenta maiores
nveis de S1_1 a regio Norte enquanto a regio com os menores nveis o Sul.
7.8 Varivel R1
SulSudesteNorteNordesteCentro-Oeste
80
70
60
50
40
30
20
10
0
Regio
R1
Individual Value Plot of R1 vs Regio
Grau de diferena
entre as variveis
Chance de no ser
diferente.
48
50250-25-50
99,99
99
90
50
10
1
0,01
Residual
Per
cent
40302010
50
25
0
-25
-50
Fitted Value
Res
idua
l483624120-12-24-36
600
450
300
150
0
Residual
Freq
uenc
y
5500
5000
4500
4000
3500
3000
2500
2000
1500
100050
01
50
25
0
-25
-50
Observation Order
Res
idua
l
Normal Probability Plot Versus Fits
Histogram Versus Order
Residual Plots for R1
One-way ANOVA: R1 versus Regio Source DF SS MS F P Regio 4 1148763 287191 2688,34 0,000 Error 5560 593965 107 Total 5564 1742729 S = 10,34 R-Sq = 65,92% R-Sq(adj) = 65,89% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev +---------+---------+---------+--------- Centro-Oeste 468 15,23 9,22 (*) Nordeste 1790 42,49 10,60 *) Norte 447 39,65 15,18 (*) Sudeste 1669 14,07 10,54 *) Sul 1191 10,16 7,40 *) +---------+---------+---------+--------- 10 20 30 40 Pooled StDev = 10,34
Com base nos dados acima possvel afirmar que a regio que apresenta maiores
nveis de R1 a regio Nordeste enquanto a regio com os menores nveis o Sul.
Grau de diferena
entre as variveis
Chance de no ser
diferente.
49
7.9 Varivel H6
SulSudesteNorteNordesteCentro-Oeste
90
80
70
60
50
40
30
20
10
0
Regio
H6
Individual Value Plot of H6 vs Regio
50250-25-50
99,99
99
90
50
10
1
0,01
Residual
Per
cent
70605040
40
20
0
-20
-40
Fitted Value
Res
idua
l
271890-9-18-27
240
180
120
60
0
Residual
Freq
uenc
y
5500
5000
4500
4000
3500
3000
2500
2000
1500
100050
01
40
20
0
-20
-40
Observation Order
Res
idua
l
Normal Probability Plot Versus Fits
Histogram Versus Order
Residual Plots for H6
50
One-way ANOVA: H6 versus Regio Source DF SS MS F P Regio 4 525704 131426 1472,35 0,000 Error 5560 496300 89 Total 5564 1022005 S = 9,448 R-Sq = 51,44% R-Sq(adj) = 51,40% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ------+---------+---------+---------+--- Centro-Oeste 468 58,213 9,699 (*) Nordeste 1790 45,127 8,829 *) Norte 447 36,253 14,618 (*) Sudeste 1669 59,053 9,008 (* Sul 1191 66,750 8,314 *) ------+---------+---------+---------+--- 40,0 48,0 56,0 64,0 Pooled StDev = 9,448
Com base nos dados acima possvel afirmar que a regio que apresenta maiores
nveis de H6 a regio Sul enquanto a regio com os menores nveis o Norte.
7.10 Varivel Liquidez
SulSudesteNorteNordesteCentro-Oeste
1,0
0,8
0,6
0,4
0,2
0,0
Regio
Liqu
idez
Individual Value Plot of Liquidez vs Regio
Grau de diferena
entre as variveis
Chance de no ser
diferente.
51
10-1
99,99
99
90
50
10
1
0,01
Residual
Per
cent
0,70,60,50,4
0,8
0,4
0,0
-0,4
-0,8
Fitted Value
Res
idua
l
0,5250,3500,1750,000-0,175-0,350-0,525-0,700
600
450
300
150
0
Residual
Freq
uenc
y
5500
5000
4500
4000
3500
3000
2500
2000
1500
100050
01
0,8
0,4
0,0
-0,4
-0,8
Observation Order
Res
idua
l
Normal Probability Plot Versus Fits
Histogram Versus Order
Residual Plots for Liquidez
One-way ANOVA: Liquidez versus Regio Source DF SS MS F P Regio 4 99,198 24,799 203,94 0,000 Error 5560 676,095 0,122 Total 5564 775,293 S = 0,3487 R-Sq = 12,79% R-Sq(adj) = 12,73% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---+---------+---------+---------+------ Centro-Oeste 468 0,6541 0,3415 (--*---) Nordeste 1790 0,3825 0,3591 (*-) Norte 447 0,5411 0,3846 (--*--) Sudeste 1669 0,5719 0,3564 (*-) Sul 1191 0,7402 0,3084 (-*-) ---+---------+---------+---------+------ 0,40 0,50 0,60 0,70 Pooled StDev = 0,3487
Com base nos dados acima possvel afirmar que a regio que apresenta maiores
nveis de Liquidez a regio Sul enquanto a regio com os menores nveis o Nordeste.
Grau de diferena
entre as variveis
Chance de no ser
diferente.
52
8. AMOSTRAGEM
8.1 VARIVEL ISDM
ISDM para amostra com 50 linhas:
possvel observar que a mdia dos dados de 4,25 e o desvio padro 1,27. Existe
95% de confiana de que a mdia est entre o intervalo de 3,89 e 4,61.
ISDM para amostra com 100 linhas:
possvel observar que a mdia dos dados de 4,48 e o desvio padro 1,04. Existe
95% de confiana de que a mdia est entre o intervalo de 4,28 e 4,69.
53
ISDM para toda a populao (5565 linhas)
possvel observar que a mdia dos dados de 4,43 e o desvio padro 1,09. Existe
95% de confiana de que a mdia est entre o intervalo de 4,40 e 4,46.
Boxplot de ISDM para amostras de 50, 100 e populao:
O Boxplot confirma a semelhana dos resultados das duas amostras comparados com a
populao total. Existe uma variabilidade dos dados em todas as trs variveis.
One-way ANOVA: ISDM; ISDM_50; ISDM_100
Source DF SS MS F P
Factor 2 1,90 0,95 0,79 0,453
Error 5712 6834,27 1,20
Total 5714 6836,17
54
S = 1,094 R-Sq = 0,03% R-Sq(adj) = 0,00%
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev --+---------+---------+---------+-------
ISDM 5565 4,432 1,093 (-*)
ISDM_50 50 4,255 1,277 (--------------*--------------)
ISDM_100 100 4,489 1,046 (---------*----------)
--+---------+---------+---------+-------
4,00 4,20 4,40 4,60
Pooled StDev = 1,094
A anlise de varincia entre as amostras e a populao nos indica que a variao de
0,79; e o P-Value: 0,453
8.2 VARIVEL EMPREGO E RENDA
EMPREGO E RENDA para amostra com 50 linhas:
possvel observar que a mdia dos dados de 4,40 e o desvio padro 1,44. Existe
95% de confiana de que a mdia est entre o intervalo de 0,36 e 0,44.
55
EMPREGO E RENDA para amostra com 100 linhas:
possvel observar que a mdia dos dados de 0,41 e o desvio padro 0,17. Existe
95% de confiana de que a mdia est entre o intervalo de 0,38 e 0,45.
EMPREGO E RENDA para toda a populao (5565 linhas)
possvel observar que a mdia dos dados de 0,40 e o desvio padro 0,15. Existe
95% de confiana de que a mdia est entre o intervalo de 0,39 e 0,40.
56
Boxplot de EMPREGO E RENDA para amostras de 50, 100 e populao:
O Boxplot confirma a semelhana dos resultados das duas amostras comparados com a
populao total. Existe uma variabilidade dos dados em todas as trs variveis.
One-way ANOVA: Emprego e Renda; Emprego e Renda_50; Emprego e Renda_100
Source DF SS MS F P
Factor 2 0,0240 0,0120 0,50 0,608
Error 5712 138,0660 0,0242
Total 5714 138,0900
S = 0,1555 R-Sq = 0,02% R-Sq(adj) = 0,00%
Level N Mean StDev
Emprego e Renda 5565 0,4038 0,1552
Emprego e Renda_50 50 0,4039 0,1448
Emprego e Renda_100 100 0,4194 0,1724
Individual 95% CIs For Mean Based on
Pooled StDev
Level ------+---------+---------+---------+---
Emprego e Renda (-*)
Emprego e Renda_50 (-----------------*----------------)
Emprego e Renda_100 (-----------*-----------)
------+---------+---------+---------+---
57
0,375 0,400 0,425 0,450
Pooled StDev = 0,1555
A anlise de varincia entre as amostras e a populao indica que a variao de 0,50;
e o P-Value: 0,608.
8.3 VARIVEL EDUCAO
EDUCAO para amostra com 50 linhas:
possvel observar que a mdia dos dados de 0,74 e o desvio padro 0,11. Existe
95% de confiana de que a mdia est entre o intervalo de 0,71 e 0,78.
EDUCAO para amostra com 100 linhas:
58
possvel observar que a mdia dos dados de 0,74 e o desvio padro 0,10. Existe
95% de confiana de que a mdia est entre o intervalo de 0,72 e 0,76.
EDUCAO para toda a populao (5565 linhas)
possvel observar que a mdia dos dados de 0,74 e o desvio padro 0,11. Existe
95% de confiana de que a mdia est entre o intervalo de 0,73 e 0,74.
Boxplot de EDUCAO para amostras de 50, 100 e populao:
O Boxplot confirma a semelhana dos resultados das duas amostras comparados com a
populao total. Existe uma variabilidade dos dados em todas as trs variveis.
One-way ANOVA: Educao; Educao_50; Educao_100
Source DF SS MS F P
Factor 2 0,0051 0,0026 0,20 0,816
59
Error 5712 72,0111 0,0126
Total 5714 72,0163
S = 0,1123 R-Sq = 0,01% R-Sq(adj) = 0,00%
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev -+---------+---------+---------+--------
Educao 5565 0,7413 0,1124 (-*-)
Educao_50 50 0,7497 0,1138 (-------------------*------------------)
Educao_100 100 0,7453 0,1066 (-------------*-------------)
-+---------+---------+---------+--------
0,720 0,736 0,752 0,768
Pooled StDev = 0,1123
A anlise de varincia entre as amostras e a populao indica que a variao de 0,20;
e o P-Value: 0,816.
9. ANLISE MULTIVARIADA
9.1 Dendograma dos agrupamentos das variveis por similaridade
S1_1
_A50
R1_A
50
Liquid
ez_A
50
Empr
ego e
Ren
da_A
50
T1_2
_A50
H6_A
50
Sad
e_A5
0
E2_4
_A50
Educ
ao
_A50
ISDM_
A50
47,80
65,20
82,60
100,00
Variables
Sim
ilari
ty
DendrogramSingle Linkage; Correlation Coefficient Distance
60
O dendograma acima permite que sejam visualizadas as variveis que possuem um
percentual de similaridade forte, na faixa de 85% so ISDM, Educao, E2_4, Sade, H6 e
T1_2. As variveis Emprego e Renda, Liquidez, R1 e S1_1 tem nvel de similaridade abaixo
de 80%.
9.2 Principais Componentes
A anlise de componentes principais uma tcnica estatstica poderosa que pode ser
utilizada para reduo do nmero de variveis e para fornecer uma viso estatisticamente
privilegiada do conjunto de dados. A anlise de componentes principais fornece as
ferramentas adequadas para identificar as variveis mais importantes no espao das
componentes principais.
0,50,40,30,20,10,0-0,1-0,2-0,3-0,4
0,75
0,50
0,25
0,00
-0,25
-0,50
First Component
Seco
nd C
ompo
nent
Liquidez_A50
S1_1_A50
Sade_A50E2_4_A50
Educao_A50
H6_A50
T1_2_A50
R1_A50
Emprego e Renda_A50
ISDM_A50
Loading Plot of ISDM_A50; ...; Liquidez_A50
possvel observar a existncia de trs grupos principais, sendo o primeiro composto
pelas variveis ISDM, Educao, E2_4, Sade, Liquidez e H6. O segundo composto por
Emprego e Renda e T1_2 e o terceiro composto por S1_1 e R1.
61
10987654321
6
5
4
3
2
1
0
Component Number
Eige
nval
ueScree Plot of ISDM_A50; ...; Liquidez_A50
notvel um peso superior da primeira varivel enquanto as outras variveis
aparecem com bastante distncia. As variveis 2, 3 e 4 podem ser aproveitadas, por
apresentarem valores superiores a 1, entretanto as demais variveis (5 a 10) no sero
utilizadas por apresentarem valores inferiores a 1.
Principal Component Analysis: ISDM_A50; Emprego e Re; R1_A50; T1_2_A50; H6_A50; Eigenanalysis of the Correlation Matrix Eigenvalue 5,5664 1,1561 0,9927 0,9407 0,4112 0,3563 0,2870 0,1583 Proportion 0,557 0,116 0,099 0,094 0,041 0,036 0,029 0,016 Cumulative 0,557 0,672 0,772 0,866 0,907 0,942 0,971 0,987 Eigenvalue 0,0751 0,0563 Proportion 0,008 0,006 Cumulative 0,994 1,000 Variable PC1 PC2 PC3 PC4 PC5 PC6 PC7 ISDM_A50 0,407 0,017 0,039 -0,115 -0,094 -0,103 0,049 Emprego e Renda_A50 0,197 0,719 -0,123 0,097 0,519 0,365 -0,127 R1_A50 -0,404 0,031 -0,006 0,112 0,011 0,219 0,227 T1_2_A50 0,305 0,494 0,091 0,026 -0,439 -0,500 -0,109 H6_A50 0,335 -0,399 0,006 -0,123 0,282 0,028 -0,683 Educao_A50 0,377 -0,030 0,160 -0,050 -0,279 0,427 0,228 E2_4_A50 0,373 -0,141 -0,022 -0,119 -0,200 0,462 0,229 Sade_A50 0,348 -0,190 -0,062 0,080 0,535 -0,399 0,581 S1_1_A50 -0,099 0,079 0,925 -0,272 0,208 -0,004 0,033 Liquidez_A50 0,124 -0,125 0,301 0,923 -0,044 0,056 -0,095 Variable PC8 PC9 PC10 ISDM_A50 0,134 0,645 0,602
62
Emprego e Renda_A50 0,001 0,027 -0,002 R1_A50 -0,222 -0,353 0,742 T1_2_A50 -0,237 -0,370 0,083 H6_A50 -0,089 -0,325 0,233 Educao_A50 0,604 -0,389 0,020 E2_4_A50 -0,701 0,066 -0,156 Sade_A50 -0,035 -0,221 0,001 S1_1_A50 -0,092 0,033 -0,032 Liquidez_A50 -0,043 0,104 -0,015
Com base nos grficos trabalhados neste captulo perceptvel que os dados podem
ser reduzidos em 3 variveis, o que facilita o trabalho por gerarem nmeros mais fceis e
prticos de serem manuseados.
10. ANLISE DE CONGLOMERADOS
Neste captulo foram geradas anlises comparativas dos dados de ISDM, Educao,
Emprego e Renda e Sade agrupado por Estado, excluindo o Distrito Federal por ter apenas
um Municpio. Tambm foi calculada a Anova do ISDM com relao a Educao, Emprego e
Renda e Sade por Estado, foram gerados diversos grficos com as diversas variveis citadas.
Comparando-se os resultados das mdias por estado, poderemos agrupar as linhas de dados
pelo nvel de desigualdade dos fatores de ISDM, Educao, Emprego e Renda e Sade.
10.1 ANOVA
10.1.1 ANOVA de ISDM por Estado
TOSPSESCRSRRRORNRJPRPIPEPBPAMTMSMGMAGOESCEBAAPAMALAC
7
6
5
4
3
2
1
0
UF2
ISD
M
Individual Value Plot of ISDM vs UF2
63
O grfico acima possibilita visualizar que a mdia do ISDM varia bastante entre os
Estados brasileiros. So Paulo o Estado que apresenta o maior valor de ISDM, passando de
6, enquanto o Amazonas apresenta o menor ISDM, ficando abaixo de 1.
One-way ANOVA: ISDM versus UF2 Source DF SS MS F P UF2 25 4757,770 190,311 558,65 0,000 Error 5538 1886,584 0,341 Total 5563 6644,353 S = 0,5837 R-Sq = 71,61% R-Sq(adj) = 71,48% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+---------+- AC 22 2,8837 1,0103 (--*-) AL 101 3,1996 0,6982 (*) AM 62 2,3550 0,7750 (-*) AP 16 3,4060 0,6679 (--*--) BA 416 3,6024 0,6378 (*) CE 184 3,4534 0,5689 (* ES 78 4,9080 0,4716 (*) GO 247 4,7989 0,4546 (*) MA 217 2,7076 0,7130 (*) MG 852 4,9973 0,7056 * MS 78 4,6714 0,5353 (-*) MT 142 4,5219 0,5831 (*) PA 142 2,9406 0,8605 (*) PB 222 3,5758 0,5246 (*) PE 185 3,6533 0,6738 (* PI 223 3,0103 0,6091 (*) PR 399 5,0427 0,4915 *) RJ 92 5,2888 0,3299 (*) RN 167 3,7924 0,5833 (*) RO 52 4,2359 0,4502 (*-) RR 15 2,6668 1,2718 (--*--) RS 497 5,1373 0,5099 *) SC 295 5,2241 0,4816 *) SE 75 3,8260 0,5672 (*-) SP 647 5,6458 0,3415 *) TO 138 3,8761 0,6077 (*) --------+---------+---------+---------+- 3,0 4,0 5,0 6,0 Pooled StDev = 0,5837
possvel notar que existe uma variao grande entre as mdias de ISDM por Estado,
por exemplo o Estado que apresenta a maior mdia So Paulo, com 5,6458, e a menor mdia
est no Amazonas, com 2,3550.
64
10.1.2 ANOVA de Emprego e Renda por Estado
TOSPSESCRSRRRORNRJPRPIPEPBPAMTMSMGMAGOESCEBAAPAMALAC
1,0
0,8
0,6
0,4
0,2
0,0
UF2
Empr
ego
e R
enda
Individual Value Plot of Emprego e Renda vs UF2
One-way ANOVA: Emprego e Renda versus UF2 Source DF SS MS F P UF2 25 28,6670 1,1467 60,24 0,000 Error 5538 105,4184 0,0190 Total 5563 134,0854 S = 0,1380 R-Sq = 21,38% R-Sq(adj) = 21,02% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ------+---------+---------+---------+--- AC 22 0,3718 0,1183 (------*-------) AL 101 0,3174 0,1295 (---*--) AM 62 0,3027 0,1306 (---*---) AP 16 0,3807 0,1789 (--------*-------) BA 416 0,3515 0,1283 (-*-) CE 184 0,3189 0,1271 (--*-) ES 78 0,4520 0,1380 (--*---) GO 247 0,4052 0,1432 (-*-) MA 217 0,2890 0,1309 (-*-) MG 852 0,3844 0,1394 (*) MS 78 0,4369 0,1334 (---*--) MT 142 0,4284 0,1333 (--*-) PA 142 0,3741 0,1506 (--*--) PB 222 0,3211 0,1101 (-*-) PE 185 0,3862 0,1366 (-*--) PI 223 0,3064 0,1167 (-*--) PR 399 0,4383 0,1268 (-*) RJ 92 0,5317 0,1923 (--*---) RN 167 0,3391 0,1088 (-*--) RO 52 0,3976 0,1289 (----*---) RR 15 0,3471 0,1740 (-------*--------) RS 497 0,4664 0,1344 (*-) SC 295 0,4865 0,1398 (-*-) SE 75 0,4251 0,1385 (---*---)
65
SP 647 0,5220 0,1675 (*-) TO 138 0,2941 0,1188 (--*--) ------+---------+---------+---------+--- 0,320 0,400 0,480 0,560 Pooled StDev = 0,1380
possvel notar que existe uma variao grande entre as mdias de Emprego e Renda
por Estado, por exemplo o Estado que apresenta a maior mdia Rio de Janeiro, e a menor
mdia est no Maranho.
10.1.3 ANOVA de R1 por Estado
TOSPSESCRSRRRORNRJPRPIPEPBPAMTMSMGMAGOESCEBAAPAMALAC
80
70
60
50
40
30
20
10
0
UF2
R1
Individual Value Plot of R1 vs UF2
One-way ANOVA: R1 versus UF2 Source DF SS MS F P UF2 25 1271842 50874 598,69 0,000 Error 5538 470592 85 Total 5563 1742434 S = 9,218 R-Sq = 72,99% R-Sq(adj) = 72,87% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- AC 22 44,640 14,190 (--*-) AL 101 46,940 9,556 (*) AM 62 54,113 11,654 (*-) AP 16 40,595 11,928 (--*--) BA 416 40,141 9,530 (* CE 184 43,530 9,440 (*) ES 78 16,215 6,082 (-*) GO 247 13,654 8,626 (*) MA 217 51,013 11,804 (*) MG 852 18,894 11,638 (* MS 78 15,912 10,111 (-*) MT 142 17,655 9,224 (*) PA 142 44,129 13,