34
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PROJETO ORIBER TEMA : Transformação Produtiva e Inovação Sustentável ANÁLISE DISCRIMINANTE Disciplina: Métodos Quantitativos Professor: Dr. Arnoldo Jose de Hoyos Leda Honorato da Silva Reis 1. INTRODUÇÃO

PROJETO ORIBER - Home | PUC-SP | Pontifícia … · O presente trabalho tem por objetivo efetuar uma análise comparativa de ... eles são seguros e ... ciência humana poderia ser

  • Upload
    voquynh

  • View
    212

  • Download
    0

Embed Size (px)

Citation preview

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração

Programa de Estudos Pós-Graduados em Administração

PROJETO ORIBER

TEMA : Transformação Produtiva e Inovação Sustentável

ANÁLISE DISCRIMINANTE

Disciplina: Métodos Quantitativos

Professor: Dr. Arnoldo Jose de Hoyos

Leda Honorato da Silva Reis

1. INTRODUÇÃO

2

O presente trabalho tem por objetivo efetuar uma análise comparativa de médias, intervalos de confiança e regressões de dados de indicadores relacionados ao desenvolvimento humano dos países do mundo. O principal propósito é comparar os conglomerados da amostra. Para tal iniciamos com análise da estatística descritiva. Em seguida passamos para a análise da comparação de médias e variância através da One-Way Analysis of Variance. Na terceira parte utilizamos a análise discriminante para tentar predizer ou explicar os indicadores relacionados ao desenvolvimento humano que explicam a posição dos países dos conglomerados das amostras. Por fim, fazemos as considerações finais. Os dados são compilados pelo Banco Mundial. O software estatístico utilizado é o MINITAB. 2. ENTENDENDO OS DADOS 2.1 Os Indivíduos Os indivíduos desta análise são os países reportados no GPS. Os dados analisados de cada país são as variáveis que descrevemos a seguir. Os dados foram coletados no banco de dados do GPS. 2.2 As Variáveis Quadro 1. As dezoito Variáveis do Eixo temático:Transformação Produtiva e Inovação Sustentável (Basic Features: Productive Transformation and Sustainable Innovation)

Variável Significado Tipo Unidade de Medida

Social Progress Index

. O Índice foi estruturado em torno de 12 componentes e 54 indicadores distintos consolidadas em três dimensões do Progresso Social: necessidades humanas básicas, Fundações de Bem-estar e oportunidade. A primeira dimensão, necessidades humanas básicas, avalia o quão bem um país prevê necessidades essenciais de seu povo através da medição se as pessoas têm comida suficiente e estão recebendo cuidados médicos básicos, se tiverem acesso a água potável, se tiverem acesso a uma habitação condigna com serviços básicos, e se eles são seguros e protegidos.

Variável Quantitativa

Percentual

Ecosystem Sustainability

A manutenção de um ecossistema sustentável depende da interação de 4 elementos: Produtividade, Diversidade, Resiliência, Distúrbios Naturais. A sustentabilidade dos ecossistemas é determinada pela relação entre esses elementos, e juntos eles determinam o nível de recursos que podem ser tomadas a partir de um ambiente e ainda mantê-lo de forma sustentável.

Variável Quantitativa

Percentual

IDH - 2013 O Índice de Desenvolvimento Humano (IDH) mede o progresso de uma nação a partir de três dimensões: renda, saúde e educação.

Variável Quantitativa

Indicador nominal que varia de 0 a 1

Combustible renewables and waste

Compreendem a biomassa sólida, biomassa líquida, biogás, resíduos industriais e resíduos urbanos, medido em percentagem do consumo total de energia

Variável Quantitativa

Percentual

Suceptibilidad Susceptibilidade refere-se à probabilidade de sofrer dano, perda e interrupção de um evento extremo ou desastres naturais. Assim, a susceptibilidade descreve as características estruturais e condições de enquadramento de uma sociedade.

Variável Quantitativa

Percentual

Global Innovation Ind

Reconhece o papel fundamental da inovação como motor do crescimento económico e prosperidade, e reconhece a necessidade de uma ampla visão horizontal de inovação, que é aplicável à ambas as economias: desenvolvidas e emergentes,

Variável Quantitativa

Percentual

3

com a inclusão de indicadores que vão além das medidas tradicionais de inovação (como o nível de pesquisa e desenvolvimento em um determinado país).

Institutions É formado por três pilares: a) Ambiente Político: indica a percepção da probabilidade de que um país possa ser desestabilizado; da qualidade dos serviços públicos e civis; da formulação e implementação de políticas; e a percepção de violações à liberdade de imprensa; b) Ambiente Regulatório; indica a percepção sobre a capacidade de um governo de formular e implementar políticas de coesão que promovam o desenvolvimento do setor privado c) Ambiente de Negócios: reflete a avaliação de três aspectos : a facilidade de começar um negócio, a facilidade de solução de insolvência e a facilidade de pagamento de impostos.

Variável

Quantitativa

Percentual

Human Capital and Research

Os quatro pilares do Índice são: • O pilar Educação contém indicadores relativos à aspectos quantitativos e qualitativos da educação do outro lado primário, secundário e terciário e contém informações tanto no presente como força de trabalho bem como a futura força de trabalho. • A Saúde e Bem-Estar pilar contém indicadores relativa ao bem-estar físico e mental de uma população sendo, desde a infância até a idade adulta. • O pilar da Força de Trabalho e Emprego destina-se a quantificar a experiência, talento, conhecimento e treinamento na população em idade activa de um país. • O pilar Ambiente propício capta o legal quadro, infra-estrutura e outros fatores que possibilitam retornos sobre o capital humano.

Variável

Quantitativa

Percentual

Infraestructure Percentagem da população sem acesso a saneamento melhorado e a uma fonte de água melhorada. As condições de habitação: parcela da população vivendo em favelas; proporção de habitações semi-sólidos e frágeis. Nutrição: Percentagem da população subnutrida, pobreza excessiva e dependências (jovens menores de 15 anos e adultos maiores de 65 anos) em relaçao à população ativa

Variável Quantitativa

Percentual

Market Sophistication

Este indicador é um derivado dos seguintes indicadores: - (a) disponibilidade de serviços financeiros (b) A acessibilidade dos serviços financeiros (c) financiamento através do mercado de ações local (d) Facilidade de acesso a empréstimos (e) a disponibilidade de capital de risco (f) restrição sobre os fluxos de capital (g) solidez dos bancos (h) a regulação das bolsas de valores e (i) índice de direitos legais.

Variável Quantitativa

Percentual

Knowledge and Technology

Direcionadas para a atividade de invenções e inovações, abrangendo: a) Criação do Conhecimento que envolve: o resultado de Atividades Criativas e Inovadores b) Sobre o Impacto do Conhecimento: aumento da produtividade do trabalho, a entrada de novas empresas, os gastos com software e quantidade de certificação de qualidade ISSO 9001; e c) Difusão do Conhecimento: royalties e taxas de licenças; percentual de exportações de alta tecnologia; percentual das exportações de serviços de comunicação, computação e informação em relação ao total de exportação de serviços; e o percentual de saída de FDI (Foreign Direct Investment) em relação ao PIB (Produto Interno Bruto).

Variável

Quantitativa

Percentual

Creative Outputs A criatividade foi reconhecida como um motor econômico para gerar riqueza, emprego, o desenvolvimento sustentável das cidades do mundo, mudanças tecnológicas, inovação empresarial e reforço da competitividade das cidades e países individuais.

Percentual

4

Criatividade mostrada na produção econômica e nos domínios culturais, por exemplo, pode ser avaliado e apreciado pela comunidade, enquanto a inovação criativa em ciência ou ciência humana poderia ser reconhecida pelas comunidades científicas e acadêmicas. Isto significa "criatividade social" é mensurável e quantificável, embora "a criatividade da vida diária" é uma capacidade geral encontrada em outro lugar em nossa vida é mais difícil de medir.

International Cooperation

Esta questão visa avaliar a disposição e capacidade da liderança política em desenvolver boas relações de vizinhança e cooperar com os países vizinhos em organizações internacionais e regionais • apoiar a integração regional ou internacional.

Indicador nominal que varia de 0 a 10

Effective use of support

Utilização eficaz de apoio : avalia se o Governo tem objetivos claros do desenvolvimento político e econômico, e sobre a forma como a liderança política faz uso de grandes projetos assistenciais internacionais, envolvendo cooperação técnica ou pessoal em sua própria agenda de desenvolvimento. O foco é sobre a capacidade de aprender a partir de know-how internacional, e se adaptar ao aconselhamento externo às realidades nacionais e ainda integrar essa assistência internacional em uma estratégia consistente de desenvolvimento de longo prazo.

Indicador nominal que varia de 0 a 10

Regional Cooperation

Avalia a disposição e capacidade da liderança política em: Desenvolver relações de boa vizinhança; Cooperar com os países vizinhos em organizações internacionais e regionais; Apoiar a integração regional ou internacional; A liderança política ativamente e com êxito constrói e expande cooperativa vizinhança e internacional relacionamentos. Ela promove a integração regional e internacional; A liderança política coopera com muitos estados vizinhos e está em conformidade com as regras estabelecidas pela organizações regionais e internacionais.

Indicador nominal que varia de 0 a 10

EPI- Indice de desempenho ambiental

Classifica o desempenho dos países em questões ambientais principais: proteção à saúde humana e proteção do ecossistema ambiental

Variável

Quantitativa

Percentual

HPI – Bem estar sustentável do país

Medida de bem estar sustentável país oferece uma vida feliz sustentável à longo prazo para as pessoas que vivem nelas.

Variável Quantitativa

Percentual

GINNI index Mede a distribuição de renda e de despesas das famílias Variável Quantitativa

Percentual

Fonte: autor a partir dos dados da planilha estatística e do GPS p.16 As variáveis que melhor identificam a Transformação Produtiva e Inovação Sustentável são: Social Progress Index, IDH 2013, Knowledge and Technology, Market Sophistication, Creative Output, Global Inovation Index. 2.3 A Tabela de Dados A tabela abaixo apresenta os dados das variáveis que melhor identificam a Transformação Produtiva e Inovação Sustentável para países objeto da pesquisa.

País  Social  Global  Market   Creative  IDH  Knowledge 

5

Progress 

Index  Innovation Sophistication 

Outputs  2013  and 

Index  Technology

Albania  69,13  30,5  61,9  20,6  0,716  30,43  

Algeria  59,13  24,2  36,2  14  0,689  29,23  

Angola  39,93  23,8  42,9  18,1  0,526  38,29  

Argentina  70,59  35,1  37,7  36,9  0,808  38,97  

Armenia  65,03  36,1  50,4  33,6  0,73  50,26  

Australia  86,10  55  68,1  52,5  0,933  61,71  

Austria  85,11  53,4  57,2  49,9  0,881  66,15  

Azerbaijan  62,44  29,6  59,9  24,6  0,747  28,55  

Bangladesh  52,04  24,4  44,1  17,2  0,558  33,85  

Belarus  65,20  37,1  46  28,6  0,786  62,22  

Belgium  82,63  51,7  58,5  45,7  0,881  72,14  

Benin  49,11  24,2  36,5  21,2  0,476  21,54  

Bolivia  62,90  27,8  48,2  24,1  0,667  32,48  

Bosnia Herzegovina  64,99  32,4  51,9  21,8  0,731  45,81  

Botswana  65,60  30,9  49,5  17,3  0,683  36,41  

Brazil  69,97  36,3  45,2  33,6  0,744  43,93  

Bulgaria  70,24  40,7  44,2  38,1  0,777  57,78  

Burkina Faso  47,33  28,2  40,4  23,9  0,388  35,38  

Burundi  37,33  22,4  47,3  16,2  0,389  16,92  

Cambodia  51,89  28,7  55,8  22,6  0,584  41,03  

Cameroon  45,51  27,5  45  27,1  0,504  33,16  

Canada  86,95  56,1  75,9  48,3  0,902  70,60  

Central Afr Republic  34,17  36,86  50,156  32,57  0,341  46,55  

Chad  32,60  36,86  50,156  32,57  0,372  46,55  

Chile  76,30  40,6  53,3  38,3  0,822  42,56  

China  58,67  46,6  50,5  35,7  0,719  96,49  

Colombia  67,24  35,5  51,8  30,7  0,711  37,61  

Congo, Republic of  47,99  36,86  50,156  32,57  0,338  46,55  

Costa Rica  77,75  37,3  40,7  36,3  0,763  47,69  

Croatia  73,31  40,7  42,5  37,9  0,812  55,56  

Cuba  61,07  36,86  50,156  32,57  0,815  46,55  

Czech Republic  80,41  50,2  49,1  47,3  0,861  75,21  

Denmark  86,55  57,5  67,8  52,4  0,9  75,56  

Djibouti  45,95  36,86  50,156  32,57  0,467  46,55  

Dominican Republic  63,03  32,3  50,4  36,4  0,7  34,87  

Ecuador  68,15  27,5  43,7  28,1  0,711  20,51  

Egypt  59,97  30  35,4  26,6  0,682  39,32  

El Salvador  64,70  29,1  43,1  29,8  0,662  19,15  

Estonia  81,28  51,5  55,4  53,4  0,84  62,74  

Finland  86,91  60,7  61,4  53,4  0,879  88,55  

France  81,11  52,2  61  45,5  0,884  71,45  

Georgia  63,94  34,5  55,2  25,9  0,744  47,18  

Germany  84,61  56  60,1  50,4  0,911  86,67  

6

Ghana  55,96  30,3  42,5  22,9  0,573  49,06  

Greece  73,43  38,9  47,9  33,3  0,853  48,21  

Guatemala  61,37  30,8  49,5  27,3  0,628  34,02  

Guinea  37,41  20,2  32,5  18,2  0,392  17,26  

Guyana  60,06  32,5  40,4  36,7  0,638  41,01  

Honduras  61,28  26,7  48,9  21,1  0,617  23,59  

Hungary  73,87  44,6  42,1  42,5  0,818  67,52  

Iceland  88,07  54,1  54,1  66,1  0,895  58,46  

India  50,24  33,7  51,2  28,6  0,586  50,94  

Indonesia  58,98  31,8  45,3  39,2  0,684  35,56  

Iran  56,65  26,1  35,9  18,1  0,749  30,09  

Iraq  44,84  36,86  50,156  32,57  0,642  46,55  

Ireland  84,05  56,7  70,3  46,9  0,899  86,84  

Israel  71,40  55,5  67,5  43,9  0,888  96,44  

Italy  76,93  45,7  51  37,5  0,872  68,89  

Jamaica  70,39  32,4  44,6  29,4  0,715  33,33  

Japan  84,21  52,4  66,8  38,1  0,89  76,58  

Jordan  61,92  36,2  39,9  34,9  0,745  46,15  

Kazakhstan  59,47  32,8  44,1  23,9  0,689  38,29  

Kenya  50,20  31,9  54,4  31,2  0,535  41,88  

Korea, Republic of  77,18  55,3  65,4  42,2  0,689  89,06  

Kuwait  70,66  35,2  47  28,1  0,814  53,68  

Kyrgyzstan  57,08  27,8  53,6  14,1  0,689  31,97  

Laos  52,41  36,86  50,156  32,57  0,569  46,55  

Latvia  73,91  44,8  54  44,1  0,689  58,80  

Lebanon  60,05  33,6  44,6  27,4  0,765  34,53  

Lesotho  48,94  27  47,5  16,3  0,486  20,85  

Liberia  44,02  36,86  50,156  32,57  0,412  46,55  

Lithuania  73,76  41  52,1  36,2  0,834  47,69  

Macedonia  68,33  36,9  54,6  32,6  0,732  44,10  

Madagascar  44,28  25,5  41,8  22,5  0,498  24,44  

Malawi  48,79  27,6  39,6  19,8  0,414  38,12  

Malaysia  70,00  45,6  63,9  42  0,773  56,58  

Mali  46,85  26,2  38,3  28,7  0,407  27,86  

Mauritania  43,11  36,86  50,156  32,57  0,487  46,55  

Mauritius  73,68  40,9  63  43,4  0,689  41,37  

Mexico  66,41  36  46,9  32,9  0,756  41,88  

Moldova  60,12  40,7  51,4  43,3  0,663  57,74  

Mongolia  58,97  37,5  57,2  36,4  0,698  37,26  

Montenegro  66,80  37  50,6  35,9  0,789  31,62  

Morocco  58,01  32,2  42,8  27,4  0,617  39,49  

Mozambique  45,23  28,5  49,9  14,3  0,393  41,88  

Namibia  61,19  28,5  44,4  27,9  0,624  17,61  

Nepal  51,58  23,8  43,1  20,3  0,54  15,04  

Netherlands  87,37  60,6  63,6  61,7  0,689  87,86  

New Zealand  88,24  54,5  68,9  47,9  0,91  73,33  

Nicaragua  62,33  25,5  47,1  23,4  0,614  16,58  

7

Niger  40,10  24,3  43,2  1,1  0,337  51,80  

Nigeria  42,65  27,8  43,9  32,8  0,504  31,97  

Norway  87,12  55,6  57,9  57,5  0,944  64,44  

Pakistan  42,40  24  35,8  23,2  0,537  33,33  

Panama  72,58  38,3  44,1  45  0,765  39,32  

Paraguay  62,65  31,6  50,2  36,9  0,676  25,81  

Peru  66,29  34,7  58,5  33,1  0,737  30,43  

Philippines  65,86  29,9  44,8  26,5  0,66  42,22  

Poland  77,44  40,6  48,2  36,7  0,834  49,23  

Portugal  80,49  45,6  53,2  44,7  0,822  51,79  

Romania  67,72  38,1  42,9  33  0,785  58,46  

Russia  60,79  39,1  42,5  31,4  0,778  60,17  

Rwanda  49,46  29,3  59,4  21,3  0,506  29,20  

Saudi Arabia  64,38  41,6  59  45  0,836  39,83  

Senegal  53,52  30,1  42,4  31  0,485  37,09  

Serbia  70,61  35,9  37  29,6  0,745  53,68  

Slovakia  78,93  41,9  48,6  39,4  0,83  55,21  

Slovenia  81,65  47,2  51,1  42,2  0,874  65,30  

South Africa  62,96  38,2  63,8  32,7  0,658  45,64  

Spain  80,77  49,3  64,7  42,1  0,869  69,57  

Sri Lanka  59,71  29  40,2  27,6  0,75  41,20  

Sudan  38,45  12,7  38,9  1,9  0,473  0,00  

Swaziland  48,87  25,3  38,1  22,5  0,898  20,51  

Sweden  87,08  62,3  68,2  55,4  0,917  96,41  

Switzerland  88,19  64,8  74,7  65,3  0,53  100,00  

Tajikistan  56,05  23,7  61,3  5  0,607  30,58  

Tanzania  46,06  25,6  36,6  20,9  0,488  25,81  

Thailand  65,14  39,3  56,9  35,2  0,722  51,28  

Togo  42,80  17,6  42,7  0,6  0,473  18,80  

Trinidad and Tobago  69,88  31,6  48,4  27,1  0,766  33,33  

Tunisia  62,96  32,9  39,9  31,1  0,721  32,14  

Turkey  64,62  38,2  49,1  41,2  0,759  51,11  

Uganda  47,75  31,1  43,7  27,6  0,484  37,44  

Ukraine  64,91  36,3  45,1  30,6  0,734  61,20  

United Arab Emirates  72,92  43,2  46,2  46,2  0,827  26,78  

United Kingdom  84,56  62,4  81,4  56,6  0,892  92,31  

United States  82,77  60,1  83,8  46,5  0,914  95,21  

Uruguay  77,51  34,8  40  34,4  0,79  37,09  

Uzbekistan  57,34  25,2  41,1  11,7  0,661  34,63  

Venezuela  63,78  25,7  29,6  23,4  0,764  42,26  

Yemen  40,23  19,5  40,7  15,7  0,5  19,32  

Zambia  49,88  25,8  47  21,2  0,561  37,44  

8

2.4 Fonte de Dados Todos os dados desta pesquisa foram obtidos em: endereço do site 3. ESTATÍSTICA DESCRITIVA / PESQUISA POR AMOSTRAGEM A pesquisa por amostragem foi feita em três amostras de 50 indivíduos ou países. Começamos com a análise das medidas e gráficos da estatística descritiva de cada variável da população total e por amostra. 3.1 Sumário População

90807060504030

20

15

10

5

0

1,0

0,9

0,8

0,7

0,6

0,5

0,4

20

15

10

5

06050403020

30

20

10

0

807060504030

30

20

10

06050403020100

30

20

10

0

100806040200

30

20

10

0

Social Progress Index

Freq

uenc

y

IDH - 2013 1. Global Innovation Index

1.4 Market Sophistication 1.6 Creative Outputs Knowledge and Technology_N

Mean 63,67StDev 14,20N 132

Social Progress Index

Mean 0,6894StDev 0,1567N 132

IDH - 2013

Mean 36,86StDev 10,91N 132

1. Global Innovation Index

Mean 50,16StDev 10,04N 132

1.4 Market Sophistication

Mean 32,57StDev 12,44N 132

1.6 Creative Outputs

Mean 4666Knowledge and Technology_N

AS VARIAVEIS REPRESENTATIVAS TRANSFORMAÇÃO PRODUTIVA E INOVAÇANormal

Todas as variáveis apresentam curva próxima da normal.

9

3.2 Sumário para Amostra 1 – Tamanho 50

0.96

0.80

0.64

0.48

0.32

10

5

0

1612840-4

20

10

0

20161284

10

5

0

8.0%

7.0%

6.0%

5.0%

4.0%

3.0%

2.0%

1.0%

16

8

0

4000

030

000

2000

010

0000

-1000

0

10

5

0

88807264564840

10

5

0

129630

10

5

0

HDI value_1

Freq

uenc

y

Carbon dioxide emissions_1 Expected Years of schooling_1

Expenditure on education_1 GDP per capita_1 Life expectancy at birth_1

Mean years of schooling_1

Mean 0.6090StDev 0.1826

N 53

HDI value_1

Mean 3.847

StDev 4.443N 53

Carbon dioxide emissions_1

Mean 11.97StDev 3.430

N 53

Expected Years of schooling_1

Mean 0.03808

StDev 0.01492N 53

Expenditure on education_1

Mean 11615StDev 10348N 53

GDP per capita_1

Mean 66.35StDev 10.97

N 53

Life expectancy at birth_1

Mean 7.158

StDev 3.135N 53

Mean years of schooling_1

Histogram of HDI value_1; Carbon dioxi; Expected Yea; ...Normal

Para a primeira amostra de 50 indivíduos observamos um resultado similar às curvas da população, isso demonstra que a amostra representa bem a população. Com exceção da variável Mean years of schooling, que nessa amostra apresenta curva próxima à curva normal, ao contrário do observado na população. 3.3 Sumário para Amostra 2 – Tamanho 50

1.05

0.90

0.75

0.60

0.45

0.30

8

4

01612840-4

20

10

01816141210864

5.0

2.5

0.0

8.0%

6.0%

4.0%

2.0%

0.0%

10

5

0

4000

032

000

2400

016

000

80000

-800

0

16

8

0

888072645648

10

5

0

129630

10

5

0

HDI value_2

Freq

uenc

y

Carbon dioxide emissions_2 Expected Years of schooling_2

Expenditure on education_2 GDP per capita_2 Life expectancy at birth_2

Mean years of schooling_2

Mean 0.6225StDev 0.1814

N 54

HDI value_2

Mean 3.941

StDev 4.163N 54

Carbon dioxide emissions_2

Mean 11.88StDev 3.235

N 54

Expected Years of schooling_2

Mean 0.04020

StDev 0.01766N 54

Expenditure on education_2

Mean 12132StDev 11001N 54

GDP per capita_2

Mean 67.90StDev 10.60

N 54

Life expectancy at birth_2

Mean 7.326

StDev 3.063N 54

Mean years of schooling_2

Histogram of HDI value_2; Carbon dioxi; Expected Yea; ...Normal

10

Para a segunda amostra de 50 indivíduos observamos um resultado similar às curvas da população, isso demonstra que a amostra representa bem a população. Com exceção da variável HDI value, que nessa amostra não apresenta curva próxima à curva normal, ao contrário do observado na população. 3.4 Sumário para Amostra 3 – Tamanho 50

1.00.80.60.40.2

16

8

0

1612840-4

20

10

0

1816141210864

5.0

2.5

0.0

7.0%

6.0%

5.0%

4.0%

3.0%

2.0%

1.0%

8

4

0

4000

030

000

2000

01000

00

-100

00

10

5

0888072645648

10

5

0

1412108642

8

4

0

HDI value_3

Freq

uenc

y

Carbon dioxide emissions_3 Expected Years of schooling_3

Expenditure on education_3 GDP per capita_3 Life expectancy at birth_3

Mean years of schooling_3

Mean 0.6085StDev 0.1792

N 51

HDI value_3

Mean 3.849

StDev 4.057N 51

Carbon dioxide emissions_3

Mean 11.71StDev 3.203

N 51

Expected Years of schooling_3

Mean 0.04055

StDev 0.01336N 51

Expenditure on education_3

Mean 10748StDev 10378N 51

GDP per capita_3

Mean 66.35StDev 10.78

N 51

Life expectancy at birth_3

Mean 7.363

StDev 2.860N 51

Mean years of schooling_3

Histogram of HDI value_3; Carbon dioxi; Expected Yea; ...Normal

Para a terceira amostra de 50 indivíduos observamos um resultado similar às curvas da população, isso demonstra que a amostra representa bem a população. Com exceção da variável HDI value (mesmo comportamento da amostra 2), que nessa amostra não apresenta curva próxima à curva normal, ao contrário do observado na população. 4. COMPARAÇÃO DE MÉDIA, ANÁLISE DE VARIÂNCIA E INTERVALO DE CONFIANÇA. Segue abaixo os resultados da One-Way ANOVA para cada variável, por amostra. A comparação é sempre entre os três conglomerados de cada amostra. 4.1 Amostra 1 – Tamanho 50

Cluster 1  Cluster 2  Cluster 3 

Cape Verde  El Salvador  Cyprus 

Guyana  Malawi  Czech Republic 

Nicaragua  Kazakhstan  Portugal 

Kenya  Maldives  Estonia 

Mauritania  Uruguay  Hungary 

Nigeria  Niger  Equatorial Guinea 

11

Solomon Islands  Mozambique  France 

Nepal  Malaysia  Belgium 

India  Mauritius  Finland 

Zambia  Panama  Italy 

Senegal  Botswana  Australia 

Guinea  Sierra Leone    

Burkina Faso  Tunisia    

Kyrgyzstan  Lithuania    

Cameroon  Swaziland    

Viet Nam  Ukraine    

Lao People's Democratic Republic Romania    

   Latvia    

   Madagascar    

  

The former Yugoslav Republic of Macedonia    

   Peru    

  Central African 

Republic    

   Brazil    

   Russian Federation   

   South Africa    

   China    

17  26  11 

One-way ANOVA: HDI value_1 versus Grupo1 Source DF SS MS F P Grupo1 2 0.7928 0.3964 21.42 0.000 Error 51 0.9441 0.0185 Total 53 1.7369 S = 0.1361 R-Sq = 45.65% R-Sq(adj) = 43.51% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---+---------+---------+---------+------ 1 17 0.4738 0.0873 (----*---) 2 26 0.6108 0.1696 (---*--) 3 11 0.8184 0.1016 (-----*----) ---+---------+---------+---------+------ 0.45 0.60 0.75 0.90 Pooled StDev = 0.1361

One-way ANOVA: Carbon dioxide emissions_1 versus Grupo1 Source DF SS MS F P Grupo1 2 590.48 295.24 34.50 0.000 Error 51 436.39 8.56 Total 53 1026.87

12

S = 2.925 R-Sq = 57.50% R-Sq(adj) = 55.84% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --+---------+---------+---------+------- 1 17 0.600 0.532 (---*---) 2 26 3.427 3.409 (--*--) 3 11 9.927 3.760 (----*----) --+---------+---------+---------+------- 0.0 3.5 7.0 10.5 Pooled StDev = 2.925

One-way ANOVA: Expected Years of schooling_1 versus Grupo1 Source DF SS MS F P Grupo1 2 242.49 121.24 16.74 0.000 Error 51 369.44 7.24 Total 53 611.93 S = 2.691 R-Sq = 39.63% R-Sq(adj) = 37.26% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+---------+- 1 17 9.418 1.764 (-----*----) 2 26 12.162 3.054 (----*---) 3 11 15.418 2.941 (------*-----) --------+---------+---------+---------+- 10.0 12.5 15.0 17.5 Pooled StDev = 2.691

One-way ANOVA: Expenditure on education_1 versus Grupo1 Source DF SS MS F P Grupo1 2 0.000541 0.000270 1.23 0.302 Error 51 0.011254 0.000221 Total 53 0.011795 S = 0.01485 R-Sq = 4.58% R-Sq(adj) = 0.84% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -+---------+---------+---------+-------- 1 17 0.03488 0.01802 (----------*---------) 2 26 0.03719 0.01311 (-------*-------) 3 11 0.04373 0.01327 (-----------*------------) -+---------+---------+---------+-------- 0.0280 0.0350 0.0420 0.0490 Pooled StDev = 0.01485

One-way ANOVA: GDP per capita_1 versus Grupo1 Source DF SS MS F P Grupo1 2 4813214923 2406607461 158.53 0.000 Error 51 774219116 15180767 Total 53 5587434039

13

S = 3896 R-Sq = 86.14% R-Sq(adj) = 85.60% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev +---------+---------+---------+--------- 1 17 2240 776 (--*-) 2 26 10278 3144 (-*-) 3 11 28864 7193 (--*--) +---------+---------+---------+--------- 0 8000 16000 24000 Pooled StDev = 3896

One-way ANOVA: Life expectancy at birth_1 versus Grupo1 Source DF SS MS F P Grupo1 2 1475.8 737.9 7.78 0.001 Error 51 4835.0 94.8 Total 53 6310.8 S = 9.737 R-Sq = 23.39% R-Sq(adj) = 20.38% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+---------+- 1 17 61.812 8.794 (-----*------) 2 26 65.358 10.597 (----*-----) 3 11 76.355 8.890 (-------*-------) --------+---------+---------+---------+- 63.0 70.0 77.0 84.0 Pooled StDev = 9.737

One-way ANOVA: Mean years of schooling_1 versus Grupo1 Source DF SS MS F P Grupo1 2 188.16 94.08 14.86 0.000 Error 51 322.94 6.33 Total 53 511.10 S = 2.516 R-Sq = 36.81% R-Sq(adj) = 34.34% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- 1 17 4.924 2.149 (----*----) 2 26 7.342 2.881 (---*---) 3 11 10.209 2.039 (-----*-----) -----+---------+---------+---------+---- 5.0 7.5 10.0 12.5 Pooled StDev = 2.516

Os valores P-value das análises de variância acima nos confirmam que: - Tendo como parâmetro o p-value menor ou igual a 5% para a rejeição da hipótese nula,

podemos considerar que a média populacional das variáveis dos conglomerados são diferentes, com exceção da variável Expenditure on Education. A variável Life expetancy

14

at birth, apesar de ter o p-value menor ou igual a 5%, não possui médias entre os conglomerados tão diferentes, conforme pode ser observado visualmente.

- Pela análise do valor F, percebemos que a maior diferença aparece na variável GDP per

Capita. Veremos abaixo o Box-Plot que nos permite visualizar mais claramente estas grandes diferenças entre os três conglomerados.

0.8

0.6

0.4

321

10

5

0

15.0

12.5

10.0

5.0%

4.0%

3.0%

30000

15000

0321

80

70

60

321

12

8

4

HDI v alue_1

Grupo1

C arbon dioxide emissions_1 Expected Years of schooling_1

Expenditure on education_1 GDP per capita_1 Life expectancy at birth_1

Mean y ears of schooling_1

Boxplot of HDI value_1; Carbon dioxi; Expected Yea; Expenditure ; ...

Fica bastante notória as diferenças que separam os três conglomerados nas 7 variáveis analisadas, com exceção das variáveis Expenditure on education e Life expetancy at birth, conforme já explicado anteriormente.

15

Expe

nditu

re on

educ

ation

_1

GDP p

er ca

pita_

1

Carbo

n diox

ide em

ission

s_1

Life e

xpec

tancy at

birth

_1

Mean y

ears

of sc

hool i

ng_1

Expe

cted Y

ears

of sc

hooli

ng_1

HDI v

alue_

1

75.43

83.62

91.81

100.00

Variables

Sim

ilari

tyDendrogram

Single Linkage; Correlation Coefficient Distance

Pelo dendrograma podemos observar que as variáveis HDI value, Expected years of schooling, Mean years of schooling e Life expectancy at birth estão correlacionadas, as variáveis Carbon dioxide emissions e GDP per capita também estão correlacionadas, e a variável Expenditure on education possui baixa correlação com as outras variáveis. 4.2 Amostra 2 – Tamanho 50

Cluster 1  Cluster 2  Cluster 3 

Senegal  Belgium  Cyprus 

Kyrgyzstan  Japan  Saudi Arabia 

Sierra Leone  Austria  Greece 

Armenia  Ireland  Korea (Republic of) 

Nepal  Finland  Czech Republic 

Ecuador     Bahamas 

Uruguay     Italy 

Moldova (Republic of)       

Nicaragua       

Chad       

Haiti       

Romania       

Morocco       

Mauritania       

Nigeria       

Guyana       

Mauritius       

Côte d'Ivoire       

Madagascar       

16

Lao People's Democratic Republic       

Honduras       

Egypt       

Mozambique       

Bulgaria       

India       

Cameroon       

Tunisia       

Malawi       

Niger       

Guatemala       

Jamaica       

Dominican Republic       

Swaziland       

Hungary       

Ukraine       

Namibia       

Central African Republic       

Croatia       

Brazil       

Russian Federation       

China       

South Africa       

42  5  7 

One-way ANOVA: HDI value_2 versus Cluster2 Source DF SS MS F P Cluster2 2 0.7711 0.3855 20.20 0.000 Error 51 0.9736 0.0191 Total 53 1.7447 S = 0.1382 R-Sq = 44.20% R-Sq(adj) = 42.01% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ------+---------+---------+---------+--- 1 42 0.5590 0.1531 (--*--) 2 5 0.8736 0.0168 (-------*--------) 3 7 0.8247 0.0446 (------*------) ------+---------+---------+---------+--- 0.60 0.75 0.90 1.05 Pooled StDev = 0.1382

One-way ANOVA: Carbon dioxide emissions_2 versus Cluster2 Source DF SS MS F P Cluster2 2 592.36 296.18 46.32 0.000 Error 51 326.09 6.39

17

Total 53 918.45 S = 2.529 R-Sq = 64.50% R-Sq(adj) = 63.10% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- 1 42 2.171 2.537 (-*--) 2 5 10.420 1.469 (-------*------) 3 7 9.929 2.986 (-----*-----) -----+---------+---------+---------+---- 3.0 6.0 9.0 12.0 Pooled StDev = 2.529

One-way ANOVA: Expected Years of schooling_2 versus Cluster2 Source DF SS MS F P Cluster2 2 195.70 97.85 13.90 0.000 Error 51 359.04 7.04 Total 53 554.74 S = 2.653 R-Sq = 35.28% R-Sq(adj) = 32.74% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev +---------+---------+---------+--------- 1 42 10.879 2.839 (---*--) 2 5 16.200 1.269 (---------*--------) 3 7 14.814 1.925 (-------*-------) +---------+---------+---------+--------- 10.0 12.5 15.0 17.5 Pooled StDev = 2.653

One-way ANOVA: Expenditure on education_2 versus Cluster2 Source DF SS MS F P Cluster2 2 0.000467 0.000234 0.74 0.481 Error 51 0.016061 0.000315 Total 53 0.016529 S = 0.01775 R-Sq = 2.83% R-Sq(adj) = 0.00% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- 1 42 0.03933 0.01906 (----*-----) 2 5 0.04940 0.00344 (---------------*---------------) 3 7 0.03886 0.01362 (-------------*------------) -----+---------+---------+---------+---- 0.030 0.040 0.050 0.060 Pooled StDev = 0.01775

One-way ANOVA: GDP per capita_2 versus Cluster2 Source DF SS MS F P Cluster2 2 5488600180 2744300090 151.21 0.000 Error 51 925600560 18149031 Total 53 6414200740

18

S = 4260 R-Sq = 85.57% R-Sq(adj) = 85.00% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ----+---------+---------+---------+----- 1 42 6857 4607 (*) 2 5 35772 2274 (---*---) 3 7 26895 2405 (--*--) ----+---------+---------+---------+----- 10000 20000 30000 40000 Pooled StDev = 4260

One-way ANOVA: Life expectancy at birth_2 versus Cluster2 Source DF SS MS F P Cluster2 2 1979.0 989.5 12.71 0.000 Error 51 3971.3 77.9 Total 53 5950.3 S = 8.824 R-Sq = 33.26% R-Sq(adj) = 30.64% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --+---------+---------+---------+------- 1 42 64.681 9.761 (---*---) 2 5 80.860 1.313 (-----------*----------) 3 7 77.929 3.107 (--------*---------) --+---------+---------+---------+------- 63.0 70.0 77.0 84.0 Pooled StDev = 8.824

One-way ANOVA: Mean years of schooling_2 versus Cluster2 Source DF SS MS F P Cluster2 2 161.55 80.78 12.27 0.000 Error 51 335.81 6.58 Total 53 497.36 S = 2.566 R-Sq = 32.48% R-Sq(adj) = 29.83% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --+---------+---------+---------+------- 1 42 6.402 2.795 (---*---) 2 5 10.760 0.777 (-----------*----------) 3 7 10.414 1.475 (---------*---------) --+---------+---------+---------+------- 6.0 8.0 10.0 12.0 Pooled StDev = 2.566

Os valores P-value das análises de variância acima nos confirmam que: - Tendo como parâmetro o p-value menor ou igual a 5% para a rejeição da hipótese nula,

podemos considerar que a média populacional das variáveis dos conglomerados são diferentes, com exceção da variável Expenditure on Education. As variáveis HDI value,

19

Cabon dioxide emissions, Expected Years of schooling, Life expetancy at birth e Mean years of schooling, apesar de ter o p-value menor ou igual a 5%, não possuem médias entre os conglomerados tão diferentes, conforme pode ser observado visualmente.

- Pela análise do valor F, percebemos que a maior diferença aparece na variável GDP per

Capita. Veremos abaixo o Box-Plot que nos permite visualizar mais claramente estas grandes diferenças entre os três conglomerados.

0.90

0.75

0.60

321

10

5

0

18

15

12

5.0%

4.0%

3.0%

40000

20000

0321

80

70

60

321

10.0

7.5

5.0

HDI v alue_2

Cluster2

C arbon dioxide emissions_2 Expected Years of schooling_2

Expenditure on education_2 GDP per capita_2 Life expectancy at birth_2

Mean y ears of schooling_2

Boxplot of HDI value_2; Carbon dioxi; Expected Yea; Expenditure ; ...

Fica bastante notória as diferenças que separam os três conglomerados nas 7 variáveis analisadas, com exceção das variáveis HDI value, Cabon dioxide emissions, Expected Years of schooling, Expenditure on education, Life expetancy at birth e Mean years of schooling, conforme já explicado anteriormente.

20

Expe

nditu

re on

educ

ation

_2

GDP p

er ca

pita_

2

Carbo

n diox

ide em

ission

s_2

Life e

xpec

tancy at

birth

_2

Mean y

ears

of sc

hool i

ng_2

Expe

cted Y

ears

of sc

hooli

ng_2

HDI v

alue_

2

70.02

80.01

90.01

100.00

Variables

Sim

ilari

tyDendrogram

Single Linkage; Correlation Coefficient Distance

Pelo dendrograma podemos observar um comportamento similar à amostra 1, em que as variáveis HDI value, Expected years of schooling, Mean years of schooling e Life expectancy at birth estão correlacionadas, as variáveis Carbon dioxide emissions e GDP per capita também estão correlacionadas, e a variável Expenditure on education possui baixa correlação com as outras variáveis. 4.3 Amostra 3 – Tamanho 50

Cluster 1  Cluster 2  Cluster 3 

Belgium  Cameroon  Bahamas 

Iceland  Kazakhstan  Saudi Arabia 

Japan  Zimbabwe  Korea (Republic of) 

Denmark  China    

 Netherlands  Lithuania    

   Madagascar    

   Botswana    

   Philippines    

   Turkmenistan    

   Belize    

   Egypt    

   Ukraine    

   Burkina Faso    

   Nigeria    

   Morocco    

21

  

The former Yugoslav Republic of Macedonia    

   Sri Lanka    

   Rwanda    

   Jamaica    

   Ghana    

   Zambia    

   Mauritius    

   Syrian Arab Republic    

   Senegal    

   Fiji    

   Angola    

  Central African 

Republic    

   Mexico    

   Tunisia    

   Belarus    

   Russian Federation    

   Niger    

   Albania    

   Thailand    

   Panama    

   Gambia    

   Myanmar    

   India    

   Brazil    

   Congo    

   Guatemala    

   Mauritania    

   South Africa    

5  43  3 

One-way ANOVA: HDI value_3 versus Grupo3 Source DF SS MS F P Grupo3 2 0.5563 0.2781 12.72 0.000 Error 48 1.0493 0.0219 Total 50 1.6056 S = 0.1479 R-Sq = 34.65% R-Sq(adj) = 31.92% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- 1 5 0.8752 0.0110 (--------*--------) 2 43 0.5639 0.1574 (--*--) 3 3 0.8043 0.0649 (-----------*----------) -----+---------+---------+---------+---- 0.60 0.75 0.90 1.05

22

Pooled StDev = 0.1479

One-way ANOVA: Carbon dioxide emissions_3 versus Grupo3 Source DF SS MS F P Grupo3 2 364.32 182.16 19.07 0.000 Error 48 458.49 9.55 Total 50 822.81 S = 3.091 R-Sq = 44.28% R-Sq(adj) = 41.96% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- 1 5 9.600 1.241 (-------*-------) 2 43 2.700 3.117 (--*-) 3 3 10.733 4.706 (----------*---------) -----+---------+---------+---------+---- 3.5 7.0 10.5 14.0 Pooled StDev = 3.091

One-way ANOVA: Expected Years of schooling_3 versus Grupo3 Source DF SS MS F P Grupo3 2 155.28 77.64 10.42 0.000 Error 48 357.58 7.45 Total 50 512.87 S = 2.729 R-Sq = 30.28% R-Sq(adj) = 27.37% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---------+---------+---------+---------+ 1 5 16.560 1.161 (---------*---------) 2 43 10.988 2.838 (--*--) 3 3 13.967 2.631 (------------*------------) ---------+---------+---------+---------+ 12.5 15.0 17.5 20.0 Pooled StDev = 2.729

One-way ANOVA: Expenditure on education_3 versus Grupo3 Source DF SS MS F P Grupo3 2 0.001141 0.000570 3.52 0.038 Error 48 0.007784 0.000162 Total 50 0.008925 S = 0.01273 R-Sq = 12.78% R-Sq(adj) = 9.15% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+---------+- 1 5 0.05380 0.00823 (-----------*----------) 2 43 0.03860 0.01283 (---*---) 3 3 0.04633 0.01739 (-------------*--------------) --------+---------+---------+---------+- 0.040 0.050 0.060 0.070

23

Pooled StDev = 0.01273

One-way ANOVA: GDP per capita_3 versus Grupo3 Source DF SS MS F P Grupo3 2 4544867404 2272433702 129.83 0.000 Error 48 840167093 17503481 Total 50 5385034497 S = 4184 R-Sq = 84.40% R-Sq(adj) = 83.75% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- 1 5 35709 3101 (---*--) 2 43 6749 4332 (-*) 3 3 26474 2609 (---*----) -----+---------+---------+---------+---- 10000 20000 30000 40000 Pooled StDev = 4184

One-way ANOVA: Life expectancy at birth_3 versus Grupo3 Source DF SS MS F P Grupo3 2 1570.6 785.3 8.88 0.001 Error 48 4242.6 88.4 Total 50 5813.2 S = 9.401 R-Sq = 27.02% R-Sq(adj) = 23.98% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ----+---------+---------+---------+----- 1 5 80.920 1.753 (---------*----------) 2 43 63.991 10.007 (---*---) 3 3 75.833 3.479 (-------------*------------) ----+---------+---------+---------+----- 64.0 72.0 80.0 88.0 Pooled StDev = 9.401

One-way ANOVA: Mean years of schooling_3 versus Grupo3 Source DF SS MS F P Grupo3 2 97.90 48.95 7.55 0.001 Error 48 311.08 6.48 Total 50 408.98 S = 2.546 R-Sq = 23.94% R-Sq(adj) = 20.77% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev +---------+---------+---------+--------- 1 5 10.800 0.524 (----------*----------) 2 43 6.767 2.679 (---*---) 3 3 10.167 2.065 (--------------*--------------) +---------+---------+---------+--------- 6.0 8.0 10.0 12.0

24

Pooled StDev = 2.546

Os valores P-value das análises de variância acima nos confirmam que: - Tendo como parâmetro o p-value menor ou igual a 5% para a rejeição da hipótese nula,

podemos considerar que todas as médias populacionais das variáveis dos conglomerados são diferentes. As variáveis HDI value, Cabon dioxide emissions, Expected Years of schooling, Expenditure on education, Life expetancy at birth e Mean years of schooling, apesar de terem o p-value menor ou igual a 5%, não possuem médias entre os conglomerados tão diferentes, conforme pode ser observado visualmente.

- Pela análise do valor F, percebemos que a maior diferença aparece na variável GDP per

Capita. Veremos abaixo o Box-Plot que nos permite visualizar mais claramente estas grandes diferenças entre os três conglomerados.

0.90

0.75

0.60

321

16

8

0

18

15

12

6.0%

5.0%

4.0%

40000

20000

0321

80

70

60

321

10.0

7.5

5.0

HDI v alue_3

Grupo3

C arbon dioxide emissions_3 Expected Years of schooling_3

Expenditure on education_3 GDP per capita_3 Life expectancy at birth_3

Mean y ears of schooling_3

Boxplot of HDI value_3; Carbon dioxi; Expected Yea; Expenditure ; ...

Fica bastante notória as diferenças que separam os três conglomerados nas 7 variáveis analisadas, com exceção das variáveis HDI value, Cabon dioxide emissions, Expected Years of schooling, Expenditure on education, Life expetancy at birth e Mean years of schooling, conforme já explicado anteriormente.

25

Expe

nditu

re on

educ

ation

_3

Carbo

n diox

ide em

ission

s_3

GDP p

er ca

pita_

3

Mean y

ears

of scho

oling

_3

Life e

xpec

tancy

at bi

rth_3

Expe

cted Y

ears

of sc

hooli

ng_3

HDI v

alue_

3

72.88

81.92

90.96

100.00

Variables

Sim

ilari

tyDendrogram

Single Linkage; Correlation Coefficient Distance

Pelo dendrograma podemos observar um comportamento um pouco diferente das amostras anteriores, em que as variáveis HDI value, Expected years of schooling, Mean years of schooling e Life expectancy at birth estão correlacionadas. Já as variáveis GDP per capita, Carbon dioxide emissions e Expenditure on education possuem baixa correlação com as outras variáveis. 5. ANÁLISE DISCRIMINANTE A variável dependente de nossa análise será o conglomerado e para tentar explicar em qual conglomerado um determinado país cai, utilizamos as 7 variáveis de indicadores relacionados ao desenvolvimento humano dos países do mundo. 5.1 Amostra 1 – Tamanho 50 Discriminant Analysis: Grupo1 versus HDI value_1; Carbon dioxide e; ... Linear Method for Response: Grupo1 Predictors: HDI value_1; Carbon dioxide emissions_1; Expected Years of schooling_1; Expenditure on education_1; GDP per capita_1; Life expectancy at birth_1; Mean years of schooling_1 Group 1 2 3 Count 17 26 11 Summary of classification True Group

26

Put into Group 1 2 3 1 17 2 0 2 0 24 0 3 0 0 11 Total N 17 26 11 N correct 17 24 11 Proportion 1.000 0.923 1.000 N = 54 N Correct = 52 Proportion Correct = 0.963 Squared Distance Between Groups 1 2 3 1 0.0000 4.8164 50.4604 2 4.8164 0.0000 26.4172 3 50.4604 26.4172 0.0000 Linear Discriminant Function for Groups 1 2 3 Constant -33.14 -34.74 -66.75 HDI value_1 -160.32 -157.19 -182.59 Carbon dioxide emissions_1 -0.02 -0.11 0.18 Expected Years of schooling_1 1.04 1.10 -0.05 Expenditure on education_1 158.43 150.36 223.07 GDP per capita_1 0.00 0.00 0.00 Life expectancy at birth_1 1.79 1.71 2.04 Mean years of schooling_1 3.10 3.37 4.53 Summary of Misclassified Observations True Pred Squared Observation Group Group Group Distance Probability 7** 2 1 1 5.375 0.766 2 7.743 0.234 3 48.747 0.000 10** 2 1 1 10.83 0.768 2 13.22 0.232 3 39.01 0.000

Discriminant Analysis: Grupo1 versus HDI value_1; Carbon dioxide e; ... HDI value_1 is highly correlated with other predictors in group 1. HDI value_1 is highly correlated with other predictors in group 3. Expected Years of schooling_1 is highly correlated with other predictors in group 3. Life expectancy at birth_1 is highly correlated with other predictors in group 3. Mean years of schooling_1 is highly correlated with other predictors in group 3. Quadratic Method for Response: Grupo1 Predictors: HDI value_1; Carbon dioxide emissions_1;

27

Expected Years of schooling_1; Expenditure on education_1; GDP per capita_1; Life expectancy at birth_1; Mean years of schooling_1 Group 1 2 3 Count 17 26 11 Summary of classification True Group Put into Group 1 2 3 1 17 0 0 2 0 25 0 3 0 1 11 Total N 17 26 11 N correct 17 25 11 Proportion 1.000 0.962 1.000 N = 54 N Correct = 53 Proportion Correct = 0.981 From Generalized Squared Distance to Group Group 1 2 3 1 -2.7 15.1 953.3 2 1209.1 8.0 206.8 3 14997.8 53.4 3.0 Summary of Misclassified Observations True Pred Squared Observation Group Group Group Distance Probability 12** 2 3 1 2417.20 0.000 2 16.66 0.268 3 14.65 0.732

A utilização da função quadrática ajustou melhor os dados, uma vez que aumentou a proporção de acerto de 96,3% para 98,1%. Veremos o que ocorre se excluirmos as variáveis com alto valor de p, utilizando a função quadrática: Discriminant Analysis: Grupo1 versus HDI value_1; Carbon dioxide e; ... HDI value_1 is highly correlated with other predictors in group 1. HDI value_1 is highly correlated with other predictors in group 3. Life expectancy at birth_1 is highly correlated with other predictors in group 3. Quadratic Method for Response: Grupo1 Predictors: HDI value_1; Carbon dioxide emissions_1; Expected Years of schooling_1; GDP per capita_1; Life expectancy at birth_1; Mean years of schooling_1

28

Group 1 2 3 Count 17 26 11 Summary of classification True Group Put into Group 1 2 3 1 17 0 0 2 0 25 0 3 0 1 11 Total N 17 26 11 N correct 17 25 11 Proportion 1.000 0.962 1.000 N = 54 N Correct = 53 Proportion Correct = 0.981 From Generalized Squared Distance to Group Group 1 2 3 1 5.9 24.2 619.6 2 1126.5 17.1 156.7 3 13811.7 60.9 13.3 Summary of Misclassified Observations True Pred Squared Observation Group Group Group Distance Probability 12** 2 3 1 2184.12 0.000 2 23.79 0.199 3 21.00 0.801

Não houve mudança no poder explicativo e o modelo fica mais simples, com seis variáveis ao invés de sete. Veremos o que acontece se considerarmos apenas a variável GDP per capita, variável com maior diferença entre os conglomerados. O objetivo é termos um modelo ainda mais simples e intuitivo: Discriminant Analysis: Grupo1 versus GDP per capita_1 Quadratic Method for Response: Grupo1 Predictors: GDP per capita_1 Group 1 2 3 Count 17 26 11 Summary of classification True Group Put into Group 1 2 3 1 17 0 0 2 0 26 0 3 0 0 11 Total N 17 26 11 N correct 17 26 11 Proportion 1.000 1.000 1.000

29

N = 54 N Correct = 54 Proportion Correct = 1.000 From Generalized Squared Distance to Group Group 1 2 3 1 13.31 22.64 31.46 2 120.54 16.11 24.44 3 1189.85 51.05 17.76

O poder explicativo aumentou, chegando a uma proporção de acerto de 100% e a análise fica ainda mais simples com apenas uma variável explicativa. 5.2 Amostra 2 – Tamanho 50 Discriminant Analysis: Cluster2 versus HDI value_2; Carbon dioxi; ... Linear Method for Response: Cluster2 Predictors: HDI value_2; Carbon dioxide emissions_2; Expected Years of schooling_2; Expenditure on education_2; GDP per capita_2; Life expectancy at birth_2; Mean years of schooling_2 Group 1 2 3 Count 42 5 7 Summary of classification True Group Put into Group 1 2 3 1 42 0 0 2 0 5 0 3 0 0 7 Total N 42 5 7 N correct 42 5 7 Proportion 1.000 1.000 1.000 N = 54 N Correct = 54 Proportion Correct = 1.000 Squared Distance Between Groups 1 2 3 1 0.0000 60.8599 32.2712 2 60.8599 0.0000 7.3591 3 32.2712 7.3591 0.0000 Linear Discriminant Function for Groups 1 2 3 Constant -47.89 -95.67 -73.19 HDI value_2 -231.32 -279.91 -251.80 Carbon dioxide emissions_2 0.60 1.43 1.69 Expected Years of schooling_2 4.30 2.39 2.21 Expenditure on education_2 141.77 197.23 124.32 GDP per capita_2 0.00 0.00 0.00 Life expectancy at birth_2 2.39 3.01 2.80 Mean years of schooling_2 2.10 3.08 2.96

30

Discriminant Analysis: Cluster2 versus HDI value_2; Carbon dioxi; ... * ERROR * Mean years of schooling_2 is highly correlated with other predictors in group 2. * ERROR * Calculations for discriminant analysis cannot be done.

Não foi possível calcular utilizando a função quadrática. Porém a utilização da função linear já ajustou os dados em uma proporção de acerto de 100%. Veremos o que ocorre se excluirmos as variáveis com alto valor de p, utilizando a função linear: Discriminant Analysis: Cluster2 versus HDI value_2; Carbon dioxi; ... Linear Method for Response: Cluster2 Predictors: HDI value_2; Carbon dioxide emissions_2; Expected Years of schooling_2; GDP per capita_2; Life expectancy at birth_2; Mean years of schooling_2 Group 1 2 3 Count 42 5 7 Summary of classification True Group Put into Group 1 2 3 1 42 0 0 2 0 5 0 3 0 0 7 Total N 42 5 7 N correct 42 5 7 Proportion 1.000 1.000 1.000 N = 54 N Correct = 54 Proportion Correct = 1.000 Squared Distance Between Groups 1 2 3 1 0.0000 60.1135 32.1973 2 60.1135 0.0000 6.0691 3 32.1973 6.0691 0.0000 Linear Discriminant Function for Groups 1 2 3 Constant -45.45 -90.95 -71.32 HDI value_2 -222.60 -267.77 -244.14 Carbon dioxide emissions_2 0.75 1.64 1.83 Expected Years of schooling_2 4.12 2.13 2.05 GDP per capita_2 0.00 0.00 0.00 Life expectancy at birth_2 2.34 2.93 2.76 Mean years of schooling_2 2.39 3.48 3.22

31

Não houve mudança no poder explicativo e o modelo fica mais simples, com seis variáveis ao invés de sete. Veremos o que acontece se considerarmos apenas a variável GDP per capita, variável com maior diferença entre os conglomerados. O objetivo é termos um modelo ainda mais simples e intuitivo: Discriminant Analysis: Cluster2 versus GDP per capita_2 Linear Method for Response: Cluster2 Predictors: GDP per capita_2 Group 1 2 3 Count 42 5 7 Summary of classification True Group Put into Group 1 2 3 1 40 0 0 2 0 5 0 3 2 0 7 Total N 42 5 7 N correct 40 5 7 Proportion 0.952 1.000 1.000 N = 54 N Correct = 52 Proportion Correct = 0.963 Squared Distance Between Groups 1 2 3 1 0.0000 46.0677 22.1238 2 46.0677 0.0000 4.3419 3 22.1238 4.3419 0.0000 Linear Discriminant Function for Groups 1 2 3 Constant -1.295 -35.254 -19.928 GDP per capita_2 0.000 0.002 0.001 Summary of Misclassified Observations True Pred Squared Observation Group Group Group Distance Probability 45** 1 3 1 8.106 0.089 2 15.525 0.002 3 3.447 0.909 50** 1 3 1 5.646 0.471 2 19.458 0.000 3 5.417 0.528

Há uma redução muito pequena no poder explicativo, reduzindo a proporção de acerto de 100% para 96,3% e a análise fica ainda mais simples com apenas uma variável explicativa.

32

5.3 Amostra 3 – Tamanho 50 Discriminant Analysis: Grupo3 versus HDI value_3; Carbon dioxide e; ... Linear Method for Response: Grupo3 Predictors: HDI value_3; Carbon dioxide emissions_3; Expected Years of schooling_3; Expenditure on education_3; GDP per capita_3; Life expectancy at birth_3; Mean years of schooling_3 Group 1 2 3 Count 5 43 3 Summary of classification True Group Put into Group 1 2 3 1 5 0 0 2 0 43 0 3 0 0 3 Total N 5 43 3 N correct 5 43 3 Proportion 1.000 1.000 1.000 N = 51 N Correct = 51 Proportion Correct = 1.000 Squared Distance Between Groups 1 2 3 1 0.0000 66.4936 11.4588 2 66.4936 0.0000 32.3375 3 11.4588 32.3375 0.0000 Linear Discriminant Function for Groups 1 2 3 Constant -81.07 -34.74 -57.02 HDI value_3 -143.48 -86.34 -119.78 Carbon dioxide emissions_3 -0.05 0.06 0.70 Expected Years of schooling_3 0.84 1.23 -0.06 Expenditure on education_3 190.57 150.34 150.83 GDP per capita_3 0.00 0.00 0.00 Life expectancy at birth_3 1.93 1.47 1.83 Mean years of schooling_3 0.68 0.60 0.98

Discriminant Analysis: Grupo3 versus HDI value_3; Carbon dioxide e; ... * ERROR * Mean years of schooling_3 is highly correlated with other predictors in group 1. * ERROR * Calculations for discriminant analysis cannot be done.

33

Não foi possível calcular utilizando a função quadrática. Porém a utilização da função linear já ajustou os dados em uma proporção de acerto de 100%. Com não foram encontradas variáveis com alto valor de p, veremos o que acontece se considerarmos apenas a variável GDP per capita, variável com maior diferença entre os conglomerados. O objetivo é termos um modelo mais simples e intuitivo: Discriminant Analysis: Grupo3 versus GDP per capita_3 Linear Method for Response: Grupo3 Predictors: GDP per capita_3 Group 1 2 3 Count 5 43 3 Summary of classification True Group Put into Group 1 2 3 1 5 0 0 2 0 43 0 3 0 0 3 Total N 5 43 3 N correct 5 43 3 Proportion 1.000 1.000 1.000 N = 51 N Correct = 51 Proportion Correct = 1.000 Squared Distance Between Groups 1 2 3 1 0.0000 47.9157 4.8728 2 47.9157 0.0000 22.2281 3 4.8728 22.2281 0.0000 Linear Discriminant Function for Groups 1 2 3 Constant -36.425 -1.301 -20.020 GDP per capita_3 0.002 0.000 0.002

O poder explicativo se manteve em 100% de proporção de acerto e a análise fica muito mais simples com apenas uma variável explicativa. 6. CONSIDERAÇÕES FINAIS De acordo com todas as análises acima, podemos constatar que a função linear se mostrou mais adequada em duas das três amostras, porém vale constatar que nessas duas amostras, não foi possível calcular utilizando a função quadrática. Também foi possível constatar que utilizando-se somente a variável GDP per Capita para divisão dos países das amostras em conglomerados chegou-se a índices de proporção de

34

acerto de 100% em duas amostras e 96,3% na outra amostra. Portanto podemos concluir que entre as variáveis de indicadores de desenvolvimento humano, a variável GDP per Capita é a mais significativa e somente a sua utilização já é suficiente para dividir os países das amostras em conglomerados. As demais variáveis muito pouco ou nada acrescentam. Assim, fica um alerta para os países do BRICS, incluindo o Brasil, que um importante caminho para a melhoria do desenvolvimento humano parece passar necessariamente pela melhoria no índice de GDP per Capita.