View
18
Download
0
Category
Preview:
Citation preview
1
MODELOS LINEARES GENERALIZADOS: UMA FERRAMENTA PARA A
CARACTERIZAÇÃO DA FECUNDIDADE E INFECUNDIDADE EM PORTUGAL
Rui Dias1, Maria Filomena Mendes2, Paulo Infante3
1 RuiDias666@gmail.com, Universidade de Évora, Portugal
2 mmendes@uevora.pt, CIDEHUS, Universidade de Évora, Portugal
3 pinfante@uevora.pt, CIMA, Universidade de Évora, Portugal
2
1. Introdução
A fecundidade baixa ou muito baixa é um dos grandes problemas do século XXI em
alguns países europeus, algo que tem contribuído para esses valores de fecundidade é a
incidência crescente de mulheres e homens que, voluntaria ou involuntariamente, não fazem a
transição para a maternidade e paternidade ou a fazem muito tardiamente (González &
Jurado-‐Guerrero, 2006). Durante a última década, Portugal registou um declínio entre 2000 e
2012 de 1,55 para 1,28 filhos por mulher, classificando-‐se como um dos Países com mais baixa
fecundidade em toda a União Europeia.
Segundo o European Demographic Datasheet (2012) do Vienna Institute of
Demography, as mulheres, mesmo nos países de baixo Índice Sintético de Fecundidade (ISF),
têm o primeiro filho mais cedo (Hungria 27,7 anos, Letónia 26, Roménia 25,2 e Moldávia 24,1).
Um factor decisivo para a redução do número de nascimentos é o adiamento da maternidade
e paternidade (Oliveira, 2008, Mendes, 2012, Mendes e Tomé, 2010, Sobotka, 2004). Os países
europeus que mais precocemente diminuíram a sua fecundidade aumentaram recentemente
os valores do ISF em resultado da recuperação dos nascimentos adiados (Goldstein et al, 2009,
Sobokta et al, 2012). Os casais portugueses, pelo contrário, foram adiando o nascimento do
segundo filho e mesmo do primeiro (Oliveira, 2012, Cunha, 2012, Maciel et al, 2012). Até à
data não foram ainda encontrados os factores determinantes deste duplo adiamento em
Portugal.
Ao longo dos anos, adiar o nascimento do primeiro e do segundo filho tem sido um
comportamento reprodutivo bastante comum e será uma das principais causas para a não
realização de preferências e intenções reprodutivas (Maciel et al, 2012, Rosina et al, 2009,
Bilari et al, 2009). Embora a aspiração à parentalidade seja ainda amplamente valorizada
(Cunha, 2007), a fecundidade em Portugal regista traços bastante distintos: elevada proporção
de famílias com um filho e incidência marginal de famílias sem filhos. Mais concretamente
verifica-‐se um aumento nos últimos anos de mais descendências de filho único e cada vez
menos descendências de terceira ordem. Existe também uma baixa incidência do “padrão
tardio” de constituição da vida familiar, com as mulheres a terem uma idade média aos 29
anos, aproximadamente, e um adiamento principalmente nos indivíduos mais escolarizados
(Cunha, 2012). Portugal apresenta também um dos valores mais baixos de infecundidade
(childlessness) da Europa com 5% na coorte de mulheres de 1963 (Frejka, 2008). Uma das
dúvidas mais frequentes é a caracterização dos indivíduos com mais de 35 anos sem filhos,
este projecto pretende assim dar um contributo importante nessa análise dos indivíduos com
mais de 35 anos que não têm nem pretendem vir a ter filhos, incluindo-‐se portanto na
3
infecundidade (childlessness). É também importante conseguir caracterizar os indivíduos que
chegando aos 30 anos sem filhos ainda têm intenções de entrar na parentalidade, incluindo-‐se
portanto naquela faixa de cidadãos que adiam o primeiro filho.
Tendo como principal objectivo a descoberta de factores que possam influenciar
indivíduos com determinadas características, a utilização de modelos de regressão parece uma
via bastante interessante e que pode trazer resultados promissores.
O modelo linear normal foi criado no início do século XIX por Legendre e Gauss e
dominou a modelação estatística até meados do século XX. Foi então que vários modelos não
lineares e não normais foram desenvolvidos para fazer face a situações em que o modelo
linear normal não era o mais adequado. Exemplos disso são os modelos complementar log-‐log
para ensaios de diluição (Fisher, 1922), os modelos probit (Bliss, 1935), e logit (Berkson, 1944;
Dyke and Patterson, 1952; Rasch, 1960) para proporções, os modelos log-‐lineares para dados
de contagens (Birch,1963), os modelos de regressão para análise de sobrevivência (Feigland
Zelen, 1965; Zippin and Armitage, 1966; Glasser, 1967).
Todos os modelos anteriormente descritos apresentam uma estrutura de regressão
linear e têm, em comum, o facto da variável resposta seguir uma distribuição dentro de uma
família de distribuições com propriedades muito específicas: a família exponencial. Os
Modelos Lineares Generalizados (MLG) introduzidos por Nelder e Wedderburn (1972)
correspondem a uma síntese destes e de outros modelos, vindo assim unificar, tanto do ponto
de vista teórico como conceptual, a teoria da modelação estatística até então desenvolvida.
Para este estudo, e tendo em conta a utilização de variáveis quer discretas quer
contínuas, optou-‐se pelo modelo linear generalizado definido pelo modelo binomial com
função de ligação canónica logit, sendo conhecido por modelo de regressão logística. O
modelo de regressão logística é o mais popular entre os modelos lineares generalizados para
analisar dados binários, muito possivelmente, devido à sua simplicidade de implementação
computacional.
2. Dados e Metodologias
A base de dados utilizada neste estudo foi a do “Special Eurobarometer 370 -‐ Social
Climate” de 2011.
A escolha da função de ligação é essencial num MLG, neste caso optou-‐se por uma
função de ligação logit pelo facto da variável resposta ser binária e também pela sua
4
simplicidade. A função de ligação relaciona a combinação linear das variáveis explicativas com
o valor esperado da variável resposta. A função de ligação logit tem a seguinte expressão:
𝜋 𝑥 =𝑒!!!!!!
1 + 𝑒!!!!!!
𝑙𝑜𝑔𝑖𝑡 = ln𝜋 𝑥
1 − 𝜋 𝑥 = 𝛽! + 𝛽!𝑥
Para a interpretação dos coeficientes estimados pelo modelo calcula-‐se as Razões de
Possibilidades (inglês: Odds Ratio, OR), a razão que define a possibilidade de ocorrência de um
evento num grupo com a possibilidade de ocorrência noutro grupo. Essa possibilidade é a
probabilidade de ocorrência desse evento dividida pela probabilidade de não ocorrência desse
mesmo evento.
A determinação dos OR torna-‐se então fundamental para a análise e interpretação dos
resultados obtidos na modelação. O seu cálculo conjuntamente com o cálculo de intervalos de
confiança são efectuados através das seguintes expressões matemáticas, quando estamos
perante um modelo sem interacções:
𝑂𝑅 = exp (𝛽!)
𝐼𝐶!!! = 𝛽! ± 𝑍!!!×𝜎!!
Na modelação estatística há que ter em atenção algumas particularidades: quanto
maior o número de variáveis incluídas no modelo, maiores as estimativas dos desvios padrão
dos coeficientes e mais dependente o modelo fica dos dados observados; o comportamento
individual das variáveis pode ser muito distinto do comportamento das mesmas quando em
conjunto com outras; o sobreajustamento (valores demasiado elevados nas estimativas) pode
ser problemático nos casos onde o número de variáveis no modelo é grande em relação ao
número de indivíduos ou quando a probabilidade de ocorrer o evento (variável resposta=1)
está perto do 0 ou 1.
De um ponto de vista metodológico, é possível organizar a modelação estatística em
várias fases/etapas:
1) Definir qual a variável resposta e quais as variáveis explicativas a utilizar na
modelação;
5
2) Análise Univariada de cada variável
• Ter atenção especial para as tabelas de contingência, entre a variável e
a variável resposta, com alguma célula igual a zero: nesses casos terá
de se juntar categorias ou eliminar por completo a categoria, caso seja
uma variável dicotómica, não incluí-‐la no modelo; se a variável é
ordinal, modelar como se fosse contínua.
3) Selecção de variáveis para a modelação multivariada
• As variáveis com um valor de p (Wald) inferior a 0,25 no ponto
anterior, assim como as variáveis importantes no contexto do estudo
são incluídas no modelo multivariado;
• Para as variáveis com esse grau de associação, estimar os Odds Ratio,
assim como os seus intervalos de confiança;
4) Verificação da importância de cada variável no modelo
• As variáveis que não contribuem significativamente (valor de p inferior
a 0,10) para o modelo devem ser retiradas e um novo modelo
ajustado. O novo modelo deve ser comparado ao anterior através do
teste de razão de verosimilhanças ou pelo valor de p de Wald;
• Este processo de exclusão contínua até que todas as variáveis
importantes estejam incluídas no modelo e as excluídas sejam
contextualmente ou estatisticamente não significativas.
5) Verificação da importância de cada variável que ficou de fora do modelo
multivariado inicial
• Cada variável que não foi seleccionada para o modelo multivariado
inicial deve ser adicionada uma a uma no modelo actual;
• Este passo é útil na identificação de variáveis que, por si só, não são
significativas, mas que dão um contributo importante ao modelo na
presença de outras.
6) Observação cuidadosa das variáveis no modelo
• Para além da atenção já evidenciada no ponto 2, no que toca à
existência de categorias com algum valor de zero, há que verificar a
homogeneidade na distribuição de eventos nas categorias das
variáveis discretas (a existência de poucos eventos em algumas
categorias pode enviesar e muito os resultados obtidos);
6
• Verificação do pressuposto da linearidade das variáveis contínuas com
o logit (utilização do método dos polinómios fraccionários ou do
método dos quartis são apenas dois exemplos que podem ser
efectuados para as variáveis contínuas).
7) Procura de interacções
• Limpar a base de dados de missing values (NA), para ser possível a
comparação entre modelos através do teste de razão de
verosimilhanças;
• Introduzir todos os pares de variáveis, um de cada vez no modelo de
efeitos principais, que têm alguma base científica para interagir;
• Testar a significância de cada interacção no modelo através do teste
de razão de verosimilhança entre o modelo com a interacção e o
modelo sem a interacção (valor de p inferior a 0,05).
8) Validação, Adequabilidade e Bondade de Ajustamento
• Para a validação do modelo é necessário o cálculo do 𝑅! de Cox &
Snell, da Distância de Sommers, 𝐷!,! e dos valores de Slope. Nenhum
destes valores deve apresentar-‐se muito superior a 0,10;
• Para a bondade de ajustamento, pode-‐se efectuar ou o teste de
Hosmer-‐Lemeshow (Hosmer & Lemeshow, 2000) ou o teste de Cessie-‐
van Houwelingen (Hosmer et al., 1997), para estes testes é necessário
que o valor de p fique acima do valor de significância pretendido
(0,05);
• Para categorizar a discriminação do modelo foi construída a curva
ROC, que fornece dados sobre a sensibilidade, especificidade e AUC
(area under curve). Sensibilidade é a percentagem de ocorrências
correctamente preditas. Especificidade é a percentagem de não
ocorrências correctamente preditas. Nestes dois casos é necessário ter
mais de 70%. O AUC fornece a habilidade do modelo em discriminar
entre indivíduos com o evento e sem evento. AUC entre 70 e 80% é
aceitável, acima disso é excelente ou excepcional.
9) Análise de Resíduos
• Para finalizar a modelação é necessário avaliar a influência de cada
observação no modelo. Neste caso em particular, analisa-‐se os
resíduos via padrão de covariáveis, comparando-‐se a estimativa dos
7
coeficientes obtidos a partir da eliminação dos padrões de covariáveis
consideradas influentes. Caso as estimativas dos coeficientes sejam
muito diferentes é necessário decidir sobre a manutenção ou não do
padrão considerado influentes na base de dados.
3. Resultados – 1º Modelo 3.1. Análise Descritiva
A primeira análise que deve ser efectuada, antes de se proceder à modelação estatística, é
uma análise descritiva de todas as variáveis que se pretende incorporar no modelo;
nomeadamente, tabelas de contingência entre as possíveis variáveis explicativas e a variável
resposta.
A variável resposta, ou seja que se quer explicada, que se pretende utilizar neste primeiro
modelo foi caracterizada da seguinte forma: indivíduos com mais de 35 anos que não têm
filhos, nem têm intenção de ter residentes em Portugal (resp35). O quadro 1 regista os valores
verificados para a variável resposta, podendo-‐se observar a existência de 65 casos de
indivíduos com mais de 35 anos que não têm filhos nem pretendem vir a ter.
Variável 0 1
resp35 983 65
Quadro 1 – Análise Descritiva da Variável Resposta.
As variáveis explicativas foram divididas em três grupos distintos: 1) variáveis respeitantes
a questões de percepção relativa à vida do indivíduo; 2) variáveis respeitantes a questões de
expectativa sobre os próximos 12 meses; 3) variáveis caracterizadoras do indivíduo.
Os quadros seguintes caracterizam as respectivas variáveis explicativas em função da
variável resposta. Com esta análise pretende-‐se verificar a existência de uma distribuição
homogénea por parte das respectivas variáveis nas suas categorias em função da variável
resposta.
8
1) Variáveis respeitantes a questões de percepção da vida do indivíduo.
• Globalmente, como se sente, com a vida que tem? (qb1RGPS)
qb1RGPS/resp35 0 1 Total
Satisfeito 586 39 625
Não Satisfeito 395 26 421
Total 981 65 1046
Quadro 2 – Tabela de Contingência: Variável qb1RGPS vs Variável Resposta.
• Como avalia a área em que vive actualmente? (qb2_1RGPS)
qb2_1RGPS/resp35 0 1 Total
Boa 842 54 896
Má 137 10 147
Total 979 64 1043
Quadro 3 – Tabela de Contingência: Variável qb2_1RGPS vs Variável Resposta.
• Como avalia o sistema de saúde do seu país actualmente? (qb2_2RGPS)
qb2_2RGPS/resp35 0 1 Total
Bom 448 32 480
Mau 524 33 557
Total 972 65 1037
Quadro 4 – Tabela de Contingência: Variável qb2_2RGPS vs Variável Resposta.
9
• Como avalia o sistema de pensões do seu país actualmente? (qb2_3RGPS)
qb2_3RGPS/resp35 0 1 Total
Bom 95 8 103
Mau 865 56 921
Total 960 64 1024
Quadro 5 – Tabela de Contingência: Variável qb2_3RGPS vs Variável Resposta.
• Como avalia os subsídios a desempregados do seu país actualmente? (qb2_4RGPS)
qb2_4RGPS/resp35 0 1 Total
Bom 135 6 141
Mau 741 52 793
Total 876 58 934
Quadro 6 – Tabela de Contingência: Variável qb2_4RGPS vs Variável Resposta.
• Como avalia o custo de vida do seu país actualmente? (qb2_5RGPS)
qb2_5RGPS/resp35 0 1 Total
Bom 48 1 49
Mau 932 64 996
Total 980 65 1045
Quadro 7 – Tabela de Contingência: Variável qb2_5RGPS vs Variável Resposta.
10
• Como avalia o combate à desigualdade e pobreza no seu país actualmente?
(qb2_7RGPS)
qb2_7RGPS/resp35 0 1 Total
Bom 158 9 167
Mau 759 55 814
Total 917 64 981
Quadro 8 – Tabela de Contingência: Variável qb2_7RGPS vs Variável Resposta.
• Como avalia o acesso à habitação no seu país actualmente? (qb2_9RGPS)
qb2_9RGPS/resp35 0 1 Total
Bom 62 2 64
Mau 890 62 952
Total 952 64 1016
Quadro 9 – Tabela de Contingência: Variável qb2_9RGPS vs Variável Resposta.
• Como avalia a situação económica do seu país actualmente? (qb2_11RGPS)
qb2_11RGPS/resp35 0 1 Total
Boa 26 1 27
Má 949 64 1013
Total 975 65 1040
Quadro 10 – Tabela de Contingência: Variável qb2_11RGPS vs Variável Resposta.
11
• Como avalia a sua situação de emprego actualmente? (qb2_12RGPS)
qb2_12RGPS/resp35 0 1 Total
Boa 424 29 453
Má 408 28 436
Total 832 57 889
Quadro 11 – Tabela de Contingência: Variável qb2_12RGPS vs Variável Resposta.
• Como avalia a situação financeira do seu agregado familiar actualmente?
(qb2_13RGPS)
qb2_13RGPS/resp35 0 1 Total
Boa 398 30 428
Má 542 34 576
Total 940 64 1004
Quadro 12 – Tabela de Contingência: Variável qb2_13RGPS vs Variável Resposta.
• Como avalia a situação de emprego no seu país actualmente? (qb2_14RGPS)
qb2_14RGPS/resp35 0 1 Total
Boa 40 2 42
Má 939 63 1002
Total 979 65 1044
Quadro 13 – Tabela de Contingência: Variável qb2_14RGPS vs Variável Resposta.
2) Variáveis respeitantes a questões relativas às expectativas sobre os próximos 12 meses.
Estas variáveis inicialmente estavam factorizadas em três categorias (melhor, na mesma e
pior), tendo em vista uma mais fácil interpretação e uma adequação ao pretendido no estudo,
juntaram-‐se as categorias “na mesma” e “pior”, resultando em novas variáveis dicotómicas.
12
• Expectativas em relação à sua vida no geral. (qb3_1cat)
qb3_1cat/resp35 0 1 Total
Melhor 101 7 108
Pior + Na mesma 834 57 891
Total 935 64 999
Quadro 14 – Tabela de Contingência: Variável qb3_1cat vs Variável Resposta.
• Expectativas em relação à sua área de residência. (qb3_2cat)
qb3_2cat/resp35 0 1 Total
Melhor 719 44 763
Pior + Na mesma 230 21 251
Total 949 65 1014
Quadro 15 – Tabela de Contingência: Variável qb3_2cat vs Variável Resposta.
• Expectativas em relação ao sistema de saúde no seu país. (qb3_3cat)
qb3_3cat/resp35 0 1 Total
Melhor 75 1 76
Pior + Na mesma 848 61 909
Total 923 62 985
Quadro 16 – Tabela de Contingência: Variável qb3_3cat vs Variável Resposta.
13
• Expectativas em relação ao sistema de pensões no seu país. (qb3_4cat)
qb3_4cat/resp35 0 1 Total
Melhor 36 1 37
Pior + Na mesma 891 64 955
Total 927 65 992
Quadro 17 – Tabela de Contingência: Variável qb3_4cat vs Variável Resposta.
• Expectativas em relação a subsídios de desemprego no seu país. (qb3_5cat)
qb3_5cat/resp35 0 1 Total
Melhor 30 0 30
Pior + Na mesma 860 61 921
Total 890 61 951
Quadro 18 – Tabela de Contingência: Variável qb3_5cat vs Variável Resposta.
• Expectativas em relação ao custo de vida no seu país. (qb3_6cat)
qb3_6cat/resp35 0 1 Total
Melhor 34 0 34
Pior + Na mesma 910 65 975
Total 944 65 1009
Quadro 19 – Tabela de Contingência: Variável qb3_6cat vs Variável Resposta.
14
• Expectativas em relação ao combate à desigualdade e pobreza no seu país. (qb3_8cat)
qb3_8cat/resp35 0 1 Total
Melhor 48 1 49
Pior + Na mesma 862 62 924
Total 910 63 973
Quadro 20 – Tabela de Contingência: Variável qb3_8cat vs Variável Resposta.
• Expectativas em relação ao acesso à habitação no seu país. (qb3_10cat)
qb3_10cat/resp35 0 1 Total
Melhor 31 1 32
Pior + Na mesma 906 62 968
Total 937 63 1000
Quadro 21 – Tabela de Contingência: Variável qb3_10cat vs Variável Resposta.
• Expectativas em relação à situação económica no seu país. (qb3_12cat)
qb3_12cat/resp35 0 1 Total
Melhor 49 1 50
Pior + Na mesma 897 62 959
Total 946 63 1009
Quadro 22 – Tabela de Contingência: Variável qb3_12cat vs Variável Resposta.
15
• Expectativas em relação à sua situação de emprego. (qb3_13cat)
qb3_13cat/resp35 0 1 Total
Melhor 65 3 68
Pior + Na mesma 847 58 905
Total 912 61 973
Quadro 23 – Tabela de Contingência: Variável qb3_13cat vs Variável Resposta.
• Expectativas em relação à situação financeira do seu agregado familiar. (qb3_14cat)
qb3_14cat/resp35 0 1 Total
Melhor 54 2 56
Pior + Na mesma 889 61 950
Total 943 63 1006
Quadro 24 – Tabela de Contingência: Variável qb3_14cat vs Variável Resposta.
• Expectativas em relação à situação de emprego no seu país. (qb3_15cat)
qb3_15cat/resp35 0 1 Total
Melhor 50 2 52
Pior + Na mesma 892 61 953
Total 942 63 1005
Quadro 25 – Tabela de Contingência: Variável qb3_15cat vs Variável Resposta.
Nota: Há duas variáveis que registam o problema de não apresentarem valores 1 na
variável resposta numa das suas categorias. São os casos das variáveis que representam as
expectativas dos indivíduos sobre os subsídios de desemprego e sobre o custo de vida nos
próximos 12 meses. Como não é possível uma nova recategorização, decidiu-‐se não colocar
essas variáveis em futuras análises, ou modelos.
16
3) Variáveis caracterizadoras do indivíduo.
Neste grupo de variáveis, cada caso é um caso, portanto, o tratamento efectuado a cada
uma das variáveis está condicionado pelos resultados obtidos em análises posteriores. No
entanto, apresentam-‐se os primeiros dados relativos a cada uma delas.
• Estado Civil (d7cat5)
Nesta variável foi adoptada a opção de agregar os indivíduos casados com os
divorciados e viúvos, tendo como principal razão o factor de viverem, ou de alguma
vez terem vivido, numa relação conjugal estável. As categorias com parceiros e
solteiros demonstraram numa análise posterior serem relevantes para a modelação e
daí a sua manutenção como categorias separadas.
d7cat5/resp35 0 1 Total
Casados +
Divorciados +
Viúvos
781 21 802
Com Parceiros 39 8 47
Solteiros 139 36 175
Total 959 65 1024
Quadro 26 – Tabela de Contingência: Variável Estado Civil vs Variável Resposta.
• Género (d10)
d10/resp35 0 1 Total
Homem 474 28 502
Mulher 509 37 546
Total 983 65 1048
Quadro 27 – Tabela de Contingência: Variável Género vs Variável Resposta.
• Condição perante o trabalho (d15cat)
A variável condição perante o trabalho estava factorizada em três categorias,
trabalhador independente, por conta doutrem ou desempregado. Optou-‐se por utilizar
uma variável dicotómica, com as categorias: empregado e desempregado.
17
d15cat/resp35 0 1 Total
Empregado 400 30 430
Desempregado 583 35 618
Total 983 65 1048
Quadro 28 – Tabela de Contingência: Variável Condição Perante Trabalho vs Variável Resposta.
• Região onde vive (d25cat)
A variável que caracteriza a região onde o indivíduo vive estava inicialmente
factorizada em três categorias, área rural ou vila, cidade de tamanho médio ou grande
cidade. Após uma análise mais extensa, optou-‐se por categorizar a variável em dois
factores: pequena ou média cidade e cidade grande.
d25cat/resp35 0 1 Total
Pequena+Média
Cidade 817 44 861
Grande Cidade 164 21 185
Total 981 65 1046
Quadro 29 – Tabela de Contingência: Variável Região Onde Vive vs Variável Resposta.
• Dificuldades em pagar as contas ao final do mês no último ano (d60cat)
Esta variável permite-‐nos verificar as dificuldades que o indivíduo relata em pagar as
suas contas ao final do mês no último ano. Inicialmente estava factorizada em três
categorias, muitas vezes, algumas vezes e raras vezes ou nunca. Para uma melhor
interpretação optou-‐se por dicotomizar a variável: muitas vezes e algumas, raras ou
nunca.
d60cat/resp35 0 1 Total
Muitas Vezes 619 39 658
Algumas, Raras
ou Nunca 332 23 355
Total 951 62 1013
Quadro 30 – Tabela de Contingência: Variável d60cat vs Variável Resposta.
18
• Último grau académico concluído (edu)
Variável categorizada inicialmente em três categorias (básico, secundário e
universitário ou mais), foi recategorizada para dicotómica. Assim tem-‐se as categorias:
nível inferior a universitário; nível universitário ou superior.
edu/resp35 0 1 Total
Inferior a
Universitário 914 59 973
Universitário ou
Superior 69 6 75
Total 983 65 1048
Quadro 31 – Tabela de Contingência: Variável Grau Académico vs Variável Resposta.
• Como se vê na sociedade numa escala de 1 a 10. (d61)
Sendo esta uma variável ordinal, deve ser analisada de duas formas. Primeiro,
tentando perceber quais as características da variável e depois como interage com a
variável reposta.
Mínimo 1º Quartil Mediana Média 3º Quartil Max
1 4 5 4,699 5 9
Quadro 32 – Análise Descritiva da Variável d61.
resp35/d61 1 2 3 4 5 6 7 8 9 10 Total
0 13 36 138 218 314 137 70 25 7 0 958
1 1 4 11 15 21 6 2 2 1 0 63
Total 14 40 149 233 335 143 72 27 8 0 1021
Quadro 33 – Tabela de Contingência: Variável d61 vs Variável Resposta.
19
Nota: Variável Idade
Nesta modelação estatística não será possível introduzir a variável idade no modelo, na
medida em que a variável resposta é construída a partir das idades dos indivíduos e isso
compromete a independência da variável resposta em relação à idade.
No entanto, uma análise breve caracterizadora da amostra em relação à idade é sempre
necessária e interessante.
Mínimo 1º Quartil Mediana Média 3º Quartil Max
15 31 48 48 63 92
Quadro 34 – Análise Descritiva da Variável Idade.
3.2. Análise Univariada
A primeira etapa a realizar na análise univariada é a construção de modelo nulo, chegando
aos valores apresentados no quadro seguinte. Posteriormente, constroem-‐se modelos
univariados para cada variável estudada e regista-‐se os valores da estimativa, erro padrão,
estatística de teste e p-‐value de Wald. Com esses dados é possível tomar uma decisão quanto
à utilização ou não de cada variável na fase seguinte da modelação.
No quadro seguinte registaram-‐se os respectivos coeficientes de cada modelo univariado
construído para o primeiro grupo de variáveis, assim como do modelo nulo.
20
Variáveis de Percepção da Vida do Indivíduo
Modelo Categoria Estimativa Erro
Padrão Est. Teste p-‐value AIC
Nulo (Intercept) -‐2,7162 0,1281 -‐21,21 <2e-‐16*** 489,32
Visão Global da sua Vida Satisfeito vs
Não Satisfeito -‐0,0110 0,2614 -‐0,04 0,966 491,06
Percepção da área que vive Boa vs Má 0,1294 0,3564 0,363 0,717 485,11
Percepção do SNS Bom vs Mau -‐0,1259 0,2563 -‐0,491 0,623 489,66
Percepção do Sistema de
Pensões Bom vs Mau -‐0,2629 0,3931 -‐0,669 0,504 482,38
Percepção dos Subsídios a
Desempregados Bom vs Mau 0,4568 0,4411 1,035 0,300 437,49
Percepção do Custo de Vida Bom vs Mau 1,193 1,019 1,171 0,242 488,9
Percepção do Combate à
Desigualdade e Pobreza Bom vs Mau 0,2407 0,3700 0,650 0,515 476,69
Percepção do Acesso à
Habitação Bom vs Mau 0,7699 0,7303 1,054 0,292 480,37
Percepção da Situação
Económica Boa vs Má 0,5616 1,0268 0,547 0,5844 489,93
Percepção da sua Situação
do Emprego Boa vs Má 0,0034 0,2739 0,012 0,99 427,43
Percepção da Situação
Financeira do Agregado Boa vs Má -‐0,1837 0,2590 -‐0,709 0,478 479,7
Percepção da Situação do
Emprego Boa vs Má 0,2941 0,7361 0,399 0,69 490,63
Quadro 35 – Modelos Univariados para Variáveis de Percepção.
Como se pode verificar pelos p-‐value dos modelos univariados construídos, apenas um
apresenta valor abaixo dos 25% de significância, limiar pelo qual são incluídas num modelo
21
multivariado. A variável em questão é a que representa a percepção que os indivíduos têm em
relação ao custo de vida no país. O valor de p apresentado foi de 0,242, muito próximo dos
0,25 que foi o colocado como patamar de decisão.
No próximo quadro são colocados os modelos e respectivos coeficientes para o segundo
grupo de variáveis.
Variáveis de Expectativa do Indivíduo para o próximo ano
Modelo Categoria Estimativa Erro
Padrão
Est.
Teste p-‐value AIC
Expectativa para a sua vida
no geral
Melhor vs Pior
ou na Mesma -‐0,0140 0,4141 -‐0,034 0,973 479,54
Expectativa para a área que
vive
Melhor vs Pior
ou na Mesma 0,4001 0,2758 1,451 0,147 484,87
Expectativa no SNS Melhor vs Pior
ou na Mesma 1,685 1,015 1,661 0,097. 462,04
Expectativa no Sistema de
Pensões
Melhor vs Pior
ou na Mesma 0,9501 1,0220 0,930 0,353 482,77
Expectativa no Combate à
Desigualdade e Pobreza
Melhor vs Pior
ou na Mesma 1,239 1,019 1,216 0,2239 468,50
Expectativa no Acesso à
Habitação
Melhor vs Pior
ou na Mesma 0,7521 1,024 0,734 0,4629 473,61
Expectativa na Situação
Económica
Melhor vs Pior
ou na Mesma 1,220 1,019 1,198 0,2311 473,31
Expectativa na sua Situação
do Emprego
Melhor vs Pior
ou na Mesma 0,3945 0,6058 0,651 0,515 459,50
Expectativa na Situação
Financeira do Agregado
Melhor vs Pior
ou na Mesma 0,6166 0,7318 0,843 0,399 474,21
Expectativa na Situação do
Emprego
Melhor vs Pior
ou na Mesma 0,5363 0,7329 0,732 0,464 474,31
Quadro 36 – Modelos Univariados para Variáveis de Expectativa.
Deste conjunto de variáveis, que representam as expectativas que os indivíduos põem em
diversos aspectos da vida pessoal e do seu país no próximo ano existem quatro que
apresentam valores de p inferiores a 0,25: expectativas para a área em que vive, expectativas
22
relativamente ao serviço de saúde, expectativas no combate à desigualdade e à pobreza e
expectativas na situação económica do país.
De seguida são apresentados os coeficientes para o terceiro grupo de variáveis.
Variáveis Caracterizadoras do Indivíduo
Modelo Categoria Estimativa Erro
Padrão
Est.
Teste p-‐value AIC
Grau Académico
Concluído
Inferior a Universitário vs
Universiário ou Superior 0,2979 0,4463 0,668 0,504 490,9
Estado Civil Casad+Div+Viu vs Com Parc. 2,0319 0,4467 4,55 5,40e-‐06 *** 421,2 Casad+Div+Viu vs Solteiros 2,2651 0,2896 7,82 5,23e-‐15 ***
Género Homem vs Mulher 0,2075 0,2585 0,803 0,422 490,67
Condição Perante
o Trabalho
Empregado vs
Desempregado -‐0,2226 0,2571 -‐0,866 0,387 490,57
Região onde Vive Peq+Med Cidade vs
Grande Cidade 0,8661 0,2787 3,108 0,0019 482,32
Dificuldades em
Pagar as Contas
Muitas Vezes vs
Alg+Raras+Nunca 0,0949 0,2716 0,349 0,727 470,40
Como se vê na
sociedade Contínua 1 a 10 -‐0,1158 0,0914 1,267 0,205 475,37
Quadro 37 – Modelos Univariados para Variáveis Caracterizadoras dos Indivíduos.
Das sete variáveis caracterizadoras do indivíduo analisadas apenas três apresentam
valores de p inferiores a 0,25. O estado civil, a região onde vive e a forma como o indivíduo se
vê na sociedade serão as variáveis que seguirão para a fase de análise multivariada seguinte.
Agregando os diversos resultados da análise univariada, chega-‐se às seguintes variáveis
significativas a 25%:
1) Como avalia o custo de vida no seu país;
2) Quais as expectativas que tem para a área que vive para os próximos 12 meses;
3) Quais as expectativas que tem para o serviço nacional de saúde para os próximos 12
meses;
4) Quais as expectativas que tem para o combate às desigualdades e pobreza no seu
país para os próximos 12 meses;
23
5) Quais as expectativas que tem para a situação económica do seu país para os
próximos 12 meses;
6) Estado Civil;
7) Região onde vive;
8) Como o indivíduo se vê na sociedade (de 1 a 10);
O quadro seguinte apresenta os valores de Odds Ratio e Intervalos de Confiança para as
variáveis significativas nos modelos univariados.
Modelo Categoria OR IC 95% p-‐value
Percepção do Custo de
Vida Bom vs Mau 3,2961
]0,4477 ;
24,2663[ 0,2416
Expectativa para a área
que vive
Melhor vs Pior ou
na Mesma 1,4920
]0,8689 ;
2,5619[ 0,147
Expectativa no SNS Melhor vs Pior ou
na Mesma 5,3950
]0,7386 ;
39,4089[ 0,0967 .
Expectativa no Combate à
Desigualdade e Pobreza
Melhor vs Pior ou
na Mesma 3,4524
]0,4687 ;
25,4315[ 0,2239
Expectativa na Situação
Económica
Melhor vs Pior ou
na Mesma 3,3868
]0,4600 ;
24,9366[ 0,2311
Estado Civil
Cas+Div+Viu vs
Parceiros 7,6288
]3,1785 ;
18,3103[ 5,40e-‐06 ***
Cas+Div+Viu vs
Solteiros 9,6321
]5,4601 ;
16,9917[ 5,23e-‐15 ***
Região onde Vive Peq+Med Cidade
vs Grande Cidade 2,3776
]1,3770 ;
4,1055[ 0,0019**
Como se vê na sociedade Contínua 1 a 10 0,8906 ]0,7445 ;
1,0653[ 0,205
Quadro 38 – Odds Ratio e Intervalos de Confiança para Variáveis Significativas a 25% na Modelação Univariada.
Observando os valores de Odds Ratio e os respectivos intervalos de confiança calculados
constata-‐se que nas primeiras cinco variáveis, as que representam percepções ou expectativas,
o intervalo de confiança é muito grande e que por isso cria dificuldades na interpretação dos
dados. Esse facto também se deve ao menor grau de significância, mesmo dentro do limite de
25% que muitas as variáveis apresentam. Ainda assim, para esse grau de significância, pode-‐se
afirmar que:
24
• A possibilidade de um indivíduo com mais de 35 anos não ter nem ter intenção de ter
um filho que classificou o custo de vida como mau é 3 vezes superior à de um
indivíduo no mesmo contexto que avaliou o custo de vida como bom.
• A possibilidade de um indivíduo com mais de 35 anos não ter nem ter intenções de ter
um filho com uma expectativa negativa da área que vive para os próximos 12 meses é
1,5 vezes superior à de um indivíduo no mesmo contexto com uma expectativa
positiva para a área que vive nos próximos 12 meses.
• A possibilidade de um indivíduo com mais de 35 anos não ter nem ter intenções de ter
um filho com uma expectativa negativa no serviço nacional de saúde para os próximos
12 meses é 5,4 vezes superior à de um indivíduo no mesmo contexto com uma
expectativa positiva no serviço nacional de saúde nos próximos 12 meses.
• A possibilidade de um indivíduo com mais de 35 anos não ter nem ter intenções de ter
um filho com uma expectativa negativa do combate à desigualdade e pobreza para os
próximos 12 meses é 3,4 vezes superior à de um indivíduo no mesmo contexto com
uma expectativa positiva do combate à desigualdade e pobreza nos próximos 12
meses.
• A possibilidade de um indivíduo com mais de 35 anos não ter nem ter intenções de ter
um filho com uma expectativa negativa na situação económica do país para os
próximos 12 meses é 3,4 vezes superior à de um indivíduo no mesmo contexto com
uma expectativa positiva na situação económica do país nos próximos 12 meses.
• A possibilidade de um indivíduo casado, divorciado ou viúvo, com mais de 35 anos não
ter nem ter intenções de ter um filho é 7,6 vezes superior à de um indivíduo no mesmo
contexto vivendo com parceiro.
• A possibilidade de um indivíduo casado, divorciado ou viúvo, com mais de 35 anos não
ter nem ter intenções de ter um filho é 9,6 vezes superior à de um indivíduo no mesmo
contexto sendo ele solteiro.
• A possibilidade de um indivíduo residente numa grande cidade com mais de 35 anos
não ter nem ter intenções de ter um filho é 2,4 vezes superior à de um indivíduo no
mesmo contexto residente numa zona rural ou cidade de dimensões médias.
• A possibilidade de um indivíduo com mais de 35 anos não ter filhos nem intenções de
ter, diminui cerca de 10% por cada aumento de 1 unidade na visão que esse mesmo
indivíduo tem de si na sociedade.
25
3.3. Análise Multivariada
Nesta fase de modelação, o primeiro passo é utilizar as variáveis significativas a 25% da
análise univariada para construir um modelo multivariado. As variáveis que não contribuem a
um nível de significância de 10% devem ser retiradas e um novo modelo ajustado. Este
processo deve ser realizado até ter um modelo ajustado com todas as variáveis com um nível
de significância abaixo dos 10%.
Este processo foi efectuado para as oito variáveis significativas a 25% da análise univariada
e alcançou-‐se o seguinte modelo multivariado:
Variáveis Categoria Estimativa Erro
Padrão
Est.
Teste p-‐value
(Intercept) -‐4,5525 1,1398 -‐3,99 6,50e-‐05 ***
Expectativa no SNS Melhor vs Pior ou
na Mesma 1,8608 1,0280 1,81 0,0703 .
Estado Civil
Cas+Div+Viu vs Com
Parceiros 1,8794 0,4831 3,89 0,0001 ***
Cas+Div+Viu vs
Solteiros 2,2552 0,3043 7,41 1,25e-‐13 ***
Região Onde Vive Peq+Med Cidade vs
Grande Cidade 0,5647 0,3184 1,77 0,0761 .
Como se vê na
Sociedade 1 a 10 Contínua -‐0,2051 0,1017 -‐2,02 0,0437 *
AIC: 384,91
Quadro 39 – Modelo Multivariado Final sem Procura de Interacções.
Para avaliar o grau de resposta das covariáveis calcula-‐se o valor de 𝑅!:
𝑅! = 1 −!"#$%&'" !"#$%&'(
!" !"#$%&'(!"#$%&'" !"#.!"#$
!! !"#.!"#$
= 1 −!"#,!"!"#
!!",!"!"#
= 1 − 0,8409 = 0,1591
Pode-‐se concluir que as covariáveis existentes no modelo explicam cerca de 16% da variável
resposta.
26
O passo seguinte a dar é a verificação da importância de cada variável que ficou de fora do
modelo actual. Este passo é útil na identificação de variáveis que, por si só, não são
significativas, mas dão um contributo importante na presença de outras variáveis.
Neste caso, observou-‐se a não alteração do modelo inicial. Nenhuma das variáveis que
ficaram de foram do modelo acrescentou algum contributo ao modelo. Todas elas
apresentaram níveis de significância superiores a 10% quando incluídas no modelo actual.
Pressupostos do Modelo
É necessário uma observação cuidada às diversas variáveis no modelo. No caso das
variáveis discretas uma análise a cada uma das categorias e no caso das variáveis contínuas
verificar o pressuposto da linearidade.
No que respeita à análise das variáveis discretas, foram desde logo retiradas as variáveis
que apresentavam zero eventos em alguma das suas categorias, isto porque o modelo não
ajustava correctamente e, portanto, seria pouco produtiva essa tentativa logo desde início. No
entanto, verifica-‐se que das quatro variáveis que se encontram como significativas no modelo
actual ajustado, uma delas apresenta categorias pouco homogeneamente distribuídas. A
variável que reflecte a expectativa do individuo em relação ao sistema de saúde do seu país
nos próximos 12 meses apresenta apenas um evento numa das suas categorias, o que
pressupõe um ajustamento bastante mais débil do modelo e que evidenciará pouca confiança
nos resultados obtidos. Assim sendo, a opção tomada foi a de não utilizar essa variável no
modelo e continuar com um modelo de apenas três variáveis.
Quanto a variáveis contínuas, o modelo identificou uma como sendo significativa. A que
diz respeito a como o indivíduo se vê na sociedade. Para verificar o pressuposto da linearidade
recorreu-‐se ao método dos quartis e registou-‐se o seguinte gráfico:
Figura 1 – Gráfico para verificação do Pressuposto da Linearidade da Variável d61 (método dos quartis).
27
Como se pode verificar através do gráfico, a linearidade da variável não pode ser
contestada. Os pontos apresentam um declive decrescente bastante linear.
Modelo Final sem Interacções
Ajustando o modelo sem a variável discreta que não passou no pressuposto da
homogeneidade de categorias, pode-‐se apresentar um modelo final ajustado sem a introdução
de interacções entre variáveis. O quadro seguinte resume a informação desse modelo final
ajustado.
Variáveis Categoria Estimativa Erro
Padrão
Est.
Teste p-‐value
(Intercept) -‐2,8339 0,4813 -‐5,89 3,90e-‐09 ***
Estado Civil
Cas+Div+Viu vs Com
Parceiros 1,7901 0,4735 3,78 0,0002 ***
Cas+Div+Viu vs
Solteiros 2,2472 0,2959 7,60 3,07e-‐14 ***
Região Onde Vive Peq+Med Cidade vs
Grande Cidade 0,5948 0,3081 1,93 0,0536 .
Como se vê na
Sociedade 1 a 10 Contínua -‐0,1932 0,0981 -‐1,97 0,0488 *
AIC: 408,54
Quadro 40 – Modelo Multivarido Final.
Fazendo o mesmo cálculo do 𝑅! para avaliar o grau de resposta das variáveis ajustadas no
modelo:
𝑅! = 1 −!"#$%&'" !"#$%&'(
!" !"#$%&'(!"#$%&'" !"#.!"#$
!" !"#.!"#$
= 1 −!"#,!"!!"
!"!,!"!!"
= 1 − 0,8516 = 0,1484
Pode-‐se portanto afirmar que as três variáveis ajustadas no modelo explicam a variável
resposta em aproximadamente 15%. O que nos permite afirmar que a perda de informação
com a retirada da variável que não passou no pressuposto anterior não foi muito acentuada.
Quando comparados os dois modelos através do Critério de Informação de Akaike (AIC), e
tendo como factor decisor a minimização do mesmo, pode-‐se confirmar que, de facto, o valor
28
de AIC aumenta com a retirada da variável e que significaria um modelo com pior
representatividade do que o anterior. No entanto, isso não significa um melhor ajuste ou uma
maior confiança nos resultados, não verificados os pressupostos.
Encontrado um modelo ajustado final, ainda sem interacções procuradas, é possível
calcular Odds Ratio e respectivos intervalos de confiança a 95% para cada uma das variáveis. O
quadro seguinte resume essa informação:
Variáveis Categoria OR IC 95% p-‐value
Estado Civil
Cas+Div+Viu vs Com
Parceiros 5,9899
]2,3696 ;
15,1519[ 0,0002 ***
Cas+Div+Viu vs
Solteiros 9,4610
]5,2977 ;
16,8959[ 3,07e-‐14 ***
Região Onde Vive Peq+Med Cidade vs
Grande Cidade 1,8127
]0,9909 ;
3,3159[ 0,0536 .
Como se vê na
Sociedade 1 a 10 Contínua 0,8243
]0,6802 ;
0,9990[ 0,0488 *
Quadro 41 – Odds Ratio e Intervalos de Confiança do Modelo Multivariado Final.
De um modo geral a interpretação realizada na análise univariada destas variáveis não se
altera. Ou seja, a possibilidade de indivíduos com mais de 35 anos que têm parceiros conjugais,
não terem filhos nem desejarem ter é superior à de indivíduos com mais de 35 anos casados,
divorciados ou viúvos em quase 6 vezes. Quanto a indivíduos com mais de 35 anos solteiros,
têm uma possibilidade de não ter filhos nem intenção de ter mais de 9 vezes superior a
homens nas mesmas condições mas sendo casados, divorciados ou viúvos. A possibilidade de
indivíduos com mais de 35 anos a viverem numa grande cidade não terem filhos nem
desejarem ter é superior em quase o dobro quando comparados com indivíduos residentes em
pequenas cidades ou de média dimensão. Por fim, a possibilidade de um indivíduo com mais
de 35 anos não ter filhos nem intenções de ter, diminui cerca de 20% por cada aumento de 1
unidade na visão que esse mesmo indivíduo tem de si na sociedade.
29
Procura de Interacções
Uma das fases necessárias à conclusão duma modelação estatística é a necessidade de
procurar interacções entre as variáveis ajustadas no modelo multivariado. Resume-‐se à
necessidade de tentar averiguar se existe relação no modelo entre duas das variáveis dadas
como relevantes ou significativas. No caso do modelo anterior ajustado não existe qualquer
interacção significativa entre as variáveis. Para um modelo com três variáveis ajustadas existe
a possibilidade de três possíveis interacções duas variáveis a duas e uma interacção entre as
três variáveis disponíveis. Nos quatro casos possíveis não foi evidenciada nenhuma
significância abaixo dos 5%, limiar pelo qual se acha relevante a entrada da interacção no
modelo. Assim sendo, o modelo anterior é considerado o modelo final encontrado na
modelação de estes dados.
Validação, Calibração e Bondade de Ajustamento do Modelo
Para efectuar a validação dum modelo de regressão logística como o utilizado neste
projecto é necessário calcular os coeficientes 𝐷!", 𝑅! e Slope. Os valores optimistas médios
destes coeficientes não podem exceder os 0,10.
No quadro seguinte são fornecidos os valores dos coeficientes anteriores para o modelo
actual.
Valores optimistas médios
𝑫𝒙𝒚 𝑹𝟐 Slope
0,0128 0,0181 0,0341
Quadro 42 – Coeficientes para validação do modelo.
Como se pode verificar pelos valores calculados, a validação do modelo foi conseguida.
Isto porque, como foi referido, os valores de cada um dos coeficientes fica muito abaixo dos
10% colocados como limite.
Para verificar o grau de bondade do ajustamento do modelo ajusta-‐se o teste de bondade
de ajustamento de Cessie-‐van Houwelingen. Este valor não se poderá situar abaixo do limiar
de significância de 0,05.
Teste de Cessie-‐van Houwelingen
Valor-‐p
0,3621
Quadro 43 – Coeficiente Cessie-‐van Houweligen.
30
Para averiguar a calibração do modelo final encontrado pode-‐se representar o seguinte
gráfico com os valores observados no modelo com a curva das estimativas para o
enviesamento. Uma melhor calibração significa as curvas mais próximas.
Figura 2 – Gráfico de observação da calibração do modelo.
Observando o gráfico é possível concluir que a calibração é positiva, não existindo uma
grande disparidade de valores nas curvas apresentadas.
Por fim, pode-‐se analisar o ajustamento do modelo através da sensibilidade. Essa análise é
feita a partir da Curva ROC representada no gráfico seguinte.
Figura 3 – Gráfico da Curva ROC e critério AUC.
31
Sensibilidade e especificidade situam-‐se acima ou muito perto dos 70%, valor que seria
pretendido, e a área abaixo da curva (AUC) acima dos 70%, valor considerado aceitável. Tudo
indicadores de um modelo bem ajustado e validado.
3.4. Conclusões
De um modo geral pode-‐se concluir que a análise descritiva nos garante uma modelação
bem-‐sucedida. Isto porque as variáveis apresentam distribuições homogéneas nas diversas
categorias e aquelas que poderiam suscitar algumas dúvidas foram retiradas por esse mesmo
motivo. Se observarmos com mais atenção cada uma das variáveis caracterizadoras, chega-‐se
às seguintes conclusões:
• Existe um número de homens casados, divorciados ou viúvos muito superior ao de
solteiros ou com parceiros na base de dados e a percentagem de indivíduos que
têm mais de 35 anos com parceiros que não têm filhos nem querem ter é muito
superior nos solteiros do que nos casados, divorciados ou viúvos;
• Existem mais mulheres que homens e mais desempregados que empregados,
embora a diferença nos dois grupos não seja grande;
• Observa-‐se uma diferença acentuada no número de indivíduos que vivem nas
pequenas e médias cidades quando comparado com quem vive nas grandes
cidades, com vantagem para as primeiras;
• No que se refere às dificuldades de pagar as despesas ao final do mês, existem
muito mais indivíduos que responderam “Muitas vezes” do que os restantes;
• Por fim, o número de indivíduos com um nível de escolaridade inferior ao Ensino
Superior é muito maior do que o de indivíduos com nível idêntico ou superior ao
Ensino Superior.
A modelação Univariada apresentou oito (8) variáveis significativas a 25%: uma (1) de
percepção, quatro (4) de expectativas e três (3) caracterizadoras do indivíduo. Destaque para o
estado civil e região onde vive o indivíduo que apresentaram valores de significância abaixo
dos 5% e que se apresentam, à partida, como as principais candidatas a manterem-‐se num
modelo final multivariado. Quanto à interpretação de valores de Odds Ratio, pode-‐se constatar
que na variável de percepção, assim como nas quatro (4) variáveis de expectativas, os
resultados apresentados serão os esperados. Ou seja, quanto pior a percepção da realidade,
ou pior a expectativa, maior a possibilidade de não ter filhos nem ter intenção de ter, em
32
indivíduos com mais de 35 anos. No que se refere às variáveis caracterizadoras, indivíduos com
mais de 35 anos, com parceiros ou solteiros têm uma maior possibilidade de não ter filhos
nem ter intenção de vir a ter quando comparados com indivíduos casados, divorciados ou
viúvos. Assim como indivíduos residentes em grandes cidades com mais de 35 anos, têm uma
maior possibilidade de não terem filhos nem quererem vir a ter, do que residentes em
pequenas e médias cidades. Já o nível que o indivíduo se coloca na sociedade aponta para uma
maior possibilidade de não ter nem querer vir a ter filhos em indivíduos com um nível inferior.
Na modelação multivariada, destaque para a escassez de resultados promissores. Ou seja, o
número de variáveis estatisticamente significativas é pequeno, embora o modelo se apresente
como estatisticamente válido e bem ajustado. Apresentando poucas variáveis estatisticamente
significativas, a capacidade de resposta tende a ser menor e também a quantidade de
informação retirada do modelo é menor. Contudo é possível concluir que, no modelo final,
existem três (3) variáveis que apresentam valores de significância estatística: estado civil,
região onde vive e como se vê na sociedade. A tendência de interpretação segue o caminho
apresentado na análise univariada, assim como os valores de Odds Ratio se situam próximos
dos obtidos na análise univariada. Na fase de procura de interacções foi concluído que não
existem interacções estatisticamente significativas entre estas variáveis, por isso o modelo
final não apresenta nenhuma interacção.
Por fim, segundo a análise relativa à validação do modelo e bondade do seu ajustamento,
conclui-‐se que tudo aponta para um modelo válido e bem ajustado. Não sendo de destacar
nenhum valor ou estatística que possa alertar para qualquer problema.
4. Resultados – 2º Modelo 4.1. Análise Descritiva
Na segunda abordagem deste estudo pretende-‐se mais uma vez realizar uma análise
através da modelação estatística. Se no primeiro modelo o objectivo era comparar indivíduos
com 35 anos ou mais sem ter filhos nem intenções de vir a ter com os restantes indivíduos da
amostra para Portugal, neste segundo modelo a comparação é feita da seguinte forma:
indivíduos com 30 anos ou mais sem ter filhos mas com intenção de ter (variável resposta,
resp30) comparados apenas com todos os indivíduos da amostra que têm filhos. Podendo
assim explicar o facto de se ter 30 anos e ainda não se ter entrado na parentalidade, mas
tendo intenção de entrar, quando reunido numa amostra com indivíduos que já têm filhos.
33
Para além da diferença na variável resposta, há que destacar o aumento da dimensão da
amostra, na medida em que nesta análise ir-‐se-‐á ter em conta não só Portugal mas também
Grécia, Espanha e Itália. Isto porque nos dará uma comparação interessante entre países mas
também porque aumenta o número de eventos na nossa amostra, necessário para se obter
um modelo válido e bem ajustado.
Primeira análise descritiva a efectuar é a da variável resposta.
Variável 0 1 Total
resp30 2764 252 3016
Quadro 44 – Análise Descritiva da Variável Resposta.
Verifica-‐se assim um aumento no número da amostra de cerca de 800 casos para mais de
3000. A incidência de eventos aumenta de cerca de 3% para mais de 9%, num total de 252
eventos para os quatro países.
De acordo com a forma utilizada para caracterizar as possíveis variáveis explicativas do
modelo, dividiu-‐se as mesmas em três grupos: variáveis com questões de percepção da vida do
indivíduo; variáveis com questões de expectativas sobre os próximos 12 meses; e variáveis
caracterizadoras do indivíduo. Segue-‐se uma análise descritiva de cada variável em relação à
nova variável resposta.
1) Variáveis com questões de percepção da vida do indivíduo.
• Globalmente, como se sente, com a vida que tem? (qb1RGPS)
qb1RGPS/resp30 0 1 Total
Satisfeito 1851 177 2028
Não Satisfeito 910 75 985
Total 2761 252 3013
Quadro 45 – Tabela de Contingência: Variável qb1RGPS vs Variável Resposta.
34
• Como avalia a área em que vive actualmente? (qb2_1RGPS)
qb2_1RGPS/resp30 0 1 Total
Boa 2239 194 2433
Má 516 57 573
Total 2755 251 3006
Quadro 46 – Tabela de Contingência: Variável qb2_1RGPS vs Variável Resposta.
• Como avalia o sistema de saúde do seu país actualmente? (qb2_2RGPS)
qb2_2RGPS/resp30 0 1 Total
Bom 1355 105 1460
Mau 1393 146 1539
Total 2748 251 2999
Quadro 47 – Tabela de Contingência: Variável qb2_2RGPS vs Variável Resposta.
• Como avalia o sistema de pensões do seu país actualmente? (qb2_3RGPS)
qb2_3RGPS/resp30 0 1 Total
Bom 585 59 644
Mau 2106 188 2294
Total 2691 247 2938
Quadro 48 – Tabela de Contingência: Variável qb2_3RGPS vs Variável Resposta.
35
• Como avalia os subsídios a desempregados do seu país actualmente? (qb2_4RGPS)
qb2_4RGPS/resp30 0 1 Total
Bom 462 53 515
Mau 2051 187 2238
Total 2513 240 2753
Quadro 49 – Tabela de Contingência: Variável qb2_4RGPS vs Variável Resposta.
• Como avalia o custo de vida do seu país actualmente? (qb2_5RGPS)
qb2_5RGPS/resp30 0 1 Total
Bom 280 33 313
Mau 2473 219 2692
Total 2753 252 3005
Quadro 50 – Tabela de Contingência: Variável qb2_5RGPS vs Variável Resposta.
• Como avalia o combate à desigualdade e pobreza no seu país actualmente?
(qb2_7RGPS)
qb2_7RGPS/resp30 0 1 Total
Bom 592 52 644
Mau 2073 195 2268
Total 2665 247 2912
Quadro 51 – Tabela de Contingência: Variável qb2_7RGPS vs Variável Resposta.
36
• Como avalia o acesso à habitação no seu país actualmente? (qb2_9RGPS)
qb2_9RGPS/resp30 0 1 Total
Bom 306 40 346
Mau 2415 211 2626
Total 2721 251 2972
Quadro 52 – Tabela de Contingência: Variável qb2_9RGPS vs Variável Resposta.
• Como avalia a situação económica do seu país actualmente? (qb2_11RGPS)
qb2_11RGPS/resp30 0 1 Total
Boa 169 20 189
Má 2584 232 2816
Total 2753 252 3005
Quadro 53 – Tabela de Contingência: Variável qb2_11RGPS vs Variável Resposta.
• Como avalia a sua situação de emprego actualmente? (qb2_12RGPS)
qb2_12RGPS/resp30 0 1 Total
Boa 1268 147 1415
Má 1035 103 1138
Total 2303 250 2553
Quadro 54 – Tabela de Contingência: Variável qb2_12RGPS vs Variável Resposta.
37
• Como avalia a situação financeira do seu agregado familiar actualmente?
(qb2_13RGPS)
qb2_13RGPS/resp30 0 1 Total
Boa 1422 154 1576
Má 1283 98 1381
Total 2705 252 2957
Quadro 55 – Tabela de Contingência: Variável qb2_13RGPS vs Variável Resposta.
• Como avalia a situação de emprego no seu país actualmente? (qb2_14RGPS)
qb2_14RGPS/resp30 0 1 Total
Boa 184 21 205
Má 2573 231 2804
Total 2757 252 3009
Quadro 56 – Tabela de Contingência: Variável qb2_14RGPS vs Variável Resposta.
2) Variáveis com questões de expectativas sobre os próximos 12 meses.
Estas variáveis inicialmente estavam factorizadas em três categorias (melhor, na mesma e
pior), tendo em vista uma mais fácil interpretação e uma adequação ao pretendido no estudo,
juntaram-‐se as categorias “na mesma” e “pior”, resultando em novas variáveis dicotómicas.
• Expectativas em relação à sua vida no geral. (qb3_1cat)
qb3_1cat/resp30 0 1 Total
Melhor 366 71 437
Pior + Na mesma 2282 176 2458
Total 2648 247 2895
Quadro 57 – Tabela de Contingência: Variável qb3_1cat vs Variável Resposta.
38
• Expectativas em relação à sua área de residência. (qb3_2cat)
qb3_2cat/resp30 0 1 Total
Melhor 2043 185 2228
Pior + Na mesma 652 65 717
Total 2695 250 2945
Quadro 58 – Tabela de Contingência: Variável qb3_2cat vs Variável Resposta.
• Expectativas em relação ao sistema de saúde no seu país. (qb3_3cat)
qb3_3cat/resp30 0 1 Total
Melhor 280 38 318
Pior + Na mesma 2385 212 2597
Total 2665 250 2915
Quadro 59 – Tabela de Contingência: Variável qb3_3cat vs Variável Resposta.
• Expectativas em relação ao sistema de pensões no seu país. (qb3_4cat)
qb3_4cat/resp30 0 1 Total
Melhor 198 23 221
Pior + Na mesma 2451 225 2676
Total 2649 248 2897
Quadro 60 – Tabela de Contingência: Variável qb3_4cat vs Variável Resposta.
39
• Expectativas em relação a subsídios de desemprego no seu país. (qb3_5cat)
qb3_5cat/resp30 0 1 Total
Melhor 196 26 222
Pior + Na mesma 2383 222 2605
Total 2579 248 2827
Quadro 61 – Tabela de Contingência: Variável qb3_5cat vs Variável Resposta.
• Expectativas em relação ao custo de vida no seu país. (qb3_6cat)
qb3_6cat/resp30 0 1 Total
Melhor 200 26 226
Pior + Na mesma 2488 223 2711
Total 2688 249 2937
Quadro 62 – Tabela de Contingência: Variável qb3_6cat vs Variável Resposta.
• Expectativas em relação ao combate à desigualdade e pobreza no seu país. (qb3_8cat)
qb3_8cat/resp30 0 1 Total
Melhor 223 32 255
Pior + Na mesma 2413 217 2630
Total 2636 249 2885
Quadro 63 – Tabela de Contingência: Variável qb3_8cat vs Variável Resposta.
40
• Expectativas em relação ao acesso à habitação no seu país. (qb3_10cat)
qb3_10cat/resp30 0 1 Total
Melhor 238 33 271
Pior + Na mesma 2435 216 2651
Total 2673 249 2922
Quadro 64 – Tabela de Contingência: Variável qb3_10cat vs Variável Resposta.
• Expectativas em relação à situação económica no seu país. (qb3_12cat)
qb3_12cat/resp30 0 1 Total
Melhor 280 31 311
Pior + Na mesma 2405 219 2624
Total 2685 250 2935
Quadro 65 – Tabela de Contingência: Variável qb3_12cat vs Variável Resposta.
• Expectativas em relação à sua situação de emprego. (qb3_13cat)
qb3_13cat/resp30 0 1 Total
Melhor 248 54 302
Pior + Na mesma 2302 189 2491
Total 2550 243 2793
Quadro 66 – Tabela de Contingência: Variável qb3_13cat vs Variável Resposta.
41
• Expectativas em relação à situação financeira do seu agregado familiar. (qb3_14cat)
qb3_14cat/resp30 0 1 Total
Melhor 249 53 302
Pior + Na mesma 2435 192 2627
Total 2684 245 2929
Quadro 67 – Tabela de Contingência: Variável qb3_14cat vs Variável Resposta.
• Expectativas em relação à situação de emprego no seu país. (qb3_15cat)
qb3_15cat/resp30 0 1 Total
Melhor 326 36 362
Pior + Na mesma 2339 211 2550
Total 2665 247 2912
Quadro 68 – Tabela de Contingência: Variável qb3_15cat vs Variável Resposta.
3) Variáveis caracterizadoras do indivíduo.
Neste grupo de variáveis, como já foi referido anteriormente, cada caso é um caso, e
portanto o tratamento efectuado a cada uma das variáveis está condicionado pelos resultados
obtidos em análises posteriores. Em seguida, apresentam-‐se os primeiros dados relativos a
cada uma delas.
• País (b1)
Com esta variável é possível verificar diferenças entre vários países. Neste estudo
optou-‐se por analisar apenas os países do Sul da Europa. Portugal, Espanha, Itália e
Grécia.
42
b1/resp30 0 1 Total
Portugal 799 30 829
Grécia 626 91 717
Espanha 658 60 718
Itália 681 71 752
Total 2764 252 3016
Quadro 69 – Tabela de Contingência: Variável País vs Variável Resposta.
• Estado Civil (d7cat5)
Esta foi sem dúvida a variável mais complicada de se categorizar e compreender. Por
esse facto, para além de muitas alternativas realizadas, serão apresentadas mais
versões deste segundo modelo com diferentes categorizações da variável Estado Civil.
Neste caso, e para melhor interpretar a variável, será categorizada numa variável
dicotómica. Agregou-‐se os indivíduos casados com os que têm parceiro, e os solteiros
com os divorciados e viúvos, isto porque no presente mantêm situações de
conjugalidade semelhantes.
d7cat5/resp30 0 1 Total
Casados + Com Parceiros 2135 123 2258
Solteiros + Divorciados +
Viúvos 614 128 742
Total 2749 251 3000
Quadro 70 – Tabela de Contingência: Variável Estado Civil vs Variável Resposta.
43
• Género (d10)
d10/resp30 0 1 Total
Homem 1190 164 1354
Mulher 1574 88 1662
Total 2764 252 3016
Quadro 71 – Tabela de Contingência: Variável Género vs Variável Resposta.
• Condição perante o trabalho (d15cat)
A variável com a condição perante o trabalho estava factorizada em três categorias,
trabalhador independente, por conta doutrem ou desempregado. Optou-‐se por utilizar
uma variável dicotómica, com as categorias: empregado e desempregado.
d15cat/resp30 0 1 Total
Empregado 1218 200 1418
Desempregado 1546 52 1598
Total 2764 252 3016
Quadro 72 – Tabela de Contingência: Variável Condição Perante Trabalho vs Variável Resposta.
• Região onde vive (d25cat)
A variável que caracteriza a região onde o indivíduo vive estava inicialmente
factorizada em três categorias, área rural ou vila, cidade de tamanho médio ou grande
cidade. Após uma análise mais extensa, optou-‐se por categorizar a variável em dois
factores: pequena ou média cidade e cidade grande.
d25cat/resp30 0 1 Total
Pequena+Média
Cidade 2024 182 2206
Grande Cidade 738 70 808
Total 2762 252 3014
Quadro 73 – Tabela de Contingência: Variável Região Onde Vive vs Variável Resposta.
44
• Dificuldades em pagar as contas ao final do mês no último ano (d60cat)
Esta variável permite-‐nos verificar as dificuldades que o indivíduo relata em pagar as
suas contas ao final do mês no último ano. Inicialmente estava factorizada em três
categorias, muitas vezes, algumas vezes e raras vezes ou nunca. Para uma melhor
interpretação optou-‐se por dicotomizar a variável: muitas vezes e algumas, raras ou
nunca.
d60cat/resp30 0 1 Total
Muitas Vezes 1637 146 1783
Algumas, Raras
ou Nunca 1076 105 1181
Total 2713 251 2964
Quadro 74 – Tabela de Contingência: Variável d60cat vs Variável Resposta.
• Último grau académico concluído (edu)
Variável categorizada inicialmente em três categorias (básico, secundário e
universitário ou mais), foi recategorizada para dicotómica. Assim tem-‐se as categorias:
nível inferior a universitário; nível universitário ou superior.
edu/resp35 0 1 Total
Inferior a
Universitário 2423 173 2596
Universitário ou
Superior 301 75 376
Total 2724 248 2972
Quadro 75 – Tabela de Contingência: Variável Grau Académico vs Variável Resposta.
• Como se vê na sociedade numa escala de 1 a 10. (d61)
Sendo esta uma variável ordinal, deve ser analisada de duas formas. Primeiro,
tentando perceber quais as características da variável e depois como interage com a
variável reposta.
45
Mínimo 1º Quartil Mediana Média 3º Quartil Max
1 4 5 5,378 6 10
Quadro 76 – Análise Descritiva da Variável d61.
resp30/d61 1 2 3 4 5 6 7 8 9 10
Total
0 34 62 227 407 787 558 393 183 35 11 2697
1 1 2 8 20 72 73 47 17 7 2 249
Total 35 64 235 427 859 631 440 200 42 13 2946
Quadro 77 – Tabela de Contingência: Variável d61 vs Variável Resposta.
Nota: Variável Idade
Nesta modelação estatística também não será possível introduzir a variável idade no
modelo, isto porque a variável resposta é construída a partir das idades dos indivíduos e isso
compromete a independência da variável em relação à idade.
No entanto, uma análise breve caracterizadora da amostra em relação à idade é, como
referido atrás, sempre necessária e interessante.
Mínimo 1º Quartil Mediana Média 3º Quartil Max
15 38 50 51,5 64 94
Quadro 78 – Análise Descritiva da Variável Idade.
Em comparação com a amostra anterior, pode-‐se observar que se trata de uma amostra
populacional com uma média de idades mais elevada.
4.2. Análise Univariada
Na fase de modelação proceder-‐se-‐á de forma idêntica à anterior. Primeiro, efectua-‐se o
ajustamento do modelo nulo. Em seguida, constroem-‐se modelos univariados para cada
variável estudada e regista-‐se os valores da estimativa, erro padrão, estatística de teste e p-‐
value de Wald. Com esses dados é possível tomar uma decisão quanto à utilização ou não de
cada variável na fase seguinte da modelação.
O seguinte quadro regista os respectivos coeficientes de cada modelo univariado
construído para o primeiro grupo de variáveis, assim como do modelo nulo.
46
Variáveis de Percepção da Vida do Indivíduo
Modelo Categoria Estimativa Erro
Padrão Est. Teste p-‐value AIC
Nulo (Intercept) -‐2,3950 0,0658 -‐36,4 <2e-‐16 *** 1735,4
Visão Global da sua Vida Satisfeito vs
Não Satisfeito -‐0,1486 0,1436 -‐1,04 0,301 1735,8
Percepção da área que vive Boa vs Má 0,2429 0,1584 1,53 0,125 1728,6
Percepção do SNS Bom vs Mau 0,3020 0,1335 2,26 0,0237 * 1724,5
Percepção do Sistema de
Pensões Bom vs Mau -‐0,1220 0,1564 -‐0,78 0,435 1699,2
Percepção dos Subsídios a
Desempregados Bom vs Mau -‐0,2297 0,1639 -‐1,40 0,161 1631,7
Percepção do Custo de Vida Bom vs Mau -‐0,2858 0,1971 -‐1,45 0,147 1733,5
Percepção do Combate à
Desigualdade e Pobreza Bom vs Mau 0,0685 0,1629 0,42 0,674 1695,1
Percepção do Acesso à
Habitação Bom vs Mau -‐0,4029 0,1828 -‐2,20 0,0275 * 1720,4
Percepção da Situação
Económica Boa vs Má -‐0,2762 0,2462 -‐1,12 0,262 1734,3
Percepção da sua Situação
do Emprego Boa vs Má -‐0,1527 0,1352 -‐1,13 0,259 1639,2
Percepção da Situação
Financeira do Agregado Boa vs Má -‐0,3491 0,1348 -‐2,59 0,0096 ** 1720,2
Percepção da Situação do
Emprego Boa vs Má -‐0,2400 0,2404 -‐1,00 0,318 1735,2
Quadro 79 – Modelos Univariados para Variáveis de Percepção.
Tratando-‐se duma análise com poucos eventos, tendo em conta o número total da
amostra, procederemos à recolha das variáveis significativas para valores inferiores a 1% de p-‐
value de Wald. Olhando a esse limite, pode-‐se constatar pelo quadro anterior que apenas uma
variável apresenta valores relevantes abaixo de 1%: percepção do indivíduo relativamente à
47
situação financeira do agregado familiar (0,0096). Será apenas essa variável a transitar para a
próxima fase de ajustamento de um modelo multivariado.
No próximo quadro são colocados os modelos e respectivos coeficientes para o segundo
grupo de variáveis.
Variáveis de Expectativa do Indivíduo para o próximo ano
Modelo Categoria Estimativa Erro
Padrão
Est.
Teste p-‐value AIC
Expectativa para a sua vida
no geral
Melhor vs Pior
ou na Mesma -‐0,9224 0,1514 -‐6,09 1,13e-‐09 *** 1659
Expectativa para a área que
vive
Melhor vs Pior
ou na Mesma 0,0962 0,1510 0,64 0,524 1715
Expectativa no SNS Melhor vs Pior
ou na Mesma -‐0,4232 0,1871 -‐2,26 0,0237 * 1705,3
Expectativa no Sistema de
Pensões
Melhor vs Pior
ou na Mesma -‐0,2354 0,2310 -‐1,02 0,308 1696,3
Expectativas nos Subsídios
a Desempregados
Melhor vs Pior
ou na Mesma -‐0,3534 0,2202 -‐1,61 0,108 1682,2
Expectativas no Custo de
Vida
Melhor vs Pior
ou na Mesma -‐0,3718 0,2199 -‐1,69 0,0908 . 1706,5
Expectativa no Combate à
Desigualdade e Pobreza
Melhor vs Pior
ou na Mesma -‐0,4673 0,2019 -‐2,32 0,0206 * 1695
Expectativa no Acesso à
Habitação
Melhor vs Pior
ou na Mesma -‐0,4467 0,1989 -‐2,25 0,0247 * 1701,9
Expectativa na Situação
Económica
Melhor vs Pior
ou na Mesma -‐0,1954 0,2020 -‐0,97 0,333 1712,7
Expectativa na sua Situação
do Emprego
Melhor vs Pior
ou na Mesma -‐0,9753 0,1682 -‐5,80 6,62e-‐09 *** 1625,7
Expectativa na Situação
Financeira do Agregado
Melhor vs Pior
ou na Mesma -‐0,9930 0,1688 -‐5,88 4,05e-‐09 *** 1658,8
Expectativa na Situação do
Emprego
Melhor vs Pior
ou na Mesma -‐0,2022 0,1898 -‐1,07 0,287 1694,1
Quadro 80 – Modelos Univariados para Variáveis de Expectativa.
48
Neste segundo conjunto de variáveis, e adoptando mais uma vez um nível de significância
bastante baixo de 1%, verifica-‐se a relevância de três variáveis: expectativa para a sua vida no
geral (p-‐value=1,13e-‐09); expectativa perante a sua situação de emprego (p-‐value=6,62e-‐09); e
expectativa perante a situação financeira do agregado familiar (p-‐value=4,05e-‐09). Serão estas
variáveis que serão utilizadas para a próxima fase de modelação.
De seguida são apresentados os coeficientes para o terceiro grupo de variáveis.
Variáveis Caracterizadoras do Indivíduo
Modelo Categoria Estimativa Erro
Padrão
Est.
Teste p-‐value AIC
País
Portugal vs Grécia 1,3537 0,2181 6,23 4,59e-‐10 ***
1694,6 Portugal vs Espanha 0,8873 0,2297 3,86 0,0001 ***
Portugal vs Itália 1,0213 0,2239 4,56 5,09e-‐06 ***
Estado Civil Cas+Parc vs
Solt+Div+Viu 1,2861 0,1343 9,58 <2e-‐16 *** 1641,4
Género Homem vs Mulher -‐0,9022 0,1376 -‐6,56 5,52e-‐11 *** 1692,1
Condição Perante o
Trabalho
Empregado vs
Desempregado -‐1,5855 0,1603 -‐9,891 <2e-‐16 *** 1616,4
Região onde Vive Peq+Med Cidade vs
Grande Cidade 0,0534 0,1471 0,36 0,717 1736,9
Grau Académico
Concluído
Inf. Univer. vs Sup.
Univer. 1,2498 0,1512 8,27 <2e-‐16 *** 1651,1
Dificuldades em
Pagar as Contas
Muitas Vezes vs
Alg+Raras+Nunca 0,0900 0,1338 0,672 0,501 1723
Como se vê na
sociedade Contínua 1 a 10 0,2093 0,0431 4,86 1,16e-‐06 *** 1686,7
Quadro 81 – Modelos Univariados para Variáveis Caracterizadoras dos Indivíduos.
Das oito (8) variáveis caracterizadoras do indivíduo analisadas seis (6) apresentam valores
de p inferiores a 0,01. Apenas a variável que retracta a região onde o indivíduo vive e a que
representa as dificuldades em pagar as contas ao final do mês apresentaram valores residuais
de relevância.
Observando globalmente os resultados obtidos na análise univariada, chega-‐se ao seguinte
conjunto de variáveis significativas a 1%:
49
1) Como avalia a situação financeira do seu agregado familiar;
2) Quais as expectativas que tem em relação à sua vida em geral para os próximos 12
meses;
3) Quais as expectativas em relação à sua situação de emprego para os próximos 12
meses;
4) Quais as expectativas que tem em relação à situação financeira do seu agregado
familiar para os próximos 12 meses;
5) País;
6) Estado Civil;
7) Género;
8) Condição Perante o Trabalho;
9) Último Grau Académico concluído;
10) Como se vê na sociedade;
O quadro seguinte apresenta os valores de Odds Ratio e Intervalos de Confiança para as
variáveis significativas nos modelos univariados.
Modelo Categoria OR IC 95% p-‐value
Percepção da Situação
Financeira do Agregado Boa vs Má 0,7053
]0,5415 ;
0,9187[ 0,0096 **
Expectativa para a sua
vida no geral
Melhor vs Pior ou
Na Mesma 0,3976
]0,2955 ;
0,5350[ 1,13e-‐09 ***
Expectativa na sua
Situação do Emprego
Melhor vs Pior ou
Na Mesma 0,3771
]0,2712 ;
0,5243[ 6,62e-‐09 ***
Expectativa na Situação
Financeira do Agregado
Melhor vs Pior ou
Na Mesma 0,3704
]0,2661 ;
0,5157[ 4,05e-‐09 ***
País
Portugal vs Grécia 3,8716 ]2,5294 ;
5,9261[ 4,59e-‐10 ***
Portugal vs Espanha 2,4286 ]1,5481 ;
3,8097[ 0,0001 ***
Portugal vs Itália 2,7767 ]1,7903 ;
4,3066[ 5,09e-‐06 ***
Estado Civil Cas+Parc vs
Solt+Div+Viu 3,6185
]2,7810 ;
4,7083[ <2e-‐16 ***
Género Homem vs Mulher 0,4057 ]0,3098 ; 5,52e-‐11 ***
50
0,5313[
Condição Perante o
Trabalho
Empregado vs
Desempregado 0,2048
]0,1496 ;
0,2805[ <2e-‐16 ***
Grau Académico Concluído Inf. Univer. vs Sup.
Univer. 3,4898
]2,5950 ;
4,6932[ <2e-‐16 ***
Como se vê na sociedade 1 a 10 Contínua 1,2329 ]1,1331 ;
1,3414[ 1,16e-‐06 ***
Quadro 82 – Odds Ratio e Intervalos de Confiança para Variáveis Significativas a 1% na Modelação Univariada.
Observando os valores de Odds Ratio e os respectivos intervalos de confiança, para as
variáveis com nível de significância abaixo do 1%, pode-‐se tirar as seguintes conclusões:
• A possibilidade de um indivíduo com 30 anos ou mais, não ter filhos mas ter intenção
de ter e que avalia a situação financeira do seu agregado familiar como sendo má é
30% inferior à de um indivíduo nas mesmas condições mas que avalia a situação
financeira do seu agregado familiar como sendo boa;
• A possibilidade de um indivíduo com 30 anos ou mais, não ter filhos mas ter intenção
de ter e com uma expectativa global de que a sua vida irá piorar ou ficar na mesma nos
próximos 12 anos é cerca de 60% inferior à de um indivíduo nas mesmas condições
mas que tenha uma expectativa global de que a sua vida irá melhorar;
• A possibilidade de um indivíduo com 30 anos ou mais, não ter filhos mas ter intenção
de ter e com uma expectativa de que a sua situação de emprego irá piorar ou ficar na
mesma nos próximos 12 anos é cerca de 63% inferior à de um indivíduo nas mesmas
condições mas que tenha uma expectativa de que a sua situação de emprego irá
melhorar;
• A possibilidade de um indivíduo com 30 anos ou mais, não ter filhos mas ter intenção
de ter e com uma expectativa de que a situação financeira do seu agregado familiar irá
piorar ou ficar na mesma nos próximos 12 anos é cerca de 63% inferior à de um
indivíduo nas mesmas condições mas que tenha uma expectativa de que a situação
financeira do seu agregado familiar irá melhorar;
• A possibilidade de um indivíduo com 30 anos ou mais, não ter filhos mas ter intenção
de ter, residente na Grécia, é quase 4 vezes superior à de um indivíduo nas mesmas
condições mas residente em Portugal;
• A possibilidade de um indivíduo com 30 anos ou mais, não ter filhos mas ter intenção
de ter, residente na Espanha, é quase 2,5 vezes superior à de um indivíduo nas
mesmas condições mas residente em Portugal;
51
• A possibilidade de um indivíduo com 30 anos ou mais, não ter filhos mas ter intenção
de ter, residente Itália, é mais de 2,5 vezes superior à de um indivíduo nas mesmas
condições mas residente em Portugal;
• A possibilidade de um indivíduo solteiro, divorciado ou viúvo com 30 anos ou mais,
não ter filhos mas ter intenção de ter é 3,6 vezes superior à de um indivíduo nas
mesmas condições mas que seja casado ou que tenha parceiro;
• A possibilidade de uma mulher com 30 anos ou mais, não ter filhos mas ter intenção
de ter é quase 60% inferior à de um homem nas mesmas condições;
• A possibilidade de um indivíduo desempregado com 30 anos ou mais, não ter filhos
mas ter intenção de ter é quase 80% inferior à de um indivíduo empregado nas
mesmas condições;
• A possibilidade de um indivíduo com um grau académico concluído igual ou superior
ao do Ensino Superior, com 30 anos ou mais, não ter filhos mas ter intenção de ter é
quase 3,5 superior à de um indivíduo nas mesmas condições mas com um grau
académico concluído inferior ao Ensino Superior;
• A possibilidade de um indivíduo com mais de 30 anos não ter filhos mas com intenção
de ter, aumenta cerca de 25% por cada aumento de 1 unidade na visão que esse
mesmo indivíduo tem de si na sociedade.
4.3. Análise Multivariada
Nesta fase, o primeiro passo é utilizar as variáveis significativas a 1% da análise univariada
para construir um modelo multivariado. Como foi realizado para o modelo anterior com uma
diferente variável resposta, as variáveis que não contribuem a um nível de significância de 5%
serão retiradas e um novo modelo ajustado. Este processo deve ser realizado até ter um
modelo ajustado com todas as variáveis com um nível de significância abaixo dos 5%. Este
processo foi efectuado para as dez (10) variáveis significativas a 1% da análise univariada, em
seguida incluíram-‐se no modelo final as variáveis que apresentaram valores de significância
abaixo de 10% na análise univariada uma a uma e verificou-‐se se apresentavam relevância no
modelo multivariado ajustado. O modelo apresentado no quadro seguinte foi o modelo final
ajustado, com as variáveis que apresentaram valores de significância abaixo dos 5%:
52
Variáveis Categoria Estimativa Erro
Padrão
Est.
Teste p-‐value
(Intercept) -‐2,1295 0,2970 -‐7,17 7,59e-‐13 ***
Expectativa para a
sua vida no geral
Melhor vs Pior ou
na Mesma -‐0,5181 0,2217 -‐2,34 0,0194 *
Expectativa na
Situação Financeira
do Agregado
Melhor vs Pior ou
na Mesma -‐0,6283 0,2473 -‐2,54 0,0111 *
País
Portugal vs Grécia 1,3430 0,2402 5,59 2,24e-‐08 ***
Portugal vs Espanha 0,7261 0,2598 2,80 0,0052 **
Portugal vs Itália 0,9299 0,2518 3,69 0,0002 ***
Estado Civil Cas+Parc vs
Solt+Div+Viu 1,8149 0,1602 11,33 <2e-‐16 ***
Género Homem vs Mulher -‐0,9601 0,1589 -‐6,04 1,51e-‐09 ***
Condição Perante o
Trabalho
Empregado vs
Desempregado -‐1,4737 0,1832 -‐8,04 8,77e-‐16 ***
Grau Académico
Concluído
Inf. Univer. vs Sup.
Univer. 0,9307 0,1776 5,24 1,60e-‐07 ***
AIC: 1275,3
Quadro 83 – Modelo Multivariado Final sem Procura de Interacções.
Para avaliar o grau de resposta das covariáveis calcula-‐se o valor de 𝑅!:
𝑅! = 1 −!"#$%&'" !"#$%&'(
!" !"#$%&'(!"#$%&'" !"#.!"#$
!" !"#.!"#$
= 1 −!"##,!!"#$!"!#!"#$
= 1 − 0,7783 = 0,2217
Pode-‐se concluir que as covariáveis existentes no modelo explicam cerca de 22% da variável
resposta.
53
Pressupostos do Modelo
É necessário uma observação cuidada às diversas variáveis no modelo. No caso das
variáveis discretas uma análise a cada uma das categorias e no caso das variáveis contínuas
verificar o pressuposto da linearidade.
Este modelo só apresenta variáveis discretas como significativas, portanto não será
necessário verificar a linearidade de qualquer variável contínua. Quanto às variáveis discretas
e a sua homogeneidade na distribuição de eventos por categorias, essa análise foi realizada
inicialmente e não se verificou nenhum caso que pudesse suscitar problemas aquando do
ajustamento dos modelos. Assim sendo, pode-‐se concluir que o pressuposto da
homogeneidade nas variáveis discretas e linearidade das variáveis contínuas foram satisfeitos
e validados. Concluindo-‐se que o modelo final sem interacções é o obtido e analisado
anteriormente.
Ajustado um modelo final, ainda sem interacções procuradas, é possível calcular Odds
Ratio e respectivos intervalos de confiança a 95% para cada uma das covariáveis. O quadro
seguinte resume essa informação:
Variáveis Categoria OR IC 95% p-‐value
Expectativa para a
sua vida no geral
Melhor vs Pior ou
na Mesma 0,5957
]0,3858 ;
0,9198[ 0,0194 *
Expectativa na
Situação Financeira
do Agregado
Melhor vs Pior ou
na Mesma 0,5335
]0,3286 ;
0,8663[ 0,0111 *
País
Portugal vs Grécia 3,8307 ]2,3924 ;
6,1335[ 2,24e-‐08 ***
Portugal vs Espanha 2,0670 ]1,2422 ;
3,4394[ 0,0052 **
Portugal vs Itália 2,5343 ]1,5471 ;
4,1516[ 0,0002 ***
Estado Civil Cas+Parc+Div+Viu
vs Solt 6,1408
]4,4858 ;
8,4062[ <2e-‐16 ***
Género Homem vs Mulher 0,3829 ]0,2804 ;
0,5227[ 1,51e-‐09 ***
Condição Perante o
Trabalho
Empregado vs
Desempregado 0,2291
]0,1600 ;
0,3280[ 8,77e-‐16 ***
54
Grau Académico
Concluído
Inf. Univer. vs Sup.
Univer. 2,5384
]1,7907 ;
3,5925[ 1,60e-‐07 ***
Quadro 84 – Odds Ratio e Intervalos de Confiança para o Modelo Multivariado Final sem Procura de Interacções.
De um modo geral a interpretação realizada na análise univariada destas variáveis não se
altera de uma forma muito acentuada.
A possibilidade de um indivíduo pretender ter filhos depois dos 30 anos e não tendo filhos,
diminui para quem tem expectativas negativas ao nível da situação financeira o agregado
familiar, quando comparados com indivíduos nas mesmas condições mas com expectativas
positivas. Neste caso diminui em mais de metade, essa possibilidade de intenção.
Verifica-‐se novamente uma maior possibilidade na intenção de ter filhos depois dos 30
anos quando ainda não se tem nenhum para residentes na Grécia, Espanha e Itália,
comparativamente aos indivíduos residentes em Portugal. No caso de indivíduos gregos existe
uma possibilidade quase 4 vezes superior a indivíduos portugueses. A possibilidade para
residentes em Espanha é 2 vezes superior quando comparados com residentes em Portugal. E
por fim para indivíduos em Itália a possibilidade na intenção de ter filhos é mais de 2,5 vezes
superior a indivíduos em Portugal.
A possibilidade de um solteiro, divorciado ou viúvo com 30 anos ou mais, sem filhos e com
intenção de ter é mais de 6 vezes superior à de um indivíduo com as mesmas características,
sendo casado ou com parceiro conjugal.
A possibilidade de uma mulher com 30 anos ou mais, sem filhos, ter intenção de ter é mais
de 60% inferior à de um homem com as mesmas características.
A possibilidade de um indivíduo desempregado com mais de 30 anos ou mais, não ter
filhos mas ter intenção de ter é inferior em quase 80% do que um indivíduo empregado com as
mesmas características.
Por fim, a possibilidade de um indivíduo com um grau académico concluído igual ou
superior ao Ensino Superior, não te filhos mas ter intenção de ter é mais de 2,5 vezes e meia
superior à de um indivíduo com as mesmas características mas tendo um grau académico
concluído inferior ao Ensino Superior.
55
Procura de Interacções
Mais uma vez, uma das fases necessárias à conclusão duma modelação estatística é a
necessidade de procurar interacções entre as variáveis ajustadas no modelo multivariado.
Resume-‐se à necessidade de tentar averiguar se existe relação no modelo entre duas ou mais
das variáveis dadas como relevantes ou significativas.
No quadro seguinte apresenta-‐se todas as interacções que foram dadas como
significativas, a 5%, aquando da utilização do teste de razão de verosimilhança. O quadro
expõe os coeficientes estimados, o desvio padrão dos mesmos, a estatística de teste, o p-‐value
de Wald e também o p-‐value do teste de razão de verosimilhança.
Interacção Estimativa Erro
Padrão
Est.
Teste
p-‐value
Wald p-‐value TRV
País vs Género
0,3601 0,5291 0,68 0,4962
0,0153 * 0,3629 0,5649 0,64 0,5206
1,3628 0,5360 2,54 0,0110 *
Expectativa para a sua
vida no geral vs Condição
Perante o Trabalho
-‐1,2975 0,3922 -‐3,31 0,0009 *** 0,0013 **
Expectativa na Situação
Financeira do Agregado
vs Condição Perante o
Trabalho
-‐1,5810 0,4255 -‐3,72 0,0002 *** 0,0003 ***
Género vs Estado Civil -‐1,0878 0,3130 -‐3,48 0,0005 *** 0,0005 ***
Quadro 85 – Interacções Significativas a 5% no Modelo Multivariado Final.
Procurando interacções individualmente, constata-‐se que existem quatro (4) interacções
que se relevam significativas a 5% quando efectuado o teste de razão de verosimilhança.
O próximo passo na modelação é a integração de todas as interacções no modelo final e
verificar qual delas se mantém significativas na presença das restantes.
Observou-‐se a não significância, a 1%, de duas das interacções quando colocadas no
modelo em conjunto e executado o teste de razão de verosimilhança para os dois casos. Posto
56
isto, é possível apresentar um modelo ajustado com as diversas variáveis e interacções
significativas.
Variáveis Categoria Estimativa Erro
Padrão
Est.
Teste p-‐value
(Intercept) -‐2,6618 0,3315 -‐8,03 9,71e-‐16 ***
Expectativa para a sua
vida no geral
Melhor vs Pior ou
na Mesma -‐0,5174 0,2231 -‐2,32 0,0204 *
Expectativa na
Situação Financeira do
Agregado
Melhor vs Pior ou
na Mesma -‐0,2223 0,2800 -‐0,79 0,4273
País
Portugal vs Grécia 1,3697 0,2456 5,58 2,44e-‐08 ***
Portugal vs Espanha 0,7218 0,2647 2,73 0,0064 **
Portugal vs Itália 0,9556 0,2564 3,73 0,0002 ***
Estado Civil Cas+Parc vs
Solt+Div+Viu 2,2919 0,2076 11,04 <2e-‐16 ***
Género Homem vs Mulher -‐0,4532 0,2068 -‐2,19 0,0284 *
Condição Perante o
Trabalho
Empregado vs
Desempregado -‐0,2304 0,3726 -‐0,62 0,5363
Grau Académico
Concluído
Inf. Univer. vs Sup.
Univer. 0,9054 0,1784 5,07 3,89e-‐07 ***
Expectativa na
Situação Financeira do
Agregado vs Condição
Perante o Trabalho
-‐1,5822 0,4281 -‐3,70 0,0002 ***
Género vs Estado Civil -‐1,0865 0,3144 -‐3,46 0,0005 ***
AIC: 1254,3
Quadro 86 – Modelo Multivariado Final.
57
Para avaliar o grau de resposta das covariáveis calcula-‐se o valor de 𝑅!:
𝑅! = 1 −!"#$%&'" !"#$%&'(
!" !"#$%&'(!"#$%&'" !"#.!"#$
!" !"#.!"#$
= 1 −!"#$,!!"#!!"!#!"#$
= 1 − 0,7634 = 0,2366
Concluindo-‐se que as covariáveis existentes no modelo explicam quase 24% da variável
resposta, aumentando ligeiramente em relação ao modelo sem interacções.
Verificando-‐se interacções no modelo final, é necessário precaução aquando da
interpretação dos dados. O cálculo dos Odds Ratio é apenas feito de forma directa para as
variáveis que não apresentam interacções. O quadro seguinte apresenta esses mesmos valores
para essas três (3) variáveis:
Variáveis Categoria OR IC 95% p-‐value
Expectativa para a
sua vida no geral
Melhor vs Pior ou
na Mesma 0,5961
]0,3850 ;
0,9230[ 0,0204 *
País
Portugal vs Grécia 3,9343 ]2,4313 ;
6,3665[ 2,44e-‐08 ***
Portugal vs Espanha 2,0581 ]1,2250 ;
3,4578[ 0,0064 **
Portugal vs Itália 2,6003 ]1,5732 ;
4,2980[ 0,0002 ***
Grau Académico
Concluído
Inf. Univer. vs Sup.
Univer. 2,4730
]1,7432 ;
3,5084[ 3,89e-‐07 ***
Quadro 87 – Odds Ratio e Intervalos de Confiança para Variáveis sem Interacções no Modelo Multivariado Final.
No que se refere às outras quatro (4) variáveis que apresentam interacções no modelo, é
necessário calcular esses Odds Ratio de uma outra forma. Fixando-‐se cada categoria é possível
calcular os Odds Ratio para cada variável.
58
• Interacção: Expectativa na Situação Financeira do Agregado vs Condição Perante o Trabalho
Expectativa na Situação Financeira do Agregado vs Condição Perante o Trabalho (OR -‐> IC 95%)
Empregado vs Desempregado
Fixando Expectativas = Melhor 0,7942 →]0,3826 ; 1,6485[
Fixando Expectativas = Pior ou Na Mesma 0,1632 →]0,1070 ; 0,2491[ ***
Quadro 88 – Odds Ratio e Intervalos de Confiança para a Interacção Expectativa da Situação Financeira do Agregado vs Condição Perante o Trabalho, fixada a Variável de Expectativa.
Expectativa na Situação Financeira do Agregado vs Condição Perante o Trabalho (OR -‐> IC 95%)
Melhor vs Pior ou na Mesma
Fixando Condição = Empregado 0,8007 →]0,4625 ; 1,3861[
Fixando Condição = Desempregado 0,1647 →]0,0769 ; 0,3521[ ***
Quadro 89 – Odds Ratio e Intervalos de Confiança para a Interacção Expectativa da Situação Financeira do Agregado vs Condição Perante o Trabalho, fixada a Variável Condição Perante o Trabalho.
Observando os valores apresentados nos intervalos de confiança é possível afirmar que em
dois dos casos não são registados valores significativas (o valor 1 situa-‐se no intervalo). Assim
sendo, serão apenas interpretados os valores estatisticamente significativos: 1) indivíduos
desempregados, com mais de 30 anos, com expectativas negativas (piorar ou na mesma) em
relação à situação financeira do seu agregado familiar têm uma possibilidade de desejarem o
primeiro filho inferior em cerca de 85% quando comparados com indivíduos empregados nas
mesmas circunstâncias; 2) um indivíduo desempregado que tenha uma expectativa negativa
em relação à situação financeira do seu agregado familiar, tem uma possibilidade de desejar o
primeiro filho inferior em cerca de 85% quando comparado com um indivíduo nas mesmas
circunstâncias mas com expectativas positivas (melhorar) em relação à situação financeira do
seu agregado familiar.
59
• Interacção: Género vs Estado Civil
Género vs Estado Civil (OR -‐> IC 95%)
Casados+Parceiros vs Solteiros+Divor+Viuvos
Fixando Género = Homem 9,8933 →]6,5861 ; 14,8612[ ***???
Fixando Género = Mulher 3,3379 →]2,0710 ; 5,3797[ ***???
Quadro 90 – Odds Ratio e Intervalos de Confiança para a Interacção Género vs Estado Civil, fixada a Variável Género.
Género vs Estado Civil (OR -‐> IC 95%)
Homem vs Mulher
Fixando Est. Civil = Casados+Parceiros 0,6356 →]0,4238 ; 0,9533[ ***???
Fixando Est. Civil = Solteiros+Divor+Viuvos 0,2145 →]0,1345 ; 0,3420[ ***???
Quadro 91 – Odds Ratio e Intervalos de Confiança para a Interacção Género vs Estado Civil, fixada a Variável Estado Civil.
Nesta interacção, nenhum dos intervalos engloba o valor 1, portanto todos os casos são
significativos e podem ser interpretados de forma quantitativa. Assim sendo, fixando as
categorias da variável género: 1) um homem com mais de 30 anos que seja solteiro, divorciado
ou viúvo tem uma possibilidade quase 10 vezes superior de desejar ter um primeiro filho do
que um homem casado e com parceiro nas mesmas circunstâncias; 2) uma mulher solteira,
divorciada ou viúva tem uma possibilidade mais de 3 vezes superior de desejar ter um primeiro
filho depois dos 30 anos do que uma mulher casada ou com parceiro, nas mesmas
circunstâncias. Quando fixadas as categorias da variável do estado civil: 1) uma mulher casada
ou com parceiro com mais de 30 anos, tem uma possibilidade quase 40% inferior de desejar
ter um primeiro filho quando comparada com um homem nas mesmas circunstâncias; 2) uma
mulher com mais de 30 anos, solteira, divorciada ou viúva tem uma possibilidade quase 80%
inferior de desejar ter um primeiro filho do que um homem nas mesmas circunstâncias.
60
Validação, Calibração e Bondade de Ajustamento do Modelo
Para efectuar a validação dum modelo de regressão logística como o utilizado neste
projecto é necessário calcular os coeficientes 𝐷!", 𝑅! e Slope. Os valores optimistas médios
destes coeficientes não podem exceder os 0,10.
No quadro seguinte são fornecidos os valores dos coeficientes anteriores para o modelo
actual.
Valores optimistas médios
𝑫𝒙𝒚 𝑹𝟐 Slope
0,0182 0,0172 0,0375
Quadro 92 – Coeficientes para validação do modelo.
Como se pode verificar pelos valores calculados, a validação do modelo foi conseguida.
Isto porque, como foi referido, os valores de cada um dos coeficientes fica muito abaixo dos
10% colocados como limite.
Para verificar o grau de bondade do ajustamento do modelo ajusta-‐se o teste de bondade
de ajustamento de Cessie-‐van Houwelingen. Este valor não se poderá situar abaixo do limiar
de significância de 0,05.
Teste de Cessie-‐van Houwelingen
Valor-‐p
0,3454
Quadro 93 – Coeficiente de Cessie-‐van Houwelingen.
Para averiguar a calibração do modelo final encontrado pode-‐se representar o seguinte
gráfico com os valores observados no modelo com a curva das estimativas para o
enviesamento. Uma melhor calibração significa as curvas mais próximas.
61
Figura 4 – Gráfico de observação da calibração do modelo.
Observando o gráfico é possível concluir que a calibração é muito positiva, não existindo
uma grande disparidade de valores nas curvas apresentadas.
Por fim, pode-‐se analisar o ajustamento do modelo através da sensibilidade e
especificidade. Essa análise é feita a partir da Curva ROC representada no gráfico seguinte.
Figura 5 – Gráfico da Curva ROC e critério AUC.
62
Sensibilidade e especificidade situam-‐se acima ou perto dos 70% e a área abaixo da curva
(AUC) acima dos 70%, valor considerado aceitável. Tudo indicadores de um modelo bem
ajustado e validado.
4.4. Conclusões
De um modo geral pode-‐se concluir, mais uma vez, que a análise descritiva nos garante
uma modelação bem-‐sucedida. As variáveis apresentam distribuições homogéneas nas
diversas categorias não sendo necessário retirar qualquer variável devido a isso. Se
observarmos com mais atenção cada uma das variáveis caracterizadoras, chega-‐se às seguintes
conclusões:
• Nas variáveis de percepção é curioso verificar que existe uma variedade de
distribuições. Existem algumas variáveis (minoria) que apresentam valores de
“Boa” percepção muito maiores que os valores de “Má” percepção, como por
exemplo, a percepção que tem da sua vida no geral ou a percepção que tem em
relação à sua área de residência. No entanto, também há variáveis com valores
opostos, como a percepção que tem do sistema de pensões ou dos subsídios a
desempregados (amostra com muito mais indivíduos que têm uma má percepção
destes assuntos do que boa). Também existe variáveis com valores muito
semelhantes, como a percepção que tem do sistema de saúde, da sua situação de
emprego ou da situação financeira do agregado familiar (amostra com um
número muito parecido de indivíduos que têm percepção má e boa).
• Nas variáveis de expectativa é curioso verificar que à excepção de uma variável,
todas elas apresentam uma expectativa negativa quanto aos próximos 12 meses.
A excepção é a expectativa que os indivíduos têm em relação à sua área de
residência, com uma grande maioria a acreditar que irá melhorar. Nas restantes
variáveis, uma grande maioria acredita que a situação descrita irá piorar ou ficar
na mesma.
• Quando observamos os valores nas variáveis caracterizadoras é possível verificar
o seguinte: 1) embora Portugal apresente a maior amostra, é o país que
apresenta menos indivíduos a desejarem ter o seu primeiro filho em idades
depois dos 30 anos; pelo contrário, a Grécia apresenta a menor amostra e é o país
que apresenta o maior número de indivíduos a desejar ter o seu primeiro filho em
idades depois dos 30 anos; 2) existindo um número muito superior de indivíduos
63
casados ou com parceiros na amostra total quando comparados com os solteiros,
divorciados ou viúvos, não deixa de ser interessante observar que a percentagem
de indivíduos a desejarem ter o seu primeiro filho em idades depois dos 30 anos é
muito superior no segundo grupo que no primeiro; 3) não obstante o facto de
existirem mais mulheres que homens, os valores de indivíduos a quererem ter o
seu primeiro filho em idades depois dos 30 anos é praticamente o dobro nos
homens; 4) numa amostra com mais desempregados que empregados, existem
muito mais indivíduos com mais de 30 anos empregados a desejar o primeiro filho
que indivíduos desempregados nas mesmas condições; 5) a amostra apresenta
uma grande maioria de indivíduos residentes em pequenas ou médias cidades; 6)
uma pequena maioria dos indivíduos apresenta muito vezes dificuldades em
pagar as contas ao final do mês; 7) embora a grande maioria dos indivíduos
apresente um grau académico concluído inferior ao Ensino Superior, a
percentagem de indivíduos com mais de 30 anos a desejar ter o seu primeiro filho
é muito superior nos indivíduos com grau académico concluído superior ao Ensino
Superior; 8) a média de idades situa-‐se nos 51,5 anos, metade dos indivíduos da
amostra tem idade entre os 38 e os 64 anos de idade.
A modelação univariada apresentou dez (10) variáveis significativas a 1%: uma (1) variável
de percepção, três (3) variáveis de expectativas e seis (6) variáveis caracterizadoras dos
indivíduos. Serão, portanto, estas variáveis que se apresentam como candidatas a estarem
incluídas no modelo final multivariado. Quando calculados os Odds Ratio foi possível verificar
que nas variáveis de percepção e expectativa os valores indicam uma maior possibilidade de
desejo em ter o primeiro filho por parte dos indivíduos com boa percepção ou com uma
melhor expectativa, quando comparados com os indivíduos com má percepção e com
expectativa de a situação se manter ou piorar. Nas variáveis caracterizadoras, é possível
constatar que: 1) residentes em Portugal têm uma menor possibilidade de desejar ter o
primeiro filho depois dos 30 anos quando comparados com residentes na Grécia, Espanha ou
Itália; 2) indivíduos casados ou com parceiros têm uma menor possibilidade de desejar ter o
primeiro filho depois dos 30 anos quando comparados com os restantes indivíduos; 3) os
homens têm uma maior possibilidade de desejar ter o primeiro filho depois dos 30 anos do
que as mulheres; 4) um empregado com mais de 30 anos tem maior possibilidade de desejar
ter um primeiro filho do que um desempregado nas mesmas circunstâncias; 5) um indivíduo
com mais de 30 anos com o Ensino Superior concluído tem maior possibilidade de desejar ter
um primeiro filho do que um indivíduo nas mesmas circunstâncias mas sem Ensino Superior
64
concluído; 6) por fim, a classificação que cada um faz da sua situação na sociedade influencia
positivamente a possibilidade de desejar um primeiro filho depois dos 30 anos.
No modelo multivariado final, destaque para o surgimento de interacções significativas e de
o modelo se apresentar com excelentes valores de validação e bondade de ajustamento. O
modelo multivariado final apresenta sete (7) variáveis significativas a 5% e duas (2) interacções
significativas a 1%, quando realizado o teste de razão de verosimilhança: duas (2) variáveis de
expectativa e cinco (5) variáveis caracterizadoras dos indivíduos. A interpretação dos valores
de Odds Ratio mantém-‐se bastante próxima da realizada na modelação univariada. Destaque
para o valor calculado para a interacção do género com o estado civil, em que os homens
solteiros, divorciados ou viúvos apresentam uma possibilidade quase 10 vezes superior, à de
homens casados ou com parceiros, de desejarem ter um primeiro filho depois dos 30 anos de
idade. Ou o facto da possibilidade de uma mulher solteira, divorciada ou viúva de desejar ter
um primeiro filho depois dos 30 anos é quase 80% inferior à de um homem nas mesmas
circunstâncias.
Por fim, realizada a análise de validação do modelo, assim como de bondade de
ajustamento do mesmo, é possível afirmar que o modelo apresenta valores de ajustamento e
de validação muito positivos. Não sendo, tal como se verificou no primeiro modelo, de
destacar qualquer valor ou estatística que possa alertar para algum problema.
5. Discussão de Resultados
Numa observação global dos resultados obtidos na análise descritiva é possível afirmar
que os valores registados acabam por ser bastante expectáveis. Tanto em Portugal, como nos
outros três (3) países analisados, existe uma predominância de valores negativos, quer na
percepção que o indivíduo tem da sua vida, quer na expectativa para os próximos 12 meses.
Embora não seja na totalidade, existe uma esmagadora maioria de indivíduos com esse tipo de
percepção e expectativa. Não se podendo ignorar o facto de estes quatro (4) países serem
países do Sul da Europa, estando neste momento com dificuldades ao nível económico e
social, é, de certo modo, natural que estes valores negativos sejam maioritários. Quanto aos
resultados obtidos na descrição das variáveis caracterizadoras dos indivíduos destaque para o
facto de Portugal apresentar muito poucos indivíduos sem intenção de ter filhos depois dos 35
anos, o que pode indicar um fraco desejo de entrar na parentalidade com aquela idade, mas
também de o ter efectuado antes dos 35 anos. De realçar também a diferença entre os países,
65
Portugal apresenta uma percentagem muito baixa de indivíduos com mais de 30 anos que
ainda deseja ter o seu primeiro quando comparado com a percentagem dos outros países.
Analisando os resultados do primeiro modelo construído, tendo em conta a escassez dos
mesmos e também o grau de resposta de apenas 15%, é possível salientar a importância
revelada pela região onde o indivíduo vive, assim como a diferença verificada entre os
indivíduos com parceiros quando comparados com os indivíduos casados, divorciados ou
viúvos. Sendo natural que haja diferenças entre indivíduos solteiros e casados, divorciados ou
viúvos, não é de todo intuitivo que haja diferenças relevantes entre o grupo base (casados,
divorciados e viúvos) e o grupo de indivíduos com parceiros. No entanto, essa diferença é
verificada e bastante acentuada. E, portanto, um dos principais resultados desta modelação
passa pelas diferenças verificadas entre as categorias da variável Estado Civil. Num futuro
estudo seria de se aprofundar o porquê de os solteiros e indivíduos com parceiro
apresentarem valores de “não ter nem ter intenção de ter filhos” tão superiores aos dos
indivíduos casados, divorciados ou viúvos em Portugal.
Os resultados do segundo modelo na sua globalidade foram mais satisfatórios, não só pela
quantidade de resultados, como também pela qualidade dos mesmos. Não obstante o facto de
existiram resultados que exigem reflexão. Mais uma vez, os valores obtidos pela interpretação
da variável Estado Civil apresentam resultados interessantes e relevantes. A recategorização
da variável pode justificar alguma diferença entre o expectável e o apresentado mas não pode
justificar tudo. Daí que seja necessário e exigível que se continue a investigar e modelar na
procura de uma possível justificação ou melhoria nos resultados. Se no caso da variável Estado
Civil existem possíveis reticências quanto às categorias utilizadas e também quanto aos
diversos resultados obtidos, tanto no primeiro modelo, como no segundo, no caso do género
não deixa de ser interessante que o homem com mais de 30 anos tenha mais possibilidade de
intenção de ter um primeiro filho que a mulher. Outro resultado curiosos e que merece ser
discutido é a menor possibilidade de intenção de ter o primeiro filho depois dos 30 anos em
Portugal quando comparado com os outros países em estudo. A diferença entre Portugal e a
Grécia não seria de todo esperada quando observamos os valores apresentados (cerca de 4
vezes maior a possibilidade de intenção na Grécia).
De um ponto de vista geral há que destacar, obviamente, os resultados obtidos pela
variável Estado Civil, que apresenta valores e interpretações fora daquilo que podem ser
encaradas como normais e que no futuro merecem um estudo mais aprofundado.
66
6. Bibliografia
Adsera, A. (2011), “The interplay of the employment uncertainty and education in
explaining second births in Europe”, Demographic Research, Volume 25, Article 16, 513-‐544.
Billari F. C., Philipov, D. e Testa, M.R. (2009), “Attitudes, norms, and perceived behavioural
control: explaining fertility intentions in Bulgaria”, European Journal of Population, 25(4): 439
– 465.
Cox, D.R., Oakes, D. (2001), “Analysis of Survival Data”, London, England: Chapman and
Hall.
Cunha, V. (2007), “O Lugar dos Filhos. Ideais, Práticas e Significados”, Lisboa: Imprensa de
Ciências Sociais.
Cunha, V. (2012), “As decisões reprodutivas na sociedade portuguesa: elementos para uma
reflexão sobre o alcance e os limites das políticas públicas na natalidade”, Paper apresentado à
Conferência Nascer em Portugal, Cascais, Palácio Cidadela, 17 de Fevereiro de 2012,
Presidência da República – Roteiros do Futuro.
Gayawan, E., Adebayo, S.B., (2013), “A Bayesian semiparametric multilevel survival
modeling of age at first birth in Nigeria”, Demographic Research, Volume 28, Article 45, 1339-‐
1372.
Goldstein, J.R., Sobotka, T., e Jasilioniene, A. (2009), “The end of lowest-‐low fertility”,
Population and Development Review 35(4): 663-‐699.
González, M.-‐J. & Jurado-‐Guerrero, T. (2006), “Remaining childless in affluent economies: a
comparison of France, West Germany, Italy and Spain, 1994–2001”, European Journal of
Population, 22, 317–352.
Hosmer DW, Lemeshow S. (2000), “Applied logistic regression”, 2nd ed. New York: John
Wiley & Sons.
Hosmer DW, Hosmer T, Le Cessie S, Lemeshow S. (1997), “A comparison of goodness-‐of-‐fit
tests for the logistic regression model”, Stat Med 1997; 16:965-‐80.
Kneale, D., Joshi, H., (2008), “Postponement and childlessness: Evidence from two British
cohorts”, Demographic Research, Volume 19, Article 58, 1935-‐1968.
67
Maciel, A.; Mendes, M. F. e Infante, P., (2012), “Um perfil de quem tenciona ter filhos em
Portugal -‐ evidência a partir dos dados do Eurobarómetro 2006”, in Livro de Resumos do IV
Congresso Português de Demografia. Associação Portuguesa de Demografia . Associação
Portuguesa de Demografia (APD). Évora, Setembro de 2012. ISBN 978-‐989-‐97935-‐1-‐4.
Mendes, M. F. (2012), “Declínio da fecundidade, adiamento e número ideal de filhos em
Portugal: o papel das medidas de política”, in Conferência Nascer em Portugal, Roteiros do
Futuro, Impr.Nacional -‐ Casa da Moeda, Lisboa, pp. 91-‐110.
Mendes, M., Tomé, L. (2010), “Does policy measures influence significantly present fertility
decisions in the Iberian Peninsula?” in IX Congress of Association of Historical Demography
(ADEH), University of Azores – Azores, Portugal, June 2012.
Oliveira, I. T. (2012), “A fecundidade em Portugal: uma análise segundo a ordem do
nascimento”, Paper apresentado à Conferência Nascer em Portugal, Cascais, Palácio Cidadela,
17 de Fevereiro de 2012, Presidência da República – Roteiros do Futuro.
Oliveira, I.T. (2008), “Fecundidades das populações e das gerações em Portugal, 1960-‐
2005”, Análise Social, vol. XLIII (1.º), 29-‐53.
Philipov, Dimiter. (2001). “Low fertility in Central and Eastern Europe: Culture or
economy? International Perspectives on Low Fertility: Trends, Theories and Policies.”, IUSSP
working group on low fertility Conference, Tokyo.
Rosina, A., Testa, M.R. (2009), “Couples’ first child intentions and disagreement: An
analysis of the Italian case.”, European Journal of Population, 25(4): 487-‐502.
Singh, R., Mukhopadhyay, K. (2011), "Survival analysis in clinical trials: Basics and must
know areas", Perspect Clin Res 2 (4): 145–148.
Sobotka, T. 2004. “Is lowest-‐low fertility in Europe explained by the postponement of
childbearing?”, Population and Development Review 30 (2), 195-‐220.
Sobotka, T., Zeman, K., Lesthaeghe, R., Frejka T. e Neels, K. (2012), “Postponement and
recuperation in cohort fertility: Austria, Germany and Switzerland in a European context.”,
Comparative Population Studies 36(2-‐3, 2011): 417-‐452.
Stevenson, M. (2007), “An Introduction to Survival Analysis”, EpiCentre, IVABS, Massey
University.
Recommended