19
UNIVERSIDADE FEDERAL DO PARÁ PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO DIRETORIA DE PESQUISA PROGRAMA INSTITUCIONAL DE BOLSAS DE INICIAÇÃO CIENTÍFICA RELATÓRIO TÉCNICO - CIENTÍFICO Período: Agosto/2016 a Fevereiro/2017 (X) PARCIAL ( ) FINAL IDENTIFICAÇÃO DO PROJETO Título do Projeto de Pesquisa: Métodos Estatísticos Aplicados à Saúde, Ciências Sociais e Agrárias. Nome da Orientadora: Silvia dos Santos de Almeida Titulação da Orientadora: Doutor Faculdade: Estatística Unidade: Instituto de Ciências Exatas e Naturais - ICEN Laboratório: Laboratório de Sistema de Informação e Georreferenciamento Título do Plano de Trabalho: Aplicações de Modelagem Estatística na Área da Saúde Nome do Bolsista: Yuri Freitas Cordovil Tipo de Bolsa: ( ) PIBIC/CNPq ( ) PIBIC/CNPq-AF (X) PIBIC/UFPA ( ) PIBIC/UFPA-AF ( ) PIBIC/INTERIOR ( ) PIBIC/FAPESPA ( ) PARD ( ) PARD renovação ( ) PADRC ( ) Bolsistas PIBIC do edital CNPq 001/2007

Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

  • Upload
    lydat

  • View
    217

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

UNIVERSIDADE FEDERAL DO PARÁ

PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO

DIRETORIA DE PESQUISA

PROGRAMA INSTITUCIONAL DE BOLSAS DE INICIAÇÃO CIENTÍFICA

RELATÓRIO TÉCNICO - CIENTÍFICO

Período: Agosto/2016 a Fevereiro/2017

(X) PARCIAL

( ) FINAL

IDENTIFICAÇÃO DO PROJETO

Título do Projeto de Pesquisa: Métodos Estatísticos Aplicados à Saúde, Ciências

Sociais e Agrárias.

Nome da Orientadora: Silvia dos Santos de Almeida

Titulação da Orientadora: Doutor

Faculdade: Estatística

Unidade: Instituto de Ciências Exatas e Naturais - ICEN

Laboratório: Laboratório de Sistema de Informação e Georreferenciamento

Título do Plano de Trabalho: Aplicações de Modelagem Estatística na Área da

Saúde

Nome do Bolsista: Yuri Freitas Cordovil

Tipo de Bolsa: ( ) PIBIC/CNPq

( ) PIBIC/CNPq-AF

(X) PIBIC/UFPA

( ) PIBIC/UFPA-AF

( ) PIBIC/INTERIOR

( ) PIBIC/FAPESPA

( ) PARD

( ) PARD – renovação

( ) PADRC

( ) Bolsistas PIBIC do edital CNPq 001/2007

Page 2: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

1. INTRODUÇÃO

Os métodos estatísticos são extremamente importantes para os avanços em

diversas áreas do conhecimento, incluindo a área da saúde, onde, por exemplo, são

utilizados para a interpretação de resultados a fim de aplica-los na prática (COGGON,

2015). Para Ayres (2013), qualquer afirmação sobre a saúde de uma pessoa necessita

de provas cientificas baseada em métodos estatísticos.

Segundo Sampaio e Danelon (2015) a aplicação da estatística é imprescindível na

área da bioestatística e das ciências médicas, pois é essencial para o planejamento,

coleta, avaliação e interpretação dos dados obtidos.

Dentre os diversos métodos estatísticos utilizados na área da saúde, pode-se

destacar a modelagem estatística, onde, por exemplo, pode-se observar a relação

(associação) entre duas ou mais variáveis por meio da Analise de Regressão e

Correlação (ARC). Neste sentido, o intuito desse trabalho é aplicar a modelagem

estatística na área da saúde.

2. JUSTIFICATIVA

A importância da presente pesquisa se justifica pela necessidade de se ter um

sistema de monitoramento de doenças na avaliação das medidas de prevenção e controle

implantadas, na identificação de mudanças no padrão epidemiológico de uma população

e, na identificação de surtos e epidemias.

Outro aspecto importante são os constantes avanços na tecnologia empregada nos

mais variados tipos de processos, que exigem, além de um quadro de pessoas

qualificadas, avaliações estatísticas nas áreas da saúde, ciências sociais e agrárias,

capazes de monitorar, detectar e avaliar mudanças nas características durante a

execução e análise, tão logo quanto possível.

A utilização dos métodos estatísticos deve melhorar o entendimento dos usuários da

estatística a respeito dos conceitos de nível e dispersão do processo. Além disso,

possibilitará melhorias nas estimativas dos índices utilizados para avaliar a capacidade

dos processos na área da saúde.

Finalmente, a utilização de métodos estatísticos aplicados à modelagem, avaliação e

controle nas áreas da saúde, possibilita aos usuários e pesquisadores dos métodos

estatísticos um passo inicial ao aperfeiçoamento e o desenvolvimento de novas

ferramentas para análise e avaliação de dados nestas áreas do conhecimento humano.

Page 3: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

3. OBJETIVOS:

a) Objetivo Geral

- O objetivo geral é utilizar métodos estatísticos no desenvolvimento da

modelagem estatística na área da saúde.

b) Objetivos já Alcançados

Na busca de atingir o objetivo geral deste trabalho, já foi feito:

i) Um levantamento teórico sobre o tema por meio de pesquisas bibliográficas

em plataformas online;

ii) Houve a busca por dados secundários dá área da saúde, a fim de satisfazerem

a proposta do tema, o que foi obtido com sucesso, conforme seção 4.1;

iii) Fez-se a construção da tabulação dos dados, para entender e se notar o

comportamento das variáveis analisadas;

iv) Realizou-se o estudo teórico do método de modelagem, que sucedeu na

aplicação prática de um modelo de regressão linear simples visto neste

relatório.

4. MATERIAIS E MÉTODOS

4.1 Caracterização dos Dados

Os dados utilizados neste trabalho foram cedidos pelo Programa/Projeto

realizado com o apoio do PROEXT – MEC/SESu, denominado Promoção de Saúde e

Prevenção de Doenças em Populações Negras, realizado no município de Salvaterra, na

Ilha do Marajó, Pará. E são referentes às observações de uma amostra aleatória de 307

indivíduos (BOLFARINE e BUSSAB, 2005), residentes nas comunidades remanescente

dos seguintes Quilombos: Boa Vista, Caldeirão, Deus Ajude, Bacabal, Bairro Alto,

Siricari, Providência e Pau Furado. Onde se observou às variáveis: pessoais, condições

sociais e aspectos relacionados à saúde, como avaliação química e antropometria, para

analise dos aspectos nutricionais, clínicos e comportamentais.

Para o presente trabalho utilizou-se variáveis referentes à avaliação química e

antropométrica, portanto, estes aspectos relacionados à saúde.

Page 4: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

4.2. Modelagem Estatística

A modelagem é a expressão algébrica da relação entre variáveis. Sendo Yi a

variável de interesse do estudo (dependente), é esperado que seus valores sofram

influência de valores de um número finito de variáveis, por exemplo Xi: com i= 1,2,...,n

(independentes) e que exista uma função “g” que expresse tal dependência. O Modelo

pode ser expresso inicialmente pela Equação (1):

Y = g(Xi), (1)

onde g pode ser uma função linear ou não linear. Neste trabalho, apresenta-se

inicialmente a forma mais simples de modelagem, que é a linear simples, neste caso,

vista por meio da Analise de Regressão (AR).

4.2.1. Análise de Regressão (AR)

A análise de regressão é a metodologia estatística que se constitui em um

conjunto de métodos e técnicas para estabelecer fórmulas (modelo) que interpretem a

relação utilitária entre duas ou mais variáveis com boa aproximação de maneira não

determinística. Antes de se definir o modelo, se faz necessário, porém, identificar e

quantificar a possível relação (associação) existente entre as variáveis, ou seja, a

correlação, que pode ser vista por meio do Diagrama de dispersão e ou do coeficiente

de correlação de Pearson.

O Objetivo da Analise de Correlação (AC) é determinar se há relação entre as

variáveis e, caso afirmativo, se é fraca ou forte; se essa relação existir, estabelecer um

modelo que interprete a relação funcional existente entre as variáveis; construído o

modelo, por exemplo, por meio da Analise de Regressão, usá-lo para fins de predição

(FONSECA et al. 2008).

a) Diagrama de Dispersão

Uma figura desses dados, chamada gráfico de dispersão, dá impressões

preliminares sobre a natureza de qualquer relacionamento (HINES, 2011). A relação

entre as variáveis pode ser verifica por meio gráfico, a partir do diagrama de dispersão

Page 5: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

A Figura 1 mostra exemplos de diagramas de dispersão para dados hipotéticos

de 100 indivíduos das variáveis: Pressão Sistólica e Idade e Glicemia e Idade. Na Figura

1, nota-se em (a) uma relação linear e em (b) uma relação polinomial (quadrática).

Figura 1: Exemplos de Diagramas de Dispersão para as Variáveis Idade e Pressão

Sistólica (a) e Idade e Glicemia (b) para um Conjunto de Pessoas.

(a) (b)

b) Coeficiente de Correlação Linear de Pearson

Para confirmação da força (valor) da relação linear entre duas variáveis Xi e Yi,

usa-se o coeficiente de correlação linear de Person (r). Que segundo (Ramos, Almeida e

Araújo, 2013), é uma ferramenta para quantificar a relação linear entre as variáveis,

medindo o grau de relação em termos quantitativos e seu valor varia na faixa de -1 ≤ r ≤

+1, onde r = +1 significa que os pontos desenhados no diagrama de dispersão estão

perfeitamente alinhados em uma reta que passa por eles com inclinação positiva, para o

valor de r = 0 é demonstrado que não existe relação entre as variáveis analisadas; e r = -

1 indica que a relação é perfeita e negativa entre Xi e Yi. O valor do coeficiente de

correlação r é calculado utilizando a Equação (2):

∑ ( )( )

√∑ ( ) ∑ ( )

, (2)

Onde

e

.

0

50

100

150

200

250

0 15 30 45 60 75

Pressão

Sis

tólica

Idade

0

50

100

150

200

250

0 20 40 60 80

Glicem

ia

Idade

Page 6: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

Após confirmação da Correlação, se faz necessário inicialmente verificar a

Normalidade da variável resposta (Y) para só depois partir par à modelagem estatística,

que neste caso, será vista por meio do Modelo de Regressão Linear.

4.2.2 Normalidade

O primeiro pressuposto analisado deve ser a Normalidade, na qual se verifica a

normalidade da variável resposta (Y), devem-se testar duas hipóteses, a hipótese nula H0

e hipótese alternativa H1, com as suposições: a variável em estudo segue uma

distribuição normal (H0); contra: a variável em estudo não segue uma distribuição

normal (H1). Desse modo, para aceitar a hipótese de normalidade da variável Y o p-

valor (nível descritivo) deve ser superior ao α (nível de significância), que neste

trabalho será adotado um, α= 5%, e caso p < α, rejeita-se a hipótese nula de normalidade

dos resíduos, ou seja, os resíduos não seguem uma distribuição normal. A Figura 2

mostra um exemplo com dados hipotéticos de teste de aderência de normalidade

denominado Kolmogorov-Sminorv, nele não se rejeita H0, pois p-valor > 0,05, logo a

variável Y possui distribuição normal.

Figura 2: Gráfico Resultante do Teste de Aderência de Kolmogorov-Smirnov.

Page 7: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

Com isso pode-se construir o modelo de Regressão Linear para estimar Y a partir

de valores de X com a equação teórica dada por:

(3)

Em que e são parâmetros que podem ser estimados pelo método dos mínimos

quadrados e εi, são os erros aleatórios (resíduos), independentes e identicamente

distribuídos. Um dos métodos para estimação desses parâmetros é o método dos

mínimos quadrados, será visto a seguir.

4.3 Modelo de Regressão Linear

O modelo linear é uma equação matemática, para demonstrar uma relação de

causa-efeito, perante isso prever futuras observações da variável resposta Y de acordo

com as observações de X. Suponha n pares de valores de variáveis dependentes Yi com

distribuição normal, e independentes Xi, com i = 1,2, ... , n, constrói-se o modelo linear

para a estimação da variável dependente Yi, sendo uma forma adequada para mostrar o

relacionamento entre as variáveis: Equação (3)

4.3.1 Método dos Mínimos Quadrados

É um método que consiste em buscar o melhor ajuste para um conjunto de dados

tentando minimizar a soma dos quadrados dos resíduos.

Considere os Resíduos como sendo a diferença entre os valores observados de Y

e os estimados pelo modelo.

( )

Como os são negativos e positivos para torna-los somente positivos elevam-

se todos ao quadrado esses resíduos,

( )

A partir disso somam-se esses resíduos e, obtém-se o Q (erro total), com ele

nota-se que a quantidade resultante irá variar de modo direto com a dispersão dos

pontos em torno da reta estimada

𝑄 ∑( ( ))

Page 8: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

Para tornar Q (erro total) mínimo, calcula-se as derivadas de Q em relação a e

igualando-as a zero:

2∑ ( ( )

)( 1)

2∑ ( ( )

)( )

Derivando novamente, isto é, obtendo as derivadas de segunda ordem nota-se que

ambos são pontos de mínimos, ou seja, os estimadores minimizam o erro total. Com as

equações forma-se um sistema:

2∑( ( )

2∑ ( ( )

)

Expandindo:

∑ 𝑛 ∑

∑ ∑ ∑

Organizando melhor, obtemos um sistema de equações normais:

∑ 𝑛 ∑

∑ ∑ ∑

Resolvendo os sistemas encontram-se os estimadores que obterão valores numéricos a

partir das n observações:

Page 9: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

𝑛 ∑ ∑

Logo o estimador será dado por: (Equação 4)

∑ ∑

ou (4)

Resolvendo :

∑ ((∑ ∑

𝑛 1

𝑛) ×∑

) ∑ 2

𝑛

1

∑ ∑ (∑ )

𝑛 ∑

𝑛 1 (∑ )

𝑛

∑ 2

𝑛

1

(∑ )(∑ )

𝑛 ∑

∑ 𝑛 1 (∑ )

𝑛

∑ 2

𝑛

1

(∑ )(∑ )

𝑛 ∑ (

∑ 𝑛 1 (∑ )

𝑛

∑ 2)

𝑛

1

Portanto o estimador de será: (Equação 5):

(∑ )(∑ )

( ∑

)

, ou

(5)

∑( )( )

∑( )

Os estimadores e minimizam Q e são não viesados com variância mínima.

Page 10: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

4.4 Pressupostos para o Modelo de Regressão Linear

Entretanto, para validação do modelo estimado, se faz necessário a observação

de alguns pressupostos do resíduo proveniente do modelo estimado, que segundo

(Ayres, 2012) são: (1) Normalidade dos resíduos; (2) Homocedasticidade ou

Homogeneidade, dos resíduos; (3) Linearidade do modelo; (4) Independência dos

resíduos.

4.4.1 Análise Residual

Depois de construído o modelo de Regressão Linear apresenta resíduo (erro)

sendo a análise residual o próximo pressuposto analisado, o resíduo de um modelo de

regressão é a diferença entre o valor observado e o valor estimado , Equação (6):

(6)

Para melhor analise dos resíduos é comum padroniza-los dividindo o erro pelo desvio

padrão do erro √ , Equação (7):

√ , (7)

Para a validade do modelo esses resíduos devem seguir uma distribuição normal,

então 95% dos resíduos padronizados estarão no intervalo (-2,+2). Caso os resíduos

padronizados assumam valores distantes desse intervalo, percebe-se a presença de

outliers, pontos diferentes dos dados experimentais. Sendo possível descartar ou

analisar esses pontos, pois os mesmos podem indicar erros no modelo ou no

experimento.

O próximo pressuposto da análise residual é verificar se os resíduos

padronizados são variáveis aleatórias independentes de X, ou seja, se os dados em

análise foram feitos com aleatórios indivíduos e se suas observações são independentes,

não correlacionadas. Um gráfico que podemos verificar essa independência é o que se

plota os valores observados versus a ordem de observações, podendo evidenciar

problemas na independência dos erros.

A Figura 3, baseada em dados hipotéticos apresenta o gráfico de probabilidade

normal para um modelo de regressão ajustado (a) na qual também foi utilizado o teste

de aderência de Kolmogorov-Smirnorv, percebe-se que a hipótese H0 não pode ser

Page 11: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

rejeitada ao nível descritivo de p-valor > 5%, ou seja, os resíduos seguem uma

distribuição de probabilidade normal. Nota-se também na Figura 3 (b) que os resíduos

são independentes de cada valor de X, pois os pontos estão distribuídos aleatoriamente

em torno da linha a zero e a maioria dos valores encontra-se dentro do intervalo [-5; 5],

sendo assim, a suposição de independência dos resíduos produzidos pelo modelo de

regressão ajustado é cabível.

Figura 3: Gráfico Resultante do Teste de Aderência de Kolmogorov-Smirnov (a) e

Gráfico de Resíduos Padronizados versus a Ordem das Observações para Dados

Independentes (b).

(a) (b)

O último pressuposto para a validade do modelo de regressão refere-se à

variância constante, visto que os resíduos seguem uma distribuição normal com média

zero e variância constante, ou seja, os valores de Y variam na mesma proporção que os

valores de X. Quando os resíduos estão distribuídos aleatoriamente em torno da reta de

regressão e de forma constante, ou seja, a variância dos resíduos é igual a uma constante

para todos os valores de X, o pressuposto da homocedasticidade é cumprido. Para a

visualização do pressuposto o gráfico apropriado remete os resíduos versus valores

ajustados à medida que X cresce. Observando a Figura 4 para dados hipotéticos nota-se

os que os dados se comportam de forma aleatória em torno da linha central na qual

representa a média dos resíduos igual a zero e, os valores se encontram em sua maioria

no dentro do intervalo [-5; 5].

Page 12: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

Figura 4: Gráfico de Resíduos Padronizados versus Valores Ajustados para dados com

variância constante

4. RESULTADOS

Para aplicação da teoria com a prática, apresenta-se a seguir alguns resultados do

trabalho. A Tabela 1 apresenta os coeficientes de Correlação Linear de Pearson e sua

significância, por meio do nível descritivo (p-valor), que no presente estudo será

considerado como significante à correlação, cujo valor de p < 0,05 (nível de

significância).

Neste caso, o Peso, dado em kg, obteve o maior valor do coeficiente de Correlação

de Pearson, 0,837, e teve o nível descritivo de 0,000, sendo significante a qualquer nível

de significância, mostrando uma forte relação com circunferência da cintura, medida em

cm. Assim como a Idade, Pressão Sistólica e Diastólica e Circunferência do Braço, em

cm, mostraram-se significantes e correlacionadas com a Circunferência da Cintura.

Tabela 1: Correlação linear de Pearson entre a Circunferência da Cintura e Variáveis

da saúde em Quilombolas Marajoaras.

Variáveis Circunferência da Cintura

Correlação p-valor

Idade 0,322 0,000

Pressão Sistólica 0,350 0,000

Pressão Diastólica 0,190 0,001

Glicemia 0,106 0,064

Altura 0,000 0,994

Peso 0,837 0,000

Circunferência do Braço 0,708 0,000

Page 13: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

Com o objetivo de modelar a Circunferência da Cintura (Y), foram estimados

diversos modelos, partindo do modelo completo (modelo múltiplo), incluindo todas as

variáveis cujos coeficientes foram significativos na correlação. Porém, neste relatório

vamos apresentar somente o modelo cujo resultado foi satisfatório do ponto de vista da

modelagem simples.

Usou-se a variável cujo coeficiente foi o mais significante. A Figura 5 mostra a

dispersão dos valores da variável em relação à Circunferência da Cintura.

Figura 5: Diagrama de dispersão para a Circunferência da Cintura e Peso em

Quilombolas Marajoaras.

Para a validação do modelo fez-se a analise dos pressupostos, sendo o primeiro

deles, a normalidade da variável resposta Y (Circunferência da Cintura). Portanto com a

Figura 6, nota-se a normalidade da variável Y com nível descritivo de 0,051, ou seja,

não se rejeita a hipótese nula de que o conjunto de valores da Circunferência da Cintura

segue uma distribuição normal.

50

60

70

80

90

100

110

120

130

140

20 40 60 80 100 120

Peso

Circunferência da Cintura

Page 14: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

Figura 6: Gráfico Resultante do Teste de Aderência de Kolmogorov-Smirnov para a

variável Circunferência da Cintura.

Com isso, foi construído o modelo de Regressão linear simples para estimar a

Circunferência da Cintura a partir do Peso, dado por:

3 1

Ou mesmo,

Circunferência da Cintura = 35,91 + 0,7785*Peso

Onde 35,91 e 0,7785 são os parâmetros estimados pelo método dos mínimos

quadrados com erros padrão de 1,970 e 0,029 respectivamente.

Para validação usual do modelo faz-se necessário a analise residual. A Figura 7

mostra o teste de aderência de Kolmogorov-Sminorv para os resíduos, percebe-se

normalidade nos resíduos padronizados, visto que, o p-valor foi de 0,054, sendo maior

que o nível descritivo fixado de 0,05.

Page 15: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

Figura 7: Gráfico Resultante do Teste de Aderência de Kolmogorov-Smirnov para os

resíduos padronizados do modelo.

Outro pressuposto da analise residual faz-se necessário à visualização do gráfico

de resíduos padronizados versus a ordem das observações da amostra, sendo este a

analise de independência dos resíduos, logo, nota-se que os mesmos são independentes,

pois os dados estão distribuídos aleatoriamente em torno da linha central (Figura 8).

Figura 8: Gráfico de Resíduos Padronizados versus a Ordem das Observações.

Page 16: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

Finalmente, chega-se ao último pressuposto que novamente é validado pela

visualização de um gráfico, sendo desta vez o de resíduos padronizados versus valores

ajustados pelo modelo, a Figura 9, conota esse gráfico, que pode-se perceber, que não

há nenhuma tendência, seja crescente, decrescente ou alguma forma, ou seja, os

resíduos são homocedásticos.

Figura 9: Gráfico de Resíduos Padronizados versus Valores Ajustados do modelo com

variância constante.

Com todos os pressupostos validados o modelo é considerado apropriado, sendo

este capaz de criar boas estimativas para circunferência da cintura de marajoaras

quilombolas a partir dos seus pesos.

5. PUBLICAÇÕES

6.1 Trabalhos Aceitos em Congressos

CORDOVIL, Y. F.; ALMEIDA, S. S.; CARVALHO JÚNIOR, J. G. Ocorrência e

letalidade das doenças meningocócicas no Estado do Pará, no período de 2007 a 2014.

In: XV ESCOLA DE MODELOS DE REGRESSÃO, Goiânia, GO, a ser apresentado

no dia 27 de março de 2017.

Page 17: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

CORDOVIL, Y. F.; ALMEIDA, S. S.; SANTOS, A. S. Minicurso Manipulação de

Dados Estatísticos no Excel. In: I CONGRESSO INTERINSTITUCIONAL DE

ENSINO E EXTENSÃO, Belém, PA, a ser apresentado no dia 16 de marco de 2017.

SANTOS, G. M. C.; CAMPOS, L. M. M.; CORDOVIL, Y. F.; PRÓTAZIO, J. M. B.

Estudo estatístico da Espécie Manilkara Huberi (Maçaranduba) oriundos da Fazenda

Rio Capim, no município de Paragominas, Pará-PA (BRASIL). In: XV ESCOLA DE

MODELOS DE REGRESSÃO, Goiânia, GO, a ser apresentado no dia 27 de março de

2017.

6. ATIVIDADES A SEREM DESENVOLVIDAS NOS PRÓXIMOS MESES

i) Nós próximos meses pretende-se continuar o estudo da modelagem

estatística, utilizando outros modelos, como por exemplo, o modelo de

regressão múltiplo e ou modelo de Regressão Logístico;

ii) Apresentação nos próximos meses um seminário sobre modelagem;

iii) Finalização de artigo científico sobre o tema do presente estudo.

7. CONCLUSÃO

O estudo teórico e a construção prática do processo de modelagem na de regressão

linear tem contribuído de forma importante para o aprimoramento da vida acadêmica e

profissional deste discente, sendo ainda um discente de inicio de curso (4º período – no

primeiro ano do curso), e a modelagem ser uma técnica ainda não ofertada (vista) no

curso de graduação. Mesmo assim, foi possível o seu estudo e a sua aplicação, de onde

se visualizou as associações das variáveis referentes à saúde, notando-se, a grande

importância da modelagem estatística no controle e monitoramento da saúde, sendo,

portanto, este trabalho um interessante contribuição da modelagem estatística na análise

da saúde de populações de quilombos, podendo ser visto como um instrumento de

medição e precaução relacionadas à saúde destes povos.

Page 18: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

8. REFERÊNCIAS BIBLIOGRÁFICAS

AGRESTI, A. Categorical Data Analysis. 2.ed., Jonh Wileyand Sons: New York.

2003. 734 p.

AYRES, M. Elementos de Bioestatística – A Seiva do Açaizeiro. 2 Ed. Belém, 2012.

588 p.

AYRES, M. Medicina Baseada em Evidências. 2 Ed. Belém: Ponto Press, 2013. 82 p.

BOLFARINE, H.; BUSSAB, W. O. Elementos de Amostragem. 1 ed. São Paulo:

Blucher, 2005. 274 p.

COGGON, D. A Importância da Estatística na Pesquisa em Saúde. Cogitare

Enfermagem. Curitiba, v. 20, n. 1, p. 10, Jan/Mar 2015.

DEVORE, J. L. Probabilidade e estatística para engenharia e ciências. 8 ed. São

Paulo: Cengage, 2014. 712 p.

FONSECA, J. S.; MARTINS, G. A.; TOLEDO, G. L. Estatística Aplicada. 2 ed. São

Paulo: Atlas, 2008. 267 p.

KUTNER, M.H.; NETER, J.; NACHTSHEIM, C. J.; LI, W. Applied Linear Statistical

Models. 5.ed., Boston, Mass.: McGraw-Hill. 2005, 1398 p.

RAMOS, E.M.L.S; ALMEIDA, S.S; ARAÚJO, R.A, Controle Estatístico da

Qualidade, 1.ed, Belém: Bookman, 2013. 160 p.

SAMPAIO, N. A. S. DANELON, M. C. T. M. Aplicações da Estatística nas Ciências.

Disponível em < http://www.aedb.br/wp-content/uploads/2015/05/64.pdf> Acesso em:

19 fev. 2017.

9. DIFICULDADES

Como principais dificuldades no desenvolvimento deste trabalho, pode-se

destacar:

(i) O fato do conteúdo teórico deste trabalho (modelagem estatística) ser de

semestres sucessivos ao atual da graduação, então foi necessário um esforço

maior por parte do discente;

(ii) E a busca por um banco de dados satisfatório para a construção do modelo.

Page 19: Universidade Federal do Pará - pibic.ufpa.br · sociais e aspectos relacionados à saúde, ... 1 indica que a relação é perfeita e negativa entre X ... são negativos e positivos

10. PARECER DO ORIENTADOR

O bolsista Yuri Freitas Cordovil tem apresentado um Excelente desempenho em

relação aos estudos pretendidos por este plano, estando com a pesquisa dentro do

cronograma esperado, o que me leva a acreditar que todas as etapas serão cumpridas

com sucesso, portanto sou de Parecer Favorável a aprovação deste Relatório Parcial.

DATA: 03 de Março de 2017

Silvia dos Santos de Almeida

Assinatura do Orientador

Yuri Freitas Cordovil

Assinatura do Aluno