22
Conceitos Fundamentais e Apresentação de dados

Apostila Aula 1 e 2 Enfermagem

Embed Size (px)

DESCRIPTION

enfermagem estatistica

Citation preview

Conceitos Fundamentais e Apresentação de dados

Conceitos Fundamentais e Apresentação de dados

1

1.Introdução

A Estatística é uma ciência cujo campo de aplicação estende-se a

muitas áreas do conhecimento humano.

Em sua essência, a Estatística é a ciência que apresenta processos

próprios para coletar, apresentar e interpretar adequadamente conjuntos

de dados, sejam eles numéricos ou não. Pode-se dizer que seu objetivo é

o de apresentar informações sobre dados em análise para que se tenha

maior compreensão dos fatos que os mesmos representam. A Estatística

subdivide-se em três áreas: descritiva, probabilística e inferencial. A

estatística descritiva, como o próprio nome já diz, se preocupa em

descrever os dados. A estatística inferencial, fundamentada na teoria das

probabilidades, se preocupa com a análise destes dados e sua

interpretação.

1.1.Conceitos fundamentais e definições

No estudo da bioestatística, encontramos tipos diferentes de dados

numéricos com variados graus de estruturas e que assumem diversos

valores. Esses dados podem ser trabalhados tanto a nível populacional

quanto, amostral.

População: refere-se a um conjunto de elementos que apresentam

pelo menos uma característica em comum, essa característica deve

delimitar corretamente quais os elementos que representam realmente

essa população. Podemos considerar, como um exemplo de população, a

quantidade de hemácias presente na corrente sanguínea de uma pessoa

adulta, considerando como características comuns: células anucleadas,

presença de hemoglobina, dentre outras.

AULA

1

Conceitos Fundamentais e Apresentação de dados

2

Amostra: refere-se a um sub-conjunto dos elementos que

constituem a população. È valido ressaltar que, a amostra deve ser

significativa, em relação a amostra. Pode-se citar como exemplo, 5mL de

sangue da totalidade de uma pessoa adulta, pois dessa forma, é possível

obter inúmeras estimativas de uma determinada pessoa, por exemplo, o

hemograma completo, a quantidade de neutrófilos, eosinófilos, basófilos,

podendo assim determinar se há um processo alérgico, presença de

helmintos, dentre outras alterações.

Em uma população e em uma amostra, podemos ter vários

elementos, e em muitos casos, devemos analisar os mesmos, com o

propósito de obtermos determinadas estimativas.

Variável: é a característica que será avaliada, medida ou contada

nos elementos de uma população ou de uma amostra. Uma variável pode

ser: o número de pessoas atendidas em uma unidade de saúde, a

quantidade de nascidos vivos em um determinado mês em uma cidade,

dentre outras.

Mas nos estudos envolvendo análise estatística, é necessário

distinguir os tipos de variáveis e como as mesmas são classificadas.

1.2.Tipos de variáveis e de dados

Para uma correta análise dos dados há a necessidade de diferenciar

os tipos de variáveis que o pesquisador está tratando durante a sua

pesquisa, pois assim, é possível realizar uma análise e uma interpretação

correta dos dados.

Variável qualitativa: são variáveis que apresentam como possíveis

valores qualidades ou atributos dos indivíduos pesquisados, essas

variáveis podem ser distribuídas em categorias mutuamente exclusivas

(são aquelas que a ocorrência de um, elimina a possibilidade de

ocorrência do outro), e podem ser expressas de duas formas, ordinal ou

nominal.

Conceitos Fundamentais e Apresentação de dados

3

Variável qualitativa nominal (categórica não ordenada): é o

tipo de variável em que a ordem dos valores não interfere na

interpretação dos dados. Em alguns casos também podemos considerar

uma variável nominal como dicotômica, como por exemplo: sexo

(masculino ou feminino) e doente (sim ou não).

Graficamente podemos representar esse tipo de variável da seguinte

forma:

Figura 1. Representação gráfica de uma variavel qualitativa nominal (1 e 2) do tipo

dicotômicas

Variável qualitativa ordinal (categórica ordenada): é o tipo de

variável em que a ordem dos valores interfere na interpretação dos dados.

Por exemplo: as lesões de uma determinada doenças podem ser

classificadas de acordo com seu nível de severidade, de modo que 1

representa um lesão fatal, 2 é severa, 3 é moderada e 4 é pequena, nesse

exemplo, existe uma ordem natural entre os agrupamentos: um nível

menor representa uma lesão mais séria.

A representação gráfica desse tipo de variável pode ser da seguinte

forma:

Conceitos Fundamentais e Apresentação de dados

4

Figura 2. Representação gráfica de uma variavel qualitativa ordinal.

Variável quantitativa: são variáveis que representam informações

que representam informações expressas em quantidades numéricas, e

pode ser expressas de duas formas, discretas ou contínuas.

Variável quantitativa discreta: são variáveis que somente

assumem valores específicos e são expressos como contagem. São

exemplos desse tipo de variável: número de gestações, número de

nascidos vivos, números de casos de enxaqueca, número de partos por

cesariana, dentre outros. Ao representar graficamente esse tipo de

variável, podemos obter o seguinte gráfico:

Figura 2. Representação gráfica de uma variavel quantitativa do tipo discreta.

Variável quantitativa contínua: são variáveis que podem assumir

qualquer valor inteiro ou não, dentro de uma determinada escala.

Podemos citar como exemplo, pressão arterial expressa em (mmHg),

Bilirrubina total (mg/dL), altura, dentre outros.

Figura 2. Representação gráfica de uma variavel quantitativa do tipo contínua.

Conceitos Fundamentais e Apresentação de dados

5

Foi possível observar pelos conceitos anteriores que há várias

formas de coletar e interpretar os dados de um estudos, os mesmos

podem ser coletados de uma população ou de uma amostra, deste que

esta seja representativa da primeira.

Geralmente os dados coletados em um estudos estão “puros”, e não

apresentam determinadas interpretações, dessa forma, há determinadas

metodologias de estatísticas descritivas que promovem uma melhor

organização dos mesmos.

2.Estatística descritiva

A estatística descritiva é um meio de organizar e resumir o um

grande número de informações, elas promovem um resumo das

características gerais de um conjunto de dados e podem assumir várias

formas, entre as quais, tabelas, gráficos, medidas de tendência central,

medidas de dispersão e medidas de posição.

2.1.Tabelas

Tendo como pré-requisito o conhecimento dos tipos de dados

(nominais ou ordinais; contínuos ou discretos) e os de variaveis

(qualitatitiva e quantitativas), é possível aprender como indentificar as

técnicas estatísticas mais apropriadas para descrever cada tipo de dado.

Embora um certo volume de informação seja perdido quando as

informações são resumidas, um grande volume também pode ser ganho.

Uma tabela talves seja a o meio mais simples de se resumir um conjunto

de observações e pode ser usada para todos os tipos de dados numéricos.

Conceitos Fundamentais e Apresentação de dados

6

2.1.1.Distribuição de frequências

Uma tabela comumente utilizada para avaliar dados é chamada de

distribuição de frequências, que consiste de um conjunto de classes ou

categorias junto com contagens numéricas que correspondem a cada

conjunto para dados nominais e ordinais. Como ilustração desse formato,

temos a tabela 1, a qual apresenta o número de individuos (contagem

numérica) que apresentaram e que não apresentaram dengue tipo 1

(classe ou categoria), para os primeiros 2560 atendimentos registrados,

para tal patologia, em uma unidade de pronto atendimento no mês de

janeiro na cidade do Rio de Janeiro.

Tabela 1. Casos de dengue tipo 1, para os primeiros 2560 atendimentos registrados,

para tal patologia, em uma unidade de pronto atendimento no mês de janeiro na cidade

do Rio de Janeiro. (Título)

Sintomas da dengue tipo 1 Número de Indivíduos →cabeçalho

SIM 246 →corpo

NÃO 2314

Na análise da tabela supracitada, é possível relatar algumas

pertinências sobre a mesma. Uma tabela deve apresentar sempre na

parte superior o título, o qual deve ser auto explicativo, ou seja, indicar

todas as informações da tabela, deve apresentar um cabeçalho, o qual

indica as variáveis em estudo,e o corpo, onde está presente os dados das

variáveis analisadas. Uma tabela não apresenta linhas na vertical, pois a

presença dessas linhas indicaria uma outra representação, denominada de

quadro. Linhas horizontais no interior no corpo da tabela podem ser

adicionadas, mas não devem, para não comprometer a estrutura da

mesma.

Para exibir dados discretos ou contínuos na forma de uma

distribuição de frequências precisa-se dividir o intervalo de valores da

Conceitos Fundamentais e Apresentação de dados

7

observações em uma série de intervalos não sobrepostos e distintos.

Como os dados discretos e os contínuos apresentam uma quantidade

maior de classes, muitas vezes as tabelas de coletas desses tipos de

dados são cansativas e não dão ao leitor uma visão rápida de uma correta

interpretação. Para isso é necessário que os dados sejam apresentados

em uma tabela de distribuição de frequências.

Imagine que, que para dar uma ideia geral sobre o peso ao nascer

de nascidos vivos, o pesquisador era apresentar não os pesos observados,

mas o número de nascidos vivos por faixas de peso. Deve, então,

construir uma tabela de distribuição de frequências.

Peso ao nascer de nascidos vivos, em quilogramas (Kg)

2,522 3,200 1,900 4,100 4,600 3,400 2,150 2,700

2,720 3,720 3,600 2,400 1,720 3,400 3,300 2,450

3.125 2,800 3,200 2,700 2,750 1,570 3,250

2,250 2,900 3,300 2,450 4,200 3,800 3,150

3,220 2,950 2,900 3,400 2,100 2,700 2,800

3,000 2,480 2,500 2,400 4,450 2,900 2,900

3,725 3,800 3,600 3,120 2,900 3,700 2,500

2,890 2,500 2,500 3,400 2,920 2,120 2,900

3,110 3,550 2,300 3,200 2,720 3,150 3,200

3,520 3,000 2,950 2,700 2,900 2,400 3,200

3,100 4,100 3,000 3,150 2,000 3,450 3,200

3,200 3,200 3,750 2,800 2,720 3,120 2,800

2,780 3,450 3,150 2,700 2,480 2,120 2,500

3,155 3,100 3,200 3,300 3,900 2,450 2,480

Pelos dados do quadro acima não é possível tirar grandes

conclusões, apenas verificar que há 100 dados coletados (observações) e

que o valor de 4,600 Kg é o maior e o de 1,570 é o menor.

Conceitos Fundamentais e Apresentação de dados

8

O primeiro passo, é definir as faixas de peso, essas faixas recebem,

nesse caso, nome de classes. Pelos dados apresentados é possível é

possível verificar que no quadro 1, o menor valor é 1,570 Kg e o maior é

4,600 kg. Arbitrariamente podemos definir classes de 1,5 a 2,0 Kg, de 2,0

a 2,5 kg, assim sucessivamente, formando sete classes, como mostra o

esquema abaixo.

1,5 ι— 2,0

2,0 ι— 2,5

2,5 ι— 3,0

3,0 ι— 3,5

3,5 ι— 4,0

4,0 ι— 4,5

4,5 ι— 5,0

A representação de cada classe é dada da seguinte forma, a

representação 1,5 ι— 2,0 significa que nessa classe, são alocados todos os

valores de 1,5 (incluindo o mesmo) até valor os valores de 1,999999...,

pois o símbolo (ι— ), significa que o intervalo é fechado em 1,5 e aberto

em 2,0, indicando que o valor 2,0 não pertence a essa classe; na classe

de 2,0 a 2,5 Kg, são alocados os nascidos que apresentam desde 2,0 até

os que nasceram com 2,499999... e assim por diante. Dessa forma, cada

classe cobre um intervalo de 0,5 Kg. A distribuição da frequência absoluta

para a variável peso ao nascer obtida a partir do quadro pode ser

representada na tabela 2.

A frequência absoluta de uma classe ou de um valor individual é o

número de observações correspondentes a essa classe ou a esse valor. De

acordo com o quadro, podemos verificar que, três (3) crianças estavam

no intervalo de 1,5 ι— 2,0, e 16 crianças estavam no intervalo de 2,0 ι—

2,5, resumindo a frequência absoluta representa o valor absoluto da

quantidade de representantes de uma determinada variável para um certo

intervalo.

Conceitos Fundamentais e Apresentação de dados

9

Tabela 2. Frequência absoluta de nascidos vivos segundo o peso ao nascer, em

quilogramas (Kg)

Classe Frequência absoluta

1,5 ι— 2,0 3

2,0 ι— 2,5 16

2,5 ι— 3,0 31

3,0 ι— 3,5 34

3,5 ι— 4,0 11

4,0 ι— 4,5 4

4,5 ι— 5,0 1

Soma 100

Algumas vezes é útil conhecer a proporção dos valores situados em

um determinado intervalo de uma distribuição de frequência, em vez

somente do número absoluto. A frequência relativa para um intervalo é

a proporção do número total de observações que nele aparece. Ela é

calculada ao dividir-se o número de valores dentro do intervalo pelo

número total de valores na tabela. A frequência relativa pode ser

calculada da seguinte forma, tomando como exemplo a primeira classe

(1,5 ι—2,0), podemos obter dividindo o valor 3 pela soma total 100 e

multiplicando por 100 para obter o valor expresso em percentagem, 3%,

analogicamente a frequência relativa da classe 2,0 ι—2,5 é (16/100) x

100 = 16%, as frequências relativas para todos os intervalos em uma

tabela somam 100%. Uma das grandes aplicabilidades das frequências

relativas, é comparar conjuntos de dados que contenham números

desiguais de observações, as frequências relativas para os dados do

quadro estão representados na tabela 3.

Conceitos Fundamentais e Apresentação de dados

10

Tabela 3. Frequência absoluta e frequência relativa de nascidos vivos segundo o peso ao

nascer, em quilogramas (Kg)

Classe Frequência

absoluta

Frequência

relativa (%)

1,5 ι— 2,0 3 3

2,0 ι— 2,5 16 16

2,5 ι— 3,0 31 31

3,0 ι— 3,5 34 34

3,5 ι— 4,0 11 11

4,0 ι— 4,5 4 4

4,5 ι— 5,0 1 1

Soma 100 100

Outra frequência que pode ser estimada, é a frequência relativa

acumulada, a qual se refere a percentagem do número total de

observações que tem um valor menor ou igual ao limite superior do

intervalo. A frequência relativa acumulada é calculada pela soma das

frequências relativas para o intervalo especificado todas as outras classes

anteriores. Assim para a frequência relativa acumulada do segundo

intervalo 2,0 ι— 2,5 é 3+16=19%, analogicamente a frequência relativa

acumulada do terceiro intervalo 2,5 ι— 3,0 é 3+16+31=50%. Tal como

as frequência relativas as frequências relativas acumuladas também

podem ser utilizadas para números desiguais de observações. Mas essas

frequências também apresentam resultados satisfatórios que promovem

várias interpretações, como por exemplo, 50% das crianças, da amostra

dos dados, apresentam peso entre 1,5 a 2,9 Kg. Os dados referentes a

frequência relativa acumulada dos dados do quadro estão representadas

na tabela 4.

Conceitos Fundamentais e Apresentação de dados

11

Tabela 4. Frequência absoluta, frequência relativa e frequência relativa acumulada de

nascidos vivos segundo o peso ao nascer, em quilogramas (Kg)

Classe Frequência

absoluta

Frequência

relativa (%)

Frequência relativa

acumulada (%)

1,5 ι— 2,0 3 3 3

2,0 ι— 2,5 16 16 19

2,5 ι— 3,0 31 31 50

3,0 ι— 3,5 34 34 84

3,5 ι— 4,0 11 11 95

4,0 ι— 4,5 4 4 99

4,5 ι— 5,0 1 1 100

Soma 100 100 -

Depois de construir uma distribuição de frequências, pode-se incluir

outras características adicionais que ajudaram a fornecer um melhor

entendimento dos dados, como por exemplo o ponto médio. O ponto

médio de uma classe é a soma dos limites superiores e inferiores da

classe dividida por dois.

2classe) da superior ( l i m i t e classe) da inferior ( l i m i t e médio ponto

O ponto médio para a primeira classe é (1,5+2,0)/2=1,75, depois

de encontra o ponto médio da primeira classe, pode-se encontrar os

pontos médios das classes seguintes, adicionando o valor do intervalo de

classe ao valor do primeiro ponto médio encontrado. Por exemplo, se o

primeiro ponto médio é 1,75 e o intervalo da classe é 0,5, então os

pontos médios restantes são:

Conceitos Fundamentais e Apresentação de dados

12

1,75 + 0,5 = 2,25

2,25 + 0,5 = 2,75

2,75 + 0,5 = 3,25

3,25 + 0,5 = 3,75

3,75 + 0,5 = 4,25

4,25 + 0,5 = 4,75

Tabela 5. Ponto médio, Frequência absoluta, frequência relativa e frequência relativa

acumulada de nascidos vivos segundo o peso ao nascer, em quilogramas (Kg)

Classe Ponto

médio

Frequência

absoluta

Frequência

relativa (%)

Frequência relativa

acumulada (%)

1,5 ι— 2,0 1,75 3 3 3

2,0 ι— 2,5 2,25 16 16 19

2,5 ι— 3,0 2,75 31 31 50

3,0 ι— 3,5 3,25 34 34 84

3,5 ι— 4,0 3,75 11 11 95

4,0 ι— 4,5 4,25 4 4 99

4,5 ι— 5,0 4,75 1 1 100

Soma 100 100 -

Como obter o intervalo de classe e o número de classes em uma

distribuição de frequências?

Conceitos Fundamentais e Apresentação de dados

13

Supondo por exemplo, a estatura em cm de 40 pessoas atendidas

durante um dia em uma unidade de saúde.

166 160 161 150 162 160 165 167 164 160

162 168 161 163 156 173 160 155 164 168

155 152 163 160 155 155 169 151 170 164

154 161 156 172 153 157 156 158 158 161

A partir desses dados é possível obter o rol dos mesmos, o rol

refere-se a ordenação dos dados de uma determinada amostra, essa

ordenação é feita em ordem crescente:

A partir desse momento, podemos verificar o menor e o maior valor

da amostra, e também obter algumas estimativas.

Amplitude amostral (AA), é a diferença entre o maior e o menor

valor da amostra, neste caso temos: 173 – 150 = 23.

O número de classes (k), também pode se estimado, e para obter

o mesmo, há várias expressões:

Raiz quadrada: k=√n

Log (Sturges): k= 1+(3,22 x log n)

In (Milone): k=-1+(2 x ln n)

k=1 +10dAt

O valor de n corresponde ao número de observações da amostra, no

caso do exemplo n é igual a 40.

Utilizando a expressão k=√n, temos k=√40 que é igual a 6,32, esse

valor indica que para a elaboração dessa tabela de distribuição de

frequência, será necessário a obtenção de seis (6) classes.

E qual será a amplitude de cada intervalo de classe (h), para obter

tal estimativa utiliza-se a seguinte expressão, h=(AA)/k

Conceitos Fundamentais e Apresentação de dados

14

Dessa forma, temos h=(23/6) = 3,83 ≅ 4

Com esses dados podemos chegar as seguintes conclusões antes de

elaborarmos a tabela de frequência, a amostra contém 40 observações,

para elaborar a tabela de frequência temos que obter seis classes onde o

intervalo entre cada uma das classes é de 4 cm, tendo como limite inferior

para a primeira classe o valor de 150 e o limite superior para a ultima

classe o é 174 (Tabela 6).

Tabela 6. Ponto médio, frequência absoluta, frequência relativa e frequência relativa

acumulada da estatura de 40 pessoas atendidas durante um dia em uma unidade de

saúde

Classe Ponto

médio

Frequência

absoluta

Frequência

relativa (%)

Frequência relativa

acumulada (%)

150 ι— 154 152 4 10,00 10,00

154 ι— 158 156 9 22,50 32,50

158 ι— 162 160 11 27,50 60,00

162 ι— 166 164 8 20,00 80,00

166 ι— 170 168 5 12,50 92,50

170 ι— 174 172 3 7,50 100,00

Soma 40 100% -

2.1.2.Tabelas de contingência

Muitas vezes os elementos de uma amostra ou de uma população

são classificados de acordo com dois fatores, e os dados devem ser então

apresentados em tabelas de contingência. As tabelas de contingência

são utilizadas para estudar a relação entre duas variáveis categóricas

(qualitativas) descrevendo a frequências das categorias de uma das

variáveis com as categorias de outra. Os dados de uma tabela de

Conceitos Fundamentais e Apresentação de dados

15

contingência são apresentados em tabelas de dupla entrada, cada entrada

relativa a um dos fatores. Como exemplo, podemos observar a tabela 7,

que representa o número de nascidos vivos registrados entre os anos de

2008 e 2010 no Brasil. É possível verificar que o número de nascidos vivos

está registrado segundo dois fatores: o ano de registro e o sexo.

Tabela 7. Nascidos vivos registrados segundo o ano de registro e o sexo (IBGE, 2011).

ano de registro sexo

total masculino feminino

2008 1 435 103 1 362 652 2 797 755

2009 1 415 650 1 348 674 2 764 324

2010 1 414 313 1 346 288 2 760 601

As tabelas de contingência podem apresentar tanto a frequência

absoluta de uma determinada variável, quanto a frequência relativa. A

frequência relativa, em alguns casos, dão estimativas de riscos, isto é,

a probabilidade de ocorrência de um determinado dano, podemos

observar esse fato na tabela 8.

Tabela 8. Recém nascidos segundo a época de contagio de rubéola na gestante e a

condição normal ou mal formado, em uma amostra de 104 gestantes, atendidas em uma

unidade de saúde.

época de

contagio

Condição total Frequência relativa

de mal formados Normal Mal

formado

Até o 3º mês 36 14 50 28,0%

Após o 3º mês 51 3 54 5,6%

Conceitos Fundamentais e Apresentação de dados

16

As frequências relativas apresentadas na tabela supracitada

estimam o risco de um recém-nascido ser defeituoso em função da época

em que a gestante se contagio com a rubéola. Note que a frequência

relativa de defeituosos (risco) é maior quando a gestante entrou em

contato com o vírus da rubéola no primeiro trimestre de gestação. Dessa

forma, é possível concluir que o contágio com a rubéola é considerado um

fator de risco na ocorrência de recém-nascidos defeituosos.

Conceitos Fundamentais e Apresentação de dados

17

2.2.Gráficos

Uma outra maneira para resumir e apresentar os dados numéricos,

é pelo emprego de gráficos. Os gráficos devem ser elaborados de um

modo a transmitirem os padrões gerais de um conjunto de observações

em uma simples visualização.

2.1.1.Gráficos de barras

Os gráficos em barras são os mais utilizados para exibir uma

distribuição de frequência para dados nominais ou ordinais. Em um gráfico

de barras, as várias categorias, nas quais as observações são

classificadas, estão apresentadas ao longo de um eixo horizontal ou

vertical. É recomendável que cada coluna conserve uma distância entre si

de aproximadamente 2/3 da largura da base de cada barra, evidenciando

deste modo, a não continuidade na sequência dos dados.

Tabela 9. Internações hospitalares no sistema único de saúde (SUS) por grupos de

causas em 2009, no Brasil (IBGE, 2010).

Espécie Frequência absoluta Frequência relativa

Doenças infecciosas e parasitárias 928 304 8.34

Neoplasias 575 371 5.18

Transtornos mentais e comportamentais 275 286 2.48

Doenças do aparelho circulatório 1 139 140 10.24

Doenças do aparelho respiratório 1 534 953 13.79

Doenças do aparelho digestório 996 109 8.95

Doenças do aparelho urinário 758 755 6.81

Gravidez e parto 2 403 986 21.60

Causas externas 884 665 7.95

Demais causas 1 632 240 14.66

AULA

2

Conceitos Fundamentais e Apresentação de dados

18

A tabela acima apresenta dados nominais, seguido de suas

frequências absolutas e relativas. Apresentando esses dados em forma de

gráfico de colunas os mesmos poderão ser representados da seguinte

forma:

Figura 1. Internações hospitalares no sistema único de saúde (SUS) por grupos de

causas no ano de 2009, no Brasil.

Ao denominar um gráfico, o nome do mesmo sempre vem precedido

de Figura, e a sua denominação sempre deve estar abaixo do mesmo.

2.1.2.Gráficos de setores

O gráfico de setores também é utilizado para apresentar variáveis

nominais e ordinais, para elaborar um gráfico de setores, primeiro, é

necessário traçar uma circunferência, a qual, em sua totalidade,

corresponde a 100%. Dentro dessa circunferência, devem-se ser

representadas as categorias das variáveis em estudo. Para isso, toma-se a

frequência relativa de cada variável e calcula-se o ângulo central, da

seguinte maneira, se 100% correspondem a 360º, uma categoria com

frequência relativa f% terá um ângulo central x.

Conceitos Fundamentais e Apresentação de dados

19

Figura 2. Internações hospitalares no sistema único de saúde (SUS) por grupos de

causas no ano de 2009, no Brasil (IBGE, 2010).

2.1.3.Histogramas

Enquanto um gráfico de barras configura a representação de uma

distribuição de frequência tanto para dados nominais quanto ordinais, um

histograma mostra uma distribuição de frequências para dados discretos

ou contínuos.

Por definição, um histograma de frequência é um diagrama de

que representa a distribuição de frequência de um conjunto de dados. A

escala horizontal é quantitativa e mede os valores dos dados. A escala

vertical mede as frequências das classes e as barras consecutivas

devem ser encostadas umas as outras.

Em virtude das barras consecutivas no histograma estarem

encostadas, elas devem começar e terminar nas fronteiras da classe ao

invés de seus limites. As fronteiras das classes são números que separam

as classes sem formar lacunas entre elas

Para elaborarmos um histograma de frequência, vamos tomar como

base os dados da tabela 6.

Conceitos Fundamentais e Apresentação de dados

20

Tabela 6. Ponto médio, frequência absoluta, frequência relativa e frequência relativa

acumulada da estatura de 40 pessoas atendidas durante um dia em uma unidade de

saúde.

Classe Ponto

médio

Frequência

absoluta

Frequência

relativa (%)

Frequência relativa

acumulada (%)

150 ι— 154 152 4 10,00 10,00

154 ι— 158 156 9 22,50 32,50

158 ι— 162 160 11 27,50 60,00

162 ι— 166 164 8 20,00 80,00

166 ι— 170 168 5 12,50 92,50

170 ι— 174 172 3 7,50 100,00

Soma 40 100% -

O primeiro passo para elaborarmos um histograma de frequência,

devemos encontrar as fronteiras de classes. Para encontrar esse valor

devemos fazer o seguinte, obter a diferença entre o valor do limite

superior que pertence a primeira classe e o limite inferior da segunda

classe, por exemplo, a primeira classe é de 150 ι— 154, mas o valor 154

apresenta o intervalo aberto então não pertence a essa classe, dessa

forma, devemos utilizar o próximo número inteiro que pertence a essa

classe, ou seja, 153, assim temos, 154 (limite inferior da segunda

classe) – 153 (valor abaixo o limite superior da primeira classe,

que é inteiro) resultando nesse caso o valor 1. Metade dessa distância é

0,5, então as fronteiras, inferior e superior, da primeira classe são: 150 -

0,5 = 149,5 e 153 + 0,5 = 153,5.

2.1.3.Polígono de frequência

Conceitos Fundamentais e Apresentação de dados

21

O polígono de frequência é similar ao histograma, utiliza os mesmos

dois eixos que um histograma e é construído ao se colocar um ponto no

centro de cada um dos intervalos de forma tal que a altura do ponto seja

igual a frequência absoluta ou a frequência relativa associada ao

intervalo.Pontos também são colocados no eixo horizontal e é feita ligação

entre o ponto da vertical com o correspondente da vertical. Para fechar o

polígono une-se os pontos.