Upload
dinhngoc
View
216
Download
0
Embed Size (px)
Citation preview
Dados
A palavra "dados" é um termo relativo, tratamento de dados
comumente ocorre por etapas, e os "dados processados" a
partir de uma etapa podem ser considerados os "dados
brutos" do próximo. (Wikipédia)
Dados Brutos
Em informática dados brutos (raw data) designam os
dados/valores recolhidos e estocados tal qual foram
adquiridos, sem terem sofrido o menor tratamento
(Wikipédia)
Dados Brutos
Suponhamos o seguintes dados Brutos como sendo a idade
de alunos de uma turma de informática
14 12 13 11 12 13
16 14 14 15 17 14
11 13 14 15 13 12
14 13 14 13 15 16
12 12
Frequência
A frequência de uma observação é o número de repetições
dessa observação no conjunto de observações, ou ainda, é o
número de vezes que conjuntos de dados aparecem em uma
“população”.
Tipos de Frequências
Frequência simples ou absoluta (fi ) - são os valores que
representam o número de dados de cada classe.
Frequência relativa(fr ) - são os valores das razões entre as
frequências simples e a frequência total.
Frequência acumulada(fa ) – é o total das frequências de
todos os valores inferiores ao limite superior do intervalo de
uma dada classe.
Frequência acumulada relativa(far ) é a frequência
acumulada da classe, dividida pela frequência total da
distribuição.
Distribuição de Frequência Simples ( )
11 2
12 5
13 6
14 7
15 3
16 2
17 1
ix if
if
Dados ou
variável
(Idade)
Frequência
(nº de Alunos)
Frequências Relativas A frequência relativa é o valor da frequência absoluta dividido
pelo número total de observações.Variável
(idade)
frequência absoluta
(Nº de alunos)
frequência relativa
11 2 2/26 = 0,0769
12 5 5/26 = 0,1923
13 6 6/26 = 0,2308
14 7 7/26 = 0,2692
15 3 3/26 = 0,1154
16 2 2/26 = 0,0769
17 1 1/26 = 0,0385
TOTAL = 26 1,0000
ix if rf
ifN
Frequência AcumuladaVariável freqüência
absoluta
freqüência relativa frequência
absoluta
acumulada
frequência
relativa acumulada
11 2 2/26 = 0,0769 2 2/26 = 0,0769
12 5 5/26 = 0,1923 7 7/26 = 0,2692
13 6 6/26 = 0,2308 13 13/26 = 0,5000
14 7 7/26 = 0,2692 20 20/26 = 0,7692
15 3 3/26 = 0,1154 23 23/26 = 0,8846
16 2 2/26 = 0,0769 25 25/26 = 0,9615
17 1 1/26 = 0,0385 26 26/26 = 1,0000
TOTAL = 26 =1,0000
ixif rf
af raf
if rf
Regras de arredondamento na
Numeração Decimal
Norma ABNT NBR 5891
1) Quando o algarismo imediatamente seguinte ao último
algarismo a ser conservado for inferior a 5, o último
algarismo a ser conservado permanecerá sem modificação
Exemplo:
1,333 3 arredondado à primeira decimal tornar-se-á 1,3
Regras de arredondamento na
Numeração Decimal
2) Quando o algarismo imediatamente seguinte ao último
algarismo a ser conservado for superior a 5, ou, sendo 5,
for seguido de no mínimo um algarismo diferente
de zero, o último algarismo a ser conservado deverá ser
aumentado de uma unidade
Exemplo
1,666 6 arredondado à primeira decimal tornar-se-á: 1,7.
4,850 5 arredondados à primeira decimal tornar-se-ão : 4,9.
Regras de arredondamento na
Numeração Decimal
3) Quando o algarismo imediatamente seguinte ao
último algarismo a ser conservado for 5 seguido de
zeros, dever-se-á arredondar o algarismo a ser conservado
para o algarismo par mais próximo. Consequentemente, o
último a ser retirado, se for ímpar, aumentará uma unidade.
Exemplo:
4,550 0 arredondados à primeira decimal tornar-se-ão: 4,6.
Regras de arredondamento na
Numeração Decimal
4) Quando o algarismo imediatamente seguinte ao último
a ser conservado for 5 seguido de zeros, se for par o
algarismo a ser conservado, ele permanecerá sem
modificação.
Exemplo:
4,850 0 arredondados à primeira decimal tornar-se-ão: 4,8.
Atividade - III
1. Verificar a altura em centímetro de cada aluno da turma e
construir uma sequência de Dados Brutos;
2. A partir dos Dados Brutos obtidos, construir a distribuição
de frequência absoluta simples, a frequência relativa,
frequência acumulada e frequência relativa acumulada. Para
o arredondamento utilize a regra da ABNT 5891.
Séries Estatísticas
Tabela é um quadro que resume um conjunto de
observações.
Elementos da Tabela:
Título – o que? Quando? Onde?
Cabeçalho – parte superior da tabela que especifica o conteúdo
Corpo – linha e colunas que contém as informações
Rodapé – elementos complementares
Séries Históricas
Descrevem os valores da variável, em determinado local,
discriminado segundo intervalos de tempo variáveis.
Série Geográficas ou espaciais
Descrevem os valores da variável, em determinado instante,
discriminado segundo regiões.
Series Específicas ou categóricas
Descrevem os valores da variável, em determinado tempo e
local, discriminados segundo especificações ou categorias.
Exemplo:
Séries Conjugadas
Quando apresenta em uma única tabela, a variação de valores
de mais de uma variável.
Apresentação dos dados
“O gráfico estatístico é uma forma de apresentação dos
dados estatísticos, cujo objetivo é o de produzir, o
investigador ou no público em geral, uma impressão mais
rápida e viva do fenômeno em estudo, já que os gráficos
falam mais rápido à compressão que as séries” (Crespo, 2002)
Quando se dispõe de um grande número de observações,
torna-se extremamente difícil a leitura de valores colocados
em tabela.
Colunas ou em barras
É a representação de uma série por meio de retângulos,
dispostos verticalmente (em colunas) ou horizontalmente
(em barras)
Histograma
Um histograma é uma representação gráfica de uma única
variável que representa a frequência de ocorrências (valores
dos dados) dentro de categorias de dados.
O histograma tanto pode ser representado para as
frequências absolutas como para as frequências relativas.
0
2
4
6
8
10
12
14
0 1 2 3 4 5 6 7 8 9 10
Nota nº de Alunos
0 1
1 1
2 2
3 4
4 6
5 8
6 12
7 10
8 3
9 2
10 1
Total 50
Polígono de Frequência
1 1
2
4
6
8
12
10
3
2
1
0
2
4
6
8
10
12
14
0 1 2 3 4 5 6 7 8 9 10
O Polígono de frequências é obtido ligando-se os pontos
médios dos topos dos retângulos de um histograma.
Sobrepondo
0
2
4
6
8
10
12
14
0 1 2 3 4 5 6 7 8 9 10
1 1
2
4
6
8
12
10
3
2
1
0
2
4
6
8
10
12
14
0 1 2 3 4 5 6 7 8 9 10
Histograma de frequência acumulada
(ou ogiva)
histograma de frequência acumulada (ou ogiva) é a
representação gráfica do comportamento da frequência
acumulada.
0
10
20
30
40
50
60
0 1 2 3 4 5 6 7 8 9 10
Fre
qu
ên
cia
Ac
um
ula
da
Distribuição por Frequência Acumulada
Gráfico de Setores
0% 2%
4%5%
7%
9%
11%
13%15%
16%
18%
Gráfico de Setores
0 1 2 3 4 5 6 7 8 9 10
É designado por um círculo, onde cada classe é representada
por um setor circular, cujo ângulo é proporcional ao tamanho
da amostra.
Distribuição de Frequência agrupadas
em Classe
Para a determinação de classes não existe uma regra pré
estabelecida, sendo necessário um pouco de tentativa e erro
para a solução mais adequada.
1. Definir o número de classes
Se n representa o número de observações (na amostra ou na
população, conforme for o caso) o número aproximado de
classes pode ser calculado por Número de Classes =
arredondando os resultados.
n
Exemplo
Nº de Classes =
Fonte: Marques, 2013
47,530
Fazendo arredondamento
para 6
Altura em cm da Turma CA 2013
2. Calcular a amplitude das classes
Essa será obtida conhecendo-se o número de classes e
amplitude total dos dados.
A amplitude total dos dados é o resultado da subtração valor
máximo - valor mínimo da série de dados
classes de
Total Amplitude = classe de Amplitudenúmero
MinValor -MaxValor = Total Amplitude
Distribuição de Frequência agrupadas em Classe
3. Distribui a
frequência dos dados
agrupados por classe
O limite superior de cada
classe é aberto (e
consequentemente, o
limite inferior de cada
classe é fechado), ou seja,
cada intervalo de classe
não inclui o valor de seu
limite superior, com
exceção da última classe.
(Nº de
Ordem)
(Altura em cm) ( Nº de alunos)
01 152 158
02 158 164
03 164 170
04 170 176
05 176 182
06 182 188
Total
i ix if
Limite Inferior Limite Superior
Distribuição de Frequência agrupadas
em Classe
Distribuição de Frequência agrupadas
em Classe(Nº de
Ordem)
(Altura em cm) ( Nº de alunos)
01 152 158 9
02 158 164 8
03 164 170 5
04 170 176 4
05 176 182 3
06 182 188 1
Total 30 if
i ix if
Fonte: Tillmann, 2013
Exemplo: A nota final (NF) do curso será dada pela fórmula:
Em que: AP – Avaliação Parcial
AF – Avaliação Final
Sendo AP (Avaliação Parcial) a média aritmética das
atividades propostas (AT1, AT2,...,ATn)
A cada AT será atribuído valores de 1 a 5.
2
AFAPNF
n
ATnATATAP
...21
Medidas de posição ou tendência central
Propriedades da média aritmética
1. A média é um valor típico, ou seja, ela é o centro de gravidade da distribuição, um
ponto de equilíbrio. Seu valor pode ser substituído pelo valor de cada item na série de
dados sem mudar o total. Simbolicamente temos:
2. A soma dos desvios das observações em relação a média é igual a zero.
3. A soma dos desvios elevados ao quadrado das observações em relação a média é
menor que qualquer soma de quadrados de desvios em relação a qualquer outro
número. Em outras palavras,
é um mínimo.
0)( Xxi
)( 2 Xxi
n
x
n
xX
n
i
i
i
1
2. Média PonderadaMedidas de posição ou tendência central
i
n
i
ii
n
nnP
p
px
ppp
pxpxpxX 1
21
2211
...
......
Onde é o peso da observação iip
A universidade definiu que as avaliações parciais teriam
peso de 30% e a prova final teria peso de 40% no cálculo
dos rendimentos dos alunos. Veja o quadro abaixo e calcule
a média do aluno.
Exemplo
4,03,03,0
4,06,93,093,08
PX
8,0
0,30
0,30
Ap 2 9,0
9,6
Ap nota peso
Ap 1
Final 0,40
Média aritmética Ponderada em dados
agrupados
(Nº de
Ordem)
(Altura em cm) ( Nº de alunos)
01 152 158 9
02 158 164 8
03 164 170 5
04 170 176 4
05 176 182 3
06 182 188 1
Total
i ix if( Ponto
médio)
mx
30 if
im fx
i
n
i
im
f
fx
X 1
n
i
im fx1
.
Média aritmética Ponderada em dados
agrupados
(Nº de
Ordem)
(Altura em cm) ( Nº de alunos)
01 152 158 9
02 158 164 8
03 164 170 5
04 170 176 4
05 176 182 3
06 182 188 1
Total
i ix if( Ponto
médio)
155 1395
161 1288
167 835
173 692
179 537
185 185
4932
mx
2
supinf LLxm
30 if
im fx
i
n
i
im
f
fx
X 1
16430
932.4X
n
i
im fx1
.
Mediana (Md) A mediana é o valor do item central da série quando estes são
arranjados em ordem de magnitude
Exemplo:
a) 2, 4, 5, 7, 8 Md=5
b) 2, 5, 6, 9, 10, 13, 15 Md=9
c) 3, 5 ,8 ,10, 15 ,21 Md=9
Para o calculo da mediana, têm-se:
Se a série for ímpar sua posição será dada por ou se for
Par a sua posição é dada por
2
1
nposição
2
122
nn
posição
Mediana (Md)
Cálculo da mediana
Se série ímpar
Ex: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 }
Md=2
2
1
nposição
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª
0 0 1 1 2 2 3 4 5
ª52
19
posição
Mediana (Md)
Cálculo da mediana
Se a sequência for par
Ex: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª
0 0 1 1 2 3 3 4 5 6
2
122
nn
posição
2
ª6ª5
2
12
10
2
10
posição
5,22
32
Md
Dados Agrupados
Sem intervalos de
Classe
Identificar a frequência
Acumulada
imediatamente superior
à metade da soma das
frequência, ou seja,
152
30
2
if
Dados Agrupados
Se existir uma frequência
acumulada (fa ), tal que:
a mediana será dada por:
Veja no exemplo ao lado.
2
i
a
ff
2
1 ii xx
Md
xi fi fa
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
8 if
42
8af 5,15
2
31
2
1615
Md
Mediana em dados Agrupados
1º Determinar as frequências acumuladas.
2º Calcular
3º Encontrar a classe correspondente à frequência acumulada
imediatamente superior à - classe mediana
2
if
2
if
Mediana (Md) para valores agrupados
af
ix
17
9
5,152
130
2
1
n
158 164Md
917
95,15
158164
158
Md
15868
5,6Md
8,162Md
cf
fnLMd
Md
aMd
2/)1(inf
= limite de classe inferior da classe da mediana;
= frequência acumulada da classe imediatamente anterior à
classe da mediana;
= frequência absoluta simples da classe da mediana,
= amplitude (tamanho) da classe da mediana.
MdL inf
af
Mdf
c
Mediana (Md) para valores agrupados
cf
fnLMd
Md
aMd
2/)1(inf
158inf MdL
9af
8Mdf
6c
Exemplo:
68
92/)130(158
Md
68
95,15158
Md
68
5,6158
Md
87,4158Md
87,162Md
Moda (Mo)
É o valor que ocorre com maior frequência em uma série de
valores.
Exemplos:
a){ 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10.
b){ 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal.
c){ 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas:
4 e 7. A série é bimodal.
Moda (Mo) – Dados agrupados
o Sem intervalo de classe: é o valor da variável de maior
frequência.
o Exemplo:Nota nº de Alunos0 11 12 23 44 65 86 127 108 39 210 1
Total 50
Moda (Mo) – Dados agrupadoso Com intervalos de
classe: A classe que apresenta a maior frequência é denominada classe modal. Nesta, é o valor dominante que está compreendido entre os limites da classe modal. O cálculo da moda consiste em tomar o ponto médio da classe modal (Moda Bruta).
1552
158152
2
)( supinf
Mo
LLMo
(Nº de
Ordem)
(Altura em cm)
01 152 158 9
02 158 164 8
03 164 170 5
04 170 176 4
05 176 182 3
06 182 188 1
Total
i ix if
Método pela fórmula de CZUBER:
: limite inferior da classe modal
: frequência anterior a classe modal
: frequência posterior a classe moda
: frequência da classe modal
: amplitude da classe modal
Moda (Mo) – Classes agrupada
4)811()911(
91158
Mo
54 58 9
58 62 11
62 66 8
66 70 5
ix if
432
258
Mo
45
258
Mo
6,596,158 Mo
hdd
dLMo
21
1inf
antffd Mo 1
postffd Mo 2
infL
antf
Mof
h
postf
Atividade IV
1. Procure exemplos de séries estatísticas em jornais e revistas de enfoque
ambiental e classifique essas séries;
2. Procure exemplos de gráficos em jornais e revistas de enfoque ambiental e
classifique esses gráficos
3. Um processo de medida no laboratório foi avaliada através da inserção
aleatoriamente de 27 amostras possuindo uma concentração conhecida de
η=8.0 mg/L para o fluxo normal de trabalho ao longo de um período de 2
semanas.
O resultado na ordem de observação foram 6.8, 7.8, 8.9, 5.2, 7.7, 9.6, 8.7,
6.7, 4.8, 8.0, 10.1, 8.5, 6.5, 9.2, 7.4, 6.3, 5.6, 7.3, 8.3, 7.2, 7.5, 6.1, 9.4, 5.3,
7.6, 8.1, e 7.9 mg/L.
A partir dos valores observados, obter:
a distribuição de frequência agrupada em classe, a frequência relativa, frequência
acumulada e frequência relativa acumulada. Para o arredondamento utilize a regra
da ABNT 5891;
Construa o seu histograma, o polígono de frequência, ogiva e o gráfico de setores;
A média aritmética, a moda, a mediana e localize essas medidas no histograma.
4) Considerando os conjuntos de dados:
a)3,5,2,6,5,9,5,2,8,6
b)20,9,7,2,12,7,20,15,7
c)51,6; 48,7; 50,3; 49,5; 48,9
d)15, 18, 20, 13, 10, 16, 14
Calcule a média, a mediana e a moda.
5) Os dados de DBO coletados na tabela ao lado, são
do baixo Rio Jari, realizada no período de novembro de
2009 a novembro de 2010. A partir desses dados
construa:
a) a sua distribuição de frequência agrupada em
classe;
b) O histograma, a ogiva e o gráfico em função do
tempo;
c) A media, a mediana e a moda.
Atividade IV
MêsDBO(mg/L)
L 1 L2 L3 L4
nov 8,09 8,22 8,20 8,11
dez 8,46 9,11 9,72 8,66
jan 6,75 5,96 6,41 6,24
fev 5,51 5,48 5,39 4,91
mar 4,96 5,22 4,38 4,77
abr 6,37 6,24 5,74 5,92
mai 8,92 8,85 7,94 8,08
jul 7,87 7,94 7,75 7,85
ago 0,83 1,28 1,70 1,18
set 1,07 1,47 1,41 1,84
out 1,82 1,62 1,74 2,33
nov 2,53 2,58 2,44 2,31
Fonte: Oliveira,2013
Referência BERTHOUEX, Paul Mac; BROWN, Linfield C.. Statistics
for Environmental Engineers. 2ª Boca Raton London New York Washington, D.c: Lewis Publishers, 2002.
MORETTIN, Pedro Alberto; BUSSAB, Wilton de Oliveira. Estatística básica. São Paulo: Saraiva, 2006.
TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro: LTC, 1999.
OLIVEIRA, B. S. Sangel. Qualidade da água associada à vulnerabilidade climática e riscos sanitários no baixo Rio Jarí – AP / Brunna Stefanny Sangel de Oliveira; orientador Alan Cavalcanti da Cunha. Macapá, 2013.