Upload
marcos-theodoro
View
91
Download
42
Embed Size (px)
DESCRIPTION
Estatistica-Basica APOSTILA MUITO BOA.PDF
Citation preview
ESTATSTICA BSICA
Professor: Narcelio de Arajo Pereira [email protected]
2010
2
SUMRIO
INTRODUO ............................................................................................ 03
UNIDADE 1: A NATUREZA DA ESTATSTICA ................................... 05
UNIDADE 2: GENERALIDADES E CONCEITOS BSICOS .............. 10
UNIDADE 3: SRIES ESTATSTICAS.................................................... 15
UNIDADE 4: GRFICOS ........................................................................... 24
UNIDADE 5: DISTRIBUIO DE FREQUENCIA ................................ 34
UNIDADE 6: MEDIDAS DE POSIO ................................................... 46
UNIDADE 7: MEDIDAS DE DISPERSO OU VARIABILIDADE....... 70
UNIDADE 8: PROBABILIDADE .............................................................. 80
UNIDADE 9: DISTRIBUIO BINOMIAL E NORMAL ..................... 87
REFERENCIAS ......................................................................................... 102
ANEXOS ..................................................................................................... 103
EXERCCIOS DE FIXAO .................................................................. 108
3
INTRODUO
Na antiguidade os povos j registravam o nmero de habitantes, nascimentos,
bitos. Faziam "estatsticas". Na idade mdia as informaes eram tabuladas
com finalidades tributrias e blicas.
No sculo XVI surgem as primeiras anlises sistemticas, as primeiras tabelas
e os nmeros relativos.
No sculo XVIII a estatstica com feio cientfica batizada por
GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem as
primeiras representaes grficas e os clculos de probabilidades. A estatstica
deixa de ser uma simples tabulao de dados numricos para se tornar "O
estudo de como se chegar a concluso sobre uma populao, partindo da
observao de partes dessa populao (amostra)".
Ao longo do sculo XX, os mtodos estatsticos foram desenvolvidos como
uma mistura de cincia, tecnologia e lgica para a soluo e investigao de
problemas em vrias reas do conhecimento humano (Stigler, 1986). Ela foi
reconhecida como um campo da cincia neste perodo, mas sua histria tem
incio bem anterior a 1900.
A estatstica moderna uma tecnologia quantitativa para a cincia
experimental e observacional que permite avaliar e estudar as incertezas e os
seus efeitos no planejamento e interpretao de experincias e de observaes
de fenmenos da natureza e da sociedade.
A estatstica no uma caixa-preta, nem bola de cristal, nem mgica.
Tampouco um conjunto de tcnicas teis para algumas reas isoladas ou
restritas da cincia. Por exemplo, ao contrrio do que alguns imaginam, a
estatstica no um ramo da matemtica onde se investigam os processos de
obteno, organizao e anlise de dados sobre uma determinada populao.
A estatstica tambm no se limita a um conjunto de elementos numricos
relativos a um fato social, nem a nmeros, tabelas e grficos usados para o
resumo, organizao e apresentao dos dados de uma pesquisa, embora este
seja um aspecto da estatstica que pode ser facilmente percebido no cotidiano
(basta abrir os jornais e revistas para ver o "bombardeio" de estatsticas). Ela
uma cincia multidisciplinar: um mesmo programa de computador que
permite a anlise estatstica de dados de um fsico poderia tambm ser usado
por um economista, agrnomo, qumico, gelogo, matemtico, bilogo,
socilogo, psiclogo e cientista poltico. Mesmo que as interpretaes dessas
anlises sejam diferentes por causa das diferenas entre as reas do
4
conhecimento, os conceitos empregados, as limitaes das tcnicas e as
conseqncias dessas interpretaes so essencialmente as mesmas.
Segundo Rao (1999), a estatstica uma cincia que estuda e pesquisa sobre: o
levantamento de dados com a mxima quantidade de informao possvel para
um dado custo; o processamento de dados para a quantificao da quantidade
de incerteza existente na resposta para um determinado problema; a tomada de
decises sob condies de incerteza, sob o menor risco possvel. Finalmente, a
estatstica tem sido utilizada na pesquisa cientfica, para a otimizao de
recursos econmicos, para o aumento da qualidade e produtividade, na
otimizao em anlise de decises, em questes judiciais, previses e em
muitas outras reas.
5
I - A NATUREZA DA ESTATSTICA
MTODO ESTATSTICO
O Mtodo Cientfico
Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso
e, outros, por necessidades prticas, sem aplicao de um mtodo.
Atualmente, quase todo acrscimo de conhecimento resulta da observao e
do estudo. Se bem que muito desse conhecimento possa ter sido observado
inicialmente por acaso, a verdade que desenvolvemos processos cientficos
para seu estudo e para adquirirmos tais conhecimentos. Podemos ento dizer
que:
Mtodo: um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja, ou seja, um meio mais eficaz para atingir determinada meta.
Dos mtodos cientficos, vamos destacar o Mtodo experimental e Mtodo
estatstico.
O Mtodo Experimental - o mtodo preferido pela fsica, Qumica, etc.
Mtodo experimental: consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador
possa descobrir seus efeitos, caso existam.
O Mtodo Estatstico
Muitas vezes temos necessidade de descobrir fatos em um campo em que o
mtodo experimental no se aplica (nas cincias sociais), j que os vrios
fatores que afetam o fenmeno em estudo no podem permanecer constantes
enquanto fazemos variar a causa que, naquele momento, nos interessa.
Nesses casos, lanamos mo de outro mtodo, embora mais difcil e menos
preciso, denominado mtodo estatstico.
Mtodo estatstico: diante da impossibilidade de manter as causas constantes, admitem todas essas causas presentes variando-as,
registrando essas variaes e procurando determinar, no resultado final,
que influncias cabem a cada uma delas.
6
A ESTATSTICA
Exprimindo por meio de nmeros as observaes que se fazem de elementos
com, pelo menos, uma caracterstica comum (por exemplo: os alunos do sexo
masculino de uma comunidade), obtemos os chamados dados referentes a
esses elementos.
Podemos dizer, ento, que:
A Estatstica uma parte da matemtica aplicada que fornece mtodos para a
coleta, organizao, descrio, anlise e interpretao de dados e para a
utilizao dos mesmos na tomada de decises.
A Estatstica Descritiva se encarrega de fazer a coleta, organizao e descrio dos dados.
A Estatstica Indutiva ou Inferencial se encarrega de fazer a anlise e interpretao dos dados.
O aspecto essencial da Estatstica o de proporcionar mtodos
infernciais, que permitam concluses que transcendam os dados obtidos
inicialmente.
Fases do Mtodo estatstico:
Podemos distinguir no mtodo estatstico as seguintes fases:
1 Definio do Problema
Saber exatamente aquilo que se pretende pesquisar o mesmo que definir
corretamente o problema.
2 Planejamento
Como levantar informaes? Que dados devero ser obtidos? Qual
levantamento a ser utilizado? Censitrio? Por amostragem? E o cronograma
de atividades? Os custos envolvidos? etc.
7
3 Coleta de Dados
Aps cuidadoso planejamento e a devida determinao das caractersticas
mensurveis do fenmeno coletivamente tpico que se quer pesquisar, damos
incio coleta dos dados numricos necessrios sua descrio. Fase
operacional. o registro sistemtico de dados, com um objetivo determinado.
A coleta de dados pode ser direta ou indireta.
3.1 Direta:
Quando feita sobre elementos informativos de registro obrigatrio
(nascimentos, casamentos, bitos, importao, exportao, etc.), elementos
pertinentes aos pronturios dos alunos de uma escola ou, ainda, quando os
dados so coletados pelo prprio pesquisador atravs de inquritos e
questionrios, como o caso das notas de verificao e de exames, do censo
demogrfico, etc.
A coleta direta de dados pode ser classificada relativamente ao fator tempo
em:
Contnua (registro): quando feita continuamente, tal como a de
nascimento, bitos e a freqncia dos alunos s aulas;
Peridica: quando feita em intervalos constantes de tempo, como os
censos (de 10 em 10 anos) e as avaliaes peridicas; recenseamento demogrfico, censo industrial;
Ocasional: quando feita esporadicamente, a fim de atender a uma conjuntura ou a uma emergncia, como no caso de epidemias.
3.2 Indireta:
Quando inferida de elementos conhecidos (coleta direta) e/ou conhecimento
de outros fenmenos relacionados com o fenmeno estudado.
Ex: pesquisa sobre mortalidade infantil, que feita atravs de dados colhidos
por uma coleta direta.
8
4 Crtica dos Dados
Obtidos os dados, eles devem ser cuidadosamente criticados, procura de
possveis falhas e imperfeies, a fim de no incorrermos em erros grosseiros
ou de certo vulto, que possam influir sensivelmente nos resultados.
A crtica dos dados se divide em: externa e interna
Crtica externa quando visa s causas dos erros por parte do informante, por distrao ou m interpretao das perguntas que lhe
foram feitas.
Crtica interna quando visa observar os elementos originais dos dados da coleta.
5 Apurao dos Dados
Nada mais do que a soma e o processamento dos dados obtidos e a
disposio mediante critrios de classificao. Resumo dos dados atravs de
sua contagem e agrupamento. a condensao e tabulao de dados.
Pode ser manual, eletromecnica ou eletrnica.
6 Exposio ou Apresentao dos Dados
Por mais diversa que seja a finalidade que se tenha em vista, os dados devem
ser apresentados sob forma de tabelas e grficos (unidade 4), pois tornam mais
fcil o exame daquilo que est sendo objeto de tratamento estatstico e ulterior
obteno de medidas de disperso (unidade 6).
7 Anlise dos Dados
Como j dissemos, o objetivo ltimo da estatstica tirar concluses sobre o
todo (populao) a partir de informaes fornecidas por parte representativa
do todo (amostra). Assim, realizadas as etapas anteriores (estatstica
descritiva), fazemos uma anlise dos resultados obtidos, atravs dos mtodos
da Estatstica Indutiva ou Inferencial, que tem por base a induo ou
inferncia, e tiramos desses resultados concluses e previses.
9
A ESTATSTICA NAS EMPRESAS
No mundo atual, a empresa uma das vigas-mestras da economia dos povos.
A direo de uma empresa, de qualquer tipo, incluindo as estatais e
governamentais, exige de seu administrador a importante tarefa de tomar
decises, e o conhecimento e o uso da estatstica facilitaro seu trplice
trabalho de organizar, dirigir e controlar a empresa.
Por meio de sondagem, de coleta de dados e de recenseamento de opinies,
podemos conhecer a realidade geogrfica e social, os recursos naturais,
humanos e financeiros disponveis, as expectativas da comunidade sobre a
empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de
serem alcanados a curto, mdio ou longo prazo.
A estatstica ajudar em tal trabalho, como tambm na seleo e organizao
da estratgia a ser adotada no empreendimento e, ainda, na escolha das
tcnicas de verificao e avaliao da quantidade e da qualidade do produto e
mesmo dos possveis lucros e/ou perdas.
Tudo isso que se pensou, se planejou, precisa ficar registrado, documentado
para evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e
do material e, ainda, para controle eficiente do trabalho.
O esquema do planejamento o plano, que pode ser resumido, com auxlio da
estatstica, em tabelas e grficos, que facilitaro a compreenso visual dos
clculos matemtico-estatsticos que lhes deram origens.
10
II - GENERALIDADES E CONCEITOS BSICOS
1 VARIVEL
A cada fenmeno corresponde um nmero de resultados possveis. Assim, por
exemplo:
- para um fenmeno sexo so dois os resultados possveis: masculino e feminino;
- para o fenmeno nmero de filhos h um nmero de resultados possveis expressos atravs dos nmeros naturais: 0,1,2,3,....,n;
- para o fenmeno estatura temos uma situao diferente, pois os resultados podem tomar um nmero infinito de valores numricos dentro de
um determinado intervalo.
Varivel: , convencionalmente, o conjunto de resultados possveis de um fenmeno.
Uma varivel pode ser: qualitativa ou quantitativa
Qualitativa: quando seus valores so expressos por atributos; ex: sexo, cor da pele, etc;
Quantitativa: quando seus valores so expressos em nmeros; ex: salrios, idade, altura, etc. Divide-se em discreta e contnua
Discreta ou descontnua: seus valores so expressos geralmente atravs de nmeros inteiros no negativos. Resulta normalmente
de contagens.
Ex: nmeros de alunos presentes as aulas: ontem = 20, hoje = 23;
N de alunos presentes s aulas de introduo estatstica no 1
semestre de 1997: mar = 18, abr = 30, mai = 35, jun = 36.
Contnua: resulta normalmente de uma mensurao, e a escala numrica de seus possveis valores corresponde ao conjunto R
dos nmeros reais, ou seja, podem assumir, teoricamente,
qualquer valor entre dois limites.
11
Exerccio resolvido:
Classifique as variveis em qualitativas e quantitativas (contnuas ou
discretas):
a) Cor dos olhos Qualitativa b) ndice de liquidez nas Indstrias Cearenses Quantitativa contnua c) Produo de caf no Brasil Quantitativa contnua d) Nmero de defeitos em aparelhos de TV Quantitativa discreta e) Comprimento dos pregos produzidos por uma empresa Quantitativa contnua
f) O ponto obtido em cada jogada de um dado quantitativa discreta
2 POPULAO E AMOSTRA
Dois conceitos devem estar bem claros: o de populao e o de amostra, pois
delas que so extrados os dados que do origem s diversas relaes
estatsticas, como a mdia, desvio-padro, etc., e que, em ltima anlise,
possibilitam descreve-las sob os mais diversos aspectos.
Populao: coleo completa de todos os elementos que so objeto de um
estudo; conjunto de entes portadores de, pelo menos, uma caracterstica
comum. A populao estatstica tambm conhecida como universo
estatstico.
Exemplo: pessoas que possuem automvel
Amostras: so subconjuntos finitos representativos de uma dada populao.
Exemplo: pessoas que possuem automvel da marca Fiat.
Censo: exame de todos os elementos da populao.
A amostra deve ser representativa da populao da qual foi extrada, ser
parecida com ela (quantitativa e quantitativamente), devendo obedecer a dois
princpios bsicos:
Deve ser suficientemente grande;
Seus constituintes devem ter sido selecionados ao acaso.
Nem sempre possvel estudar exaustivamente todos os elementos da
populao!
12
- Pode a populao ter dimenso infinita
Exemplo: Populao constituda pelas presses atmosfricas, nos diferentes
pontos de uma cidade.
- Pode o estudo da populao levar destruio da populao
Exemplo: Populao dos fsforos de uma caixa.
- Pode o estudo da populao ser muito dispendioso
Exemplo: Sondagens exaustivas de todos os eleitores, sobre determinado
candidato.
Quando no possvel estudar, exaustivamente, todos os elementos da
populao, estudam-se s alguns elementos, a que damos o nome de Amostra.
importante a fase de escolha da amostra?
Sim, pois a amostra deve ser to representativa quanto possvel da Populao
que se pretende estudar, uma vez que vai ser a partir do estudo da amostra,
que vamos tirar concluses para a Populao.
Quando a amostra no representa corretamente a populao diz-se
destorcida e a sua utilizao pode dar origem a interpretaes erradas,
como nos seguintes exemplos:
- Utilizar uma amostra constituda por 10 flamenguistas, para prever o
vencedor do prximo Flamengo X Vasco.
- Utilizar uma amostra constituda pelos leitores habituais de determinada
revista especializada, para tirar concluses sobre a populao geral.
3 AMOSTRAGEM
Conceito: uma tcnica especial para recolher amostras que garante, tanto quanto possvel, o acaso na escolha.
Dessa forma, cada elemento da populao passa a ter a mesma chance de ser
escolhido, o que garante amostra o carter de representatividade, e isto
muito importante, pois, como vimos, nossas concluses relativas populao
vo estar baseadas nos resultados obtidos nas amostras dessa populao.
13
Daremos, a seguir, trs das principais tcnicas de amostragem.
3.1 Amostragem casual ou aleatria simples
Esta tcnica de amostragem equivalente a um sorteio lotrico:
Na prtica esta amostragem pode ser realizada da seguinte maneira:
Enumera-se a populao de 1 a n;
Sorteia-se K nmeros dessa seqncia, que representaro a amostra.
Exemplo: Vamos obter uma amostra representativa para a pesquisa de peso de
80 (oitenta) alunos de uma escola:
Numeramos os alunos de 01 a 80 (populao);
Colocamos os oitenta nmeros, em pedaos iguais de um mesmo papel, dentro de uma caixa. Agitamos e realizamos o sorteio de 8 alunos, que
representa uma amostra de 10% desta populao.
Quando o nmero de elementos da amostra grande, esse tipo de sorteio
torna-se muito trabalhoso. A fim de facilit-lo, foi elaborada uma tabela Tabela de Nmeros Aleatrios -, construda de modo que os dez algarismos
(de 0 a 9) so distribudos ao acaso nas linhas e colunas (ver anexo).
3.2 Amostragem proporcional estratificada
Muitas vezes a populao se divide em subpopulaes estratos
Como provvel, que a varivel em estudo apresente, de estrato em estrato,
um comportamento heterogneo e, dentro de cada estrato, um comportamento
homogneo, convm que o sorteio dos elementos da amostra leve em
considerao tais estratos.
exatamente isso que fazemos quando empregamos a amostragem
proporcional estratificada, que, alm de considerar a existncia de estratos,
obtm elementos da amostra proporcional ao nmero de elementos desses
estratos.
Exemplo: Vamos obter uma amostra proporcional estratificada, de 10 % do
exemplo anterior, supondo que dos 80 alunos, temos 44 meninos e 36
meninas.
14
So, portanto dois estratos, (sexo masculino e sexo feminino). Temos:
SEXO POPULAO 10 % AMOSTRA
MASCULINO 44 10 x 44 = 4,4
100
4
FEMININO 36 10 x 36 = 3,6
100
4
TOTAL 80 10 x 80 = 8
100
8
3.3 Amostragem sistemtica
Quando os elementos da populao j se acham ordenados, no h
necessidade de construir o sistema de referncia. So exemplos os pronturios
mdicos de um hospital, os nmeros de uma rua, uma linha de produo, etc.
Nestes casos, a seleo dos elementos que constituiro a amostra pode ser
feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem
denominamos sistemtica.
Assim, no caso de uma linha de produo, podemos, a cada dez itens
produzidos, retirar um para pertencer a uma amostra da produo diria. Neste
caso, estaramos fixando o tamanho da amostra em 10% da populao.
Exemplo: Supomos uma rua com 500 casas, das quais desejamos obter uma
amostra formada por 20 casas para uma pesquisa de opinio.
Neste caso, podemos usar o seguinte procedimento:
Como 500/20 = 25, escolhemos por sorteio casual um nmero de 01 a 25;
Este nmero indicar a primeira casa da amostra, vamos supor a casa de nmero 6;
Os demais elementos da amostra seriam considerados de 25 em 25;
Assim, as demais casas da amostra seriam as casas de nmeros 31 (6+25), 56 (31+25), 81 (56+25), etc.
15
III - SRIES ESTATSTICAS
TABELAS
Um dos objetivos da estatstica sintetizar os valores que uma ou mais
variveis podem assumir, para que tenhamos uma viso global da variao
dessa ou dessas variveis. Depois dos dados organizados, faz-se necessrio
que essas informaes sejam apresentadas em formato de tabelas, pois iro
nos fornecer rpidas e seguras informaes a respeito das variveis em estudo,
permitindo-nos determinaes administrativas e pedaggicas mais coerentes e
cientficas.
TABELA: um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemtica.
Uma tabela compe-se de: corpo, cabealho, coluna indicadora, linhas, casa
ou clula e ttulo. Deste modo, uma tabela deve apresentar o seguinte esquema
de representao:
1. Corpo: conjunto de linhas e colunas que contm informaes sobre a varivel em estudo;
2. Cabealho: parte superior da tabela que especifica o contedo das colunas;
3. Coluna indicadora: parte da tabela que especifica o contedo das linhas;
4. Linhas: retas imaginrias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com
as colunas;
5. Casa ou clula: cruzamento de uma coluna com uma linha, destinado a um s nmero (nunca deve ficar em branco);
6. Ttulo: designao do fato observado, local e poca;
H ainda que se considerar os elementos complementares, que so a fonte, as
notas e as chamadas, colocadas, de preferncia, no seu rodap.
Rodap: espao reservado, em seguida ao fecho da tabela, para insero de
notas de natureza informativa;
16
Fonte: entidade responsvel pelo levantamento dos dados ou pela elaborao
da tabela;
Notas: so informaes de natureza geral, destinada a conceituar ou esclarecer
o contedo das tabelas, ou indicar a metodologia adotada;
Chamadas: informaes de natureza especfica sobre determinada parte da
tabela, destinada a conceituar ou esclarecer dados.
De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela
devemos colocar:
Um trao horizontal (-) quando o valor nulo;
Trs pontos (...) quando no temos a informao;
Zero (0) quando o valor muito pequeno para ser expresso pela
unidade utilizada. Se os valores so expressos em numerais decimais,
precisamos acrescentar parte decimal um nmero correspondente de
zeros (0,0; 0,00; 0,000; .....);
Um ponto de interrogao (?) quando temos dvida quanto exatido
de determinado valor;
A letra x quando o dado for omitido, a fim de evitar individualizao das informaes.
Obs: Os lados direito e esquerdo de uma tabela oficial devem ser abertos.
17
Ex: Levantamento Epidemiolgico no Estado do Rio de Janeiro - 1970
Especificao N de Casos N de bitos
Sarampo (1) 115 15
Varola ... 10
Clera - -
Meningite 35 5
Total 150 30
Fonte: Departamento Nacional de Endemias Rurais
Nota: As atividades da campanha de vacinao abrangeram as reas de maior
incidncia.
(1) inclusive a rea urbana.
SRIES ESTATSTICAS:
Denominamos sries estatsticas toda tabela que apresenta a distribuio de
um conjunto de dados estatsticos em funo da poca, do local ou da espcie.
Dividem-se em sries homgradas e conjugadas.
Sries Homgradas: so aquelas em que a varivel descrita apresenta variao discreta ou descontnua. Podem ser do tipo temporal,
geogrfica ou especfica.
a) Srie Temporal: Identifica-se pelo carter varivel do fator cronolgico. O
local e a espcie (fenmeno) so elementos fixos. Esta srie tambm
chamada de histrica, cronolgica, marcha ou evolutiva.
ABC VECULOS LTDA.
Vendas no 1 bimestre de 1996
PERODO UNIDADES
VENDIDAS (mil)
JAN/96 20
FEV/96 10
TOTAL 30
b) Srie Geogrfica: Apresenta como elemento varivel o fator geogrfico. A
poca e o fato (espcie) so elementos fixos. Tambm chamada de espacial,
territorial ou de localizao.
18
ABC VECULOS LTDA.
Vendas no 1 bimestre de 1996
FILIAIS UNIDADES
VENDIDAS (mil)
SO PAULO 13
RIO DE JANEIRO 17
TOTAL 30
c) Srie Especfica: O carter varivel apenas o fato ou espcie. Tambm
chamada de srie categrica.
ABC VECULOS LTDA.
Vendas no 1 bimestre de 1996
MARCA UNIDADES
VENDIDAS (mil)
FIAT 18
GM 12
TOTAL 30
Sries conjugadas: Tambm chamadas de tabelas de dupla entrada. So apropriadas apresentao de duas ou mais sries de maneira
conjugada, havendo duas ordens de classificao: uma horizontal e
outra vertical. O exemplo abaixo de uma srie geogrfica-temporal.
ABC VECULOS LTDA.
Vendas no 1 bimestre de 1996 (em mil unidades)
FILIAIS JANEIRO FEVEREIRO
SO PAULO 10 3
RIO DE JANEIRO 12 5
TOTAL 22 8
19
DADOS ABSOLUTOS E DADOS RELATIVOS
Dados absolutos: so dados resultantes da coleta direta da fonte, sem outra manipulao seno a contagem ou medida.
A leitura dos dados absolutos sempre enfadonha e inexpressiva; embora
esses dados traduzam um resultado exato e fiel, no tm a virtude de ressaltar
de imediato as suas concluses numricas. Da o uso imprescindvel que faz a
Estatstica dos dados relativos.
Dados relativos: so os resultados de comparaes por quocientes (razes) que se estabelecem entre dados absolutos e tm por finalidade
realar ou facilitar as comparaes entre quantidades.
Traduzem-se os dados relativos, em geral, por meio de percentagens, ndices,
coeficientes e taxas.
1 Percentagens
Considere a srie:
MATRCULAS NAS ESCOLAS DA CIDADE A 1995
CATEGORIAS N. DE ALUNOS
1 Grau 19286
2 Grau 1681
3 Grau 234
TOTAL 21201 Dados fictcios.
Calculemos as percentagens dos alunos da cada grau:
1 grau 19286 x 100 = 90,96 = 91,0 21201
2 grau 1681 x 100 = 7,92 = 7,9 21201
3 grau 234 x 100 = 1,10 = 1,1 21201
20
Com esses dados, podemos formar uma nova coluna na srie em estudo:
MATRCULAS NAS ESCOLAS DA CIDADE A 1995
CATEGORIAS N. DE ALUNOS %
1 Grau 19286 91,0
2 Grau 1681 7,9
3 Grau 234 1,1
TOTAL 21201 100 Dados fictcios.
Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade A,
91 esto matriculados no 1 grau, 8 aproximadamente no 2 grau e 1 no 3
grau.
O emprego da porcentagem de grande valia quando nosso intuito destacar
a participao da parte no todo.
NOTAS:
Do mesmo modo que tomamos 100 para base de comparao, tambm podemos tomar outro nmero qualquer, entre os quais destacamos o
nmero 1. claro que, supondo o total igual a 1, os dados relativos das
parcelas sero todos menores que 1.
Em geral, quando usamos 100 para base, os dados so arredondados at a primeira casa decimal; e quando tomamos 1 por base, so
arredondados at a terceira casa decimal.
Exerccio: Complete a tabela abaixo
ESCOLAS N. DE ALUNOS DADOS RELATIVOS
POR 1 POR 100
A 175 0,098 9,8
B 222
C 202
D 362
E 280
F 540
TOTAL 1781 1,000 100,0
21
2 ndices
Os ndices so razes entre duas grandezas tais que uma no inclui a outra.
So exemplos de ndices:
ndice ceflico = dimetro transversal do crnio x 100
dimetro longitudinal do crnio
Quociente intelectual = idade mental x 100
idade cronolgica
Densidade demogrfica = populao
superfcie
ndice econmicos:
Produo per capta = valor total da produo
populao
Consumo per capta = consumo do bem
populao
Renda per capta = renda____
populao
Receita per capta = receita__
populao
3 Coeficientes
Os coeficientes so razes entre o nmero de ocorrncias e o nmero total
(nmero de ocorrncias e nmero de no-ocorrncias).
22
So exemplos de coeficientes:
Coeficiente de natalidade = nmero de nascimentos
populao total
Coeficiente de mortalidade = nmero de bitos__
populao total
Coeficiente educacionais:
Coeficiente de evaso escolar = n. de alunos evadidos__
n. inicial de matrculas
Coeficiente de aproveitamento escolar = n. de alunos aprovados
n. final de matrculas
Coeficiente de recuperao escolar = n. de alunos recuperados_
n. de alunos em recuperao
4 Taxas
As taxas so os coeficientes multiplicados por uma potncia de 10 (10, 100,
1000 etc.) para tornar o resultado mais inteligvel.
So exemplos de taxas:
Taxa de natalidade = Coeficiente de natalidade X 1000
Taxa de mortalidade = Coeficiente de mortalidade X 1000
Taxa de evaso escolar = Coeficiente de evaso escolar X 100
23
Exerccios:
1 Considere a srie estatstica:
SRIES ALUNOS MATRIC. %
1 546
2 328
3 280
4 120
TOTAL 1274
Complete-a, determinando as percentagens com uma casa decimal e fazendo a
compensao, se necessrio.
2 Uma escola apresentava, no final do ano, o seguinte quadro:
SRIES MATRICULAS
MARO NOVEMBRO
1 480 475
2 458 456
3 436 430
4 420 420
TOTAL 1794 1781
a. Calcule a taxa de evaso por srie
b. Calcule a taxa de evaso da escola
3 Considerando que Minas Gerais, em 1992, apresentou (dados fornecidos pelo IBGE):
Populao: 15.957,6 mil habitantes;
Superfcie: 586.624 Km2;
Nascimentos: 292036;
bitos: 99281.
Calcule:
a. o ndice da densidade demogrfica;
b. a taxa de natalidade;
c. a taxa de mortalidade;
24
IV - GRFICOS ESTATSTICOS
1- Conceito:
O grfico um mtodo de representao de dados estatsticos em forma
visual, por meio de figuras geomtricas. Devem corresponder, mas nunca
substituir as tabelas estatsticas.
uma forma de apresentao dos dados estatsticos, cujo objetivo o de
produzir, no investigador ou no pblico em geral, uma impresso mais rpida
e viva do fenmeno em estudo, j que os grficos falam mais compreenso
que as sries.
Para tornarmos possvel uma representao grfica, estabelecemos uma
correspondncia entre os termos da srie e determinada figura geomtrica, de
tal modo que cada elemento da srie seja representado por uma figura
proporcional.
A representao grfica deve obedecer a certos requisitos fundamentais como:
Simplicidade deve proporcionar que o observador analise
rapidamente o fenmeno apresentado;
Clareza deve proporcionar que o observador tenha uma correta leitura
dos valores representativos do fenmeno;
Veracidade deve expressar a verdade sobre o fenmeno estatstico
representado.
2 - Caractersticas:
Grficos de informao: So grficos destinados principalmente ao pblico
em geral, objetivando proporcionar uma visualizao rpida e clara. So
grficos tipicamente expositivos, dispensando comentrios explicativos
adicionais. As legendas podem ser omitidas, desde que as informaes
desejadas estejam presentes.
Grficos de anlise: So grficos que se prestam melhor ao trabalho
estatstico, fornecendo elementos teis fase de anlise dos dados, sem deixar
de ser tambm informativos. Os grficos de anlise freqentemente vm
25
acompanhados de uma tabela estatstica. Inclui-se, muitas vezes um texto
explicativo, chamando a ateno do leitor para os pontos principais revelados
pelo grfico.
Uso indevido de Grficos: Podem trazer uma idia falsa dos dados que esto
sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade,
de um problema de construo de escalas.
3 - Classificao dos grficos:
Os principais grficos so os Diagramas, Estereogramas, Pictogramas e
Cartogramas.
3.1 - Diagramas:
So grficos geomtricos dispostos, no mximo, em duas dimenses. So os
mais usados na representao de sries estatsticas. Eles podem ser em linhas,
em barras horizontais, em barras verticais (colunas), e em setores.
Grficos em linhas ou lineares
O grfico em linha constitui uma aplicao do processo de representao das
funes num sistema de coordenadas cartesianas.
Como sabemos, nesse sistema fazemos uso de duas retas perpendiculares; as
retas so os eixos coordenados e o ponto de interseco, a origem. O eixo
horizontal denominado eixo das abscissas (ou eixo dos x) e o vertical, eixo
das ordenadas (ou eixo dos y). Para exemplificar considere a srie:
26
Determinamos, graficamente, todos os pontos da srie, usando as
coordenadas, ligamos todos esses pontos, dois a dois, por segmentos de reta, o
que ir nos dar uma poligonal, que o grfico em linha ou em curva
correspondente a srie do exemplo.
So freqentemente usados para representao de sries cronolgicas com um
grande nmero de perodos de tempo. As linhas so mais eficientes do que as
colunas, quando existem intensas flutuaes nas sries ou quando h
necessidade de se representarem vrias sries em um mesmo grfico.
Quando representamos, em um mesmo sistema de coordenadas, a variao de
dois fenmenos, a parte interna da figura formada pelos grficos desses
fenmenos denominada de rea de excesso.
27
Grficos em colunas ou barras
a representao de uma srie por meio de retngulos, dispostos
verticalmente (em colunas) ou horizontalmente (em barras).
Quando em colunas, os retngulos tm a mesma base e as alturas so
proporcionais aos respectivos dados.
Quando em barras, os retngulos tm a mesma altura e os comprimentos so
proporcionais aos respectivos dados.
Exemplo: Grfico em colunas
28
Exemplo: Grfico em barras
NOTAS:
Quando as legendas no so breves usa-se de preferncia os grficos em barras horizontais;
A ordem a ser observada a cronolgica, se a srie for histrica, e a decrescente, se for geogrfica ou categrica;
A distncia entre as colunas (ou barras), por questes estticas, no dever ser menor que a metade nem maior que os dois teros da largura
(ou da altura) dos retngulos.
Grficos em barras ou colunas mltiplas
29
Eles diferem dos grficos em barras ou colunas convencionais apenas pelo
fato de apresentar cada barra ou coluna segmentada em partes componentes.
Servem para representar comparativamente dois ou mais atributos.
Grficos em setores
Este grfico construdo com base em um crculo, e empregado sempre que
desejamos ressaltar a participao do dado no total.
O total representado pelo crculo, que fica dividido em tantos setores quantas
so as partes.
Os setores so tais que suas reas so respectivamente proporcionais aos
dados da srie. Obtemos cada setor por meio de uma regra de trs simples e
direta, lembrando que o total da srie corresponde a 360.
30
O grfico em setores s deve ser empregado quando h, no mximo, sete
dados.
Obs: As sries temporais geralmente no so representadas por este tipo de
grfico.
31
3.2 - Estereogramas:
So grficos geomtricos dispostos em trs dimenses, pois representam
volume. So usados nas representaes grficas das tabelas de dupla entrada.
Em alguns casos este tipo de grfico fica difcil de ser interpretado dada a
pequena preciso que oferecem.
3.3 - Pictogramas:
So construdos a partir de figuras representativas da intensidade do
fenmeno. Este tipo de grfico tem a vantagem de despertar a ateno do
pblico leigo, pois sua forma atraente e sugestiva. Os smbolos devem ser
auto-explicativos. A desvantagem dos pictogramas que apenas mostram uma
viso geral do fenmeno, e no de detalhes minuciosos. Veja o exemplo
abaixo:
32
3.4 - Cartogramas: So ilustraes relativas a cartas geogrficas (mapas). O
objetivo desse grfico o de figurar os dados estatsticos diretamente
relacionados com reas geogrficas ou polticas.
Distinguimos duas aplicaes:
a. representar os dados absolutos (populao) neste caso, lanamos mo, em geral, dos pontos, em nmero
proporcional aos dados.
b. representar dados relativos (densidade) - neste caso, lanamos mo, em geral, de hachuras ou cores.
33
34
V - DISTRIBUIO DE FREQUENCIA
1 Tabela Primitiva e Rol
Considere a coleta de dados a seguir de uma varivel qualquer relativa a uma
pesquisa com vinte pessoas:
Ex: 45, 41, 42, 41, 42, 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51.
Esse tipo de tabela chamada de tabela primitiva, ou seja:
Tabela primitiva ou dados brutos: uma tabela ou relao de elementos que
no foram numericamente organizados.
Assim, conhecidos os valores de uma varivel, difcil formarmos uma idia
exata do comportamento do grupo como um todo, a partir de dados no
ordenados. Em razo disso, pouca informao se consegue obter
inspecionando os dados anotados. Mesmo uma informao to simples como a
de saber o valor mximo e mnimo requer certo exame dos dados da tabela.
ROL: a tabela obtida aps a ordenao dos dados, em ordem crescente ou
decrescente.
Para o exemplo acima temos:
Rol: 41, 41, 41, 42, 42, 43, 44, 45, 46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60,
60.
Essa classificao dos dados proporciona algumas vantagens concretas com
relao sua forma original:
- possvel visualizar de forma ampla as variaes de consumo;
- os valores extremos so percebidos de imediato;
- possvel observar a tendncia de concentrao dos valores.
Apesar de o rol propiciar ao analista mais informaes e com menos esforo
de concentrao do que os dados brutos, ainda assim persiste o problema de a
anlise ter que se basear nas 20 observaes. O problema se agravar quando
o nmero de dados for muito grande.
35
2 Distribuio de Frequncia
um tipo de tabela que condensa uma coleo de dados conforme as
freqncias (repeties de seus valores). A forma pela qual podemos
descrever os dados estatsticos resultantes de variveis quantitativas, como o
caso de notas obtidas pelos alunos de uma classe, estaturas de um conjunto de
pessoas, salrios recebidos pelos operrios de uma fbrica etc.
Frequncia: a quantidade que fica relacionada a um determinado valor da
varivel.
Distribuio de frequncia sem intervalos de classe: a simples
condensao dos dados conforme as repeties de seus valores. Para um ROL
de tamanho razovel esta distribuio de frequncia inconveniente, j que
exige muito espao. Veja exemplo abaixo:
Dados Frequncia
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1
52 1
54 1
57 1
58 2
60 2
TOTAL 20
36
Distribuio de frequncia com intervalos de classe: Quando o tamanho da
amostra elevado mais racional efetuar o agrupamento dos valores em
vrios intervalos de classe.
Classes Frequncias
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20
3 Elementos de uma Distribuio de Frequncia com Intervalos de Classe:
3.1 Classe
As classes so representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k
(onde K o nmero total de classes da distribuio).
Na tabela do exemplo anterior, a distribuio formada por cinco classes,
ento temos k = 5 e o intervalo de classe 49 |------- 53 representa a 3 classe,
ou seja, i = 3.
3.2 Limites de classe
O menor nmero o limite inferior de classe (li) e o maior nmero, limite
superior de classe (Li).
Na classe 49 |------- 53, temos:,l3 = 49 e L3 = 53.
O smbolo |------- representa um intervalo fechado esquerda e aberto
direita. O dado 53 do ROL no pertence a classe 3 e sim a classe 4, que
representada por 53 |------- 57.
Classe de frequncia ou, simplesmente, classes so os intervalos de variao
da varivel.
Limites de classe so os extremos de cada classe.
37
3.3 Amplitude do intervalo de classe
Ela obtida atravs da diferena entre o limite superior e inferior da classe e
simbolizada por:
Na tabela do exemplo anterior hi = 53 - 49 = 4. Obs: Na distribuio de
frequncia com classes o hi ser igual em todas as classes, como mostrado a
seguir:
hi = 57 - 53 = 4
hi = 49 - 45 = 4
3.4 Amplitude total da distribuio
Na tabela anterior AT = 61 - 41= 20
Nota: evidente que, se as classes possuem o mesmo intervalo, verificamos a
relao:
3.5 Amplitude amostral
Em nosso exemplo AA = 60 - 41 = 19.
Obs: AT sempre ser maior que AA.
Amplitude do intervalo de classe ou, simplesmente, intervalo a medida do
intervalo que define a classe.
Amplitude total da distribuio (AT) a diferena entre o limite superior da
ltima classe e o limite inferior da primeira classe.
AT = Lmax - lmin.
hi = Li - li
AT = k
hi
Amplitude amostral (AA) a diferena entre o valor mximo e o valor mnimo
da amostra (obtidos atravs do ROL).
AA = Xmax - Xmin
38
3.6 Ponto mdio da classe
Para obtermos o ponto mdio de uma classe, calculamos a semi-soma dos
limites da classe (mdia aritmtica):
No intervalo da 3 classe 49 |------- 53 o ponto mdio x3 calculado:
x3 = (l3 + L3)/2 = (53 + 49)/2 = 51
Obs.: O ponto mdio da classe o valor que a representa para efeito de
clculos de medidas de posio e disperso ou variabilidade.
3.7 Frequncia simples ou absoluta
A frequncia simples simbolizada por fi (lemos f ndice i ou frequncia da
classe i).
Assim, considerando o exemplo abaixo, temos:
ESTATURAS DE 40 ALUNOS NA ESCOLA A
ESTATURA (cm) FREQUNCIA
150 |------- 154 4
154 |------- 158 9
158 |------- 162 11
162 |------- 166 8
166 |------- 170 5
170 |------- 174 3
TOTAL 40
f1 = 4; f2 = 9; f3 = 11; f4 = 8; f5 = 5 e f6 = 3.
A soma das freqncias sempre igual ao total da amostra.
Ponto mdio da classe (xi) , como o prprio nome indica, o ponto que divide
o intervalo de classe em duas partes iguais.
xi = li + Li
2
Frequncia simples ou frequncia absoluta ou simplesmente, frequncia de
uma classe ou de um valor individual o nmero de observaes
correspondentes a essa classe ou a esse valor.
39
Exerccio 1: As notas obtidas por 50 alunos de uma classe foram:
1; 2; 3; 4; 5; 6; 6; 7; 7; 8; 2; 3; 3; 4; 5; 6; 6; 7; 8; 8; 2; 3; 4; 4; 5; 6; 6; 7; 8; 9;
2; 3; 4; 5; 5; 6; 6; 7; 8; 9; 2; 3; 4; 5; 5; 6; 7; 7; 8; 9;
a) Complete a distribuio de frequncia abaixo:
i Notas xi fi
1 0 |--- 2
2 2 |--- 4
3 4 |--- 6
4 6 |--- 8
5 8 |--- 10
Total 50
b) Agora, responda:
1. Qual a amplitude amostral?
2. Qual a amplitude da distribuio?
3. Qual o nmero de classes da distribuio?
4. Qual o limite inferior da quarta classe?
5. Qual o limite superior da classe de ordem 2?
6. Qual a amplitude do segundo intervalo de classe?
7. Qual a frequncia da terceira classe?
c) Complete:
1. h3 = .......
2. n = ........
3. l1 = ........
4. L3 = ........
5. x2 = ........
6. f5 = ........
40
4 Tipos de Freqncias
A soma das freqncias simples igual ao nmero total de dados da
distribuio.
A soma das frequncias relativas igual a 1 ou 100 %.
Logo, para o exemplo da pgina 36 a frequncia da terceira classe :
fr3 = f3/n ; fr3 = 11/40 = 0,275
O propsito das frequncias relativas o de permitir a anlise ou facilitar as
comparaes.
Assim, no exemplo, a frequncia acumulada correspondente terceira classe
:
F3 = f1 + f2 + f3 = 4 + 9 + 11 = 24
O que significa existirem 24 alunos com estatura inferior a 162 cm (limite
superior do intervalo da terceira classe).
Assim, no exemplo, para a terceira classe, temos:
Fr3 = F3 / fi = 24/40 = 0,600
Frequncia simples ou absolutas (fi) so os valores que realmente
representam o nmero de dados de cada classe.
Frequncias relativas: so os valores das razes entre as freqncias
absolutas de cada classe e a frequncia total da distribuio.
Frequncia acumulada de uma classe (Fi): o total das frequncias de todos
os valores inferiores ao limite superior do intervalo de uma determinada
classe:
Fk = f1 + f2 + f3 + ...... + fK
Frequncia acumulada relativa (Fri) de uma classe: a frequncia
acumulada da classe, dividida pela frequncia total da distribuio.
Fri = Fi / fi
41
Exerccio 2: Complete o quadro com as frequncia que se pede.
CLASSE xi fi Fi fri (%) Fri (%)
50 |----- 54 52 4
54 |----- 58 56 9
58 |----- 62 60 11
62 |----- 66 64 8
66 |----- 70 68 5
70 |----- 74 72 3
Total -- 40 -- 100 --
Sendo xi = ponto mdio de classe; fi = frequncia simples; Fi = frequncia
Acumulada; fri (%) = frequncia percentual e Fri (%) = frequncia percentual
acumulada.
5 - Mtodo Prtico para Construo de uma Distribuio de Freqncias com
Classes:
1 - Organize os dados brutos em um ROL.
2 - Calcule a amplitude amostral AA. Para o exemplo da pgina 32, temos:
AA = 60 - 41 = 19
3 - Calcule o nmero de classes atravs da:
a) Regra de Sturges:
n i = n de classes
3 ---- 5 3
6 ---- 11 4
12 ---- 22 5
23 ---- 46 6
47 ---- 90 7
91 ---- 181 8
182---- 362 9
b) Raiz quadrada de n. (usa-se somente a parte inteira do nmero quando a
raiz no for exata).
Obs: Qualquer regra para determinao do n de classes da tabela no nos leva
a uma deciso final; esta vai depender na realidade de um julgamento pessoal,
que deve estar ligado natureza dos dados.
42
No nosso exemplo: n = 20 dados, ento, a regra sugere a adoo de 5 classes
pela regra de Sturges e de 4 classes pela regra da raiz quadrada, ficando a
critrio de quem vai fazer a distribuio de frequncia.
4 - Decidido o n de classes, calcule ento a amplitude do intervalo de classe
h > AA / i.
No nosso exemplo: AA / i = 19/4 = 4,75. Obs: Como h > AA / i um valor
ligeiramente superior para haver folga na ltima classe. Utilizaremos ento
h = 5.
5 - Temos ento o menor n da amostra, o n de classes e a amplitude do
intervalo. Podemos montar a tabela, com o cuidado para no aparecer classes
com frequncia = 0 (zero).
No nosso exemplo: o menor n da amostra = 41 + h = 46, logo a primeira
classe ser representada por 41 |------- 46. As classes seguintes respeitaro o
mesmo procedimento.
O primeiro elemento da classe seguinte sempre ser formado pelo ltimo
elemento da classe anterior.
6 - Representao Grfica de uma Distribuio
Uma distribuio de frequncia pode ser representada graficamente pelo
Histograma, pelo Polgono de frequncia e pelo Polgono de frequncia
acumulada (alguns autores denominam de ogiva de Galton).
Em todos os grficos acima utilizamos o primeiro quadrante do sistema de
eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das
abscissas) colocamos os valores da varivel e na linha vertical (eixo das
ordenadas), as frequncias.
6.1 - Histograma
A rea de um histograma proporcional soma das frequncias simples ou
absolutas.
O Histograma formado por um conjunto de retngulos justapostos, cujas
bases se localizam sobre o eixo horizontal, de tal modo que seus pontos
mdios coincidam com os pontos mdios dos intervalos de classe.
43
Para o exemplo a seguir, temos o seguinte histograma:
ESTATURAS DE 40 ALUNOS NA ESCOLA A
ESTATURA
(cm)
FREQUNCIA
150 |------- 154 4
154 |------- 158 9
158 |------- 162 11
162 |------- 166 8
166 |------- 170 5
170 |------- 174 3
TOTAL 40
6.2 Polgono de Frequncia
Para realmente obtermos um polgono (linha fechada), devemos completar a
figura, ligando os extremos da linha obtida aos pontos mdios da classe
anterior primeira e da posterior ltima, da distribuio.
O Polgono de frequncia um grfico em linha, sendo as frequncias
marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos
mdios dos intervalos de classe.
44
Para o exemplo anterior temos o seguinte Polgono de frequncia:
6.3 Polgono de Frequncia Acumulada
Para o exemplo em estudo temos o seguinte Polgono de frequncia
acumulada:
O Polgono de frequncia acumulada traado marcando-se as frequncias
acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos
correspondentes aos limites superiores dos intervalos de classe.
45
Uma distribuio de frequncia sem intervalos de classe representada
graficamente por um diagrama onde cada valor da varivel representado por
um segmento de reta varivel e de comprimento proporcional respectiva
frequncia.
Exerccio 3: Complete o quadro com as frequncia que se pede e com base
nele construa o histograma, polgono de frequncia e polgono de frequncia
acumulada.
CLASSE xi fi Fi fi (%) Fi (%)
50 |----- 54 52 4
54 |----- 58 56 9
58 |----- 62 60 11
62 |----- 66 64 8
66 |----- 70 68 5
70 |----- 74 72 3
Total -- 40 -- 100 --
Sendo xi = ponto mdio de classe; fi = frequncia simples; Fi = frequncia
Acumulada; fi (%) = frequncia percentual; Fi(%) = frequncia percentual
acumulada.
46
VI - MEDIDAS DE POSIO
1 Introduo
O estudo que fizemos sobre distribuies de frequncia, at agora, permite-nos
descrever, de modo geral, os grupos dos valores que uma varivel pode
assumir. Dessa forma, podemos localizar a maior concentrao de valores de
uma dada distribuio, isto , se ela se localiza no incio, no meio ou no final,
ou ainda, se h uma distribuio por igual.
Porm, para ressaltar as tendncias caractersticas de cada distribuio,
isoladamente, ou em confronto com outras, necessitamos introduzir conceitos
que se expressam atravs de nmeros, que nos permitam traduzir essas
tendncias. Esses conceitos so denominados elementos tpicos da
distribuio e so as:
a. medidas de posio;
b. medidas de variabilidade ou disperso;
c. medidas de assimetria;
d. medidas de curtose.
Dentre os elementos tpicos, destacamos, neste captulo, as medidas de
posio - estatsticas que representam uma srie de dados orientando-nos
quanto posio da distribuio em relao ao eixo horizontal do grfico da
curva de freqncia.
As medidas de posies mais importantes so as medidas de tendncia
central ou promdias, que recebem tal denominao pelo fato de os dados
observados tenderem, em geral, a se agruparem em torno dos valores centrais.
Dentre as medidas de tendncia central, destacamos:
a. a mdia aritmtica;
b. a moda;
c. a mediana.
Outras promdias menos usados so as mdias: geomtrica, harmnica,
quadrtica, cbica e biquadrtica.
47
As outras medidas de posio so as separatrizes, que englobam: a prpria
mediana, os decis, os quartis e os percentis.
2 Mdia Aritmtica ( )
Em um conjunto de dados, podemos definir vrios tipos de mdias. Porm, em
nossos estudos iremos nos limitar mais importante: a mdia aritmtica.
onde xi so os valores da varivel e n o nmero de valores.
2.1 Dados no - agrupados
Quando desejamos conhecer a mdia dos dados no-agrupados em tabelas de
freqncias, determinamos a mdia aritmtica simples.
Exemplo: Sabendo-se que a venda diria de arroz tipo A, durante uma semana,
foi de 10, 14, 13, 15, 16, 18 e 12 kg, temos, para venda mdia diria na
semana de:
.= (10+14+13+15+16+18+12) / 7 = 14 kg
Logo: .= 14 Kg
s vezes, a mdia pode ser um nmero diferente de todos os da srie de dados
que ela representa. o que acontece quando temos os valores 2, 4, 6 e 8, para
os quais a mdia 5. Esse ser o nmero representativo dessa srie de valores,
embora no esteja representado nos dados originais. Neste caso, costumamos
dizer que a mdia no tem existncia concreta.
2.2 Desvio em relao mdia
Mdia Aritmtica quociente entre a soma dos valores da varivel pelo
nmero deles:
Denominamos Desvio em relao mdia a diferena entre cada elemento de
um conjunto de valores e a mdia aritmtica.
48
Designando o desvio por di, temos:.di = Xi -
No exemplo anterior temos sete desvios:...
d1 = 10 - 14 = - 4;
d2 = 14 - 14 = 0;
d3 = 13 - 14 = - 1;
d4 = 15 - 14 = 1;
d5 = 16 - 14 = 2;
d6 = 18 - 14 = 4;
d7 = 12 - 14 = - 2.
2.3 .Propriedades da mdia
1 propriedade: A soma algbrica dos desvios em relao mdia nula.
Ou seja:
No exemplo anterior: d1 + d2 + d3 + d4 + d5 + d6 + d7 = 0
2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos
os valores de uma varivel, a mdia do conjunto fica aumentada (ou
diminuda) dessa constante.
Se no exemplo anterior, somarmos a constante 2 a cada um dos valores da
varivel temos:
Y = (12+16+15+17+18+20+14) / 7 = 16 kg
Ou seja, Y = .+ 2 = 14 +2 = 16 kg
49
3 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de
uma varivel por uma constante (c), a mdia do conjunto fica
multiplicada (ou dividida) por essa constante.
Se no exemplo anterior multiplicarmos a constante 3 a cada um dos valores da
varivel temos:
Y = (30+42+39+45+48+54+36) / 7 = 42 kg
Ou seja, Y = x 3 = 14 x 3 = 42 kg
2.4 Dados Agrupados
A mdia aritmtica sem intervalos de classe
Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando
para varivel o nmero de filhos do sexo masculino. Calcularemos a
quantidade mdia de meninos por famlia:
N de meninos Freqncia = fi
0 2
1 6
2 10
3 12
4 4
= 34
Neste caso, como as freqncias so nmeros indicadores da intensidade de
cada valor da varivel, elas funcionam como fatores de ponderao, o que nos
leva a calcular a mdia aritmtica ponderada, dada pela frmula:
50
O modo mais prtico de obteno da mdia ponderada abrir, na tabela, uma
coluna correspondente aos produtos xifi:
xi fi xi . fi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
=34 =78
Temos, xifi = 78 e f i = 34
Logo xifi / f i = 78 / 34 = 2,3
Portanto a mdia de 2,3 meninos por famlia
Nota:
- Sendo x uma varivel discreta, como interpretar o resultado obtido, 2
meninos e 3 dcimos de menino?
O valor mdio de 2,3 meninos sugere, neste caso, que o maior nmero de
famlias tem 2 meninos e 2 meninas, sendo, porm, a tendncia geral de uma
leve superioridade numrica em relao ao nmero de meninos.
A mdia aritmtica com intervalos de classe
Neste caso, convencionamos que todos os valores includos em um
determinado intervalo de classe coincidem com o seu ponto mdio, e
determinamos a mdia aritmtica ponderada por meio da frmula:
Onde xi o ponto mdio da classe.
51
Exemplo: Considere a distribuio de frequncia abaixo, relativo a estaturas
em cm de bebs. Calcular a estatura mdia de bebs conforme a tabela abaixo.
i Estaturas (cm) fi
1 50 |------- 54 4
2 54 |------- 58 9
3 58 |------- 62 11
4 62 |------- 66 8
5 66 |------- 70 5
6 70 |------- 74 3
= 40
Pela mesma razo do caso anterior, vamos, inicialmente, abrir uma coluna
para os pontos mdios (xi) e outra para os produtos xifi:
i Estaturas (cm) fi xi xi.fi
1 50 |------- 54 4 52 208
2 54 |------- 58 9 56 504
3 58 |------- 62 11 60 660
4 62 |------- 66 8 64 512
5 66 |------- 70 5 68 340
6 70 |------- 74 3 72 216
= 40 = 2.440
Temos, xifi = 2440 e f i = 40; Logo xifi / f i = 2440 / 40 = 61
Portanto, a estatura mdia dos bebs de 61 cm.
2.5 Emprego da mdia
A mdia utilizada quando:
a. desejamos obter a medida de posio que possui a maior estabilidade;
b. houver necessidade de um tratamento algbrico ulterior.
52
3 Moda
Mo o smbolo da moda.
Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais
comum, isto , o salrio recebido pelo maior nmero de empregados dessa
fbrica.
3.1 Dados no - agrupados
Quando lidamos com dados no-agrupados, a moda facilmente reconhecida:
basta, de acordo com definio, procurar o valor que mais se repete.
Exemplo: Na srie de dados {7, 8, 9, 10, 10, 10, 11, 12} a moda igual a 10.
H sries nas quais no exista valor modal, isto , nas quais nenhum valor
aparea mais vezes que outros.
Exemplo: {3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.
.Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos,
ento, que a srie tem dois ou mais valores modais.
Exemplo: {2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7.
A srie bimodal.
3.2 Dados agrupados
Sem intervalos de classe
Uma vez agrupados os dados, possvel determinar imediatamente a moda:
basta fixar o valor da varivel de maior freqncia.
Exemplo: Qual a temperatura mais comum medida no ms abaixo:
Temperaturas ( C) Freqncia
0 3
1 9
2 12
3 6
Resp: 2 C a temperatura modal, pois a de maior freqncia (12 vezes).
Denominamos Moda o valor que ocorre com maior freqncia em uma srie
de valores.
53
Com intervalos de classe
A classe que apresenta a maior freqncia denominada classe modal. Pela
definio, podemos afirmar que a moda, neste caso, o valor dominante que
est compreendido entre os limites da classe modal.
O mtodo mais simples para o clculo da moda consiste em tomar o ponto
mdio da classe modal. Damos a esse valor a denominao de moda bruta.
Onde: l* = limite inferior da classe modal;
L*= limite superior da classe modal.
Exemplo: Calcule a estatura modal conforme a tabela abaixo.
Classes
(cm) Freqncia
54 |-------- 58 9
58 |-------- 62 11
62 |-------- 66 8
66 |-------- 70 5
Resposta: A classe modal 58 |------ 62, pois a de maior frequncia.
l* = 58 e L* = 62
Mo = (58+62) / 2 = 60 cm (este valor estimado, pois no conhecemos o
valor real da moda).
H, para o clculo da moda, outros mtodos mais elaborados, como, por
exemplo, o que faz uso da frmula de Czuber:
Na qual:
l* o limite inferior da classe modal;
54
h* a amplitude da classe modal;
D1 = f* - f (ant.);
D2 = f* - f (post.);
Sendo:
f* a frequencia simples da classe modal;
f (ant.) a frequencia simples da classe anterior classe modal;
f (post.) a frequencia simples da classe posterior classe modal.
Exemplo: Considere a distribuio a seguir
Classes fi
150 |------ 154 4
154 |------ 158 9
158 |------ 162 11
162 |------ 166 8
166 |------ 170 5
170 |------ 174 3
Total 40
Temos:
D1 = 11 9 = 2 e D2 = 11 8 = 3;
Mo = 158 + 2 x 4 = 159,6 cm
2 + 3
3.3 Emprego da moda
A moda utilizada quando:
a. desejamos obter uma medida rpida e aproximada de posio;
b. quando a medida de posio deva ser o valor mais tpico da
distribuio.
55
4 Mediana
Smbolo da mediana: Md
4.1 Dados no-agrupados
Dada uma srie de valores como, por exemplo:
{5, 2, 6, 13, 9, 15, 10}
De acordo com a definio de mediana, o primeiro passo a ser dado o da
ordenao (crescente ou decrescente) dos valores:
{2, 5, 6, 9, 10, 13, 15}
Em seguida, tomamos aquele valor central que apresenta o mesmo nmero de
elementos direita e esquerda. Neste caso o valor que divide a srie acima
em duas partes iguais o 9, logo a Md = 9.
Se, porm, a srie dada tiver um nmero par de termos, a mediana ser, por
definio, qualquer dos nmeros compreendidos entre os dois valores centrais
da srie. Convencionou-se utilizar o ponto mdio.
.Mtodo prtico para o clculo da Mediana
a) Se a srie dada tiver nmero mpar de termos:
O valor mediano ser o termo de ordem dado pela frmula:
( n + 1 ) / 2
Exemplo: Calcule a mediana da srie {1, 3, 0, 0, 2, 4, 1, 2, 5}
1 - ordenar a srie {0, 0, 1, 1, 2, 2, 3, 4, 5}
n = 9, logo (n + 1)/2 dado por (9 + 1) / 2 = 5, ou seja, o 5 elemento da srie
ordenada ser a mediana.
A mediana ser o 5 elemento = 2
A Mediana de um conjunto de valores, dispostos segundo uma ordem
(crescente ou decrescente), o valor situado de tal forma no conjunto que o
separa em dois subconjuntos de mesmo nmero de elementos.
56
b) Se a srie dada tiver nmero par de termos:
O valor mediano ser dado pela frmula:
. [( n/2 ) +( n/2+ 1 )] / 2
Obs.: n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo valor
correspondente.
Exemplo: Calcule a mediana da srie {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}
1 - ordenar a srie {0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
n = 10, logo a frmula ficar: [(10/2 ) + (10/2 + 1)] / 2
[(5 + 6)] / 2, ser na realidade (5 termo+ 6 termo) / 2
5 termo = 2 e 6 termo = 3
A mediana ser = (2 + 3) / 2, ou seja, Md = 2,5. A mediana no exemplo ser a
mdia aritmtica do 5 e 6 termos da srie.
Notas:
Quando o nmero de elementos da srie estatstica for mpar, haver
coincidncia da mediana com um dos elementos da srie.
Quando o nmero de elementos da srie estatstica for par, nunca haver
coincidncia da mediana com um dos elementos da srie. A mediana
ser sempre a mdia aritmtica dos 2 elementos centrais da srie.
Em uma srie a mediana, a mdia e a moda no tm, necessariamente, o
mesmo valor.
A mediana depende da posio e no dos valores dos elementos na srie
ordenada. Essa uma da diferenas marcantes entre mediana e mdia
(que se deixa influenciar, e muito, pelos valores extremos). Vejamos:
Em {5, 7, 10, 13, 15}; a mdia = 10 e a mediana = 10
Em {5, 7, 10, 13, 65}; a mdia = 20 e a mediana = 10
Isto , a mdia do segundo conjunto de valores maior do que a do primeiro,
por influncia dos valores extremos, ao passo que a mediana permanece a
mesma.
57
4.2 Dados agrupados
Se os dados se agrupam em uma distribuio de frequncia, o clculo da
mediana se processa de modo muito semelhante quele dos dados no-
agrupados, implicando, porm, a determinao prvia das frequncias
acumuladas.
Ainda aqui, temos que determinar um valor tal que divida a distribuio em
dois grupos que contenham o mesmo nmero de elementos.
Sem intervalos de classe
Neste caso, o bastante identificar a frequncia acumulada imediatamente
superior metade da soma das frequncias. A mediana ser aquele valor da
varivel que corresponde a tal frequncia acumulada.
- Quando o somatrio das frequncias for mpar o valor mediano ser o termo
de ordem dado pela frmula:
Exemplo considere a distribuio abaixo:
Varivel xi fi Fi
0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
Total 35 --
Como o somatrio das frequncias fi = 35, a frmula para calcular a mediana ser:
(35+1) / 2 = 18 termo
Pela distribuio temos a mediana igual ao valor da varivel correspondente
ao 18 termo, ou seja, igual a 3.
58
- Quando o somatrio das frequncias for par o valor mediano ser o termo de
ordem dado pela frmula:
Exemplo - Calcule Mediana da tabela abaixo:
Varivel xi fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total 8 --
Aplicando frmula acima teremos:
[(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 + 16) / 2 = 15,5
Logo, o valor da mediana para esta distribuio ser igual a 15,5.
Com intervalos de classe
Neste caso, o problema consiste em determinar o ponto do intervalo em que
est compreendida a mediana.
Para tanto, temos inicialmente que determinar a classe na qual se acha a
mediana classe mediana.
Devemos seguir os seguintes passos:
59
Exemplo: Considere a distribuio a seguir
Classes fi Fi
50 |------- 54 4 4
54 |------- 58 9 13
58 |------- 62 11 24
62 |------- 66 8 32
66 |------- 70 5 37
70 |------- 74 3 40
Total 40 --
Temos: = 40 / 2 =.20
Logo,.a classe mediana ser a terceira classe, ou seja, 58 |------ 62 e com base
nesta classe temos ainda:
l* = 58........... F(ant) = 13........... f* = 11........... h* = 4
Substituindo esses valores na frmula acima, obtemos:
Md = 58 + [(20 - 13) x 4] / 11 = 58 + (28/11) = 58 + 2,54 = 60,54
Obs.: Este valor (Md = 60,54) estimado, pois no temos os 40 valores da
distribuio.
NOTA: No caso de existir uma frequncia acumulada exatamente igual a fi/2, a mediana ser o limite superior da classe correspondente.
60
Exemplo: Considere a distribuio a seguir
i Classes fi Fi
1 0 |------ 10 1 1
2 10 |------ 20 3 4
3 20 |------ 30 9 13
4 30 |------ 40 7 20
5 40 |------ 50 4 24
6 50 |------ 60 2 26
Total 26 --
Temos: = 26 / 2 =.13
Logo,.Md = L* = 30
4.3 - Emprego da Mediana
A mediana usada quando:
a. desejamos obter o ponto que divide a distribuio em duas partes iguais;
b. h valores extremos que afetam de maneira acentuada a mdia
aritmtica;
c. a varivel em estudo salrio.
5 Posio Relativa da Mdia, Moda e Mediana
Quando uma distribuio simtrica, as trs medidas coincidem. Porm, a
assimetria torna-as diferentes e essa diferena tanto maior quanto maior a
assimetria. Assim, em uma distribuio em forma de sino, temos:
Media = Mediana = Moda, no caso da curva simtrica;
Moda < Mediana < Media, no caso da curva assimtrica positiva;
Media < Mediana < Moda, no caso da curva assimtrica negativa;
61
6 As Separatrizes
Como vimos, a mediana caracteriza uma srie de valores devido sua posio
central. No entanto, ela apresenta uma caracterstica, to importante quanto a
primeira: ela separa a srie em dois grupos que apresentam o mesmo
nmero de valores.
Assim, alm das medidas de posio que estudamos, h outras que,
consideradas individualmente, no so medidas de tendncia central, mas
esto ligadas mediana relativamente sua segunda caracterstica, j que se
baseiam em posio na srie. Essas medidas os quartis, os percentis e os decis so, juntamente com a mediana, conhecidas pelo nome genrico de separatrizes.
6.1 Os quartis
Denominamos quartis os valores de uma srie que a divide em quatro
partes iguais.
62
H, portanto, trs quartis:
a. O primeiro quartil (Q1) valor situado de tal modo na srie que uma quarta parte (25%) dos dados menor que ele e as trs quartas partes
restantes (75%) so maiores.
b. O segundo quartil (Q2) evidentemente, coincide com a mediana (Q2 = Md).
c. O terceiro quartil (Q3) valor situado de tal modo na srie que as trs quartas partes (75%) dos termos so menores que ele e uma quarta parte
restante (25%) maior.
Quando os dados so agrupados, para determinar os quartis usamos a
mesma tcnica do clculo da mediana, bastando substituir, na frmula da
mediana, por:
Sendo K o nmero de ordem do quartil. Assim temos:
63
Exemplo:
Classes fi Fi
150 |------- 154 4 4
154 |------- 158 9 13
158 |------- 162 11 24
162 |------- 166 8 32
166 |------- 170 5 37
170 |------- 174 3 40
Total 40 --
Exerccio:
1. Complete os esquemas para o clculo do primeiro e do terceiro quartis da distribuio de frequncia:
(Q1)
(Q3)
64
6.2 Os Decis
Indicamos:
D1, D2, D3, ............, D9
evidente que:
D5= Q2 = Md
Denominamos decis os nove valores que separam uma srie em 10 partes
iguais.
65
O clculo de um decil segue a mesma tcnica do clculo da mediana, porm, a
frmula ser substituda por:
Sendo K o nmero de ordem do decil. Assim temos:
Exemplo: Calcule o stimo decil
Classes fi Fi
150 |------- 154 4 4
154 |------- 158 9 13
158 |------- 162 11 24
162 |------- 166 8 32
166 |------- 170 5 37
170 |------- 174 3 40
Total 40 --
Stimo Decil:
7 x fi/10 = 7 x 40/10 = 28
D7 = 162 + (28 -24).4
8
D7 = 162 + 2 = 164
10
10
10 D3
D1
(D7)
66
6.3 Os Percentis
Indicamos:
P1, P2, P3, ............, P99
evidente que:
P50= D5= Q2 = Md, P25= Q1, P75= Q3
O clculo de um percentil segue a mesma tcnica do clculo da mediana,
porm, a frmula ser substituda por:
Sendo K o nmero de ordem do percentil. Assim para o 27 percentil, temos:
Exemplo:
Considerando a distribuio de frequncia, temos para o oitavo percentil:
Classes fi Fi
150 |------- 154 4 4
154 |------- 158 9 13
158 |------- 162 11 24
162 |------- 166 8 32
166 |------- 170 5 37
170 |------- 174 3 40
Total 40 --
Denominamos percentis os noventa e nove valores que separam uma srie
em 100 partes iguais.
(P8)
67
68
Exerccio:
1. Complete o esquema para o clculo do vigsimo percentil da distribuio:
69
2. Calcule a mdia aritmtica das distribuies de frequncia abaixo:
3. Calcule a mediana de cada uma das distribuies de frequncia do exerccio
anterior.
4. Calcule a moda de cada uma das distribuies de frequncia do exerccio
anterior.
5. Calcule o primeiro e o terceiro quartis de cada uma das distribuies de
frequncia do exerccio anterior.
5. Calcule o quarto e o nono decil de cada uma das distribuies de frequncia
do exerccio anterior.
6. Calcule o 1, o 10, o 15, o 23 e o 90 percentiis de cada uma da
distribuio b) do exerccio anterior.
70
VII MEDIDAS DE DISPERSO OU VARIABILIDADE
1 Disperso ou variabilidade
Vimos anteriormente que um conjunto de valores pode ser convenientemente
sintetizado, por meio de procedimentos matemticos, em poucos valores
representativos mdia aritmtica, moda e mediana. Tais valores podem servir de comparao para dar a posio de qualquer elemento do conjunto.
No entanto, quando se trata de interpretar dados estatsticos, mesmo aqueles j
convenientemente simplificados, necessrio ter-se uma idia retrospectiva de
como se apresentavam esses mesmos dados nas tabelas.
Assim, no o bastante dar uma das medidas de posio para caracterizar
perfeitamente um conjunto de valores. Vemos, ento, que a mdia ainda que considerada como um nmero que tem a faculdade de representar uma srie de
valores no pode, por si mesma, destacar o grau de homogeneidade que existe entre os valores que compem o conjunto.
Consideremos os seguintes conjuntos de valores das variveis x, y e z:
X: 70, 70, 70, 70, 70
Y: 68, 69, 70, 71, 72
Z: 5, 15, 50, 120, 160
Calculando a mdia aritmtica de cada um desses conjuntos, obtemos:
mdia da varivel x = 70;
mdia da varivel y = 70;
mdia da varivel z = 70;
Vemos, ento, que os trs conjuntos apresentam a mesma mdia aritmtica: 70
Entretanto, fcil notar que o conjunto X mais homogneo que os
conjuntos Y e Z, j que todos os valores so iguais mdia. O conjunto Y,
por sua vez, mais homogneo que o conjunto Z, pois h menor
diversificao entre cada um de seus valores e a mdia representativa.
Chamando de disperso ou variabilidade a maior ou menor diversificao
dos valores de uma varivel em torno de um valor de tendncia central tomado
como ponto de comparao, podemos dizer que o conjunto X apresenta
71
disperso ou variabilidade nula e que o conjunto Y apresenta uma disperso
ou variabilidade menor que o conjunto Z.
Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior
ou menor disperso ou variabilidade entre esses valores e a sua medida de
posio, a Estatstica recorre s medidas de disperso ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, o Desvio-padro, a
Varincia e o Coeficiente de variao.
2 Amplitude Total
2.1 Dados no-agrupados
Exemplo: para os valores: 40, 45, 48, 52, 54, 62 e 70
Temos: AT = 70 40 = 30, logo AT = 30.
Quando dizemos que a amplitude total dos valores 30, estamos afirmando
alguma coisa do grau de sua concentrao. evidente que, quanto maior a
amplitude total, maior a disperso ou variabilidade dos valores da varivel.
Relativamente aos trs conjuntos de valores (X, Y e Z) mencionados no incio
deste captulo, temos:
ATX = 70 70 = 0, (disperso nula)
ATY = 72 68 = 4
ATZ = 160 5 = 155
2.2 Dados agrupados
2.2.1 Sem intervalos de classe
Neste caso, ainda temos:
A Amplitude total a diferena entre o maior e o menor valor observado:
AT = X (max) - X (min)
AT = X (max) - X (min)
72
Exemplo:
Considerando a tabela abaixo:
Xi fi
0 2
1 6
2 12
3 7
4 3
Total 30
Temos: AT = 4 0 = 4, logo AT = 4.
2.2.2 Com intervalos de classe
Neste caso, a amplitude total a diferena entre o limite superior da ltima
classe e o limite inferior da primeira classe:
Exemplo:
Considerando a distribuio de frequncia abaixo:
Classes fi
150 |------- 154 4
154 |------- 158 9
158 |------- 162 11
162 |------- 166 8
166 |------- 170 5
170 |------- 174 3
Total 40
Temos:
AT = 174 150 = 24, logo: AT = 24 cm.
A amplitude total tem o inconveniente de s levar em conta os dois valores
extremos da srie, descuidando do conjunto de valores intermedirios, o que
quase sempre invalida a idoneidade do resultado. Ela apenas uma indicao
aproximada da disperso ou variabilidade.
AT = L (max) - l (min)
73
3 Varincia e Desvio-padro
3.1 Introduo:
A varincia e o desvio-padro levam em considerao a totalidade dos valores
da varivel em estudo, o que faz delas ndices de variabilidade bastante
estveis e, por isso mesmo, os mais geralmente empregados.
A varincia uma medida que tem pouca utilidade como estatstica descritiva,
porm extremamente importante na inferncia estatstica e em combinaes
de amostras.
Quando se tratar de uma amostra devemos usar no denominador n 1.
Sendo a varincia calculada a partir dos quadrados dos desvios, ela um
nmero em unidade quadrada em relao varivel em questo, o que, sob o
ponto de vista prtico inconveniente.
Quando se tratar de uma amostra devemos usar no denominador n 1.
NOTA:
A varincia baseia-se nos desvios em torno da mdia aritmtica, porm
determinando mdia aritmtica dos quadrados dos desvios. Assim,
representando a varincia por s2, temos:
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e
interpretaes prticas, denominada desvio-padro, definida como a raiz
quadrada da varincia e representada por S.
74
Tanto o desvio-padro como a varincia so usados como medidas de disperso ou variabilidade. O uso de uma ou de outra depender da
finalidade que se tenha em vista.
Outra frmula bastante utilizada para calcular o desvio-padro de uma
populao :
3.2 Propriedades do desvio-padro
O desvio padro uma medida que s pode assumir valores no negativos e
quanto maior for o seu valor, maior ser a disperso dos dados.
Algumas propriedades do desvio padro, que resultam imediatamente da
definio, so:
Somando-se (ou subtraindo-se) uma constante a todos os valores de uma varivel, o desvio padro no se altera.
yi = xi c sy = sx
Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (diferente de zero), o desvio padro fica multiplicado
(ou dividido) por essa constante.
yi = xi . c sy = c . sx
O desvio padro sempre no negativo e ser tanto maior, quanta mais
variabilidade houver entre os dados.
Se s = 0, ento no existe variabilidade, isto , os dados so todos iguais.
Essas propriedades nos permitem introduzir, no clculo do desvio padro
simplificaes teis.
Para o clculo do desvio-padro, consideremos os seguintes casos:
75
3.3 Dados no-agrupados
Devemos empregar uma das duas frmulas mostradas para clculo do desvio-
padro.
Exemplo: Calcular o desvio padro da populao representada por:
Populao = {10, 6, 1, 3, 5}
xi 10 5 5 25
6 5 1 1
1 5 - 4 16
3 5 - 2 4
5 5 0 0
-- -- = 46
Usando a frmula:
Sabemos que n = 5 e que / n = 46 / 5 = 9,2.
Logo, a raiz quadrada de 9,2 o desvio padro, S = 3,03
Obs.: Podemos tambm calcular utilizando a outra frmula possvel.
Quando nosso interesse no se restringe descrio dos dados, mas, partindo
da amostra, visamos tirar inferncias vlidas para a respectiva populao,
convm efetuar uma modificao, que consiste em usar o divisor (n 1) em lugar de n. A frmula ficar ento:
Exemplo: Se os dados 10, 6, 1, 3 e 5 representassem uma amostra o desvio
padro amostral seria a raiz quadrada de 46 / (5 -1) = 3,39
76
3.4 Dados agrupados
Quando os dados esto agrupados (temos a presena de frequncias) a frmula
do clculo do desvio padro para uma populao ficar:
Quando se trata de uma amostra devemos usar a seguinte frmula:
Podemos tambm calcular o desvio-padro populacional pela seguinte
frmula:
Exemplo:
Calcule o desvio padro populacional da tabela abaixo:
xi f i xi . f i . f i
0 2 0 2,1 -2,1 4,41 8,82
1 6 6 2,1 -1,1 1,21 7,26
2 12 24 2,1 -0,1 0,01 0,12
3 7 21 2,1 0,9 0,81 5,67
4 3 12 2,1 1,9 3,61 10,83
Total 30 63 -- Somatrio 32,70
Sabemos que fi = 30 e . f i / n = 32,7 / 30 = 1,09.
A raiz quadrada de 1,09 o desvio padro, ou seja, s = 1,044
77
Se considerarmos os dados como sendo de uma amostra o desvio padro seria:
A raiz quadrada de 32,7 / (30 -1) = 1,062
Obs: Nas tabelas de frequncias com intervalos de classe a frmula a ser
utilizada a mesma do exemplo anterior.
No exemplo anterior a varincia igual a:
a) Para a populao
S2 = (1,044)2 = 1,09
b) Para a amostra: S2 = (1,062)2 = 1,13
3.5 Entendendo o significado do desvio-padro:
Em termos simples, desvio-padro um modo de representar a disperso dos
dados ao redor da mdia. Se os dados obedecerem a uma distribuio normal,
todos estaro compreendidos por uma curva em forma de sino; eles se
distribuiro simetricamente ao redor da mdia.
O quadro a seguir mostra os dados contidos entre desvio-padro para ambos
os lados da mdia.
Mdia + ou ( ) desvio-padro
% da populao includa Grosseiramente
1 68,3 2/3 da populao
1,96 95,0
2 95,5 95 % da populao
2,58 99,0
3 99,7 100 % da populao
78
1 - Aproximadamente 68% dos dados esto no intervalo
2 - Aproximadamente 95% dos dados esto no intervalo
79
4 Coeficiente de Variao
O desvio padro por si s no nos diz muita coisa. Assim, um desvio padro
de duas unidades pode ser considerado pequeno para uma srie de valores cujo
valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode
ser dito. Alm disso, o fato de o desvio padro ser expresso na mesma unidade
dos dados limita o seu emprego quando desejamos comparar duas ou mais
sries de valores, relativamente sua disperso ou variabilidade, quando
expressas em unidades diferentes.
Para contornar essas dificuldades e limitaes, podemos caracterizar a
disperso ou variabilidade dos dados em termos relativos a seu valor mdio,
medida essa denominada coeficiente de variao (CV):
Exemplo:
Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo
grupo de indivduos:
S
Estaturas 175 cm 5,0 cm
Pesos 68 Kg 2,0 Kg
Temos:
CVE = 5/175 x 100 = 2,85%
CVP = 2/68 x 100 = 2,94%
Logo, nesse grupo de indivduos, os pesos apresentam maior grau de disperso
que as estaturas.
80
VIII - PROBABILIDADE
1 - Introduo:
O clculo das probabilidades pertence ao campo da Matemtica, entretanto a
maioria dos fenmenos de que trata a Estatstica so de natureza aleatria ou
probabilstica. O conhecimento dos aspectos fundamentais do clculo da
probabilidade uma necessidade essencial para o estudo da Estatstica
Indutiva ou Inferencial.
2 - Experimento Aleatrio
Exemplo:
Da afirmao " provvel que o meu time ganhe a partida hoje" pode resultar:
- que ele ganhe - que ele perca - que ele empate
Este resultado final pode ter trs possibilidades.
3 - Espao Amostral
No experimento aleatrio "lanamento de uma moeda" temos o espao
amostral: {cara, coroa}.
No experimento aleatrio "lanamento de um dado" temos o espao
amostral: {1, 2, 3, 4, 5, 6}.
No experimento aleatrio "dois lanamentos sucessivos de uma moeda" temos
o espao amostral:
{(ca,ca) ; (co,co) ; (ca,co) ; (co,ca)}
So fenmenos que, mesmo repetidos vrias vezes sob condies semelhantes,
apresentam resultados imprevisveis. O resultado final depende do acaso.
Ao conjunto desses resultados possveis de um experimento aleatrio damos o
nome de espao amostral ou conjunto universo, representado por S.
.
81
Obs.: cada elemento do espao amostral que corresponde a um resultado
recebe o nome de ponto amostral. No primeiro exemplo: cara pertence ao
espao amostral {cara, coroa}.
4 - Eventos
Se considerarmos S como espao amostral e E como evento: Assim, qualquer
que seja E, se E est contido em S, ento E um evento de S.
Se E = S, E chamado de evento certo.
Se E est contido em S e E um conjunto unitrio, E chamado de evento
elementar.
Se E = , E chamado de evento impossvel.
5 - Probabilidade
Dado um experimento aleatrio, sendo S o seu espao amostral, vamos
admitir que todos os elementos de S tenham a mesma chance de acontecer, ou
seja, que S um conjunto equiprovvel.
Exemplos:
1- No lanamento de uma moeda qual a probabilidade de obter cara em um evento A?
S = {ca, co} = 2 A = {ca} = 1 P (A) = 1/2 = 0,5 = 50%
qualquer subconjunto do espao amostral S de um experimento aleatrio.
82
2- No lanamento de um dado qual a probabilidade de obter um nmero par em um evento A?
S = {1,2,3,4,5,6} = 6 A = {2,4,6} = 3 P (A) = 3/6 = 0,5 = 50%
3- No lanamento de um dado qual a probabilidade de obter um nmero menor ou igual a 6 em um evento A?
S = {1,2,3,4,5,6} = 6 A = {1,2,3,4,5,6} = 6 P (A) = 6/6 = 1,0 = 100%
Obs: a probabilidade de todo evento certo igual a 1 ou 100%.
4- No lanamento de um dado qual a probabilidade de obter um nmero maior que 6 em um evento A?
S = {1,2,3,4,5,6} = 6 A = { } = 0 P (A) = 0/6 = 0 = 0%
Obs: a probabilidade de todo evento impossvel igual a 0 ou 0%
6 - Eventos Complementares
Sabemos que um evento pode ocorrer ou no. Sendo p a probabilidade de que
ele ocorra (sucesso) e q a probabilidade de que ele no ocorra (insucesso),
para um mesmo evento existe sempre a