PDF Estatistica WeberCampos

2012 Copyright. Curso Agora eu Passo - Todos os direitos reservados ao autor.

PC/DF

ESTATÍSTICA

Módulo 01: Conceitos Iniciais

Módulo 02: Distribuição de Frequências

Módulo 03: Gráficos Estatísticos

Módulo 04: Medidas de Posição

Módulo 05: Medidas de Dispersão

Módulo 06: Diagrama de Caixa

Módulo 07: Amostragem

Prof. Weber Campos ([email protected])

Prof. Weber Campos 2

Estatística

MÓDULO 01: CONCEITOS INICIAIS

1. Estatística:

É um ramo da Matemática Aplicada, uma metodologia, uma técnica científica, adotada para

se trabalhar com dados, ou seja, com elementos de pesquisa. Esta metodologia, este método,

consiste em uma série de etapas, iniciando pela coleta das informações (dos dados) que, após

coletadas, passarão por uma organização e apresentação. Chegamos, daí, a uma fase

complementar, na qual se dará a análise daqueles dados (já organizados e descritos). Ora, esta

análise dos dados coletados funcionará como um meio, pelo qual chegaremos a uma conclusão. Esta,

por sua vez, ensejará uma tomada de decisão.

A Estatística não é meramente coletar dados de pesquisa para dispô-los numa tabela. O alcance da

Estatística é maior: os elementos servirão a uma análise, porque, ao final, queremos chegar a uma

conclusão. Existe uma decisão a ser tomada, e o será com base na conclusão a qual a análise dos

dados nos conduzir.

Não há um só medicamento vendido nas farmácias que não tenha sido submetido a rigorosos

controles estatísticos. Antes de virar “remédio”, aquela droga foi testada um zilhão de vezes.

Primeiro em animais e depois em pessoas. E foram anotados os efeitos colaterais causados pela

droga, em cada uma das vezes que elas foram tomadas pelos pacientes. Esses dados foram

analisados, para gerar uma conclusão. Aquela substância só se transforma em medicamento e chega

às prateleiras se a conclusão for satisfatória e os riscos estiverem dentro de um padrão aceitável.

1.1. Estatística Descritiva ou Dedutiva:

É aquela encarregada dos primeiros passos do processo estatístico, quais sejam, a coleta, a

organização e a descrição (ou apresentação) dos dados.

Estas três etapas iniciais: coleta, organização e descrição, podem ser resumidas em uma

única palavra: síntese dos dados. Portanto, se a questão de prova perguntar se a estatística

descritiva é responsável pela síntese dos dados, isto estará correto.

1.2. Estatística Indutiva ou Inferencial:

É a responsável pelas etapas finais do processo estatístico: a análise e a interpretação dos

dados que culminará na tomada de decisão.

2. População:

Também chamada de Conjunto Universo. É aquele conjunto do qual desejamos extrair a

informação, e cujos elementos têm, pelo menos, uma característica comum, a qual está inserida no

contexto daquilo que desejamos analisar.

3. Censo:

É uma das formas de se processar um estudo estatístico. Suponhamos que uma colégio tenha

precisamente duzentos estudantes. Se, em nossa pesquisa, resolvermos consultar todos os alunos,

ou seja, todos os elementos da população, fazendo o questionamento a cada um deles, sem

exceção, estaremos realizando um censo.

Ou seja, o censo é o tipo de estudo estatístico que abrange todos os elementos da população.

O exemplo clássico é o censo demográfico, que o IBGE realiza no país a cada dez anos, e em

que pretensamente são consultados todos os lares brasileiros.


Estatística

4. Amostragem:

É o tipo de estudo estatístico que se contrapõe ao censo. Como o próprio nome sugere, aqui

será utilizada uma amostra, ou seja, uma parte, um subconjunto da população, que terá o condão de

representar o conjunto inteiro. Ou seja, para que se possa considerar uma parte da população como

uma amostra, é preciso que esta parte seja representativa do todo.

Se a questão de prova afirmar apenas que amostra é uma parte da população, e somente

isso, então estará errada. É preciso frisar a característica essencial de uma amostra, que é a

representatividade. Assim, estaria correta a assertiva: amostra é uma parte da população (um

subconjunto), a partir da qual se pode auferir conclusões acerca desta mesma população.

Observamos, assim, o caráter de representatividade da amostra.

Uma pergunta frequente em sala de aula versa sobre o número mínimo de elementos de um

subconjunto da população, suficiente para caracterizá-lo como uma amostra, ou seja, o número de

elementos capaz de conferir ao subconjunto aquela representatividade. Existem fórmulas capazes de

determinar o número mínimo de elementos de uma amostra (para que assim seja considerada),

conforme se deseje uma maior ou menor precisão nos resultados. Não existe uma porcentagem fixa

do total para se obter a amostra!

5. Algumas Razões para a Adoção da Amostragem:

São todas elas intuitivas:

a) Quando a população é muito grande. Ora, há situações em que a população é

incomensuravelmente extensa, de forma que se torna inviável o uso do censo e, por outro lado,

extremamente conveniente a adoção de uma amostra. Por exemplo, uma pesquisa eleitoral,

realizada em um município com milhões de eleitores: Seria quase impossível entrevistar cada eleitor!

Coleta-se, pois, uma amostra.

b) Quando se deseja o resultado da pesquisa em curto espaço de tempo. Vale o mesmo

exemplo da pesquisa eleitoral. Às vezes, se deseja atualizar o resultado destas pesquisas de dois em

dois dias, ou mesmo diariamente. Não seria possível se entrevistar milhões de eleitores no intervalo

de poucas horas.

c) Quando se deseja gastar menos. Ora, o dispêndio de recursos financeiros é

consideravelmente menor se o número de elementos da pesquisa também o for. Sai mais barato

entrevistar algumas centenas ou mesmo milhares de pessoas, que entrevistar alguns milhões.

d) Quando o objeto da pesquisa é destrutivo. Suponhamos que uma montadora de veículos

quer testar a segurança do air-bag de um determinado modelo. O que ela faz? Pega alguns

exemplares daquele carro e os submete a colisões fortíssimas contra muros de concreto, filmando

tudo em câmera lenta. O carro fica destruído para que a experiência seja realizada. Não faria sentido

realizar uma pesquisa como esta para toda a frota produzida.

6. Variável:

É o objeto da pesquisa. É aquilo que estamos investigando. Por exemplo, se perguntamos

quantos livros alguém lê por ano, esta é a variável: número de livros lidos por ano; se a pesquisa

questiona qual a altura de um grupo de pessoas, então altura será a variável; da mesma forma,

podemos pesquisar uma infinidade de outras variáveis: nível de instrução, religião, cor dos olhos,

peso, estado civil, nacionalidade, número de pessoas que moram na sua casa , etc. O objeto da

pesquisa, do estudo estatístico, será, pois, a variável.


Estatística

6.1. Classificação das Variáveis:

Há, inicialmente, uma divisão principal para as variáveis estatísticas, que consiste em

considerá-las como: Variáveis Quantitativas ou Variáveis Qualitativas.

Esta divisão é de facílima compreensão: será quantitativa a variável para a qual se possa atribuir um

valor numérico. Ou seja, se a resposta fornecida à pesquisa estiver expressa por um número, então

a variável é quantitativa. Por exemplo: Quantos livros você lê por ano? A resposta é um número?

Então, variável quantitativa. Quantas pessoas moram em sua casa? A resposta é um número? Então,

novamente, variável quantitativa. Agora, se a pergunta é “qual a sua cor preferida?”, logicamente a

resposta não será um número, daí estaremos tratando de uma Variável Qualitativa, ou seja, aquela

para a qual não se atribui um valor numérico.

Dentro desta classificação inicial, há uma outra:

- Variáveis Quantitativas podem ser: discretas ou contínuas.

- Variáveis Qualitativas podem ser: nominais ou ordinais.

Variável Discreta é a variável quantitativa que não pode assumir qualquer valor, dentro de

um intervalo de resultados possíveis. Por exemplo, se eu pergunto quantos irmãos você tem, a

resposta jamais poderia ser “tenho 3,75 irmãos”, ou “tenho 4,8 irmãos”, ou seja, a resposta não

poderia assumir todos os valores de um intervalo. Ou ainda, as respostas possíveis seriam sempre

descontínuas.

Usando ainda outras palavras, se a variável quantitativa é discreta, existirá um vácuo, uma

descontinuidade, entre um resultado possível e outro.

A variável discreta em geral é aquela obtida por meio de uma contagem, ou seja: a variável

discreta nós contamos!

Exemplos: Quantas pessoas moram na sua casa? Quantos livros você tem em sua estante?

Quantos carros importados você tem na sua garagem? Se, para responder à pergunta, recorremos a

uma contagem, então estamos diante de uma variável quantitativa discreta (ou descontínua).

Por sua vez, a Variável Contínua é aquela que pode assumir qualquer valor dentro de um

intervalo de resultados possíveis. Se eu pergunto quantos quilos você pesa, a resposta pode ser 65,357kg. Se eu pergunto qual a temperatura na cidade hoje, a resposta pode ser 27,35C. Para

facilitar a memorização, lembraremos que a variável contínua em geral pode ser obtida por uma

medição, ou seja, a variável contínua nós medimos! Exemplos: peso, altura, duração de tempo para

resolução de uma prova, pressão, temperatura , etc.

Já no tocante às variáveis qualitativas, serão consideradas ordinais sempre que pudermos

estabelecer uma ordem, uma hierarquia, entre as respostas obtidas. Por exemplo, se vamos a um

quartel, pesquisar a patente militar dos que ali trabalham, para saber quantos são soldados, ou

sargentos, ou tenentes, ou capitães , etc, a resposta à pergunta “qual a sua patente?” não será,

obviamente, um valor numérico; logo, estaremos com uma variável qualitativa. Será que é possível

determinar uma hierarquia dentre estas respostas? Claro que sim! Logo, estamos diante de uma

variável qualitativa ordinal. Outro exemplo: se o prefeito de determinada cidade nos contrata para

fazermos um estudo estatístico acerca do nível de instrução dos moradores daquele lugar, e as

respostas possíveis a esta pesquisa são algo como “sem instrução escolar”, “nível fundamental

incompleto”, “nível fundamental completo”, “nível médio incompleto”, “nível médio completo”, “nível

superior” , etc. Ora, tais respostas não são números, logo, variável qualitativa. Podemos estabelecer

uma hierarquia entre estas respostas? Sim! Logo: variável ordinal.

Por outro lado, se a variável qualitativa é de tal forma que não possamos verificar uma

ordem, uma hierarquia, então diremos que a variável é nominal. Por exemplo, uma pesquisa para

saber a religião de um grupo de pessoas. As respostas não são numéricas, logo a variável é

qualitativa; e entre estas respostas não se pode estabelecer qualquer hierarquia, daí, religião

praticada é uma variável qualitativa nominal. Outro exemplo: a sua cor preferida. Não é número, e

não há hierarquia, logo, variável qualitativa nominal.

Por exclusão, e de uma forma simplificada, podemos apenas dizer que variável qualitativa nominal é

toda aquela que não é ordinal.


Estatística

7. Dados Brutos:

Como o próprio nome indica, são os dados obtidos da pesquisa, dispostos da mesma forma como

foram coletados, sem que tenha sido realizado com eles qualquer ordenamento. Em outras palavras,

podemos dizer que são os resultados das variáveis dispostos aleatoriamente, isto é, sem nenhuma

ordem de grandeza crescente ou decrescente.

8. Rol:

Vimos que uma das etapas do processo estatístico consiste em organizar os dados. Inclusive,

já sabemos que organizar os dados é um dos passos da Estatística Descritiva ou Dedutiva. Daí, uma

forma de organizar os dados brutos consiste em dispor estes dados em uma ordem. Daí, rol nada

mais é que a ordenação dos dados brutos, de um modo crescente ou decrescente.

9. Séries Estatísticas:

São nada mais que tabelas, as quais expressam o resultado de um estudo estatístico. Se,

olhando para esta tabela, pudermos identificar três elementos, quais sejam: o objeto do estudo, o

local e a época da pesquisa, então estaremos diante de uma série estatística. É, portanto, uma

maneira de apresentar os dados estatísticos, de uma forma tabulada.

São três, pois, os elementos de uma série estatística: 1º) o fato: é o fenômeno que foi

investigado, e cujos valores estão sendo apresentados na tabela; 2º) o local: indica o âmbito

geográfico ou a região onde o fato aconteceu; 3º) a época: refere-se ao período, data ou tempo,

quando a variável foi investigada.

Logo, ao nos defrontarmos com uma série estatística, devemos apresentar respostas às seguintes

perguntas: O quê? Quando? Onde? Tais perguntas serão respondidas, respectivamente, pelos

elementos: descrição do fato, época e local.

Na série estatística haverá sempre um elemento que sofrerá variações, enquanto outros dois

permanecerão constantes (inalterados). A partir deste elemento variável estabeleceremos uma

classificação, apresentada a seguir.

9.1. Classificação das Séries Estatísticas:

Dependendo do elemento que varia e dos elementos que permanecem fixos, as séries serão

classificadas em: Históricas, Geográficas, Específicas e Distribuição de Frequências.

9.1.1. Séries Históricas:

Serão chamadas Séries Históricas aquelas cujo elemento que sofrerá variação é a época,

permanecendo fixos o local e a descrição do fenômeno.

Vejamos o exemplo abaixo:

PRODUÇÃO DE MINÉRIO DE FERRO (BRASIL)

Anos Quantidade (*)

(toneladas)

(*) Valores hipotéticos.

1978 12.104.375

1979 13.072.942

1980 18.739.223

1981 16.435.838

Observemos que, olhando esta tabela acima, saberemos dizer qual foi o fenômeno estudado, qual o

local e a época da pesquisa. Verificamos ainda que, destes elementos, o objeto do estudo é fixo

(produção de ferro), o local é fixo (Brasil), porém a época da pesquisa varia de 1978 a 1981,

determinando, por isso, que se trata de uma série histórica.


Estatística

Existem alguns sinônimos para este tipo de série estatística, e que devem ser cuidadosamente

memorizados, para o caso de uma questão teórica. São eles: séries cronológicas, temporais ou de

marcha.

9.1.2. Séries Geográficas:

Serão chamadas Séries Geográficas aquelas cujo elemento variável será o local, permanecendo

fixos o tempo e a descrição do fenômeno. São igualmente chamadas de séries espaciais, territoriais

ou de localização. Convém dedicarmos especial atenção a estes sinônimos. Vejamos o exemplo

abaixo:

PRODUTO INTERNO BRUTO - 1980

Países US$

(bilhões) (*)

(*) valores hipotéticos.

Holanda 126,3

Itália 106,3

França 103,6

Portugal 92,0

Verificamos, facilmente, que são fixos o fenômeno estudado (produto interno bruto) e a

época da pesquisa (1980). Todavia, o elemento local sofre variação, caracterizando, por isso, esta

série estatística como série geográfica.

9.1.3. Séries Específicas:

Chamaremos de Séries Específicas aquelas cuja descrição do fenômeno sofrerá variação,

permanecendo fixos os elementos local e tempo. Recebem ainda os sinônimos de séries

especificativas ou categóricas. Analisemos o exemplo abaixo:

Número de alunos concludentes

UFC – 2007

Cursos n.º alunos (*) (*)valores hipotéticos

Direito 238

Medicina 125

Engenharia 74

Estatística 1

Observemos que permanecem fixos o local da pesquisa (UFC – Universidade Federal do Ceará) e a

época (ano 2000). Todavia, o fenômeno estudado está sofrendo uma variação, em diversas

categorias (daí, o nome séries categóricas), dando ensejo a esta classificação das séries específicas.

9.1.4. Distribuição de Frequências:

A quarta e última espécie de série estatística é, de longe, a mais importante delas. Trata-se

da chamada Distribuição de Frequências. A maioria das provas de estatística trabalha as questões

tomando por base dados apresentados sob esta forma, ou seja, dados dispostos na Distribuição de

Frequências. Por este motivo, daremos redobrada ênfase a este tópico, reservando, inclusive, um

módulo inteiro para tratarmos deste assunto. Na Distribuição de Frequências, os dados são

ordenados segundo um critério de magnitude, em classes ou intervalos, permanecendo fixos o fato,

o local e a época. Isto é, embora o fenômeno estudado seja único, este sofrerá uma subdivisão em

classes.

Vejamos o exemplo a seguir:


Estatística

Altura dos alunos do curso X, em 11/03/2007.

Alturas (m) Nº de alunos

1,50 | 1,60 14

1,60 | 1,70 29

1,70 | 1,80 37

1,80 | 1,90 18

1,90 | 2,00 2

Observemos que o fenômeno estudado é único (altura dos alunos), todavia está se subdividindo em

várias classes. Temos, pois, a classe dos alunos com altura variando entre 1,50m e 1,60m; a classe

dos alunos com altura entre 1,60m e 1,70m, e assim por diante. Quando formos detalhar, em um

próximo tópico, a Distribuição de Frequências, voltaremos a falar sobre as classes e sobre todos os

demais elementos deste tipo de série estatística.

9.1.5. Séries Conjugadas (ou mistas ou compostas)

Estas são séries que resultam de uma combinação de, pelo menos, duas das séries vistas

anteriormente. Por exemplo:

Gastos da Empresa X

1999 - 2002

Anos

Gastos (R$)

Material Pessoal

1999 100.000,00 21.000,00

2000 110.500,00 23.300,00

2001 120.100,00 24.900,00

2002 130.200,00 26.500,00

As informações variam em dois sentidos: por ano (verticalmente) e por especificação do fenômeno

observado (horizontalmente: gastos com material e gastos com pessoal).

10. NORMAS PARA APRESENTAÇÃO DE DADOS ESTATÍSTICOS:

Um dos objetivos da Estatística é resumir os dados ou valores que uma ou mais variáveis possam

assumir, a fim de que se tenha uma síntese da variação dessas variáveis. Para isso, ela recorre aos

Quadros ou Tabelas, que irão nos fornecer informações a respeito das variáveis em estudo.

10.1. Conceito de Tabela:

Trata-se simplesmente de um quadro, que sintetiza um conjunto de observações, com o objetivo de

uniformizá-las e racionalizá-las, de forma a tornar mais simples e fácil a sua percepção. Destarte,

uma tabela deve ser construída de modo a fornecer o máximo de esclarecimentos, com o mínimo de

espaço.

10.2. Elementos Fundamentais de uma Tabela Estatística:

a) Título: é a indicação contida na parte superior da tabela, onde deve estar definido o fato

observado, com a especificação de local e época, referentes a esse fato.

Exemplo:

NÚMERO DE ASSASSINATOS EM PERNAMBUCO – 1999

b) Corpo: é constituído por linhas e colunas, que fornecem o conteúdo das informações prestadas.


Estatística

c) Cabeçalho: é a parte da tabela que apresenta a natureza do que contém cada coluna. Ou seja,

apresenta o conteúdo das colunas.

Exemplo:

Locais Quantidade de Ocorrências

d) Coluna Indicadora: é a que determina o que contêm as linhas. Ou seja, apresenta o conteúdo

das linhas.

Exemplo:

Região Metropolitana de Recife

Cidades Litorâneas de Pernambuco

Cidades do Agreste de Pernambuco

Cidades do Sertão de Pernambuco

10.3. Elementos Complementares de uma Tabela Estatística:

a) Fonte: designa a entidade que forneceu os dados estatísticos. Ex.: Fonte: IBGE, Ibope,

etc.

b) Notas: esclarecimentos de natureza geral.

c) Chamadas: esclarecimentos de natureza específica.

Observação: Preferencialmente, as notas e chamadas devem ser colocadas no rodapé da tabela.

10.4. Observações sobre a construção de uma Tabela:

São apenas recomendações acerca do aspecto formal que uma tabela deve apresentar:

- A tabela não deverá ser fechada lateralmente.

- As casas (células) não deverão ficar em branco, apresentando sempre um número ou sinal

convencional.

10.5. Sinais Convencionais:

São também convenções, concernentes ao aspecto formal de uma tabela estatística:

a) Três Pontos (...): quando o dado existe, mas não o conhecemos, ou seja, não dispomos dele;

b) Traço horizontal (): quando o valor é zero;

c) Ponto de Interrogação (?): quando há dúvida quanto à exatidão de determinado dado;

d) A letra “zê” (Z): quando o dado for rigorosamente zero;

e) O “zero” (0): quando o valor é muito pequeno para ser expresso pela unidade adotada.


Estatística

11. TIPOS DE TABELA:

11.1. Tabela Simples (unidimensional):

São aquelas que apresentam dados ou informações relativas a uma única variável.

Exemplo:

Preferência por um time de futebol % de torcedores

Flamengo

Corinthians

São Paulo

Palmeiras

Santos

27

22

19

17

15

Total 100

11.2. Tabela de Dupla Entrada ou Cruzada (bidimensional):

São as que apresentam, por sua vez, dados ou informações relativas a mais de uma variável.

Exemplo:

Preferência por

Programa de rádio

Sexo

Total Masculino Feminino

Noticiário

Musical

Novela

Esportivo

Outros

08

10

07

15

05

05

10

15

06

03

13

20

22

21

08

Total 45 39 84

EXERCÍCIOS DOS CONCEITOS INICIAIS

01. (Estatistico CEASA/MG 2004 FUMARC) Os clientes da Distribuidora de Arroz ABC Ltda têm fichas

de cadastro numeradas consecutivamente de 261 a 973. Deve-se selecionar uma amostra aleatória

de 25 pacientes para serem pesquisados quanto à “satisfação de atendimento por parte da

Distribuidora”. O número de elementos dessa população é:

a) 712 b) 710 c) 973 d) 713

02. (TCU 93) Assinale a opção correta:

a) Estatística Inferencial compreende um conjunto de técnicas destinadas à síntese de dados

numéricos.

b) O processo utilizado para se medir as características de todos os membros de uma dada

população recebe o nome de censo.

c) A Estatística Descritiva compreende as técnicas por meio das quais são tomadas decisões sobre

uma população com base na observação de uma amostra.

d) Uma população só pode ser caracterizada se forem observados todos os seus componentes.

e) Parâmetros são medidas características de grupos, determinadas por meio de uma amostra

aleatória.

03. (TCDF 95) Assinale a opção correta:

a) Em Estatística, entende-se por população um conjunto de pessoas.

b) A variável é discreta quando pode assumir qualquer valor dentro de determinado intervalo.

c) Frequência relativa de uma variável aleatória é o número de repetições dessa variável.

d) A série estatística é cronológica quando o elemento variável é o tempo.

e) Amplitude total é a diferença entre dois valores quaisquer do atributo.


Estatística

04. (Fiscal de Rendas RJ 2003 FJG) Os dados de um determinado estudo representam muitas

variáveis para cada uma das pessoas que se submeteram ao estudo. Uma variável considerada

qualitativa é a seguinte:

A) idade B) altura C) sexo D) peso

05. Considerando a tabela a seguir indicada, pode-se concluir que seus dados refletem uma série:

PRODUTOS QUANTIDADE (ton)

ARROZ 300.000

AÇÚCAR 250.000

MILHO 120.000

FEIJÃO 30.000

a) especificativa ou específica.

b) Geográfica.

c) Temporal.

d) Distribuição de frequência

06. (TCDF 2002 CESPE) Julgue os itens seguintes.

1. Por Estatística Descritiva entende-se um conjunto de ferramentas, tais como gráficos e tabelas,

cujo objetivo é apresentar, de forma resumida, um conjunto de observações.

2. Quando aplicada em uma população de pessoas formada pelo mesmo número de homens e de

mulheres, uma amostra aleatória simples também apresenta o mesmo número de homens e de

mulheres.

07. (FTE-Alagoas 2002 CESPE) Julgue os seguintes itens.

1. Um censo consiste no estudo de todos os indivíduos da população considerada.

2. Como a realização de um censo tipicamente é muito onerosa e(ou) demorada, muitas vezes é

conveniente estudar um subconjunto próprio da população, denominado amostra.

3. Em uma distribuição de frequências para um conjunto de n indivíduos, pode-se calcular as

frequências relativas, dividindo-se cada frequência absoluta pela amplitude da correspondente classe

ou do intervalo.

GABARITO

01. D

02. B

03. D

04. C

05. A

06. 1.Certo 2.Errado

07. 1.Certo 2.Certo 3.Errado


Estatística

MÓDULO 02: DISTRIBUIÇÃO DE FREQUÊNCIAS

As distribuições de frequências (ou tabelas de frequências) são muito importantes na Estatística.

Basicamente são utilizadas para se ter uma idéia quantitativa sobre a distribuição dos dados, ou seja, como os dados se manifestam.

Assim como existem dois tipos de dados quantitativos (discretos e contínuos) existem também dois tipos de distribuições de frequências.

1. DISTRIBUIÇÃO DE FREQUÊNCIAS PARA DADOS DISCRETOS

Neste caso a distribuição de frequências se compõe basicamente de duas informações: as possíveis ocorrências e a quantidade de vezes que cada uma ocorreu de fato.

Ex.: Imagine que você lança um dado 20 vezes e anota, em cada lançamento, o valor da face voltada para

cima. Suponha que temos os seguintes resultados: 1 5 3 1 4 6 2 1 3 1 3 1 2 5 2 3 3 4 1 5

Para este exemplo temos a seguinte tabela de frequências:

Valores Observados (Xi)

Frequência Observada (fi)

1 6 2 3 3 5 4 2 5 3 6 1

Total 20

OBS.:

Na primeira coluna temos os valores das faces do dado e na segunda coluna temos o número de vezes que cada face ocorreu no experimento.

A soma total da coluna das frequências tem valor igual ao total de observações do experimento. 2. DISTRIBUIÇÃO DE FREQUÊNCIAS PARA DADOS CONTÍNUOS

Para um melhor entendimento sobre o conceito de distribuição de frequências para dados contínuos usaremos o seguinte exemplo:

“Um professor, ao aplicar um teste em uma turma, deseja fazer uma pesquisa completa sobre o desempenho dos seus 50 alunos.”

A lista dos resultados obtidos foi a seguinte (dados brutos):

5,5 7,8 7,0 4,4 3,0 2,0 0,5 0,0 9,5 5,0 2,4 3,5 4,0 4,0 1,5 1,0 6,0 2,5 8,0 3,2 5,0 5,3 5,5 4,0 4,5 6,5 2,5 1,0 4,8 5,0 3,0 1,9 1,5 7,5 5,0 5,1 4,0 4,5 5,5 5,5 0,0 0,5 2,2 3,6 0,5 9,5 5,0 3,7 4,0 2,0

Agrupando os resultados por classes ou intervalos, obteremos a seguinte distribuição de frequências:


Estatística

Notas Frequências

0 | 2

2 | 4

4 | 6

6 | 8

8 | 10

10 12 20 5 3

Total 50

O arranjo ou organização dos dados brutos por classe, junto com as frequências correspondentes, é chamado de Distribuição de Frequências com intervalos de classe (ou Dados tabulados agrupados em classes). IMPORTANTE:

Somente utilizaremos a distribuição de frequência com intervalos de classe, em duas situações:

a) Quando os dados da amostra forem dados contínuos! (Lembrando: dados obtidos por medição!)

b) Quando os dados da amostra forem dados discretos (lembrando: obtidos por contagem), porém em número acima de 30 (trinta) elementos.

3. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA:

a) Classes: são os intervalos de variação da variável. São representados por i = 1, 2, 3, ..., k; onde k é o número total de classes da distribuição. Cada classe é representada por um intervalo onde são indicados apenas os valores limites. Vejamos quais são os tipos de intervalos de classe existentes:

i) 3 | 5 ou [3 ; 5) : fechado à esquerda e aberto à direita. Inclui o limite inferior e exclui o limite superior.

ii) 3 | 5 ou (3 ; 5] : aberto à esquerda e fechado à direita. Exclui o limite inferior e inclui o limite superior.

iii) 3 || 5 ou [3 ; 5]: fechado à esquerda e à direita. Inclui os dois limites.

iv) 3 5 ou (3 ; 5): aberto à esquerda e à direita. Exclui os dois limites.

b) Limites de Classe: são os extremos de uma classe. linf = limite inferior lsup = limite superior c) Amplitude de Classe: é a medida do intervalo que define a classe. É obtida pela diferença entre os

limites superior e inferior dessa classe. É indicada por h.

infsup llh

d) Ponto Médio de uma Classe: é aquele que divide o intervalo de classe em duas partes iguais.

Chamaremos Ponto Médio de PM, e o calcularemos do seguinte modo:

2

infsup llPM

ou

2inf

hlPM

IMPORTANTE: O Ponto Médio de uma classe é o seu representante legítimo. Outras Relações: 1) O limite superior de uma classe é o ponto médio do intervalo dessa classe somado com a

metade da amplitude de classe.

2sup

hPMl

2) O limite inferior de uma classe é o ponto médio do intervalo dessa classe subtraído da metade da amplitude de classe.


Estatística

2inf

hPMl

IMPORTANTE: Quando todas as classes de uma distribuição possuem mesmas amplitudes de classe, teremos que:

- A diferença entre os pontos médios é constante e igual à amplitude de classe. Portanto, para calcular todos os pontos médios de uma distribuição, calcule o primeiro ponto médio pela fórmula e depois vá somando a amplitude de classe para encontrar os outros pontos médios.

e) Amplitude Total da Distribuição: é a diferença entre o limite superior da última classe (limite superior

máximo) e o limite inferior da primeira classe (limite inferior mínimo). É designada por At.

minmax LLAt

Obs.: A Amplitude Total para o Rol e Dados brutos também é chamada de Amplitude Amostral (Aa), e é definida como a diferença entre o maior e o menor elemento da amostra.

Teremos que: minmax xxAa

f) Frequência: existem vários tipos de frequências usadas em uma Distribuição de Frequências com e

sem intervalos de classe, veja abaixo quais são elas.

4. TIPOS DE FREQUÊNCIAS:

As frequências mencionadas abaixo estão definidas para uma distribuição de frequência com intervalos de classe. As definições dessas frequências para uma distribuição sem intervalos de classe são feitas de maneira análoga.

4.1. FREQUÊNCIA ABSOLUTA fi

Indica quantos elementos pertencem a cada classe.

4.2. FREQUÊNCIA ABSOLUTA ACUMULADA CRESCENTE fac

Indica a quantidade de elementos que é menor ou igual ao limite superior da classe. É conhecida também, como frequência “abaixo de”.

4.3. FREQUÊNCIA RELATIVA Fi

Indica a proporção de elementos em cada classe com relação ao total de elementos.

4.4. FREQUÊNCIA RELATIVA ACUMULADA CRESCENTE Fac

Indica a proporção de elementos, em relação ao total de elementos, que é menor ou igual ao limite superior da classe. É conhecida também, como frequência relativa “abaixo de”.


Estatística

MÓDULO 03: REPRESENTAÇÃO GRÁFICA DOS DADOS ESTATÍSTICOS

1. INTRODUÇÃO:

Gráfico estatístico nada mais é do que uma forma de apresentação dos dados estatísticos. Tem como

objetivo produzir, em quem o analisa, uma informação direta e objetiva do fenômeno em análise.

É claro que nenhuma prova de concurso pedirá para você desenhar o gráfico, então como será

medido o nosso conhecimento sobre os gráficos estatísticos? Poderá ser feito de dois modos: 1º)

uma questão teórica para medir o conhecimento sobre os tipos de gráficos estatísticos; e 2º) a

questão fornece um determinado gráfico pronto e pede que calculemos uma medida estatística

baseada nele.

Esse último modo é o mais frequente em provas, e para resolver as questões deste tipo, temos que

saber ler e retirar as informações que são fornecidas no gráfico.

Passemos agora a conhecer os principais tipos de gráficos estatísticos. Dê uma atenção especial aos

gráficos usados para a representação de uma Distribuição de Frequências. E para esses gráficos,

procure saber como montar a tabela de frequências correspondente.

2. GRAFICOS ESTATÍSTICOS PARA SÉRIES GEOGRÁFICAS, TEMPORAIS E ESPECÍFICAS:

Convém ressaltar que o mais relevante não é que o aluno saiba desenhar os gráficos que

veremos a seguir, e sim que ele saiba interpretá-lo e, se for o caso, reconhecer no gráfico algumas

medidas estatísticas que possam, eventualmente, ser requeridas pela questão.

2.1. GRÁFICO DE COLUNAS:

É a representação de uma série estatística por meio de retângulos não contíguos, dispostos

verticalmente. Os retângulos possuem a mesma base e as suas alturas são proporcionais aos

respectivos dados.

É usado para séries temporais, séries específicas ou séries geográficas.

Exemplo 01:

Produção de Veículos no Brasil (1992 – 1996)

(em milhares de unidades)

800

900

700

600

1000

92 93 94 95 96


Estatística

Exemplo 02:

Alunos Formados na UFPE em 1999

Advogados Médicos Engenheiros

Exemplo 03:

a b c d e a b c d e

Masculino Feminino Sexo

2.2. GRÁFICO EM BARRAS:

Exemplo 04:

PRODUÇÃO DE CEBOLA

BRASIL – 1992

É a representação de uma série estatística por meio de retângulos dispostos horizontalmente. Os

retângulos possuem mesma altura e os seus comprimentos são proporcionais aos respectivos dados.

É normalmente usado para séries geográficas ou também na representação de séries específicas.

Legenda

a - Noticiário b - Musical

c - Novela d- Esportivo e - Outros

200

160

100

15

10

5 3

6

7

8

São Paulo

R. G. do Sul

Sta Catarina

Pernambuco

Minas Gerais

0 40 80 120 160 200 240 280 (mil toneladas)


Estatística

2.3. GRÁFICO EM LINHAS

São usados sobretudo na representação de séries temporais.

Exemplo: Estudando a população de um determinado país, obtêm-se os seguintes dados:

Exemplo 05:

Ano

População

(em

milhões)

1995 50

1996 55

1997 65

1998 70

1999 85

1995 1996 1997 1998 1999 Anos

2.4. GRÁFICO EM SETORES:

É designado por meio de um círculo, onde cada classe é representada por um setor circular, cujo

ângulo é proporcional ao tamanho da amostra.

É utilizado quando se deseja mostrar as partes de um todo, ou seja, quando se deseja comparar

proporções.

Exemplo o6:

Empresas Produção

(unidades)

Produção

(percentagem

do total)

A 100 50%

B 30 15%

C 60 30%

D 10 5%

Total 200 100%

As áreas dos setores são proporcionais aos dados da série, e são obtidas por meio de uma regra de

três simples, na qual consideraremos que a área total da circunferência – 100% – corresponde a

360º.

Daí, como no exemplo a empresa A representa 50% do total da produção, faremos a seguinte

regra de três:

360º --- 100%

XA --- 50%

Daí, 503610 AX 180AX

Logo, encontraremos que este setor deverá cobrir um ângulo de 180º.

De forma semelhante, encontraremos os ângulos para o restante das empresas:

empresa B: 54BX

empresa C: 108CX

empresa D: 18DX

50

População

55

65

85

70


Estatística

Com esse dados, marcamos num círculo, com um transferidor, os ângulos correspondentes a

cada setor, obtendo o gráfico de setores:

3. GRAFICOS ESTATÍSTICOS PARA DISTRIBUIÇÕES DE FREQUÊNCIAS

Nesta seção, veremos os gráficos utilizados para representar distribuições de frequências. O

mais importante que se deve aprender aqui é como montar a tabela de frequências a partir do

gráfico dado na questão, conhecimento este já exigido em algumas questões de prova.

Os gráficos a seguir apresentados somente serão compreendidos em sua totalidade pelo leitor depois

que estudarmos, no próximo capítulo deste Curso, quais são, o que significam e como se constroem

as frequências de uma distribuição.

3.1. GRÁFICO DE HASTES OU BASTÕES:

Bastante utilizado para representar dados não agrupados em classes, o que normalmente ocorre

com dados discretos. (Lembrando: aqueles normalmente obtidos por contagem). Neste caso, não

há perda de informação, pois os valores da variável aparecem individualmente, como constam da

amostra.

Observação: O Gráfico de Hastes pode ser construído utilizando-se, indistintamente, as frequências

simples absolutas ou relativas de cada elemento.

Exemplo 07: Num lançamento de um dado 30 vezes tivemos o seguinte resultado:

O gráfico de hastes correspondente a tabela é o seguinte:

Tente fazer a volta, ou seja, a partir do gráfico monte a tabela.

Xi fi

1

2

3

4

5

6

6

5

8

2

4

5

A

B C

D

50%

15%

30%

5%

8

5

4

6

2

fi

1 2 3 4 5 6 Xi


Estatística

3.2. GRÁFICO EM ESCADA:

A representação das frequências acumuladas para uma variável discreta é feita mediante o

uso de um gráfico em escada.

Exemplo 08: As notas de Matemática de 40 alunos de uma sala de aula foram os seguintes:

O gráfico de escada correspondente a essa tabela de frequências acumuladas é o seguinte:

No gráfico, um ponto representa um intervalo fechado e um círculo, um intervalo aberto.

Novamente, tente a partir do gráfico chegar na tabela de frequências acumuladas.

3.3. HISTOGRAMA:

Podemos afirmar seguramente que, entre todos os gráficos estatísticos, este é o de maior

relevância na esfera dos concursos públicos.

O Histograma é destinado à representação de Distribuições de Frequências. Qualquer

questão, portanto, que tente relacioná-lo com outros tipos de Séries Estatísticas (séries geográficas,

temporais , etc.) restará sumariamente equivocada.

Repetindo: utilizaremos o Histograma para representar dados agrupados em classes.

Neste caso, verificaremos que haverá uma certa perda de informação, tendo em vista que na

Distribuição de Frequências trabalharemos com classes de elementos, e não com elementos

dispostos individualmente.

Observação: O Histograma pode ser construído utilizando-se, indistintamente, as frequências simples

absolutas ou relativas de um intervalo de classe.

No Histograma, as classes estarão representadas por retângulos – um para cada classe –

dispostos vertical e contiguamente (sem espaço entre eles), cujas bases serão margeadas pelos

limites destas classes (limites inferior e superior) e cujas alturas serão determinadas pelas

frequências – absolutas ou relativas – de cada classe.

Trataremos novamente do Histograma no Capítulo seguinte deste Curso.

Xi fi fac

2

4

5

7

8

10

5

7

8

10

6

4

5

12

20

30

36

40

36

20

12

30

5

fac

1 2 3 4 5 6 7 8 9 10 Xi

40


Estatística

Exemplo 08:

Notas fi

2 | 4

4 | 6

6 | 8

8 | 10

5

7

4

2

Total 18

3.4. POLIGONAL CARACTERÍSTICA:

É o gráfico construído a partir do Histograma, utilizando-se apenas dos contornos deste.

3.5. POLÍGONO DE FREQUÊNCIAS:

É o gráfico construído unindo-se por linhas retas os pontos médios das bases superiores dos

retângulos de um Histograma. Estes pontos médios, conforme veremos no próximo capítulo, são os

elementos que estão exatamente no meio de cada classe, dividindo-as em duas metades.

Exemplo 09: fi

Notas fi

2 | 4

4 | 6

6 | 8

8 | 10

5

7

4

2

Total 18

3.6. CURVA DE FREQUÊNCIAS:

A partir do Polígono de Frequências podemos representar contornos mais suaves (polígono de

frequência polido), utilizando-se curvas para chegarmos a uma das representações de grande

utilidade para a Estatística, a qual chamaremos de Curva de Frequências.

Usando-nos destas Curvas, poderemos entender com mais facilidade algumas relações e algumas

propriedades presentes no estudo das Medidas de Posição e das Medidas de Dispersão, conforme

veremos em capítulos posteriores.

Para o exemplo apresentado no item anterior, a respectiva curva de frequência é dada por:

7 -

5 -

2 -

4 -

0 2 4 6 8 10 Classes

7

fi

5

2

4

2 4 6 8 10 Classes

7

5

2

4

fi

2 4 6 8 10 Classes


Estatística

fi

0 2 4 6 8 10 Classes

3.6.1. As Formas das Curvas de Frequências:

As curvas de frequências podem assumir certas formas características. Citamos algumas

delas:

Curva em foma de sino: estas apresentam um formato assemelhando-se ao contorno de um sino,

evidenciando uma forte concentração dos valores em torno do centro da distribuição.

São muitos os fenômenos que oferecem distribuições em forma de sino: a estatura dos

adultos, o peso dos adultos, a inteligência medida em testes de Q.I., os preços de um produto, etc.

Na prática, é bem provável que a curva apresente uma certa assimetria à esquerda (cauda

mais alongada à esquerda) ou à direita (cauda mais alongada à direita) . Então, é possível distinguir

três configurações para as curvas em forma de sino:

Curva Assimétrica à Direita Curva Assimétrica à Esquerda

Por hora, ninguém se preocupe em memorizar esta nomenclatura de curvas assimétricas.

Sequer falamos ainda em simetria ou assimetria de um conjunto. Em momento oportuno, trataremos

exaustivamente destas configurações das Curvas de Frequências.

Curvas em foma de Jota: apresentam ponto de ordenada máxima em um das extremidades.

São curvas comuns aos fenômenos econômicos e financeiros: distribuição de vencimentos ou

rendas pessoais.

7 -

5 -

2 -

4 -

f

f f

Curva Simétrica


Estatística

Curvas em foma de U: são caracterizadas por apresentarem ordenadas máximas em ambas as

extremidades.

Como exemplo de distribuição que dá origem a esse tipo de curva podemos citar a de

mortalidade por idade.

Curva em foma de U

3.7. POLÍGONO DE FREQUÊNCIAS ACUMULADAS (ou OGIVA):

São gráficos construídos a partir das frequências acumuladas crescentes, podendo ser absolutas

ou relativas.

3.7.1. Ogiva com as frequências acumuladas crescentes

Depois de se desenhar, para cada classe, os retângulos com alturas correspondentes ao valor

da frequência acumulada crescente, construiremos a curva da Ogiva interligando-se os pontos das

bases superiores dos retângulos, que correspondem aos limites superiores de cada classe.

Exemplo 10:

Notas fi fac

2 | 4

4 | 6

6 | 8

8 | 10

5

7

4

2

5

12

16

18

Total 18

f

fac

5

12

16

18

0 2 4 6 8 10 Classes

f

Curva em J

f

Curva em J invertido


Estatística

EXERCÍCIOS DE REPRESENTAÇÃO GRÁFICA DOS DADOS ESTATÍSTICOS

01. (IRB 2006 ESAF) No campo estatístico, ogivas são:

a) polígonos de frequência acumulada.

b) polígonos de frequência acumulada relativa ou percentual.

c) histograma de distribuição de frequência.

d) histograma de distribuição de frequência relativa ou percentual.

e) o equivalente à amplitude do intervalo.

02. (IRB 2006 ESAF) Histograma e Polígono de frequência são

a) a mesma representação gráfica (idênticas) de uma distribuição de frequência.

b) um texto descritivo e uma representação gráfica de uma distribuição de frequência.

c) um texto descritivo e uma função gráfica de uma distribuição de frequência.

d) duas representações gráficas de uma distribuição de frequência.

e) duas representações gráficas de uma distribuição de frequência, porém com sentidos opostos.

03. (Analista SUSEP 2006 ESAF) Considerando V = Verdadeiro e F = Falso e o contido em cada item

abaixo, qual é a opção que indica as respostas com as alternativas adequadas (para cada item e

com base em todo o texto do respectivo item):

( ) Nas curvas de frequência simétrica ou em forma de sino caracterizam-se pelo fato das

observações equidistantes do ponto central máximo terem a mesma frequência.

( ) Nas curvas de moderadamente assimétrica ou desviadas, a cauda da curva de um lado da

ordenada máxima é mais longa do que do outro lado. Se o ramo mais alongado fi ca à direita, a

curva é dita desviada para a direita ou de assimetria negativa, enquanto que, se ocorrer o

inverso, diz-se que a curva é desviada para a esquerda ou de assimetria positiva.

( ) Nas curvas em forma de J (letra jota ou anzol) ou J invertido, o ponto de ordenada máxima

ocorre em uma das extremidades.

a) V, F, F c) V, F, V e) F, F, V

b) V, V, F d) F, V, F

04. (TCU 93) Gráficos são instrumentos úteis na análise estatística. Assinale a afirmação incorreta:

a) Um histograma representa uma distribuição de frequências para variáveis do tipo contínuo.

b) O gráfico de barras representa, por meio de uma série de barras, quantidades ou frequências para

variáveis categóricas.

c) O gráfico de setores é apropriado, quando se quer representar as divisões de um montante total.

d) Um histograma pode ser construído utilizando-se, indistintamente, as frequências absolutas ou

relativas de um intervalo de classe.

e) Uma ogiva pode ser obtida ligando-se os pontos médios dos topos dos retângulos de um

histograma.

05. (AFTN 94 ESAF) Assinale a opção correta:

a) A utilização de gráficos de barras ou de colunas exige amplitude de classe constante na

distribuição de frequência.

b) O histograma é um gráfico construído com frequências de uma distribuição de frequências ou de

uma série temporal.

c) O polígono de frequência é um indicador gráfico da distribuição de probabilidade que se ajusta à

distribuição empírica a que ele se refere.

d) O histograma pode ser construído para a distribuição de uma variável discreta ou contínua.

e) O polígono de frequência é construído unindo-se os pontos correspondentes aos limites inferiores

dos intervalos de classe da distribuição de frequência.

GABARITO 1.A 2.D 3.C 4.E 5.C 6.E


Estatística

MÓDULO 04 - MEDIDAS DE POSIÇÃO

1. MÉDIA ARITMÉTICA : X

Para um conjunto de valores

Média Aritmética Simples: n

xxx

n

xX ni

21 , n = nº de elementos

Média Aritmética Ponderada: n

nn

ppp

xpxpxpX

21

2211

Para Dados Tabulados Não Agrupados em Classes

Média Aritmética Ponderada: k

kkii

fff

xfxfxf

n

xfX

21

2211

Para Dados Tabulados Agrupados em Classes

Média Aritmética Ponderada: k

kkii

fff

xfxfxf

n

xfX

21

2211

Obs.: Em uma distribuição com classes, os xi são geralmente representados pelos pontos médios das classes. Propriedades da Média Aritmética

1) A Média Aritmética é afetada por valores extremos.

2) Se n1 valores têm média 1X , se n2 valores têm média 2X , ..., se nm valores têm média

mX , então a média do conjunto formado por todos os valores é dada pela relação:

m

mm

nnn

XnXnXnX

...

...

21

2211 “A Média das Médias!”

3) A soma dos desvios de um conjunto de números tomados em relação à média aritmética é zero. Simbolicamente: Para um conjunto de valores

0 XXi

Para Dados Tabulados:

0. XXifi

4) Propriedade da Soma e Subtração: "Ao somarmos (ou subtrairmos) um valor constante

(c) a cada um dos elementos de um conjunto de números (conj. A)".

Resultado: A média do novo conjunto (conj. B) fica somada (ou subtraída) dessa constante.

cAB cXX AB

5) Propriedade do Produto e Divisão: "Ao multiplicarmos (ou dividirmos) um valor constante (c) a cada um dos elementos de um conjunto de números (conj. A)".

, k = nº de linhas da

tabela de frequências

, k = nº de linhas da

tabela de frequências

, p = peso de cada elemento no

conjunto.


Estatística

Resultado: A média do novo conjunto (conj. B) fica multiplicada (ou dividida) por essa constante.

cXXcAB AB e cXXcAB AB

CÁLCULO SIMPLIFICADO DA MÉDIA ARITMÉTICA

Muitas vezes as contas que somos obrigados a fazer na construção da coluna (fi.Xi) para o cálculo da média Aritmética são trabalhosas e poderiam vir a ser bastante demoradas, sobretudo se as classes tiverem como Pontos Médios valores não-inteiros, ou seja, valores “quebrados”, o que ocorre com frequência nas provas de concursos.

A saída inteligente para resolver este problema, é transformar a variável original Xi em uma outra variável, através de uma operação de subtração e depois uma divisão, de forma que não calcularemos os produtos fi.Xi, mas sim, os produtos fi.Yi que são mais fáceis de obter.

Poderemos simbolizar a nova variável (a variável transformada) por uma outra letra, Yi por exemplo. Ou Wi, ou Zi... fica a seu critério. Iremos, portanto, no cálculo da Média construir uma nova coluna, que será chamada Coluna da Variável Transformada. Vejamos um exemplo retirado da prova AFRF 2002.2:

Classes fi Xi

(pontos médios)

Yi = Xi – 64,5_ 10

fi .Yi

29,5 |— 39,5 39,5 |— 49,5 49,5 |— 59,5 59,5 |— 69,5 69,5 |— 79,5 79,5 |— 89,5 89,5 |— 99,5

4 8

14 20 26 18 10

34,5 44,5 54,5 64,5 74,5 84,5 94,5

-3 -2 -1 0 1 2 3

-12 -16 -14 0

+26 +36 +30

n=100 +50

Os passos deste método são os seguintes (Para distribuições com amplitudes de classes iguais):

Xi Yi Y X

1) Construir a coluna da variável transformada (aqui chamada Yi), seguindo a sugestão: i) Subtrairemos os Xi pelo ponto médio de uma das classes da distribuição. Sugiro a classe

central da distribuição. Se a distribuição tiver um número par de classes, escolha a classe central com maior frequência. No exemplo acima escolhemos o PM da 4ª Classe.

ii) Dividiremos o resultado pela Amplitude da Classe, o “h” (no exemplo: h=10). IMPORTANTE: Sempre que construirmos a coluna da variável transformada por meio da sugestão apresentada acima, teremos como resultado uma sequencia de números inteiros, iniciando por zero na classe escolhida no item "i" acima e incrementando de +1 para baixo e de -1 para cima. (Veja a tabela acima).


Estatística

2) Construir a coluna (fi.Yi) e calcular o seu somatório; 3) Encontrar o valor da Média da Variável Transformada, usando a fórmula da média:

n

YifiY Neste exemplo: 5,0

100

50Y

4) O Cálculo da Média:

A relação entre X e Y é dada por: Y = X – 64,5_ , 10 e ao isolarmos X obtemos: X = 10.Y + 64,5 . Pelas propriedades da Média, sabemos que ao somar, subtrair, multiplicar ou dividir uma

constante por uma variável, a média desta variável se altera de forma igual. Portanto, como 5,6410 YX , então 5,6410 YX

Substituindo o valor de Y igual a 0,5 , calculado no item 3, obtemos a média da variável X:

X = 10 . 0,5 + 64,5 = 69,5

2. MODA : Mo Para um conjunto de valores

É o elemento do conjunto que mais se repete. Ex.: {2, 3, 3, 3, 4, 4} Mo = 3 Em relação a Moda, classifica-se um conjunto em:

Amodal: Quando não possuir moda. Ex.: {3, 6, 7, 9}

Unimodal: Quando possuir um única moda. Ex.: {3, 3, 3, 7, 9}

Bimodal: Quando possuir duas modas. Ex.: {3, 3, 6, 9, 9}

Multimodal: Quando possuir mais de duas modas. Ex.: {3, 3, 6, 6, 7, 9, 9} Para Dados Tabulados Não Agrupados em Classes

É o elemento da tabela que possui maior frequência simples (absoluta ou relativa).

Para Dados Tabulados Agrupados em Classes 1º Passo: Encontre a Classe Modal (é a classe que apresenta maior frequência absoluta simples). 2º Passo: Aplique a fórmula de Czuber :

hpa

alMo

inf

linf = limite inferior da classe modal. h = amplitude da classe modal.

a = diferença entre a frequência absoluta simples da classe modal e a da classe anterior.

antfifia

p = diferença entre a frequência absoluta simples da classe modal e a da classe posterior.

posfifip


Estatística

Obs.: Se a distribuição apresenta amplitudes de classes diferentes, então antes de executar

o 1º passo descrito acima, normalize as frequências absolutas simples (dividir as if por

suas amplitudes de classe). Estas frequências normalizadas serão as novas frequências absolutas simples para efeito do cálculo da moda.

Propriedades da Moda

1) Propriedade da Soma e Subtração: Ao somarmos (ou subtrairmos) um valor constante a cada um dos elementos de um conjunto de números, a moda fica somada (ou subtraída) dessa constante.

2) Propriedade do Produto e Divisão: Ao multiplicarmos (ou dividirmos) um valor

constante por cada um dos elementos de um conjunto de números, a moda fica multiplicada (ou dividida) por essa constante.

3. MEDIANA : Md Para um conjunto de valores (coloque em ordem crescente!)

Se n é ímpar :

1o Passo: "Posição do elemento central" =

2

1na Daí, obtemos o elemento

central. 2o Passo: "Determinação da Mediana" A Mediana é o próprio elemento central.

Se n é par : 1o Passo: "Posições dos elementos centrais"

Posição do 1o elemento central =

2

na Daí, obtemos o 1º elemento central.

Posição do 2o elemento central = é a posição seguinte. Daí, temos o 2º elemento central.

2o Passo: "Determinação da Mediana "

A Mediana é obtida pela média aritmética dos 2 elementos centrais. Para Dados Tabulados Não Agrupados em Classes (coloque em ordem crescente!)

1o Passo: "Encontrar a(s) Posição(ões) do(s) Elemento(s) Central (is)" Proceder da mesma forma que foi feita no conjunto de valores.

2o Passo: "Encontrar o(s) Elemento(s) Central(is)" Procurar na tabela o elemento cuja fac seja imediatamente maior ou igual à posição do elemento central, que foi obtida no 1o passo. (Se n é par teremos 2 elementos a serem encontrados).

3o Passo: "Determinação da Mediana" Se n é ímpar : a Mediana é o elemento central encontrado no 2o passo. Se n é par : a Mediana é a média aritmética dos 2 elementos centrais

encontrados no 2o passo.


Estatística


1o Passo: Número de elementos acumulados abaixo da Mediana: n/2 (ou 50%). 2o Passo: "Determinação da Classe Mediana"

A Classe Mediana é a classe da distribuição de frequências que primeiro apresentar fac (ou Fac) maior ou igual a n/2 (ou 50%).

3o Passo: "Interpolação linear para o cálculo da Mediana"

linf = limite inferior da classe mediana lsup = limite superior da classe mediana facinf = frequência acumulada de elementos abaixo do linf. facsup = frequência acumulada de elementos abaixo do lsup.

Propriedades da Mediana

1) Propriedade da Soma e Subtração: Ao somarmos (ou subtrairmos) um valor constante a cada um dos elementos de um conjunto de números, a mediana fica somada (ou subtraída) dessa constante.

2) Propriedade do Produto e Divisão: Ao multiplicarmos (ou dividirmos) um valor constante por cada um dos elementos de um conjunto de números, a mediana fica multiplicada (ou dividida) por essa constante.

6. SEPARATRIZES

6.1. QUARTIL

O quartil divide a distribuição em quatro partes iguais. Temos, portanto, 3 quartis. Os quartis serão representados por Qj , para j = 1, 2 e 3. (1o quartil: j=1; 2o quartil: j=2; 3o quartil: j=3)

Para um conjunto de valores (coloque em ordem crescente!)

O método mais prático para obter os 3 quartis é utilizar o princípio do cálculo da mediana.

Na realidade serão calculadas “3 medianas” para um mesmo conjunto.

Ex.1: Calcule os quartis (Q1 , Q2 e Q3 ) do conjunto: {3, 8, 1, 0, 9, 6, 4}

1. O primeiro passo a ser dado é o da ordenação (crescente) dos valores: {0, 1, 3, 4, 6, 8, 9}

linf lsup Md

facsup facinf n/2 (ou

50%)


Estatística

2. Cálculo do 2º quartil: O 2º quartil será a mediana do conjunto {0, 1, 3, 4, 6, 8, 9}. A Md = 4 , ou seja, o 2º quartil: Q2 = 4 .

3. Cálculo do 1º quartil: Grupo de valores à esquerda do 2º Quartil: {0, 1, 3} O 1º quartil será a mediana desse grupo de valores. Em {0, 1, 3} a mediana é Md = 1. Ou seja, o 1º quartil: Q1 = 1

4. Cálculo do 3º quartil: Grupo de valores à direita do 2º Quartil: {6, 8, 9} O 3º quartil será a mediana desse grupo de valores. Em {6, 8, 9} a mediana é Md = 8. Ou seja, o 3º quartil: Q3 = 8

Ex. 2: Calcule os quartis (Q1 , Q2 e Q3) do conjunto: {1, 1, 3, 5, 6, 6, 7, 7, 7, 9, 9, 9} .

1. A série já está em ordem crescente. 2. Cálculo do 2º quartil:

O 2º quartil será a mediana do conjunto {1, 1, 3, 5, 6, 6, 7, 7, 7, 9, 9, 9} . A Md = (6+7)/2 = 6,5 , ou seja, o 2º quartil: Q2 = 6,5 .

3. Cálculo do 1º quartil: Grupo de valores à esquerda do 2º Quartil: {1, 1, 3, 5, 6, 6} . O 1º quartil será a mediana desse grupo de valores. Em {1, 1, 3, 5, 6, 6} a mediana é Md = (3+5)/2 = 4. Ou seja, o 1º quartil: Q1 = 4 .

4. Cálculo do 3º quartil: Grupo de valores à direita do 2º Quartil: {7, 7, 7, 9, 9, 9} O 3º quartil será a mediana desse grupo de valores. Em {7, 7, 7, 9, 9, 9} a mediana é Md = (7+9)/2 = 8. Ou seja, o 3º quartil: Q3 = 8


1º Passo: "Número de elementos acumulados abaixo do Qj" é igual a: 4

nj (ou j.25%).

2º Passo: "Encontrar a classe do Qj" :

Será a classe que primeiro apresentar fac (ou Fac) maior ou igual a 4

nj (ou j.25%).

3º Passo: "Interpolação linear para o cálculo do Qj"

linf = limite inferior da classe do Qj. lsup = limite superior da classe do Qj. finf = frequência acumulada de elementos abaixo do linf. fsup = frequência acumulada de elementos abaixo do lsup.

linf lsup Qj

fsup finf

n/2 (ou

j.25%)


Estatística

MÓDULO 05 - MEDIDAS DE DISPERSÃO 1. Conceito: Dispersão é a maior ou menor diversificação dos valores de uma variável, em torno de um valor de tendência central tomado como ponto de comparação. Para qualificar os valores de uma variável, mostrando a maior ou menor concentração ou dispersão entre seus valores e a medida de posição tomada como referência, no caso a média aritmética, recorre-se às medidas de dispersão ou de variabilidade.

Portanto, a finalidade das medidas de dispersão é verificar a representatividade do grau de concentração ou dispersão dos dados em torno da média. 2. AMPLITUDE TOTAL: AT É a diferença entre o maior valor e o menor valor dos dados apresentados. Exemplo para um conjunto:

Seja o conjunto: X = {1, 2, 3, 5, 7, 9} Teremos que: AT= 9 – 1 AT = 8 Exemplo de Dados Tabulados não agrupados em classes: Seja:

Xi fi

2 4 6 8

10 13

5 10 15 12 5 3

Total 50

Teremos que: AT = 13 – 2 AT = 11 Exemplo de Dados tabulados agrupados em classes: Seja:

classes fi

2 |— 4 4 |— 6 6 |— 8

8 |— 10 10 |— 12

3 5 7 4 1

Total 20

Teremos que: AT = 12 – 2 AT = 10 Obs.: Note que a Amplitude Total também pode ser determinada pela diferença entre o Ponto

Médio da última classe e o Ponto Médio da primeira classe!

Obs.: Essa medida tem aplicações muito limitadas, pois só capta o que acontece com os valores extremos, sendo completamente insensível aos valores intermediários.


Estatística

3. DESVIO MÉDIO: DM É a média dos valores absolutos dos desvios calculados em relação à média aritmética do conjunto. 3.1. Para um conjunto:

n

XXiDM

Exemplo: Seja X = {1, 3, 5, 7, 9} Teremos que: X = 5 Daí:

Xi Xi – X | Xi – X |

1 3 5 7 9

1 – 5 = -4 3 – 5 = -2 5 – 5 = 0 7 – 5 = 2 9 – 5 = 4

4 2 0 2 4

Total 12

Logo: DM = 12 / 5 DM = 2,4 3.2. Para Dados tabulados não agrupados: Teremos que:

n

XXifiDM

.

Exemplo: Calcule o desvio médio da distribuição:

Xi fi

2 4 6 8

10 13

5 10 15 12 5 3

Total 50

Acharemos as colunas Xi – X , |Xi – X | e fi.|Xi – X | .

Calculando a média, encontraremos: X =6,5. Logo:

Xi fi Xi – X |Xi – X | fi. |Xi – X |

2 4 6 8

10 13

5 10 15 12 5 3

2-6,5=-4,5 4-6,5=-2,5 6-6,5=-0,5 8-6,5=1,5

10-6,5=3,5 13-6,5=6,5

4,5 2,5 0,5 1,5 3,5 6,5

4,5x5=22,5 2,5x10=25 0,5x15=7,5 1,5x12=18 3,5x5=17,5 6,5x3=19,5

Total 50 110


Estatística

Daí: DM = 110 / 50 DM = 2,20

3.3. Para Dados tabulados agrupados em classes: Teremos também que:

n

XXifiDM

.

A única diferença para o DMA nos dados tabulados não agrupados é que agora a coluna Xi

– X será encontrada pela diferença entre o Ponto Médio de cada classe e a Média Aritmética da distribuição!

Portanto, devemos aqui encontrar primeiramente a coluna dos Pontos Médios (Xi)!

4. VARIÂNCIA: V ou S2

É a média dos quadrados dos desvios dos elementos tomados em relação à média aritmética.

Para um conjunto de valores:

Para a População:

n

XXiV

2)( ou

n

XiXi

nV

2

21

Para a Amostra:

1

)( 2

n

XXiV ou

n

XiXi

nV

2

2

1

1

Para a Distribuição de Frequências:

Para a População:

n

XXifiV

2)( ou

n

fiXifiXi

nV

2

21

Para a Amostra:

1

)( 2

n

XXifiV ou

n

fiXifiXi

nV

2

2

1

1

Lembre-se que em uma distribuição de frequência com classes, os elementos Xi não são conhecidos, e que estes são representados geralmente pelos pontos médios das classes.


Estatística

IMPORTANTE: Na fórmula da Variância aparece o termo )(Xi para um conjunto de valores e o

termo )( fiXi para os Dados Tabulados. É importante saber que há uma relação entre os

termos acima e o valor da média aritmética X . Temos as seguintes relações:

- Para o Rol ou Dados Brutos: XnXi .

- Para Dados Tabulados: XnfiXi .

Deste modo, se forem fornecidos os valores de X e de n, consequentemente teremos o valor do termo que aparece na fórmula da variância.

Exemplo: Seja X = {1, 3, 5, 7, 9} Teremos que: X = 5 Daí:

Xi Xi – X (Xi – X )2

1 3 5 7 9

1 – 5 = -4 3 – 5 = -2 5 – 5 = 0 7 – 5 = 2 9 – 5 = 4

16 4 0 4

16

Total 40

Logo: V = 5

40 V = 8

Exemplo: Calcule a variância a partir da distribuição populacional a seguir:

Xi fi

2 4 6 8

10 13

5 10 15 12 5 3

Total 50

Acharemos as colunas Xi – X , (Xi – X )2 e fi.( Xi – X )2 .

Calculando a média, encontraremos: X =6,5. Logo:

Xi fi Xi – X (Xi – X )2 fi. (Xi – X )2

2 4 6 8

10 13

5 10 15 12 5 3

2-6,5=-4,5 4-6,5=-2,5 6-6,5=-0,5 8-6,5=1,5

10-6,5=3,5 13-6,5=6,5

20,25 6,25 0,25 2,25

12,25 42,25

20,25x5 = 101,25 6,25x10 = 62,5 0,25x15 = 3,75 2,25x12 = 27 12,25x5 = 61,25 42,25x3 = 126,75

Total 50 382,50


Estatística

Daí: 50

50,382V V = 7,65

Cálculo Simplificado da Variância

Da mesma forma que usamos uma variável transformada no Cálculo Simplificado da Média Aritmética, também usaremos no Cálculo Simplificado da Variância com a finalidade de facilitar a obtenção da variância que dependendo dos dados fornecidos na questão pode ser bastante trabalhosa. Assim, transformaremos a variável original X em uma outra variável, por meio de uma operação de subtração e depois de uma divisão. Poderemos simbolizar a nova variável (a variável transformada) por uma outra letra, Z por exemplo. Ou W, ou Y... fica a seu critério. Iremos, portanto, no cálculo simplificado da variância construir uma nova coluna, que será chamada Coluna da Variável Transformada. Vejamos um exemplo:

Classes fi Xi

(pontos médios)

Zi = Xi – 64,5 10

fi .Zi fi .Zi2

29,5 |— 39,5 39,5 |— 49,5 49,5 |— 59,5 59,5 |— 69,5 69,5 |— 79,5 79,5 |— 89,5 89,5 |— 99,5

4 8

14 20 26 18 10

34,5 44,5 54,5 64,5 74,5 84,5 94,5

-3 -2 -1 0 1 2 3

-12 -16 -14 0

+26 +36 +30

36 32 14 0

26 72 90

n=100 +50 +270

Os passos deste método são os seguintes (Para distribuições com amplitudes de classes iguais):

5) Construir a coluna da variável transformada (aqui chamada Z), seguindo a sugestão:

i) Subtrairemos os Xi pelo ponto médio de uma das classes da distribuição. A escolha mais adequada é uma classe central da distribuição. Se a distribuição tiver um número par de classes, escolha a classe central com maior frequência. No exemplo acima, escolhemos o PM da 4ª Classe.

ii) Dividiremos o resultado pela Amplitude da Classe, o “h” (no exemplo: h=10).

IMPORTANTE: Sempre que construirmos a coluna da variável transformada por meio da sugestão apresentada acima, teremos como resultado uma sequência de números inteiros, iniciando por zero na classe escolhida anteriormente e incrementando de +1 para baixo e de -1 para cima. (Veja a tabela.)


Estatística

6) Construir a coluna (fi .Zi) e calcular o seu somatório; 7) Construir a coluna (fi .Zi2) e calcular o seu somatório; 8) Encontrar o valor da Variância da Variável Transformada, usando a fórmula da variância:

- Para a população:

n

ZifiZifi

nVZ

2

2.

.1

.

Substituindo os dados, teremos: 45,2100

)50(270

100

1 2

ZV

9) Cálculo da Variância

A relação entre X e Z é dada por: Z = X – 64,5_ , 10 e ao isolarmos X, obteremos: X = 10.Z + 64,5 . Pelas propriedades da variância, sabemos que ao somar ou subtrair uma constante a uma

variável, a variância não se altera, e que ao multiplicar (ou dividir) uma variável por uma constante, a variância fica multiplicada ou dividida pelo quadrado da constante.

Portanto, como 5,6410 ZX , então: ZX VV 2)10( .

Substituindo o valor de VZ = 2,45 , calculado no item 4, obtemos a variância da variável X: VX = (10)2 . 2,45 = 245 .

Propriedades da Variância:

A variância de dados constantes é zero;

A variância utiliza o quadrado dos desvios em relação à média, portanto terá o quadrado da unidade dos dados, ou seja, m2, kg2, ...

Quanto a Propriedade da Soma e da Subtração: Somando-se (ou subtraindo-se) a cada elemento de um conjunto de valores uma constante arbitrária, a variância não se altera.

Quanto a Propriedade do Produto e da Divisão: Multiplicando-se (ou dividindo-se) cada elemento de um conjunto de valores por um valor constante, arbitrário e diferente de zero, a variância ficará multiplicada (ou dividida) pelo quadrado desta constante.

Obs.: Veja nos resumos, ao final da apostila, o cálculo simplificado da variância! 5. DESVIO PADRÃO: dp ou S É a raiz quadrada da média dos quadrados dos desvios em relação à média aritmética, ou

seja, é a raiz quadrada da variância: VS .

Caso uma questão peça o valor do desvio padrão, primeiramente calcule a variância e em

seguida tire a raiz quadrada.


Estatística

5.4. Propriedades do Desvio Padrão:

O desvio padrão de dados constantes é zero;

O desvio padrão é uma medida que utiliza a mesma unidade dos dados.

Quanto a Propriedade da Soma e da Subtração: Somando-se (ou subtraindo-se) a cada elemento de um conjunto de valores uma constante arbitrária, o desvio padrão não se altera.

Quanto a Propriedade do Produto e da Divisão: Multiplicando-se (ou dividindo-se) cada elemento de um conjunto de valores por um valor constante, arbitrário e diferente de zero, o desvio padrão ficará multiplicado (ou dividido) por esta constante.

6. AMPLITUDE SEMI-INTERQUARTÍLICA (DESVIO QUARTÍLICO): Dq É a metade da diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1).

Ou seja:

2

13 QQDq

Atenção:

→ O intervalo interquartílico é definido por: 31 Q;Q

→ A distância ou amplitude interquartílica é definida como: 13 QQ

→ O intervalo semi-interquartílico é definido por:

22

31 Q;

Q

→ A distância ou amplitude semi-interquartílica é definida como: 2

13 QQ

7. COEFICIENTE DE VARIAÇÃO: CV (A Dispersão Relativa)

Também conhecido por Coeficiente de Variação de Pearson. É utilizada para fazer comparação da dispersão de duas séries distintas em torno de suas respectivas médias.

É definida como o quociente entre o Desvio Padrão e a Média Aritmética do conjunto de dados.

Ou seja: X

SCV

Exemplo: Considere que tenhamos duas distribuições. A primeira com média 4 e desvio padrão 1,5 e a outra com média 3 e desvio padrão 1,3. Neste caso temos os seguintes CV's:

43.03

3.1375.0

4

5.121 CVCV

logo conclui-se que, como CV2 é maior que CV1 , a segunda distribuição tem uma dispersão relativa maior que a primeira. Obs.: Quanto menor for o valor do CV, mais homogêneo será o conjunto de dados. Portanto, no exemplo acima, a primeira distribuição é mais homogênea do que a segunda.


Estatística

Obs.: Em geral CV maior ou igual a 50% é considerado alto, sendo a média pouco representativa. Valores menores que 50% implicam CV baixo e a média é tão mais representativa quanto menor for o valor do CV. 8. VARIÂNCIA RELATIVA : VR

A variância relativa também é uma medida de dispersão relativa que é obtida como a razão entre a variância e o quadrado da média aritmética.

2

2

X

SVR

A variância relativa pode ser definida como o quadrado do coeficiente de variação, vejamos:

2

22

2

X

S

X

SCVVR

RESUMO DAS PROPRIEDADES DA SOMA, SUBTRAÇÃO, PRODUTO E DIVISÃO: Se tomarmos todos os elementos de um conjunto e os...

...somarmos a uma

constante

...subtrairmos de uma

constante

...multiplicarmos por uma constante

...dividirmos por uma constante

As medidas: Média, Mediana,

Moda, Quartil, Decil e Percentil

estarão:

Também somada a

esta constante

Também subtraída

desta constante

Também multiplicada por esta constante

Também dividida por esta

constante

O Desvio Padrão e o Desvio Médio

ficarão:

Inalterado

Inalterado

Multiplicado

pelo módulo desta constante

Dividido pelo módulo desta

constante

A Variância ficará:

Inalterada

Inalterada

Multiplicada pelo quadrado desta

constante

Dividida pelo quadrado desta

constante

O Coeficiente de Variação ficará:

alterado

(calcular X

S)

alterado

(calcular X

S)

Inalterado Inalterado


Estatística

MÓDULO 06 - DIAGRAMA DE CAIXA (OU BOX-SPLOT)

O diagrama de caixa (ou Box-Splot) é um tipo de representação gráfica dos dados estatísticos. Para sua construção é necessário cinco números, três dos quais calculados a partir dos dados e os outros dois resultantes de uma simples observação dos dados. Esta é uma representação muito esclarecedora sobre a forma como os dados se distribuem, quanto a: - maior ou menor concentração; - simetria; - existência de valores “extremos”.

Os cinco números, a partir dos quais se constrói o diagrama de caixa, são os seguintes: mínimo, máximo, primeiro quartil (Q1), mediana (Md) e terceiro quartil (Q3).

O diagrama de caixas pode ser construído horizontalmente ou verticalmente. Exemplo 01: Os dados seguintes representam as pontuações obtidas por 48 estudantes, num determinado teste. Apresente-os num diagrama de caixa.

37, 42, 49, 53, 55, 57, 58, 59, 60, 62, 62, 63, 64, 65, 66, 68, 69, 70, 71, 72, 74, 75, 75, 76, 77, 77, 78, 78, 79, 79, 80, 80, 81, 83, 84, 84, 85, 86, 87, 88, 89, 90, 90, 92, 93, 95, 98, 99.

Solução:

Mediana = 76 + 77 = 76,5 2

1º quartil = 63 + 64 = 63,5 2

3º quartil = 84 + 85 = 84,5 2

Quanto ao mínimo e ao máximo, são, respectivamente, 37 e 99.

Para construir o diagrama de caixa, desenha-se um retângulo com comprimento igual à amplitude entre os quartis e com altura qualquer (a altura do retângulo não tem qualquer significado).

Dentro do retângulo desenha-se um segmento de reta que assinala a posição da mediana. Dos lados do retângulo determinados pelo 1º quartil e pelo 3º quartil saem dois segmentos de reta, até ao mínimo e até ao máximo, respectivamente:


Estatística

Da representação anterior ressalta imediatamente que:

- 25% das notas são menores ou iguais a 63 pontos (as notas estão dadas em números inteiros);

- 25% das notas são superiores ou iguais a 85 pontos;

- 50% das notas estão compreendidas entre 64 e 84 pontos;

Existem fundamentalmente duas características do diagrama de caixa que nos dão ideia da simetria ou enviesamento dos dados e que são:

- Distância entre a linha indicadora da mediana e os lados do retângulo;

- Comprimento das linhas que saem dos lados do retângulo.

Apresentamos a seguir três exemplos de diagramas de caixa correspondentes a tipos diferentes de distribuição dos dados:

Simétrica Assimétrica à esquerda Assimétrica à direita

BARREIRAS DE OUTLIERS Consideram-se seguidamente duas linhas que unem os meios dos lados dos retângulos com o

menor e maior elementos da amostra que estão dentro das barreiras de outliers (extremos), definidas a seguir. Os outros elementos que não estão no intervalo constituído pelas barreiras de outliers são assinalados com o símbolo *.

Define-se barreira inferior como sendo o valor: Q1 – 1,5 x (Q3 – Q1) Define-se barreira superior como sendo o valor: Q3 + 1,5 x (Q3 – Q1)

Quando é que consideramos um valor como outlier?

Dizemos que um valor é outlier quando não está compreendido no intervalo:

[barreira inferior, barreira superior].

Numa representação em caixa-com-bigodes, os outliers assinalam-se com o símbolo “*”.


Estatística

MÓDULO 07 - AMOSTRAGEM

1. INTRODUÇÃO A inferência estatística envolve a formulação de certos julgamentos sobre um todo após examinar apenas uma parte – ou amostra – dele. E em nosso dia-a-dia, muitas vezes nós usamos uma amostra para julgar um todo, mas nem percebemos que fazemos isso. Quando queremos verificar se certo alimento é saboroso, comemos apenas um pequeno pedaço; a cozinheira prova a sopa para verificar se precisa de um pouco mais de sal; quando passamos os olhos sobre um novo livro ou uma revista para ver se vamos comprar; quando assistimos um programa de TV por uns poucos segundos ou minutos para decidir se mudamos ou não um canal,...

A amostragem estatística é semelhante a cada um dos exemplos acima, embora seus métodos sejam mais formais.

Mas, para as inferências serem corretas, é necessário garantir que a amostra seja representativa da população, isto é, a amostra deve possuir as mesmas características básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar. E para tanto, ela deve ser retirada segundo determinadas técnicas de amostragem.

2. TÉCNICAS (OU PROCESSOS) DE AMOSTRAGEM Ao coletarmos uma amostra podemos fazê-la com reposição ou sem reposição, caso a amostragem

seja realizada com reposição, um mesmo indivíduo tem chance de pertencer mais de uma vez a amostra, o que não acontece, no caso da amostragem ser sem reposição. Independentemente da maneira como a amostra é coletada (com ou sem reposição) o importante é que os indivíduos que comporão a amostra deverão ser selecionados através de uma técnica de amostragem adequada.

Para a escolha do processo de amostragem, o pesquisador deve levar em conta o tipo de pesquisa, a acessibilidade aos elementos da população, a disponibilidade ou não de ter os elementos da população, a representatividade desejada ou necessária, a oportunidade apresentada pela ocorrência de fatos ou eventos, a disponibilidade de tempo, recursos financeiros e humanos etc.

As técnicas de amostragem são divididas em dois grupos: Amostragem Probabilística e Amostragem Não-Probabilística.

2.1. Amostragem Probabilística (ou Aleatória ou Casual): é aquela em que cada elemento da população tem uma chance conhecida e diferente de zero de ser selecionado para compor a amostra. Em outras palavras: todas as fases necessárias para a escolha dos elementos que constituirão a amostra são baseadas em “sorteios”.

As amostragens probabilísticas geram amostras probabilísticas (com distribuição normal, ou binomial, ...).

Dentre as amostragens probabilísticas se destacam:

- Amostragem Aleatória Simples

- Amostragem Sistemática

- Amostragem Estratificada

- Amostragem por Conglomerado

2.2. Amostragem Não-Probabilística (ou Não-Aleatória ou Não-Casual): é aquela em que a seleção dos elementos da população para compor a amostra depende ao menos em parte do julgamento do pesquisador ou do entrevistador no campo. Dentre estas se destacam:

- Amostragem por Conveniência

- Amostragem por Julgamento

- Amostragem por Quotas


Estatística

3. PRINCIPAIS TÉCNICAS DE AMOSTRAGEM PROBABILÍSTICA o Amostragem Aleatória Simples

Este tipo de amostragem é equivalente a um sorteio lotérico.

Na prática, a amostragem aleatória simples pode ser realizada enumerando-se todos os indivíduos da população (por exemplo, de 1 a n) e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, uma quantidade (digamos k) de números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra.

Exemplo: Deseja-se pesquisar a estatura dos 80 alunos que estudam em uma escola, para isso resolveu-se retirar uma amostra de 10% do total de alunos. Usando a amostragem aleatória simples, mostre como pode ser feita a seleção da amostra.

Solução:

A população é formada pelos 80 alunos da escola. E a amostra será formada pelos alunos sorteados. Sendo o tamanho da amostra de 10% do total de 80 alunos, ou seja, 8 alunos.

1º passo: Numeramos os alunos de 01 a 80. Podemos elaborar uma lista com o número ao lado do nome do aluno.

2º passo: Escrevemos os números de 01 a 80 em pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos a caixa para misturar bem os pedaços de papel.

3º passo: Retiramos, um a um, oito números que formarão a amostra.

Pronto! Medindo as alturas dos alunos correspondentes aos números sorteados, obteremos uma amostra das estaturas dos noventa alunos.

Para evitar o trabalho de escrever os números em pedaços de papel, sobretudo se a população é muito grande, foi elaborada uma tabela – Tabela de Números Aleatórios – construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas. Então, para compor uma amostra de 8 números, só é preciso selecionar 8 números que estejam dispostos em uma coluna ou linha ou diagonal da tabela. Esse grupo de 8 números selecionados equivale ao sorteio dos 8 papeizinhos.

Não vou expor a tabela de números aleatórios, porque ela não virá na prova. A minha intenção é somente dar conhecimento da existência dessa tabela.

o Amostragem Sistemática

Quando os elementos da população já se acham ordenados, não há necessidade de construir um sistema de referência. São exemplos: os prontuários médicos de um hospital, as casas de uma rua, uma linha de produção etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos Sistemática.

Ela é uma simplificação do processo anterior. Neste caso, apenas o primeiro elemento da amostra será sorteado, e os demais serão retirados em uma progressão aritmética, com razão k, em que:

n

Nk ,

Onde: N = tamanho da população e n = tamanho da amostra até se completar o tamanho da amostra desejado.

Exemplo:

Suponhamos uma rua contendo 600 prédios, dos quais desejamos obter uma amostra formada de 50 prédios. Podemos, neste caso, usar o seguinte procedimento: como 600/50=12, escolhemos por sorteio um número de 1 a 12 (inclusive), o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 12 em 12. Assim, se o número sorteado fosse o número 10, tomaríamos, pelo lado direito da rua, o 10º prédio, o 22º, o 34º, o 46º etc., e ao terminar o lado direito voltamos ao início da rua, pelo lado esquerdo, para continuar a contagem, a fim de completar a amostra dos 50 prédios.


Estatística

o Amostragem Estratificada

Muitas vezes a população se divide em subpopulações – estratos. Exemplos: Numa escola podemos separar os alunos em dois estratos: meninos e meninas; numa pesquisa podemos separar as pessoas por faixas (estratos) de idade; ou separar as pessoas de acordo com a formação escolar: nível secundário, nível médio e nível superior; para as propriedades rurais criar estratos de acordo com o tamanho: 0|--10, 10|--20, 20|--30 hectares.

Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio da amostra leve em consideração tais estratos.

É exatamente isso que fazemos quando empregamos a amostragem estratificada.

Quanto à forma de retirar os elementos dos estratos para compor a amostra, é classificada em:

Uniforme

Quando é retirado o mesmo número de elementos em cada estrato, independentemente do tamanho do estrato.

Proporcional

Quando o número de elementos retirado em cada estrato é proporcional ao tamanho do estrato.

Para exemplificar os dois tipos de amostragem estratificada descritos, consideremos o seguinte exemplo.

Exemplo: Supondo, no exemplo feito na amostragem aleatória simples, que, dos 80 alunos da escola, 50 são meninas e 30 são meninos, vamos realizar uma amostragem estratificada uniforme e proporcional para um tamanho de amostra de 10%.

Temos dois estratos na população considerada: meninos e meninas.

Por primeiro, analisaremos a amostragem estratificada uniforme.

Neste tipo, o número de meninos e de meninas que vão compor a amostra deve ser igual. Como a amostra é de 8 alunos (10% de 80), então vamos selecionar (de forma aleatória) 4 meninos e 4 meninas. Só isso!

E, agora, a amostragem estratificada proporcional.

A determinação do tamanho de cada estrato é mostrada na tabela abaixo.

Sexo População porcentagem da amostra (10%)

tamanho da amostra

menina 50 10% de 50 5

menino 30 10% de 30 3

Total 80 10% de 80 8

Ficou definido na tabela que a amostra de 8 alunos será formada por 5 meninas e 3 meninos. E o processo de seleção dessas crianças deve ser feito de maneira aleatória, por exemplo, através da amostragem aleatória simples.


Estatística

o Amostragem por Conglomerados

A amostragem por Conglomerado pressupõe a disposição dos itens de uma população em subgrupos (conglomerados) representativos da população global. Idealmente, cada conglomerado pode ser encarado como uma minipopulação. Em geral, os conglomerados são grupos de itens que se acham em estreito contato físico, como casas, quarteirões, bairros, municípios etc.

A amostragem por conglomerados tem duas vantagens muito distintas sobre a amostragem aleatória simples. Uma é que se os itens da população se acham muito dispersos, uma amostragem aleatória simples pode acarretar uma considerável despesa, viagens, estadias etc., para ser bem extraída, ao passo que os itens de cada conglomerado estão próximos uns dos outros. Suponhamos, por exemplo, que a população de interesse consistisse dos proprietários de automóveis do estado de Minas Gerais. Sem dúvida uma amostragem aleatória simples incluiria proprietários em localidades demasiadamente afastadas no estado, o que dificultaria a coordenação e a padronização na coleta dos dados. Por outro lado, os conglomerados de municípios ou cidades conteriam proprietários de carros em áreas concentradas, reduzindo o custo e facilitando a coordenação. Após selecionar aleatoriamente os conglomerados em todo o estado de Minas Gerais, dentro de cada conglomerado, a amostragem poderia ser aleatória simples, estratificada, novamente por conglomerados (por exemplo, bairros de uma cidade), ou ainda ser feito um censo para o caso do conglomerado selecionado não possua muitos indivíduos.

Uma segunda vantagem da amostragem por conglomerado é que não é necessário uma listagem dos itens da população. Basta uma lista dos conglomerados. Assim, não é possível obter uma listagem de todos os proprietários de imóveis do Brasil, mas pode-se obter uma lista de estados, ou municípios, ou cidades. Ou então os conglomerados podem ser quarteirões. Embora não possamos obter uma listagem das casas de uma cidade, os quarteirões podem, em geral, ser identificados, fazendo-se a seleção por meio de mapas. Então os quarteirões escolhidos podem ser visitados, identificando-se as casa que comporão a amostra.

4. PRINCIPAIS TÉCNICAS DE AMOSTRAGEM NÃO-PROBABILÍSTICAS o Amostragem por Conveniência

A amostragem por conveniência é adequada e frequentemente utilizada para geração de ideias em pesquisas exploratórias, principalmente.

A amostra por conveniência é empregada quando se deseja obter informações de maneira rápida e barata. Uma vez que esse procedimento consiste em simplesmente contatar unidades convenientes da amostragem, é possível recrutar respondentes tais como estudantes em sala de aula, mulheres no shopping, alguns amigos e vizinhos, entre outros. Os autores comentam que este método também pode ser empregado em pré-testes de questionários.

Alguns exemplos de pesquisa com amostras por conveniência:

Solicitar as pessoas que voluntariamente testem um produto e que em seguida respondam a uma entrevista.

Parar pessoas no supermercado e colher suas opiniões.

Colocar linhas de telefone adaptadas para que durante um programa de televisão os telespectadores possam dar suas opiniões.

o Amostragem por Julgamento

O pesquisador escolhe deliberadamente certos elementos da população para formar a amostra, baseado num pré-julgamento.

Exemplo: Pesquisa de mercado para lançar uma nova marca de leite longa vida tipo A. O pesquisador selecionará indivíduos com poder aquisitivo médio/alto, que são os principais consumidores deste produto (publico alvo), embora toda a população independentemente do poder aquisitivo possa ser consumidora deste produto.


Estatística

o Amostragem por Quotas

É também baseada em um julgamento e não em um processo aleatório. É frequentemente usada em pesquisas de opinião e pesquisa de mercado. Neste método deve-se conhecer as características da população de antemão e, então, usar uma amostra semelhante à população em termos de composição.

O objetivo é obter-se uma amostra que seja representativa da população. A forma da população deve ser conhecida, pelo menos aproximadamente, à proporção que aparece uma certa quantidade, por exemplo, as proporções de pessoas de diferentes idades, sexo e grupos étnicos. A amostragem por quotas busca repetir esses percentuais na amostra. A amostragem por quotas pode ser comparada a uma amostragem estratificada. A população é estratificada por variáveis importantes, tais como idade, sexo e localidade e a quota necessária é obtida de cada estrato. Mas a diferença importante é que a amostragem por quotas não é selecionada por qualquer base aleatória.

EXERCÍCIOS

01. Para cada uma das seguintes situações diga qual o tipo de amostragem foi utilizada.

a) Para compor a amostra foram sorteados aleatoriamente 10% de homens e 10% de mulheres de uma cidade. Tipo de Amostragem:________________

b) Numa escola precisa-se dividir 20 pessoas em dois grupos. Para o primeiro grupo ele seleciona

aleatoriamente 10 pessoas, e considera os 10 restantes para o segundo grupo. Tipo de Amostragem: ___________________________

c) Uma lista numerada contém 200 nomes, numerados consecutivamente a partir do número 1.

Iniciando pelo 10º nome, uma amostra foi composta considerando sorteados os nomes referentes aos números 20, 30, 40, 50 e assim sucessivamente até que fossem escolhidos 10 nomes. Tipo de amostragem: Amostragem _______________

02. Complete:

a) Na amostragem ______________ cada elemento da população tem a mesma chance de ser incluído na amostra.

b) Na amostragem ______________a seleção dos itens da população que farão parte da amostra são escolhidos seguindo uma sequência fixa, isto é, são escolhidos os itens r, r+k, r+2k, r+3k, e assim por diante.

c) A amostragem _______________pressupõe a divisão da população em subgrupos de itens similares, procedendo-se então a amostragem em cada subgrupo.

d) A amostragem _______________pressupõe a disposição dos itens de uma população em subgrupos heterogêneos representativos da população global, procedendo-se a amostragem dos subgrupos.

03. (ESAF/AFPS/2002/Administração Tributária Previdênciária) Assinale a opção correta em referência ao

significado do termo amostragem aleatória simples. a) Refere-se a um método de classificação da população. b) Refere-se à representatividade da amostra. c) É um método de escolha de amostras. d) Refere-se a amostras sistemáticas de populações infinitas. e) Refere-se à amostragem por quotas. 04. (Ministério da Integração Nacional 2012 Esaf) Para selecionar uma amostra aleatória de tamanho n de

uma população formada por N unidades, que são numeradas de 1 a N segundo uma certa ordem, escolhe-se aleatoriamente uma unidade entre as k primeiras unidades da população, onde k = N/n e seleciona-se cada k-ésima unidade da população em sequência. Esta técnica de amostragem denomina-se amostragem

a) sistemática. b) por etapas. c) estratificada. d) por conglomerados. e) por quotas.


Estatística

05. (AFCE-TCDF-2002/CESPE) Julgue os itens seguintes.

1. Quando aplicada em uma população de pessoas formada pelo mesmo número de homens e de mulheres, uma amostra aleatória simples também apresenta o mesmo número de homens e de mulheres.

06. (FTE-Alagoas-2002/CESPE) Julgue os seguintes itens.

1. Quando a escolha dos elementos que farão parte de uma amostra é realizada usando-se um mecanismo probabilístico, diz-se que se trata de amostra por quotas.

07. (Auditor Fiscal SEFAZ/RJ 2011 FGV) A respeito das técnicas de amostragem probabilística, NÃO é

correto afirmar que

(A) na amostragem por conglomerado a população é dividida em diferentes grupos, extraindo-se uma amostra apenas dos conglomerados selecionados.

(B) na amostragem estratificada, se a população pode ser dividida em subgrupos que consistem em indivíduos bastante semelhantes entre si, pode-se obter uma amostra aleatória em cada grupo.

(C) na amostragem aleatória simples se sorteia um elemento da população, sendo que todos os elementos têm a mesma probabilidade de serem selecionados.

(D) na amostragem por voluntários a população é selecionada de forma a estratificar aleatoriamente os grupos selecionados.

(E) na amostragem sistemática os elementos da população se apresentam ordenados, e a retirada dos elementos da amostra é feita periodicamente.

08. (Agente Fiscal do RS 2006 FAURGS) Analise as seguintes informações sobre Amostragem Aleatória

simples.

I. É o processo de retirada de uma amostra da população no qual cada unidade da população tem a mesma chance de ser retirada.

II. É o processo de retirada de uma amostra da população no qual se conhecem as chances de retirada de cada unidade, ainda que não sejam idênticas entre si.

III. Para realizar este processo de amostragem, é necessária a utilização de uma tabela de dígitos aleatórios ou pseudo-aleatórios.

IV. É o único processo de amostragem que garante que a amostra resultante seja representativa da população.

Quais estão corretas? a) Apenas I. c) Apenas III. e) Apenas IV. b) Apenas II. d) Apenas I e III.

09. (Ministério da Integração Nacional 2012 Esaf) Para selecionar uma amostra aleatória de tamanho n de uma população formada por N unidades, que são numeradas de 1 a N segundo uma certa ordem, escolhe-se aleatoriamente uma unidade entre as k primeiras unidades da população, onde k = N / n e seleciona-se cada k-ésima unidade da população em sequência. Esta técnica de amostragem denomina-se amostragem



Estatística

10. (ESAF/AFPS/2002/Administração Tributária Previdênciária) Assinale a opção correta em referência ao significado do termo amostragem aleatória simples.

a) Refere-se a um método de classificação da população. b) Refere-se à representatividade da amostra. c) É um método de escolha de amostras. d) Refere-se a amostras sistemáticas de populações infinitas. e) Refere-se à amostragem por quotas.

11. (Ministério da Integração Nacional 2012 Esaf) Para selecionar uma amostra aleatória de tamanho n de

uma população formada por N unidades, que são numeradas de 1 a N segundo uma certa ordem, escolhe-se aleatoriamente uma unidade entre as k primeiras unidades da população, onde k = N/n e seleciona-se cada k-ésima unidade da população em sequência. Esta técnica de amostragem denomina-se amostragem


12. (CPRM 2013 Cespe)

Considere que um estudo estatístico tenha sido realizado para determinar a concentração média de uma substância em duas diferentes áreas (A e B). Considere, ainda, que as figuras acima apresentam os esquemas amostrais para essas áreas, que foram divididas em uma malha regular de três por cinco quadrados, e que os pontos mostrados nas figuras representam os locais em que os dados foram coletados. Com base nessas informações, julgue os próximos itens. 1. O esquema amostral para a área A caracteriza-se pela aplicação de uma malha regular com

distribuição sistemática dos pontos de amostragem.


Estatística

GABARITO:

01. a) Estratificada Proporcional b) Aleatória Simples c) Sistemática

02. a) aleatória simples b) sistemática c) estratificada d) por Conglomerados

03. c 04. a 05. E 06. E (A amostragem por quotas é uma técnica NÃO-PROBABILISTICA) 07. d 08. a 09. c 10. c 11. a 12. 1. C


Estatística

EXERCÍCIOS DAS VIDEOAULAS

01. (PRF 2008 Cespe) Ficou pior para quem bebe O governo ainda espera a consolidação dos dados do primeiro mês de aplicação da Lei Seca para avaliar seu impacto sobre a cassação de CNHs. As primeiras projeções indicam, porém, que as apreensões subirão, no mínimo, 10%. Antes da vigência da Lei Seca, eram suspensas ou cassadas, em média, aproximadamente 155.000 CNHs por ano. Se as previsões estiverem corretas, a média anual deve subir para próximo de 170.000. A tabela a seguir mostra esses resultados nos últimos anos (fonte: DENATRAN).

Para que a média de CNHs suspensas ou cassadas, de 2003 a 2008, atinja o valor previsto de 170.000, será necessário que, em 2008, a quantidade de CNHs suspensas ou cassadas seja um número MEDIA A inferior a 180.000. B superior a 180.000 e inferior a 200.000. C superior a 200.000 e inferior a 220.000. D superior a 220.000 e inferior a 240.000. E superior a 240.000. 02. (CORREIOS 2005 CESPE) Julgue o item seguinte.

1. Considere que a média aritmética do faturamento mensal de uma agência dos Correios em 12 meses de determinado ano tenha sido igual a R$ 10.000,00. Supondo que a média aritmética do faturamento mensal dos últimos nove meses desse ano tenha sido de R$ 11.000,00, então a média aritmética do faturamento nos três primeiros meses desse ano deve ter sido um valor entre R$ 7.500,00 e R$ 8.000,00.


Estatística

03. (Senado-2002/CESPE) Suponha que os gráficos I e II abaixo representem, respectivamente, as notas na prova de Língua Portuguesa, que tem um valor máximo de 10 pontos, obtidas por 10 candidatos a cada um dos cargos de Consultor Legislativo e Consultor de Orçamentos do Senado Federal. Nessa situação, é correto afirmar que

I. o desvio-padrão da série de notas do gráfico I é maior que o da série de notas do gráfico II.

gráfico I gráfico II

04. (Senado 1996 Cespe) A distribuição orçamentária em um órgão composto de 80 setores,

apresenta média aritmética de R$ 50.000,00 e uma dispersão relativa de 10% em torno da média. Suponha que haja uma redução de 30% no orçamento de todos os 80 setores e julgue os itens seguintes.

1. O orçamento médio por setor assumirá o valor de R$ 32.500,00.

2. Em face da redução, a nova variância será igual a R$ 12.250.000,00.

3. O desvio padrão permanecerá inalterado.

4. A dispersão relativa em torno da média permanecerá inalterada.

5. Após a redução de 30% no orçamento dos 80 setores, será necessário um aumento de 30% para que o orçamento médio, por setor, apresente o valor de R$ 50.000,00.

05. (B. Brasil 2002/Cespe)


Estatística

1. O desvio-padrão da série numérica formada pelos totais de toneladas movimentadas pelos países listados no gráfico I seria maior se dela fosse excluído o valor correspondente aos EUA.

2. No período mostrado no gráfico II, a mediana da série numérica formada pelos percentuais de cargas destinadas ao Brasil ou dele originadas, que passaram pelo canal do Panamá, é maior que a moda dessa série.

06. (Policial Rodoviário Federal 2004 CESPE)

O gráfico acima ilustra o número de acidentes de trânsito nos estados do Acre, Mato Grosso do Sul, Amazonas, Espírito Santo e Minas Gerais, no ano de 2001. Com base nessas informações, julgue os itens seguintes.

1. A média aritmética de acidentes de trânsito nos cinco estados citados é superior a 7.000.

2. Se, no ano de 2004, com relação ao ano de 2001, o número de acidentes de trânsito em cada um dos estados considerados aumentasse de 150, então o desvio-padrão da série numérica formada pelo número de acidentes de trânsito em cada estado em 2004 seria superior ao desvio-padrão da série numérica formada pelo número de acidentes de trânsito em cada estado em 2001.

3. Se, no ano de 2004, com relação ao ano de 2001, o número de acidentes de trânsito no Acre passasse para 2.500, o número de acidentes de trânsito no Espírito Santo fosse reduzido para 10.000, o de Minas Gerais fosse reduzido para 13.000 e os demais permanecessem inalterados, então o desvio-padrão da série numérica formada pelo número de acidentes de trânsito em cada estado em 2004 seria superior ao desvio-padrão da série numérica formada pelo número de acidentes de trânsito em cada estado em 2001.

4. Se, no ano de 2004, com relação ao ano de 2001, o número de acidentes de trânsito no Acre crescesse 10%, o do Mato Grosso do Sul diminuísse 20%, o do Amazonas aumentasse 15% e os demais permanecessem inalterados, então a média aritmética da série numérica formada pelo número de acidentes de trânsito em cada estado, em 2004, seria maior que a mediana dessa mesma série.


Estatística

07. (CPRM 2013 Cespe)

A tabela acima apresenta os resultados de um estudo estatístico realizado para avaliar o teor de óxidos de ferro (X, em g/kg) no solo de determinada região. As amostras foram coletadas nos pontos de cruzamento de uma malha georreferenciada. Com base nessas informações, julgue os itens a seguir.

1. A moda da distribuição das amostras é igual a 100 g/kg.

2. A mediana amostral de X é igual a 90 g/kg.

3. A variância amostral de X é inferior ou igual a 130 g2/kg2. 08. (TCE/ES 2012 Cespe) Em pesquisa realizada para se estimar o salário médio dos empregados de

uma empresa, selecionou-se, aleatoriamente, uma amostra de nove empregados entre todos os empregados da empresa. Os dados de tempo de serviço, em anos, e salário, em quantidade de salários mínimos, dos indivíduos dessa amostra estão dispostos na tabela abaixo.

A partir dos dados da tabela, julgue os itens seguintes.

1. A estimativa não viciada da variância dos salários dos indivíduos da amostra com mais de 5 anos de serviço é igual a 2/3.

2. Excluindo-se da amostra um empregado qualquer, nem o menor salário nem a moda amostral sofreriam alterações com relação aos valores observados na amostra completa.

09. (SAEB/SEI 2012 Cespe) Determinado órgão precisa conceder licenças ambientais para a

construção de edifícios residenciais. No entanto, o local possui diversos aspectos ambientais a serem solucionados. A tabela abaixo apresenta a frequência de empresas que precisam satisfazer certa quantidade de obrigações antes da liberação da licença ambiental.

Com base nessas informações, julgue os itens a seguir.

1. No total, mais de 15 empresas esperam licenças ambientais.

2. A mediana dos dados é maior ou igual a 3.

3. Em media, menos de 3 obrigações são devidas pelas empresas.

4. Se o desvio padrão amostral dos dados é 1,19, então o coeficiente de variação é menor que 50%.


Estatística

10. (DPRF Agente Administrativo 2012 Cespe)

A tabela acima mostra a distribuição da quantidade Q de pessoas transportadas, incluindo o condutor, por veiculo de passeio circulando em determinado município, obtida como resultado de uma pesquisa feita nesse município para se avaliar o sistema de transporte local. Nessa tabela, P representa a porcentagem dos veículos de passeio circulando no município que transportam Q pessoas, para Q = 1, ..., 5. Com base nessas informações, julgue os seguintes itens.

1. Como a moda da distribuição descrita representa a maior frequência observada, seu valor é igual a 50%.

2. A quantidade de pessoas transportadas por veiculo de passeio circulando no município é distribuída em torno do valor 3, que representa a mediana da distribuição descrita. Como ocorre a concentração de muitos casos abaixo desse valor, essa distribuição possui assimetria negativa.

3. Como a tabela mostrada apresenta sequencia decrescente dos percentuais a medida que o valor da quantidade Q aumenta, a distribuição descrita apresenta curtose negativa.

11. (SAEB/SEI 2012 Cespe)

O estudo sobre a escolaridade dos habitantes de certa cidade produziu a tabela acima, que mostra a distribuição percentual do tempo de estudo (em anos). Com base nos dados apresentados na tabela, julgue os itens subsequentes.

1. O histograma padronizado da distribuicao dos tempos de estudo esta corretamente representado na figura abaixo.


Estatística


A tabela acima apresenta as estatísticas produzidas em um levantamento acerca do numero diário de acidentes que envolvem motocicletas em determinado local. Com base nessas informações, julgue os próximos itens.

1. O coeficiente de variação da distribuição em questão é superior a 1 e inferior a 1,4.

2. A variância da distribuição do numero diário de acidentes com motocicletas no referido local é inferior a 100.

3. Segundo o coeficiente de assimetria de Pearson, a distribuição desse numero diário de acidentes apresenta assimetria negativa.

4. E correto inferir que a probabilidade de haver, em determinado dia, 10 ou mais acidentes que envolvam motocicletas no referido local é estritamente inferior a 0,5.


Estatística


M. M. B. Paolielo et al.. In: Saúde Pública, 1997 (com adaptações).

Em decorrência do desenvolvimento urbano e tecnológico, tem-se a preocupação de monitorar os efeitos nocivos da poluição ambiental sobre a saúde da população urbana. A figura acima mostra o diagrama de caixa (box-plot) que descreve a distribuição da concentração de chumbo no sangue, em μg/dL, obtida com base em uma amostra aleatória de 200 pessoas do sexo masculino e de 100 pessoas do sexo feminino que trabalham em postos de combustível localizados em determinado município brasileiro. Com base nessas informações, julgue os itens de 1 a 3. 1. Com base nas linhas horizontais que cortam as caixas do diagrama apresentado, conclui-se

corretamente que a média das concentrações de chumbo encontradas no sangue das pessoas do sexo feminino que trabalham em postos de combustível do referido município brasileiro é inferior a media das concentrações dessa mesma substancia no sangue das pessoas do sexo masculino que trabalham nesses postos de combustível.

2. O diagrama esquemático referente ao sexo feminino, em comparação com o referente ao sexo

masculino, possui uma caixa (box) menor e pernas mais curtas, sugerindo que a variabilidade dos valores de concentração de chumbo no sangue das pessoas que trabalham em postos de combustível do referido município brasileiro é menor para as pessoas do sexo feminino que para as do sexo masculino.

3. Ha informações suficientes no diagrama apresentado para se concluir corretamente que 25% das

pessoas do sexo feminino que trabalham em postos de combustível do referido município brasileiro apresentam concentrações de chumbo iguais ou superiores a 10 μg/dL. Já o percentual de pessoas do sexo masculino que trabalha nesses postos e apresenta concentrações de chumbo iguais ou superiores a 10 μg/dL é maior que 25%.


Estatística

14. (CPRM 2013 Cespe) Considerando que A e B sejam eventos aleatórios definidos em um mesmo espaço de probabilidade e que

P(A) = 0,5, P(A|B) = 0,5 e P(B|A) = 0,25 Julgue os itens seguintes.

1. P(A B) ≥ 0,7.

2. P(B) = 0,25.

SOLUÇÃO:

P(B|A) = P(A B) 0,25 = P(A B) P(A B) = 0,25 X 0,5 = 0,125 P(A) 0,5

P(A|B) = P(A B) 0,5 = 0,125_ P(B) = 0,125_ = 125_ = 0,25 P(B) P(B) 0,5 500

P(A B) = P(A) + P(B) – P(A B) = 0,5 + 0,25 – 0,125 = 0,75 – 0,125 = 0,625 Portanto:

Item 1 está Errado! Item 2 está Certo!

GABARITO: 01. D 02. E 03. E 04. E C E C E 05. E C 06. C E E C 07. C E C 08. E C 09. C E C E 10. E E E 11. E 12. C E E C 13. C C C 14. E C

Documents

PDF Estatistica WeberCampos