44
APOSTILA DE ESTATÍSTICA E PROBABILIDADE MÓDULO 1

APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

  • Upload
    ar13mg

  • View
    200

  • Download
    1

Embed Size (px)

Citation preview

Page 1: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

APOSTILA DE

ESTATÍSTICA E PROBABILIDADE

MÓDULO 1

PROFESSOR: REINALDO CARVALHO DE MORAIS

Page 2: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

********************************************CAPÍTULO 1

INTRODUÇÃO À ESTATÍSTICA********************************************

Uma das principais virtudes de um bom profissional passa pela capacidade de tomar boas

decisões de acordo com a situação. Esse tipo de habilidade pode ser construída de várias formas,

dentre elas pela prática do dia-a-dia das empresas. O conhecimento teórico adquirido freqüentando

a faculdade e lendo artigos científicos e revistas de negócios também é uma das formas. O ideal

para a formação talvez seja buscar as diversas possibilidades.

Dentre as várias formas de se tomar decisões, o profissional pode se valer de fatos e

dados. O uso de planilhas eletrônicas e a exploração do máximo de informações possível vêm

aumentando no decorrer dos anos nas organizações. Por exemplo: quando um banco necessita

tomar a decisão sobre conceder ou não um empréstimo pra um determinado cliente, são avaliados

determinados dados desse cliente. Verificam-se, dentre outras informações, o tempo de conta, a

idade, o estado civil, a profissão, etc. Dessa forma torna-se possível avaliar o risco desse cliente

quitar a referida dívida.

As técnicas estatísticas têm sido cada vez mais utilizadas nas empresas e órgãos públicos

para auxiliar os gestores a racionalizar o uso de informações em benefício do processo de tomada de

decisões. Os avanços ocorridos na informática nos últimos anos têm contribuído para aumentar tanto

a quantidade quanto a qualidade dos dados disponíveis.

1.1 – O QUE É ESTATÍSTICA?

A estatística pode ser definida como: a ciência de coletar, organizar e interpretar fatos

numéricos que chamamos de dados. Diariamente somos bombardeados com diversos dados. Pela

mídia, recebemos informações sobre:

Índice de popularidade do presidente da república.

Temperatura média para determinado dia.

Venda de veículos no mês passado, etc.

Outra definição de estatística1: “Estatística se refere ao conjunto de técnicas usadas na

coleção, organização e interpretação de dados. Estes podem ser quantitativos, com valores

expressos numericamente, ou qualitativos, representados por características tais quais as

preferências dos consumidores obtidas em uma pesquisa. A análise estatística é utilizada na

1 KAZMIER, Leonard J. Estatística Aplicada à Administração e Economia – 4ª Edição – 2007, pag 13

2

Page 3: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

administração e economia para auxiliar na tomada de decisões mediante a compreensão das fontes

de variação e a identificação de padrões e relacionamentos nos dados.”

Outro autor define estatística da seguinte forma2: A ciência de coletar, analisar,

interpretar e retirar conclusões a partir de dados.

Nos debates públicos sobre economia, educação e políticas sociais, todas as partes

envolvidas utilizam dados em seus argumentos. Você vai ao médico e com base no que é relatado

são solicitados determinados exames. Com base nos dados dos exames determinado tratamento é

indicado. Você vai ao mecânico e relata certo ruído. Com base nisso são testados determinados

equipamentos. Portanto, o uso de informações aumenta a chance de tomar decisões mais eficientes.

1.2 – A IMPORTÂNCIA DA ESTATÍSTICA COMO INSTRUMENTO

A Estatística surge como um rico instrumento para auxiliar o tomador de decisões através

de critérios objetivos. Especificamente utilizando números e raciocínio lógico. Ou seja: não cabem

“achismos”. Administrar envolve a constante tomada de decisões, que podem se dar por critérios

objetivos (conhecimento teórico ou tácito) ou subjetivos.

O objetivo da estatística é obter compreensão a partir dos dados. Para conseguirmos isso,

freqüentemente trabalhamos com um conjunto de números. Os dados não são somente números.

São números dentro de um contexto. Por exemplo: Você ouve dizer que a taxa de desemprego na

região metropolitana de Belo Horizonte foi de 10% no mês passado. E daí? Esse número é grande?

Depende da base de comparação, que pode ser geográfica ou temporal. Depende da instituição que

calculou. A metodologia do IBGE3 é diferente da metodologia dos Centros de pesquisa estaduais.

Empresas, governo e indivíduos tomam decisões com base em determinados indicadores.

Exemplos:

Taxa de desemprego.

Taxa de juros do cartão de crédito.

Taxa de inflação.

Probabilidade de ficar desempregado.

Quando você resolver problemas estatísticos pense no contexto do problema e formule

as conclusões obtidas na situação específica. Lembre-se de que o objetivo da estatística não é o

cálculo em si, mas o ganho de compreensão a partir dos números.

1.3– O SURGIMENTO DA ESTATÍSTICA

Historicamente, as idéias e os métodos estatísticos foram se desenvolvendo aos poucos,

à medida que aumentava o interesse da sociedade em coletar e utilizar dados para um grande

número de propósitos. As origens mais remotas da estatística vinculam-se ao desejo dos

2 WALPOLE (2009).

3 Instituto Brasileiro de Geografia e Estatística

3

Page 4: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

governantes de contar o número de habitantes ou medir o valor de terras tributáveis em seus

domínios.

O termo estatística4 surge da expressão em latim statisticum collegium, palestra sobre os

assuntos do Estado, de onde surgiu a palavra em língua italiana statista, que significa "homem de

estado", ou político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado. A

palavra foi proposta pela primeira vez no século XVII, em latim, por Schmeitzel na Universidade de

Jena e adotada pelo acadêmico alemão Godofredo Achenwall. Aparece como vocabulário na

Enciclopédia Britânica em 1797, e adquiriu um significado de coleta e classificação de dados, no

início do século 19.

A Teoria das probabilidades começou a ganhar força a partir do século 17 quando os

cientistas se interessaram em calcular as chances de sucesso nos jogos de azar.

1.4 – APLICAÇÕES DA ESTATÍSTICA EM ÁREAS DO CONHECIMENTO

Uma das principais características da estatística consiste no seu papel de “ciência da

variação” (ou variabilidade). Como existe variabilidade em todos os campos do conhecimento, a

estatística vem sendo utilizada nas mais diversas áreas.

ESTATÍSTICA NA EDUCAÇÃO FÍSICA

O que determina o desempenho dos atletas em determinada prática esportiva?

Certamente várias são as teorias desenvolvidas por pesquisadores acerca do assunto. Para otimizar

a decisão em relação à aceitação ou rejeição de hipóteses sobre o assunto vários foram os modelos

e testes estatísticos desenvolvidos. Como exemplo, suponha que um pesquisador esteja interessado

em determinar qual a melhor combinação de exercícios físicos que determinado atleta deve ter para

maximizar seu desempenho numa determinada modalidade.

Pode-se elaborar um modelo que relacione o desempenho (Y) com outras variáveis (X1,

X2, ... , X8):

Y = Desempenho

X1 - Ingestão diária de carboidratos

X2 - Número de horas de sono diárias

X3 - Tempo de experiência na prática do referido esporte

X4 - Idade em que o atleta iniciou as atividades

X5 - Concentração de colesterol no sangue

X6 - Tipo sanguíneo

X7 - Prática ou não de outras atividades

X8 - Fumante ou não

4 www.wikipedia.com.br

4

Page 5: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

ESTATÍSTICA NA MEDICINA

A Estatística aplica-se à área médica em qualquer situação que envolva o planejamento,

coleta e análise de dados. Problemas como testar a eficácia de determinado medicamento em

relação a uma doença, bem como a criação de índices que classifiquem as doenças pelo nível de

gravidade são alguns exemplos. Outro exemplo é a elaboração de políticas de prevenção e combate

a doenças, baseada em dados sobre a população de interesse. Verificar se determinada variável

patológica constitui uma endemia, uma epidemia, ou ainda uma pandemia. Planejamento de saúde

pública para determinada área de abrangência.

ESTATÍSTICA NA ECONOMIA

Otimização de Carteiras de Investimentos: Para investir no mercado de capitais

necessita-se da obtenção da melhor combinação de risco e retorno possível. As melhores estimativas

para tais parâmetros são a chave para a construção de modelos mais realistas.

Finanças governamentais: O governo necessita das melhores projeções possíveis em

relação à arrecadação de impostos para saber quanto terá de dinheiro no próximo ano para realizar

despesas com saúde, educação, segurança, etc.

Indicadores econômicos: Prever com certa precisão o Índice de Inflação, por exemplo,

pode ser de fundamental importância para uma determinada empresa que deseja se expandir. A

compra de máquinas através de financiamento deve considerar a taxa de juros cobrada, assim como

a expectativa inflacionária.

ESTATÍSTICA NA ENGENHARIA

Métodos de Previsão: A compra de determinados insumos utilizados na fabricação de

produtos exige um planejamento eficiente. Adquirir quantidades menores que o necessário pode

resultar em falta de produtos. Por outro lado, comprar muito acima do necessário pode deixar o

capital da empresa ocioso. Assim, uma boa solução para o problema é utilizar métodos de previsão

com base em variáveis que estejam relacionadas à venda do produto.

Controle de estoque: tempo em que as mercadorias levam para serem vendidas. A

empresa deve manter um nível de estoque capaz de atender suas demandas. Se faltar insumos,

pode prejudicar o processo de produção. O acúmulo de estoques envolve custos.

Controle estatístico de processos: Qual a margem de erro no peso de determinado

produto empacotado?

Amostragem: Quantas peças devem ser inspecionadas para sabermos o índice de

defeitos?

Planejamento de experimentos: Qual a melhor temperatura para retirar determinada

peça do forno?

5

Page 6: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

1.5– ALGUMAS DEFINIÇÕES

POPULAÇÃO X AMOSTRA

Ao realizar uma pesquisa, na maioria das vezes é inviável consultar todos os elementos

de interesse. Um exemplo clássico nesse sentido é a pesquisa eleitoral. Na época das eleições

deseja-se saber a preferência do eleitorado sobre os candidatos ao pleito. No Brasil, país com quase

200 milhões de habitantes, temos mais de 100 milhões de eleitores. É pouco viável perguntar a

todos esses indivíduos quais as intenções de voto. Para ter uma idéia de como se distribuem os

eleitores por candidato nas pesquisas, faz-se necessário utilizar uma amostra da população de

eleitores. Dessa forma, se o número de eleitores for 100 milhões e a amostra utilizada na pesquisa

for de 2.000 pessoas, qual o tamanho da população e qual o tamanho da amostra?

Na medicina, o uso de amostras é muito claro. Quando uma pessoa fica doente e os

médicos necessitam verificar as características do sangue dela, é impossível pesquisar todo o

sangue da pessoa. O procedimento consiste na simples coleta de uma pequena amostra de sangue.

Avaliando-se essa pequena amostra são tiradas conclusões acerca de todo o sangue do corpo.

Nesse caso a população seria o volume total de sangue.

Quanto maior o tamanho da amostra, maior a probabilidade de ela refletir o tamanho da

população inteira. Por exemplo: suponha que estejamos interessados em pesquisar o perfil dos

alunos dos cursos de Engenharia da faculdade. Se houver 1.000 alunos matriculados, pode ser

inviável entrevistar todos. Nesse contexto faz-se necessário realizar a pesquisa por amostragem

tomando um subconjunto da população. Podemos pesquisar apenas 100 alunos. Alguns cálculos

estatísticos são necessários para medir a precisão da referida pesquisa.

ESTRATÉGIA PEDAGÓGICA

Para efeitos didáticos, a Estatística básica pode ser ensinada em três etapas:

1) Descrição de dados (também conhecida como Análise exploratória de dados),

2) Probabilidade,

3) Inferência (nessa etapa utilizamos dados de amostras para extrair conclusões

acerca da população de interesse.

A Descrição de dados é utilidade quando tomamos um conjunto de dados e resumimos os

mesmos através de gráficos, tabelas, medidas de tendência central, medidas de variabilidade, etc.

A Teoria das Probabilidades nos auxiliar a tomar decisões levando em consideração a

incerteza inerente aos acontecimentos.

A Inferência se utiliza das propriedades probabilísticas para a construção de testes de

hipóteses sobre determinado fenômeno. Por exemplo, suponha que o pesquisador acredite que as

mulheres têm uma tendência maior a votar também em mulheres, em comparação aos homens.

6

Page 7: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

Após colher uma amostra, as técnicas de inferência estatística podem ser usadas para concluir que

essa hipótese seja verdadeira ou falsa.

ESTATÍSTICA VERSUS PARÂMETRO

Ao realizar uma pesquisa, se for consultada toda a população de interesse afirmamos que

a pesquisa é censitária. Portanto foi realizado um censo. No Brasil, de 10 em 10 anos esse tipo de

pesquisa é realizada para o levantamento de informações sociais e econômicas da população.

Suponha que estamos interessados em traçar o perfil de todos os estudantes de

Engenharia da Faculdade Pitágoras de Betim. Se forem 2.000 alunos no total, o que caracteriza uma

pesquisa por censo e o que caracteriza uma pesquisa por amostragem? Se consultarmos todos os

2.000 alunos estaremos diante de um censo. Se consultarmos um subconjunto dos 2.000 (100, por

exemplo) estaremos diante de uma pesquisa por amostragem.

Se uma das perguntas do questionário utilizado na pesquisa for “Qual a sua altura?”

podemos calcular a altura média dos alunos dos cursos de engenharia. Se a altura média for extraída

de uma pesquisa com os 1.000 alunos (ou seja, pesquisa censitária), estaremos diante de um

parâmetro. Se a altura média for extraída de uma pesquisa por amostragem (com 100 alunos, por

exemplo), estaremos diante de uma estatística.

TIPOS DE VARIÁVEIS

Quando realizamos uma pesquisa, a mesma geralmente contém um conjunto de

perguntas. A pesquisa realizada com os alunos de estatística contém perguntas sobre altura, peso,

idade, tipo de transporte para a faculdade, etc. Geralmente, cada pergunta feita no questionário

pode ser considerada uma variável. Por exemplo, se for perguntado no questionário qual a cor

preferida, esta pode variar entre azul, vermelho, verde, etc. Se for perguntada a altura do estudante,

a mesma pode variar entre 140 e 210 centímetros, por exemplo.

Temos que fazer a distinção entre os tipos de variáveis. Basicamente as variáveis podem

ser divididas entre VARIÁVEIS QUANTITATIVAS ou VARIÁVEIS QUALITATIVAS (CATEGÓRICAS).

As quantitativas podem ser discretas ou contínuas. As qualitativas podem ser ordinais ou

nominais. Observe a figura abaixo.

7

Page 8: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

DISCRETA (Nº de irmãos)

QUANTITATIVA

CONTÍNUA (Altura)

VARIÁVEIS

NOMINAL (Estado Civil)

QUALITATIVA

ORDINAL (Escolaridade)

EXERCÍCIO 1.1

Classifique as seguintes variáveis:

Altura: Quantitativa contínua.

Peso:

Número de irmãos:

Estado Civil:

Escolaridade do pai:

Tipo de transporte para a faculdade:

Conhecimento de Excel:

8

Page 9: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

********************************************

CAPÍTULO 2

ANÁLISE EXPLORATÓRIA DE DADOS:

TABELAS, GRÁFICOS E FREQÜÊNCIA

********************************************Para realizar uma pesquisa, uma das etapas consiste no levantamento dos dados. Após

essa etapa, as informações podem ser tabuladas numa planilha. Como exemplo de pesquisa, os

alunos de Estatística de uma determinada turma do curso de Administração responderam a algumas

perguntas conforme o quadro abaixo:

1 – Qual sua data de nascimento ?______________________________________2 – Em média, quantas horas você trabalha por semana?____________________3 – Qual sua altura?__________ 4 – Qual seu peso?___________5 – Em que dia da semana foi (ou será) seu aniversário em 2009?_______________6 – Você nasceu numa capital? ( ) sim ( ) não7 – Qual a distância de sua residência à Faculdade Pitágoras?________________8 – Você gosta de ir ao supermercado? ( ) sim ( ) não9 – Você tem quantos irmãos?_________________________________________10 – Como você vai para a faculdade? ( ) ônibus ( ) carro ( ) a pé ( ) motocicleta ( ) outro11 – Quanto você gostava de Física? ( ) muito ( ) médio ( ) pouco ( ) nada12 – Quanto você gostava de Química? ( ) muito ( ) médio ( ) pouco ( ) nada13 – Quanto você gostava de Matemática? ( ) muito ( ) médio ( ) pouco ( ) nada14 – Quanto você gostava de História? ( ) muito ( ) médio ( ) pouco ( ) nada15 – Quanto você gostava de Geografia? ( ) muito ( ) médio ( ) pouco ( ) nada16 – Quanto você gostava de Língua Portuguesa? ( ) muito ( ) médio ( ) pouco ( ) nada17 – Quanto você gostava de Literatura Brasileira? ( ) muito ( ) médio ( ) pouco ( ) nada18 – Quanto você gostava de Língua Inglesa? ( ) muito ( ) médio ( ) pouco ( ) nada19 – Quanto você gostou de microeconomia? ( ) muito ( ) médio ( ) pouco ( ) nada20 – Quanto você gostou de macroeconomia? ( ) muito ( ) médio ( ) pouco ( ) nada

Foi utilizada uma planilha em Excel para a tabulação dos dados. O quadro abaixo mostra

uma parte da referida planilha:

9

Page 10: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

Para a apresentação dos dados num relatório de pesquisa, foi construída a tabela abaixo.

TABELA 2.1: Banco de dados dos alunos de Estatística da Turma de Administração de

2009

Horas Dia da semana DeslocamentoIndivíduo Atlura Peso Gênero Idade trabalhadas em que será o Capital Superm. Irmãos para a Matemática História Microeconomia Macroeconomia

por semana aniversário Faculdade

1 170 69 M 30 50 domingo 1 1 3 2 4 3 4 42 163 65 M 28 48 sexta 0 0 2 2 3 3 3 33 171 78 M 26 44 quarta 1 0 2 2 4 3 4 44 165 55 F 23 0 quarta 0 1 0 2 3 1 3 35 161 51 F 19 0 sábado 1 1 3 1 4 2 3 36 160 47 F 19 20 terça 1 1 1 3 3 4 3 37 165 80 M 25 30 domingo 0 1 1 1 3 2 0 08 165 53 F 25 21 sexta 0 1 2 3 4 4 4 49 170 70 F 36 91 sábado 0 1 4 2 3 4 4 4

10 160 51 M 19 36 quinta 0 1 2 1 3 1 2 211 173 55 F 21 30 sábado 0 1 1 3 3 2 3 312 163 55 F 21 36 sábado 0 1 1 1 4 2 4 413 164 72 F 22 48 quinta 0 1 2 4 3 2 0 014 158 48 F 19 0 quarta 0 1 1 5 4 2 4 415 180 65 M 20 20 terça 0 0 0 2 2 4 2 316 172 80 M 35 40 sábado 1 1 3 1 4 4 4 417 171 69 F 20 43 terça 0 0 3 2 4 2 3 318 158 54 F 29 30 quarta 0 0 2 1 3 4 4 4

Fonte: Dados da pesquisa

Após a obtenção dos dados tabulados, a análise dos mesmos torna-se possível. Para isso,

podemos utilizar o próprio Excel ou algum software estatístico. Geralmente tais softwares são

relativamente caros. Alguns deles são adquiridos somente por grandes empresas ou organizações de

10

Page 11: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

pesquisa.

2.1 – APRESENTAÇÃO DOS DADOS

2.1.1 - GRÁFICOS

GRÁFICO DE SETORES

Ao analisarmos os dados dos alunos da turma de 2009 podemos construir a seguinte

tabela relativa à variável “DESLOCAMENTO”.

TABELA 2.2: Distribuição de freqüência da variável DESLOCAMENTO

DESLOCAMENTO FREQÜÊNCIA PORCENTAGEMA PÉ 4 22,2%

CARRO 7 38,9%MOTOCICLETA 1 5,6%

ÔNIBUS 5 27,8%OUTROS 1 5,6%TOTAL 18 100,0%

Fonte: Dados da pesquisa

Outra forma de apresentar os dados acima é através do gráfico de setores – também

conhecido como “gráfico de pizza”:

Formas de deslocamento dos alunos para a faculdade

22,2%

38,9%5,6%

27,8%

5,6%

A PÉ CARRO MOTOCICLETA ÔNIBUS OUTROS

GRÁFICO 2.1: Formas de deslocamento dos alunos de Estatística da Turma de Administração de 2009

11

Page 12: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

Observe que o gráfico apresenta valores em porcentagem. O número de alunos (n) é 18.

O gráfico poderia ser construído com valores absolutos. No entanto, fica mais didático com o uso de

porcentagens.

GRÁFICOS DE BARRAS

Para a variável acima, também pode ser utilizado um gráfico de barras. A vantagem é

que ele oferece uma precisão visual um pouco melhor.

Formas de deslocamento dos alunos para a faculdade

4

7

1

5

1

0

1

2

3

4

5

6

7

8

A PÉ CARRO MOTOCICLETA ÔNIBUS OUTROS

GRÁFICO 2.2: Formas de deslocamento dos alunos de Estatística da Turma de Administração de 2009

Cuidado com a escala

É muito importante ter atenção com a escala dos gráficos. Observe a figura abaixo:

TAXA DE DESEMPREGO

10,2%

10,3%

10,4%

10,5%

10,6%

10,7%

10,8%

10,9%

11,0%

11,1%

2003 a 2006 2007 a 2010

TAXA DE DESEMPREGO

10,5%

11,0%

4,0%

5,0%

6,0%

7,0%

8,0%

9,0%

10,0%

11,0%

12,0%

2003 a 2006 2007 a 2010

Qual a diferença entre os dois gráficos?

Observe que os valores para as taxas de desemprego para os dois períodos são as

mesmas. Porém, uma mudança na escala do gráfico no eixo das ordenadas (no caso eixo do

12

Page 13: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

percentual de desemprego) distorceu fortemente o aspecto visual da situação.

Gráfico para duas variáveis categóricas

O gráfico mostrado na seção anterior descreve apenas uma variável. Quando estamos

interessados em descrever duas variáveis ao mesmo tempo, podemos construir uma tabela de

dupla entrada (também conhecida como tabela de contingência).

Uma das perguntas feitas na pesquisa com os alunos da turma de 2009 foi: “Você gosta

de supermercado?” Dessa forma a variável aleatória “SUPERMERCADO” pode assumir duas

situações: ou a pessoa gosta de supermercado ou a pessoa não gosta. Quando utilizamos tabelas de

dupla entrada os dados são desagregados, ou seja, podem ser interpretados de forma mais

detalhada. Observe na tabela abaixo que o total de pessoas que gosta de supermercado é 13 e que

não gosta é 5. Além disso, podemos saber que dos 13 que gostam, 4 são homens e 9 são mulheres.

Outra forma de interpretar seria: das 11 mulheres, 2 não gostam de supermercado.

TABELA 2.3: Distribuição da variável SUPERMECADO por GÊNERO

SEXO Gosta Não Gosta TotalMasculino 4 3 7Feminino 9 2 11

Total 13 5 18

SUPERMERCADO

Fonte: Dados da pesquisa

Observe um gráfico feito no Excel para representar os dados acima.

Gosta

Não Gosta

Masculino

Feminino

9

24

3

0

2

4

6

8

10

12

Masculino Feminino

GRÁFICO 2.2: Gosto ou não por supermercado de acordo com o sexo

EXERCÍCIO 2.1(a) Faça um gráfico de barras vertical para o a variável: “IRMÃOS”

13

Page 14: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

(b) Faça um gráfico de setores para a mesma variável.

EXERCÍCIO 2.2Construa uma tabela de dupla entrada para as variáveis: capital e supermercado.

Gosta Não gostaCapitalInteriorTOTAL

SUPERMERCADONASCIMENTO TOTAL

Valores versus percentuais

Observe que o gráfico de setores pode ser feito utilizando-se tanto os valores absolutos,

como os percentuais. A escolha dependerá do tipo de estudo e bom senso do analista. O importante

é que o gráfico seja o mais didático possível, para que o leitor consiga entendê-lo.

GRÁFICOS DE LINHAS

Podemos fazer um gráfico de linhas para a variável: DESLOCAMENTO, conforme mostrado

na figura abaixo:

4

7

1

5

1

0

1

2

3

4

5

6

7

8

A PÉ CARRO MOTOCICLETA ÔNIBUS OUTROS

GRÁFICO 2.3: Distribuição da variável DESLOCAMENTO

14

Page 15: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

Entretanto, conforme discutido anteriormente, para esse tipo de variável (categórica), os

gráficos de barras e setores são os mais indicados. O gráfico de linhas é bastante utilizado

para o uso de séries temporais. O gráfico abaixo representa a evolução do retorno de três ações

na bolsa de valores.

-4

-3

-2

-1

0

1

2

3

4

5

6

jan/0

4

mar

/04

mai/

04jul

/04

set/0

4

nov/0

4

jan/0

5

mar

/05

mai/

05jul

/05

set/0

5

nov/0

5

jan/0

6

mar

/06

mai/

06jul

/06

set/0

6

nov/0

6

jan/0

7

mar

/07

mai/

07jul

/07

set/0

7

nov/0

7

jan/0

8

mar

/08

mai/

08jul

/08

set/0

8

nov/0

8

A

B

C

Gráfico 2.3: Evolução do retorno dos ativos A, B e C

EXERCÍCIO 2.3

A Tabela abaixo apresenta a evolução do número de pedidos de férias de

funcionários de uma empresa fictícia. Faça um gráfico de linha para representar os dados.

Mês Nº de pedidosJaneiro 10Fevereiro 8Março 5Abril 3Maio 2Junho 4Julho 7Agosto 3Setembro 1Outubro 1Novembro 5Dezembro 7Fonte: Dados da empresa W

Tabela 2.2 - Evolução do número de pedidos de férias dos

funcionários da Empresa W em 2009

Por que colocar os dados num gráfico?

Eles oferecem uma forma resumida de enxergar como os dados se comportam.

15

Page 16: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

2.1.2 – DISTRIBUIÇÃO DE FREQÜÊNCIA

O conjunto de dados da turma de Administração apresenta dados relativos à altura dos

alunos. Se eu quiser resumir tais dados? Posso construir uma distribuição de freqüência.

Uma distribuição de freqüência é uma tabela na qual os valores de uma variável são

agrupados em classes e a quantidade de valores observados em cada classe é registrada. Dados

organizados em distribuições de freqüência também são chamados dados agrupados.

Podemos construir distribuições de freqüência tanto pra variáveis quantitativas quanto

qualitativas (ou categóricas). Segue abaixo um exemplo de distribuição de freqüência para a uma

variável qualitativa: DESLOCAMENTO.

FREQÜÊNCIA FREQÜÊNCIA ABSOLUTA RELATIVA

A PÉ 4 22,2%CARRO 7 38,9%

MOTOCICLETA 1 5,6%ÔNIBUS 5 27,8%OUTROS 1 5,6%TOTAL 18 100,0%

DESLOCAMENTO

A seguir, mostraremos os passos para construir uma distribuição de freqüência para uma

variável quantitativa. O quadro abaixo apresenta os dados de altura dos 18 alunos do banco de

dados de referencia.

170 163 171 165 161 160160 173 163 164 158 180165 165 170 172 171 158

PASSOS PARA A CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUENCIA

1º PASSO: Ordenar os dados

158 158 160 160 161 163163 164 165 165 165 170170 171 171 172 173 180

2º PASSO: Calcular a amplitude

Amplitude = (maior valor – menor valor): 180 – 158 = 22

3º PASSO: Calcular o número de classes:

Número de classes = (aqui devo sempre arredondar pra cima)

16

Page 17: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

4º PASSO: Calcular a amplitude de classes:

Amplitude de classe = Amplitude Número de classes

Observação: O arredondamento no cálculo da amplitude de classe deve ser sempre para

cima, para evitar que alguma observação da amostra fique fora da tabela de distribuição.

5º PASSO: Definir o limite inferior da primeira classe:

158

Observação: O limite inferior da primeira classe deve ser igual ao menor valor observado

da amostra, e o limite superior da última classe deve ser superior ao maior valor observado da

amostra.

6º PASSO: Definir os intervalos (extremos) das classes:

1ª) 158 a 163; 2ª) 163 a 168; 3ª) 168 a 173; 4ª) 173 a 178; 5ª) 178 a 183;

Observação: Os intervalos são definidos somando o limite inferior da primeira classe mais

a amplitude da classe.

7º PASSO: : Contar a freqüência de observações em cada classe (ni) e calcular a freqüência relativa (fi)

8º PASSO: calcular a freqüência acumulada (Ni) e a freqüência relativa acumulada (Fi)

9º PASSO: apresentar a tabela de freqüência.

         

Altura ni fi Ni Fi158 ├ 163 5 0,28 5 0,28163 ├ 178 6 0,33 11 0,61168 ├ 173 5 0,28 16 0,89173 ├ 178 1 0,06 17 0,94178 ├ 183 1 0,06 18 1,00

TOTAL 18 1,00 18 1,00Fonte: Dados da pesquisa

Significado dos símbolos

17

Page 18: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

ni: Freqüência absoluta simples

fi: Freqüência relativa simples

Ni: Freqüência absoluta acumulada

Fi: Freqüência relativa acumulada

Portanto, quais os tipos de freqüência?

Absoluta

Absoluta acumulada

Relativa

Relativa Acumulada

Por que eu preciso disso tudo?

Estamos aprendendo a resumir os dados de uma pesquisa. Uma das formas de fazer isso

é através de distribuições de freqüência. Na vida real a construção de uma distribuição de freqüência

é uma pouco mais simples quando usamos computadores.

Uma forma de visualizar os dados da distribuição de freqüência é através do gráfico

conhecido como HISTOGRAMA. A figura abaixo mostra um histograma construído no EXCEL.

5

6

5

1 1

0

1

2

3

4

5

6

7

158 ├ 163 163 ├ 178 168 ├ 173 173 ├ 178 178 ├ 183

EXERCÍCIO 2.4

18

Page 19: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

Construa uma distribuição de freqüência para a variável peso:

1º PASSO: Ordenar os dados

2º PASSO: Calcular a amplitude

3º PASSO: Calcular o número de classes:

4º PASSO: Calcular a amplitude de classes:

5º PASSO: Definir o limite inferior da primeira classe:

6º PASSO: Definir os intervalos (extremos) das classes:

7º PASSO: : Contar a freqüência de observações em cada classe (ni) e calcular a freqüência relativa (fi)

8º passo: calcular a freqüência acumulada (Ni) e a freqüência relativa acumulada (Fi)

9º PASSO: apresentar a tabela de freqüência.

EXERCÍCIO 2.5

19

Page 20: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

Construa um histograma utilizando a distribuição de freqüência do exercício anterior.

Qual a diferença entre o histograma e o gráfico de barras?

Os histogramas se parecem bastante com os gráficos de barras. Entretanto existem três

diferenças principais:

(1) As barras podem ser grudadas. (Há situações onde isso não ocorre quando a freqüência for

zero).

(2) É indicado para variáveis quantitativas agrupadas e não para variáveis categóricas.

Posso usá-lo para variáveis categóricas?

Sim, mas para representar categorias o gráfico de barras é mais indicado. O hábito de

fazer a distinção entre os dois tipos de gráfico nos conduz a sempre diferenciar entre variáveis

contínuas e discretas, sob o ponto de vista de distribuições de probabilidades.

EXERCÍCIO 2.6

O quadro abaixo mostra o número de multas aplicadas por um radar numa determinada

avenida nos 30 dias de um mês. Siga os passos abaixo para construir uma distribuição de

freqüência para os dados.

20

Page 21: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

2 4 5 5 6 7 7 8 8 810 10 11 11 11 11 12 12 13 1313 13 13 14 14 15 15 16 16 1718 18 19 19 19 21 21 22 25 26

(a) Calcule a amplitude

(b) Calcule o número de classes

(c) Calcule a amplitude de classes

(d) Defina o limite inferior da primeira classe

(e) Defina os intervalos de classes (use a tabela abaixo)

(f) Conte a freqüência de observações em cada classe (ni) e calcule a freqüência relativa (fi) (use a tabela abaixo)

(g) Calcule a freqüência acumulada (Ni) e a freqüência relativa acumulada (Fi) (use a tabela abaixo)

Classes freqüência freqüência Freqüência Freqüência relativaabsoluta (ni) relativa (fi) acumulada (Ni) acumulada (Fi)

Distribuição de Freqüência das notas de estatística

21

Page 22: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

********************************************

CAPÍTULO 3

ANÁLISE EXPLORATÓRIA DE DADOS:

MEDIDAS DE POSIÇÃO E DISPERSÃO

********************************************

3.1 – RESUMINDO OS DADOS – MEDIDAS DE TENDÊNCIA CENTRAL

Uma das formas de explorar um conjunto de dados é através do uso de tabelas e gráficos.

Além disso, podemos utilizar algumas medidas estatísticas conhecidas como medidas-resumo, que

se dividem em medidas de tendência central e medidas de dispersão.

MÉDIA ARITMÉTICA SIMPLES

A média aritmética simples é uma das medidas de tendência central mais utilizada no dia-

a-dia. A mesma é calculada conforme a fórmula abaixo:

onde n representa o número de observações ou tamanho da amostra. A média aritmética simples

geralmente é representada pela letra x com uma barra sobre a mesma. No numerador aparece um

símbolo de somatório indicando que todas as unidades observacionais devem ser somadas. O quadro

abaixo mostra cinco valores referentes ao tempo de chegada da viatura em acidentes de trânsito

classificados como graves:

9 10 30 39 50

A média aritmética simples pode ser calculada da seguinte forma:

O resultado da fórmula mostra uma média de 27,6 minutos.

Esse valor pode ser calculado no Excel utilizando a fórmula:

22

Page 23: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

EXERCÍCIO 3.1

Calcule o tempo médio de chegada da viatura para os acidentes de gravidade BAIXA.

A média é _____

NÚMERO GRAVIDADE NÚMERO DE DISTÂNCIA TEMPO DEDA DA DIA DURAÇÃO VÍTIMA VEÍCULOS DO MOTORISTA CHEGADA

OCORRÊNCIA OCORRÊNCIA (TEMPO) FATAL ENVOLVIDOS POSTO POLICIAL ALCOOLIZADO DA VIATURA1 ALTA FIM-DE-SEMANA 75 SIM 8 2,5 SIM 102 MÉDIA DURANTE A SEMANA 66 NÃO 5 1,4 SIM 53 BAIXA DURANTE A SEMANA 18 NÃO 3 3,2 NÃO 154 BAIXA DURANTE A SEMANA 19 NÃO 4 5,9 NÃO 265 MÉDIA DURANTE A SEMANA 25 NÃO 2 6,4 NÃO 306 BAIXA FIM-DE-SEMANA 26 NÃO 2 8,3 NÃO 407 MÉDIA FIM-DE-SEMANA 35 NÃO 2 1,3 SIM 68 BAIXA DURANTE A SEMANA 44 NÃO 2 5,5 NÃO 199 BAIXA DURANTE A SEMANA 17 NÃO 3 14,2 NÃO 35

10 MÉDIA DURANTE A SEMANA 29 SIM 2 6,6 SIM 2211 BAIXA DURANTE A SEMANA 30 NÃO 3 7,1 NÃO 1912 BAIXA DURANTE A SEMANA 41 NÃO 2 3,3 NÃO 1213 BAIXA DURANTE A SEMANA 22 NÃO 3 4,1 NÃO 1214 MÉDIA FIM-DE-SEMANA 55 NÃO 5 8,8 SIM 2515 ALTA FIM-DE-SEMANA 80 SIM 3 7,6 SIM 3016 BAIXA DURANTE A SEMANA 24 NÃO 2 8 NÃO 1817 MÉDIA DURANTE A SEMANA 36 NÃO 2 4 NÃO 1618 MÉDIA FIM-DE-SEMANA 75 NÃO 5 5,3 SIM 2219 MÉDIA DURANTE A SEMANA 15 SIM 1 9,3 NÃO 3120 BAIXA DURANTE A SEMANA 22 NÃO 2 4,1 NÃO 1421 ALTA DURANTE A SEMANA 21 SIM 2 13,2 NÃO 5022 MÉDIA FIM-DE-SEMANA 25 NÃO 1 11 SIM 3323 MÉDIA DURANTE A SEMANA 39 NÃO 6 15 SIM 3824 ALTA FIM-DE-SEMANA 61 SIM 2 14,3 SIM 3925 MÉDIA DURANTE A SEMANA 40 NÃO 4 10 NÃO 4026 BAIXA DURANTE A SEMANA 17 NÃO 2 14 NÃO 5127 MÉDIA DURANTE A SEMANA 26 NÃO 2 5 NÃO 1728 ALTA FIM-DE-SEMANA 69 SIM 6 2,5 SIM 929 BAIXA DURANTE A SEMANA 22 NÃO 2 1,9 SIM 630 BAIXA DURANTE A SEMANA 29 NÃO 1 1 NÃO 4

MÉDIA PONDERADA

23

Page 24: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

A média ponderada é uma média aritmética na qual cada valor é ponderado de acordo com

sua importância no grupo como um todo.

A fórmula da média ponderada é:

Operacionalmente, cada valor no grupo (X) é multiplicado por um fator de peso apropriado

(w) e o produto é então somado e dividido pela soma dos pesos.

Por exemplo, se eu estiver interessado na nota média do ENEM (Exame Nacional do ensino

médio) para quatro escolas de uma determinada região, é importante ponderar os valores das notas

pelo número de matrículas por escola. A Tabela abaixo apresenta o número de matrículas na rede

estadual em cada estado (valores fictícios):

ESCOLA NOTA Nº DE ALUNOSA 8 200B 9 150C 6 400D 7 250

Fonte: fictícia

Distribuição das notas das escolas num teste de proficiência

A média ponderada para os dados da tabela acima pode ser calculada da seguinte forma:

Para calcular a média ponderada no EXCEL devemos utilizar a função SOMARPRODUTO

para obter o resultado do numerador. Para o denominador, utilizamos a função SOMA. A saída do

EXCEL a seguir resume o procedimento.

24

Page 25: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

EXERCÍCIO 3.2Calcule a média ponderada da NOTA para os dados da tabela abaixo:

Companhia NOTA Nº DE MILITARESCompanhia A 80 175Companhia B 77 250Companhia C 91 330Companhia D 85 425

Fonte: fictícia

Nota das Companhias referentes ao Batalhão 10

O RESULTADO É ___________

ACHANDO A MEDIANA

Quando temos um conjunto de dados que apresentam valores discrepantes, podemos

utilizar outra medida para resumir os dados: a MEDIANA.

O cálculo é feito tomando o valor do meio, após os dados terem sido colocados em ordem

crescente.

O quadro abaixo apresenta os valores do TEMPO DE CHEGADA – em minutos – da viatura

para acidentes de gravidade BAIXA.

25

Page 26: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

5 6 16 17 22 22 25 30 31 33 38 40

Para calcular a mediana desses dados, devemos inicialmente colocá-los em ordem

crescente.

O próximo passo consiste em encontrar a “posição que divide os dados ao meio”. Se

tivéssemos 3 valores, a posição seria referente ao segundo valor. Se tivéssemos 11 valores a posição

seria referente ao sexto valor. Se tivéssemos 13, a posição seria referente ao 7º valor. Como temos 12

valores, devemos escolher a posição referente ao 6,5º valor. Para isso basta encontrar o “valor do

meio” entre 22 e 25: 23,5.

No Excel, basta utilizar a função:

=MED

Observe:

Portanto, se você tiver, por exemplo, 3 valores, a mediana é o valor que encontra-se na

posição 2. Se tiver 4 valores, a mediana é o valor que se encontra na posição 2,5 (entre os números de

posição 2 e 3). E se você tiver n números?

3 passos para achar a mediana:

1 – Organize os números em ordem crescente

2 – Se você tiver um número ímpar de valores , a mediana é o valor que está no meio.

3 – Se tiver um número par de valores , some 1 ao número de valores e depois divida por

dois. A mediana será o valor correspondente à posição calculada (n+1)/2.

26

Page 27: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

EXERCÍCIO 3.3

Calcule a mediana da variável DISTÂNCIA.

O resultado é ___________

MODA

A Moda é simplesmente o valor que mais aparece. Geralmente é mais útil para variáveis

nominais (ou categóricas). A função utilizada no EXCEL para o cálculo da moda é: MODO

EXERCÍCIO 3.4

Qual a MODA da variável “NÚMERO DE VEÍCULOS ENVOLVIDOS”?

O resultado é ___________

Para um pequeno conjunto de dados no qual nenhum dos valores medidos se repetiu, não

existe moda.

Quando dois valores aparecem com a mesma freqüência, a distribuição é descrita como

sendo bimodal. Distribuições de medições com muitas modas são denominadas multimodais.

EXERCÍCIO 3.5

Para uma amostra de 15 estudantes do ensino fundamental numa lanchonete, os seguintes valores

de vendas, agrupados em ordem crescente são observados:

0,10 0,10 0,25 0,25 0,250,35 0,40 0,53 0,90 1,251,35 2,45 2,71 3,09 4,10

Calcule:

[a] Média:

[b] Mediana:

27

Page 28: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

[c] Moda

EXERCÍCIO 3.6

O quadro abaixo apresenta uma amostra de 20 operadores de produção de uma companhia, os

quais receberam os seguintes valores líquidos como pagamento após todos os descontos em uma

dada semana, arredondado ao dólar mais próximo e agrupada em ordem crescente:

240 240 265 300240 240 265 305240 240 280 325240 255 280 330240 255 290 340

Calcule:

[a] Média

[b] Mediana

[c] Moda

EXERCÍCIO 3.7

28

Page 29: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

Aumento Custo médio por mês percentual (antes do aumento)

Leite 0,10 20Carne moída -0,06 30

Vestuário -0,08 30Gasolina 0,20 50

Item

Use a tabela acima para determinar a variação média percentual através da ponderação das

variações percentuais para cada item, pelo valor mensal gasto com cada item antes da modificação.

(PORTANTO, CALCULE A MÉDIA PONDERADA.

29

Page 30: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

********************************************

CAPÍTULO 4

ANÁLISE EXPLORATÓRIA DE DADOS:

MEDIDAS DISPERSÃO

********************************************

4.1 – RESUMINDO OS DADOS – MEDIDAS DE DISPERSÃO

Lembre-se que o nosso propósito ao estudar as medidas-resumo passa por descrever os

dados de forma que os mesmos possam ser interpretados. Ao utilizar a média, mediana ou moda

estamos fornecendo um número que exerce essa função de resumir. No entanto, por serem medidas

de tendência central elas não fornecem uma idéia do grau de espalhamento dos dados. Para isso, faz-

se necessário o estudo das medidas de dispersão ou variabilidade.

A AMPLITUDE

A amplitude consiste na diferença entre o maior e o menor valor num conjunto de dados,

conforme a fórmula abaixo:

Amplitude = Limite superior – Limite inferior

O quadro abaixo apresenta um conjunto de valores relativos a dois conjuntos de dados: A e B.

A B8 89 109 10

10 1010 1010 1011 1011 1012 12

A amplitude dos dois conjuntos de dados é:

Amplitude = 12 – 8 = 4

No entanto, a referida medida apresenta limitações, pois retrata apenas os valores

extremos do conjunto de dados, desconsiderando o que ocorre entre o maior e o menor valor.

30

Page 31: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

Podemos ilustrar tal argumento construindo um histograma para cada grupo com base nos dados das

distribuições de freqüência, conforme os quadros a seguir.

VALOR FREQÜÊNCIA8 19 2

10 311 212 1

GRUPO AVALOR FREQÜÊNCIA

8 19 0

10 811 012 1

GRUPO B

1

2

3

2

1

8 a 8,9 9 a 9,9 10 a 10,9 11 a 11,9 12 a 12,9

1

0

8

0

1

8 a 8,9 9 a 9,9 10 a 10,9 11 a 11,9 12 a 12,9

Portanto, a amplitude5 só descreve a largura dos dados e não como eles são dispersos

entre os limites.

Os dois conjuntos de dados acima têm a mesma amplitude, mas os valores são distribuídos

de forma diferente. O segundo conjunto tem valores discrepantes – valores extremos altos e baixos.

Aparentemente, a amplitude pode medir até que ponto os valores estão dispersos, mas é difícil ter

uma idéia real de como os dados são distribuídos.

O PROBLEMA COM VALORES DISCREPANTES6.

A amplitude é uma forma simples de dizer qual é a dispersão de um conjunto de dados,

mas, muitas vezes, não é a melhor maneira de medir como os dados são distribuídos dentro do

conjunto. Se os dados tiverem valores discrepantes, o uso da amplitude para descrever como os

valores são dispersos pode ser bastante enganoso, devido à sensibilidade a tais valores discrepantes.

Suponha que tenhamos um conjunto de dados como a seguir:

5 GRIFFITHS, Dawn, Use a cabeça: estatística. Editoras Altabooks. Rio de Janeiro, 2009, pag.88.6 Adaptado de: GRIFFITHS, Dawn, Use a cabeça: estatística. Editoras Altabooks. Rio de Janeiro, 2009, pag.89.

31

Page 32: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 4 5 5 5

Aqui, os números estão razoavelmente distribuídos de forma uniforme entre o limite

inferior e o limite superior, e não há nenhum valor discrepante com que nos preocupamos. Qual a

amplitude desse conjunto de dados?

Amplitude = 5 – 1 = 4

Mas o que acontece se introduzirmos um valor discrepante, como o número 10?

1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 4 5 5 5 10

Amplitude = 10 – 1 = 9

Nosso limite inferior é o mesmo, mas o limite superior aumentou para 10, nos dando uma

nova amplitude igual a 9. A amplitude aumentou em 5, só porque acrescentamos um número extra,

um valor discrepante.

Sem o valor discrepante, os dois conjuntos de dados seriam idênticos; então, por que há

uma diferença tão grande na forma em que descrevemos como os dados estão distribuídos?

Notamos que a amplitude apresenta-se como uma medida de dispersão limitada, uma vez

que reflete apenas os extremos dos dados.

Se ela é tão limitada, por que é tão usada? Pelo fato de ser de fácil entendimento, até de

leigos.

Então qual seria a solução para driblar o problema da limitação da amplitude? Podemos

trabalhar com quartis.

QUARTIS

Os quartis surgem como medidas estatísticas intermediárias. Num conjunto de dados

podemos obter os seguintes valores:

a) O primeiro quartil: Aponta o valor que representa a posição referente a 25% dos dados.

Os 25% menores.

b) Segundo quartil: Aponta o valor que representa a posição referente a 50% dos dados. Os

50% menores. Na verdade esse valor é a própria mediana.

c) Terceiro quartil: Aponta o valor que representa a posição referente a 75% dos dados. Os

75% menores (ou 25% maiores).

Nesse sentido, ao apresentar medidas resumo num conjunto de dados de uma pesquisa,

podemos resumir uma variável com as seguintes informações: mínimo, máximo, média, mediana,

primeiro quartil, terceiro quartil e desvio-padrão.

DESVIO PADRÃO E VARIÂNCIA

32

Page 33: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

Uma forma de avaliar como os dados se distribuem em torno da média é a variância. Tal

medida consiste da “média quadrática dos desvios em relação à média”. O motivo do uso da “média

quadrática” é que a média aritmética simples dos desvios sempre dá zero.

Tirar a média dos valores absolutos também é viável, no entanto é uma medida pouco

usada, pois apresenta limitações em termos de propriedades probabilítisticas.

A fórmula da variância é:

Portanto, a variância consiste em subtrair cada valor observado da média, elevá-lo ao

quadrado, somar todos os valores e em seguida dividir pelo tamanho da amostra.

No entanto, para que a medida de variação tenha a mesma dimensão da média, é mais

comum trabalhar com o desvio-padrão, que nada mais é que a RAIZ QUADRADA DA VARIÂNCIA.

EXERCÍCIO 4.1

Calcule a variância e o desvio padrão da variável DISTÂNCIA do banco de dados

fictício para as variáveis de gravidade ALTA.

2,57,6

13,214,32,5

O resultado é:

Variância:_____________

Desvio padrão:_________

Os comandos para o cálculo da variância e desvio padrão são, respectivamente:

VARP

DESVPAD

Confira os cálculos acima no Excel.

RETOMANDO

A primeira etapa da análise de dados consiste no resumo dos mesmos. Uma das formas de

33

Page 34: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

fazer isso é através da construção de distribuições de freqüência e pelo uso dos mais diversos tipos de

gráficos.

Além disso, podemos utilizar medidas-resumo. As principais são média, mediana, desvio-

padrão, mínimo, máximo e quartis.

O quadro a seguir apresenta a nota dos alunos de três turmas.

A B C5 3 05 4 16 6 97 8 107 9 10

TURMAS

A nota média das três turmas é a mesma: 6.

Dessa forma podemos notar uma limitação da média: Não fornece informação sobre como

os dados se distribuem. Uma forma de solucionar o problema é através do cálculo do desvio padrão.

Os valores de desvio padrão para os dados do quadro acima são, respectivamente: 0,9;

2,3 e 4,5. Isso significa que, apesar das médias serem iguais, os valores encontram-se mais

espalhados na turma C.

COEFICIENTE DE VARIAÇÃO DE PERSON

Outra medida do grau de dispersão dos dados é o Coeficiente de Variação de Pearson. O

mesmo consiste na razão entre o desvio padrão e a média, conforme a fórmula abaixo:

x 100

EXERCÍCIO 4.2

Considere que você seja o Administrador de uma Fábrica de Biscoitos. Em função do aumento da

demanda pelos produtos surgiu a necessidade de expansão da fábrica. Ao pesquisar sobre a fonte

de financiamento do maquinário, foram obtidos os seguintes dados acerca da taxa de juros cobrada

por dois diferentes bancos nos últimos 12 meses conforme a Tabela abaixo:

34

Page 35: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

Banco Alfa Banco Betaset/08 2,1 1,8out/08 2 1,8nov/08 1,9 1,8dez/08 1,8 1,7jan/09 1,8 1,7fev/09 1,7 1,8mar/09 1,6 2,2abr/09 1,7 2,2mai/09 1,8 1,7jun/09 1,9 1,6jul/09 2 1,6

ago/09 2 1,6Fonte: Fictícia

Taxas de juros para empréstimosnos últimos 12 meses

(1) Calcule a Média Aritmética da Taxa de Juros da cada banco nos últimos 12 meses

(2) Mostre que o desvio-médio é igual a zero para o Banco Alfa.

(3) Calcule a variância e desvio-padrão para cada Banco.

(4) Calcule o Coeficiente de Variação para a Taxa de Juros dos Bancos.

(5) Discuta com seus colegas qual o melhor Banco a ser escolhido para fazer o financiamento do maquinário.

EXERCÍCIO 4.3

Um investidor possui R$ 30.000 aplicados no mercado de ações. Os investimentos foram divididos

em: R$ 7.500 no ativo A, R$ 9.000 no ativo B e R$ 13.500 no ativo C. Durante 5 meses, os retornos

respectivos (em percentual) foram:

35

Page 36: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

A 1,5 2,0 1,2 1,8 1,0B 2,0 0,5 1,5 1,3 0,7C 1,3 1,0 0,7 0,9 1,1

Considerando que o retorno da carteira de investimentos consiste na média ponderada do retorno

dos ativos, calcule o retorno da carteira (em percentual) no período considerado.

EXERCÍCIO 4.4

O número de carros vendidos por cada um dos vendedores de uma agencia de automóveis durante um determinado mês, agrupado em ordem crescente, é:

2 4 7 10 1010 12 12 14 15

Determine:

[a] Amplitude

[b] Desvio médio absoluto

[c] Média

[d] Mediana

[e] Moda

[f] variância

[g] Desvio-padrão

36

Page 37: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

[h] Coeficiente de variação

EXERCÍCIO 4.5

NÚMERO GRAVIDADE NÚMERO DE DISTÂNCIA TEMPO DEDA DA DIA DURAÇÃO VÍTIMA VEÍCULOS DO MOTORISTA CHEGADA

OCORRÊNCIA OCORRÊNCIA (TEMPO) FATAL ENVOLVIDOS POSTO POLICIAL ALCOOLIZADO DA VIATURA1 ALTA FIM-DE-SEMANA 75 SIM 8 2,5 SIM 102 MÉDIA DURANTE A SEMANA 66 NÃO 5 1,4 SIM 53 BAIXA DURANTE A SEMANA 18 NÃO 3 3,2 NÃO 154 BAIXA DURANTE A SEMANA 19 NÃO 4 5,9 NÃO 265 MÉDIA DURANTE A SEMANA 25 NÃO 2 6,4 NÃO 306 BAIXA FIM-DE-SEMANA 26 NÃO 2 8,3 NÃO 407 MÉDIA FIM-DE-SEMANA 35 NÃO 2 1,3 SIM 68 BAIXA DURANTE A SEMANA 44 NÃO 2 5,5 NÃO 199 BAIXA DURANTE A SEMANA 17 NÃO 3 14,2 NÃO 35

10 MÉDIA DURANTE A SEMANA 29 SIM 2 6,6 SIM 2211 BAIXA DURANTE A SEMANA 30 NÃO 3 7,1 NÃO 1912 BAIXA DURANTE A SEMANA 41 NÃO 2 3,3 NÃO 1213 BAIXA DURANTE A SEMANA 22 NÃO 3 4,1 NÃO 1214 MÉDIA FIM-DE-SEMANA 55 NÃO 5 8,8 SIM 2515 ALTA FIM-DE-SEMANA 80 SIM 3 7,6 SIM 3016 BAIXA DURANTE A SEMANA 24 NÃO 2 8 NÃO 1817 MÉDIA DURANTE A SEMANA 36 NÃO 2 4 NÃO 1618 MÉDIA FIM-DE-SEMANA 75 NÃO 5 5,3 SIM 2219 MÉDIA DURANTE A SEMANA 15 SIM 1 9,3 NÃO 3120 BAIXA DURANTE A SEMANA 22 NÃO 2 4,1 NÃO 1421 ALTA DURANTE A SEMANA 21 SIM 2 13,2 NÃO 5022 MÉDIA FIM-DE-SEMANA 25 NÃO 1 11 SIM 3323 MÉDIA DURANTE A SEMANA 39 NÃO 6 15 SIM 3824 ALTA FIM-DE-SEMANA 61 SIM 2 14,3 SIM 3925 MÉDIA DURANTE A SEMANA 40 NÃO 4 10 NÃO 4026 BAIXA DURANTE A SEMANA 17 NÃO 2 14 NÃO 5127 MÉDIA DURANTE A SEMANA 26 NÃO 2 5 NÃO 1728 ALTA FIM-DE-SEMANA 69 SIM 6 2,5 SIM 929 BAIXA DURANTE A SEMANA 22 NÃO 2 1,9 SIM 630 BAIXA DURANTE A SEMANA 29 NÃO 1 1 NÃO 4

Utilizando o banco de dados acima, calcule:

[a] A média do tempo de chegada da viatura nos fins de semana.

[b] A média do tempo de chegada da viatura nos dias de semana.

[c] A variância e desvio padrão do tempo de chegada da viatura nos fins de semana.

37

Page 38: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

[d] A variância e desvio padrão do tempo de chegada da viatura nos dias de semana.

[e] O Coeficiente de Variação para fins de semana e dias de semana.

[f] O tempo médio de duração do atendimento para ocorrências de gravidade: ALTA, MÉDIA E BAIXA.

[g] Calcule a variância e desvio padrão para as médias do item anterior.

REFERÊNCIAS BIBLIOGRÁFICAS

GRIFFITHS, Dawn. Use a cabeça! Estatística. Rio de Janeiro: Altabooks, 2009.

MAGALHÃES, Marcos Nascimento, LIMA, Antônio Carlos Pedroso de. Noções de

Probabilidade e Estatística. 6º. Edusp, 2007.

MONTGOMERY, D. C.; RUNGER, G. C. Estatística aplicada e probabilidade para

38

Page 39: APOSTILA DE ESTATÍSTICA E PROBABILIDADE - ENGENHARIA - MÓDULO 1

engenheiros. 3.ed. Rio de Janeiro: LTC, 2009.

MOORE, David S. A estatística básica e sua prática. Rio de Janeiro. LTC, 2005.

MOORE, David. S, McCABE, George P., DUCKWORTH, William M., SCLOVE, Stanley

L. A Prática da Estatística Empresarial. Como Usar Dados para Tomar Decisões. Rio de

Janeiro: LTC, 2006.

TRIOLA, Mário F. Introdução à Estatística. LTC. 10a edição 2008. 722p.

WALPOLE, Ronald. E. Probabilidade e estatística para engenharia e ciências. São

Paulo: Pearson Prentice Hall, 2009.

39