266
PROBABILIDADE E ESTATÍSTICA Material de Apoio à Disciplina Profª: Susana Machado Ferreira 1-INTRODUÇÃO A palavra ESTATÍSTICA, de origem latina STATUS (ESTADO), significou por muito tempo ciência dos Negócios do Estado. Nas mãos dos estadistas era uma verdadeira ferramenta administrativa, pois registrava o número de habitantes, de nascimentos, de óbitos, faziam estimativas das riquezas individual e social, distribuía terras aos povos, cobravam impostos, etc. No século XVII, a nova ciência (ou método mais cientifico) foi batizada por Gottfried Achenwall como o nome de ESTATÍSTICA. A estatística tem evoluído até o dia de hoje, como uma ferramenta auxiliar de todas as ciências; ela utiliza números para a coleta, organização, resumo e apresentação de dados e também para a obtenção de conclusões e a tomada de decisões razoáveis. 1.1- O QUE É ESTATÍSTICA Definição Estatística é a parte da matemática que fornece métodos para coleta, organização, descrição, analise e interpretação de dados para tomada de decisões. Aplicações Usuais da Estatística - Índices econômicos - Taxas de natalidade e mortalidade 1

Apostila Probabilidade e Estatística 2009

  • Upload
    dxch

  • View
    2.476

  • Download
    12

Embed Size (px)

Citation preview

Page 1: Apostila Probabilidade e Estatística 2009

PROBABILIDADE E ESTATÍSTICA

Material de Apoio à Disciplina

Profª: Susana Machado Ferreira

1- INTRODUÇÃO

A palavra ESTATÍSTICA, de origem latina STATUS (ESTADO), significou por muito tempo ciência dos Negócios do Estado. Nas mãos dos estadistas era uma verdadeira ferramenta administrativa, pois registrava o número de habitantes, de nascimentos, de óbitos, faziam estimativas das riquezas individual e social, distribuía terras aos povos, cobravam impostos, etc.

No século XVII, a nova ciência (ou método mais cientifico) foi batizada por Gottfried Achenwall como o nome de ESTATÍSTICA.

A estatística tem evoluído até o dia de hoje, como uma ferramenta auxiliar de todas as ciências; ela utiliza números para a coleta, organização, resumo e apresentação de dados e também para a obtenção de conclusões e a tomada de decisões razoáveis.

1.1- O QUE É ESTATÍSTICA

Definição

Estatística é a parte da matemática que fornece métodos para coleta, organização, descrição, analise e interpretação de dados para tomada de decisões.

Aplicações Usuais da Estatística

- Índices econômicos- Taxas de natalidade e mortalidade- Eleições- Pesquisa de opinião- Pesquisa de mercado

1.2 – TIPOS DE ESTATÍSTICA 1.2.1) Estatística Descritiva - é a parte da estatística que procura descrever e analisar

um certo fenômeno.

1.2.2) Estatística Inferencial – é a parte da estatística que se preocupa em tirar conclusões e fazer interpretações dos resultados obtidos.

1

Page 2: Apostila Probabilidade e Estatística 2009

1.3 - POPULAÇÃO VERSUS AMOSTRA

Em estatística uma população não necessariamente significa um ajuntamento de pessoas. Pode, na verdade, representar um ajuntamento de pessoas ou de qualquer tipo de item, como, por exemplo, casas, livros, aparelhos de televisão ou carros. A população de interesse geralmente é chamada de população-alvo.

População ou População-Alvo – é a coleção de todas as observações sobre determinado fenômeno.

Exemplo: População dos tipos de pedras preciosas no RS. População das idades dos alunos da Universidade em 2008.

Amostra – é o conjunto de dados observados ou extraídos da população.

Exemplo: Amostra definida da população dos tipos de pedras preciosas no RS, na região da fronteira. Amostra das idades dos alunos da Universidade na disciplina de probabilidade e estatística.

Censo e Pesquisa por Amostragem – Uma pesquisa que inclui todos os membros da população é chamada de censo. A técnica de coletar informações a partir de uma parcela da população é denominada pesquisa por amostragem.

Exemplo: Se coletarmos informações sobre os rendimentos de todas as famílias em Bagé no ano de 2008, isso vai ser chamado de censo.

Se coletarmos informações sobre os rendimentos de 50 famílias de Bagé no ano de 2008, estaremos fazendo uma pesquisa por amostragem.

Amostra Representativa – Uma pesquisa que representa, o mais próximo possível, as características da população é chamada de amostra representativa.

Exemplo: Para se encontrar a renda média das famílias que vivem na cidade de Bagé, por meio da condução de uma pesquisa por amostragem, a amostra deve conter famílias que pertençam a diferentes faixas de renda, quase na mesma proporção existente na população. Esse tipo de amostra é chamado de amostra representativa.

Amostra Aleatória - Uma amostra extraída de maneira tal que cada elemento da população tenha uma chance de ser selecionado é chamado de amostra aleatória. Caso a chance de ser selecionado seja a mesma para cada elemento da população, a amostra denomina-se amostra aleatória simples.

Exemplo: Uma maneira de selecionar uma amostra aleatória é por meio de sorteio ou extração. Por exemplo, se formos selecionar 5 alunos de uma classe de 50, escrevemos os 50 nomes em pedaços separados de papel. Depois, colocamos todos os 50 pedaços em uma caixa e misturamos bastante. Finalmente, de maneira aleatória, extraímos da caixa cinco

2

Page 3: Apostila Probabilidade e Estatística 2009

pedaços de papel. Os cinco nomes extraídos compõem uma amostra aleatória. Por outro lado, se colocarmos todos os 50 nomes em ordem alfabética e, então, selecionarmos os cinco primeiros nomes da lista, isso representa uma amostra não-aleatória.

Uma amostra pode ser selecionada com ou sem reposição.

Na amostragem com reposição, cada vez selecionamos um elemento a partir da população colocamos esse elemento de volta na população antes de selecionar o elemento seguinte.

Exemplo: Considere uma caixa contendo 25 bolas de diferentes cores. Suponha que retiremos uma bola, anotemos sua cor e a coloquemos de volta na caixa antes de extrair a próxima bola. Cada vez que extraímos uma bola, a caixa contém 25 bolas. Este representa um exemplo de amostragem com reposição.

A amostragem sem reposição ocorre quando o elemento selecionado não é recolocado na população.

Exemplo: Considere uma pesquisa de opinião baseada em um determinado número de eleitores, selecionamos a partir da população de todos os eleitores registrados. Nesse caso, o mesmo eleitor não é selecionado mais de uma vez.

Exercício:1) Explique a cada uma das questões a seguir constitui uma população ou uma

amostra.a) Resultados de todos os alunos em uma turma de estatística.

b) Produção de batatas para 10 glebas de terra.

c) Salários semanais correspondentes a todos os empregados de uma empresa.

d) Gado possuído por 100 fazendeiros em Iowa.

e) Número de computadores vendidos durante a última semana em todas as lojas de computadores de Los Angeles.

1.4 – TERMOS BÁSICOS

Esta seção explica o significado de um elemento (ou membro), uma variável, uma observação e um conjunto de dados.

Cada empresa listada na tabela 1.1 constitui um elemento ou um membro da amostra.

Elemento ou Membro – Um elemento ou membro de uma amostra ou população representa um sujeito ou objeto específico sobre o qual a informação é coletada.

3

Page 4: Apostila Probabilidade e Estatística 2009

Tabela 1.1Vendas em 2001 de Sete Empresas dos EUA

___________________________________________Empresa Vendas em 2001

(milhões de dólares)____________________________________________

Lojas Wal-Mart 217.799IBM 85.866General Motors 177.260Dell Computadores 31.168Procter & Gamble 39.262JC Penney 32.004Home Depot 53.553

____________________________________________

Em nosso exemplo, vendas em 2001 é chamada de variável. Vendas em 2001 é uma característica das empresas que estão sendo pesquisadas ou estudadas.

Variável – Uma variável corresponde a uma característica sob estudo que assume diferentes valores para diferentes elementos.

Cada um dos valores que representa vendas em 2001, para as sete empresas apresentadas na tabela 1.1, é chamado de observação ou medição.

Observação ou Medição – O valor de uma variável para um elemento é chamado de observação ou medição.

As informações fornecidas na tabela 1.1, que dizem respeito a vendas das empresas em 2001, são chamadas de dados ou conjuntos de dados.

Conjunto de Dados – Um conjunto de dados é uma complicação de observações sobre uma ou mais variável.

Outros exemplos de conjunto de dados são: uma lista de preços de 25 casas recentemente vendidas, notas de 15 alunos, opiniões de 100 eleitores.

Exercício:1) A tabela a seguir fornece o número de mordidas de cachorro relatadas à policia

no ano passado em seis cidades.

______________________________________________

4

Page 5: Apostila Probabilidade e Estatística 2009

Cidade Número de Mordidas______________________________________________

Center City 47Elm Grove 32Franklin 51Bay City 44Oakdale 12Sand Point 3

______________________________________________

a) Qual é a variável para esse conjunto de dados?

b) Quantas observações estão nesse conjunto de dados?

c) Quantos elementos esse conjunto de dados contem?

1.5 – TIPOS DE VARIÁVEIS

Uma variável pode ser classificada como quantitativa ou qualitativa. Esses dois tipos de variáveis são explicados a seguir:

1.5.1 – Variáveis Quantitativas

Variável Quantitativa – Uma variável que pode ser mensurada numericamente é chamada de variável quantitativa.

Exemplos:Rendas, estaturas, preços de casa, etc.

Tais variáveis quantitativas podem ser classificadas como variáveis discretas ou como variáveis continuas.

Variável Discreta – Uma variável cujos valores são contáveis é chamada de variável discreta. Em outras palavras, uma variável discreta pode assumir determinados valores sem valores intermediários.

Exemplos:O número de carros vendidos, o número de pessoas que vão ao banco em um dia

qualquer, o número de carros em um estacionamento.

Variável Contínua – Uma variável que assumir qualquer valor numérico, ao longo de um determinado intervalo, ou intervalos, é chamada de variável continua.

5

Page 6: Apostila Probabilidade e Estatística 2009

Exemplos:O tempo gasto para completar uma prova, pesos de pessoas, estatura de uma pessoa.

1.5.2 – Variáveis Qualitativas ou Variáveis Categóricas Variável Qualitativa ou Variável Categórica – Uma variável que não pode assumir

um valor numérico, mas pode ser classificada em duas ou mais categorias não-numéricas, denomina-se variável qualitativa ou variável categórica.

Exemplos:O nível de um aluno que ainda não se formou na faculdade, a cor do cabelo, o sexo de

uma pessoa e o modelo de um carro.

Exercício:1) Indique quais das seguintes variáveis são quantitativas e quais são qualitativas.a) Número de erros tipográficos em um jornal

b) Contas mensais de TV a cabo

c) Locais favoritos dos alunos de faculdade para as férias de primavera

d) Número de carros possuídos por famílias

e) Receitas de estados oriundos de loterias

1.6 – DADOS DE SEÇÕES CRUZADAS VERSUS DADOS DE SÉRIES TEMPORAIS

Os dados podem ser classificados como dados de seções cruzadas ou como dados de series temporais.

1.6.1 - Dados de Seções Cruzadas

Definição: Dados coletados sobre diferentes elementos no mesmo ponto no tempo ou no mesmo período são conhecidos como dados de seções cruzadas.

Exemplo:

As informações sobre rendas de 100 famílias para 2002.

1.6.2 - Dados de Séries

Definição: Dados coletados sobre o mesmo elemento, para a mesma variável, em diferentes pontos do tempo, ou para diferentes períodos de tempo, são chamados de dados de séries temporais.

6

Page 7: Apostila Probabilidade e Estatística 2009

Exemplo:As informações sobre as exportações dos EUA para os anos de 1983 a 2002.

1.7 – FONTES DE DADOS

A disponibilidade de dados precisos e apropriados é essencial para a obtenção de resultados confiáveis. Os dados podem ser obtidos a partir de fontes internas, de fontes externas ou de pesquisas e experimentos.

Exercício:1) Classifique os dados a seguir como dados de seções cruzadas ou como dados de séries temporais.a) Preços médios de casa em 100 cidades

b) Salários de 50 empregados

c) Número de carros vendidos pela General Motors, por ano, de 1980 até 2002

d) Número de empregados contratados por uma empresa, por ano, de 1985 até 2002

1.8 – NOTAÇÃO DE SOMATÓRIO

Muitas vezes, a notação matemática auxilia na expressão concisa de uma relação matemática. A notação de somatório, é utilizada para denotar a soma de valores.

A letra grega maiúscula (sigma) é utilizada para representar o somatório de todos os valores. Utilizando a notação , podemos escrever a soma da seguinte maneira:

A notação nessa expressão representa a soma de todos os valores de x e é lida como “sigma de x” ou “somatório de todos os valores de x”.

Exemplos:1) Os salários anuais (em milhares de dólares) de quatro trabalhadores são 75, 42, 125 e 61. Encontre:a)

b)

7

Page 8: Apostila Probabilidade e Estatística 2009

c)

2) A tabela a seguir lista quatro pares de valores para m e f.______________________________________________

m 12 15 20 30____________________________________________

f 5 9 10 16____________________________________________

Calcule o seguinte:a)

b)

c)

d)

Exercícios:1) As contas de telefone referentes a janeiro de 2003 para quatro famílias foram

US$83, US$205, US$57 e US$134. Faça com que y seja a quantia referente à conta de telefone correspondente a janeiro de 2003 para uma família. Encontre:

a)

8

Page 9: Apostila Probabilidade e Estatística 2009

b)

c)

2) O número de alunos (arredondando para milhar mais próximo) atualmente matriculados em sete universidades são: 7, 39, 21, 16, 3, 43 e 19. Seja x o número de alunos atualmente matriculados em uma universidade. Encontre:

a)

b)

c)

Teste de Auto-Revisão

1) Em estatística, uma população significa um conjunto de todos(as) os(as)a) homens e mulheresb) sujeitos e objetosc) pessoas que vivem em um pais

2) Em estatística, uma amostra significa uma parcela referente a (à)a) pessoas selecionadas a partir da população de um paísb) pessoas selecionadas a partir da população de uma áreac) população de interesse

3) Indique qual dos itens a seguir representa um exemplo de amostragem com reposição e qual representa um exemplo de amostragem sem reposição.

a) Dez alunos são selecionados a partir de um curso de estatística de maneira tal que, assim que um aluno é selecionado, seu nome é apagado da lista antes de o próximo aluno ser selecionado.

9

Page 10: Apostila Probabilidade e Estatística 2009

b) Uma caixa contém cinco bolas de diferentes cores. Uma bola é extraída da caixa, sua cor é registrada e a bola é colocada de volta na caixa antes de a próxima bola ser extraída. Esse experimento é repetido 12 vezes.

4) Indique quais das seguintes variáveis são quantitativas e quais são qualitativas. Classifique as variáveis quantitativas como discretas ou continuas.

a) Programas de TV favoritos de mulheres

b) Salários de jogadores de futebol

c) Número de animais de estimação possuídos por famílias

e) Total de indenizações pagas por 15 seguradores de automóveis em 2002

5) Uma pesquisa de opiniões on-line, com 30.270 entrevistados, conduzida durante o período de 14 a 21 de janeiro de 2002, formulou a pergunta “Qual é o melhor emprego no Super Bowl?” A tabela a seguir fornece o número de pessoas que votou em cada um dos cinco empregos.

________________________________________________ Emprego Votos

________________________________________________Jogador 11.715Locutor/repórter 9982Líder de torcida 5221Técnico 1927Árbitro 1425

__________________________________________________ Fonte: Monster.com pesquisa on-line. USA TODAY,

1º de fevereiro de2002.

Explique o significado de membro, variável, medição e conjunto de dados com referência na tabela.

6) O total de cômodos em cada uma das cinco casas é 8, 5, 10, 6, 5 e 8. Seja x o número de cômodos em uma casa. Encontre:

a)

10

Page 11: Apostila Probabilidade e Estatística 2009

b)

c)

MINIPROJETO

1) Pegue uma amostra de 30 alunos e pergunte-lhes o quanto gastaram em livros no semestre 2008/02. Uma vez que você tenha coletado as informações, escreva um relatório conciso que inclua respostas em relação a essas questões.a) Liste os dados.

b) Qual é a população-alvo razoável para a amostra que você utilizou?

c) A sua amostra é uma amostra aleatória a partir dessa população-alvo?

d) Você acredita que a sua amostra é representativa dessa população?

e) Este é um exemplo de amostragem com reposição ou de amostragem sem reposição?

f) Os dados da amostra são discretos ou contínuos?

g) Descreva o significado de um elemento, uma variável e uma medição para esse conjunto de dados?

h) Descreva quaisquer problemas que você tenha tido enquanto coletava os dados.

Alguns desses dados seria inútil? Se positivo, explique por quê?

2. ORGANIZANDO DADOS

Este capítulo explica como organizar e exibir dados utilizando tabelas e gráficos. Aprenderemos a preparar tabelas de distribuição de freqüências para dados qualitativos e para dados quantitativos; aprenderemos a construir gráficos de barras, gráficos de pizza,

11

Page 12: Apostila Probabilidade e Estatística 2009

histogramas e polígonos para esses dados; e aprenderemos a preparar disposições ramo-e-folha.

2.1 – Dados Brutos

Dados Brutos - na seqüência em que foram coletados, e antes de serem processados ou classificados, são chamados de dados brutos.

2.2 – Organizando e Elaborando Gráficos com dados Qualitativos

Os conjuntos de dados são organizados em tabelas, e os dados são exibidos utilizando-se gráficos.

2.2.1 – Distribuição de Freqüência

Na tabela, a variável correspondente a tipo de ocupação, que representa uma variável qualitativa. As categorias (representando o tipo de ocupação) listadas na primeira coluna são mutuamente excludentes. Em outras palavras, cada um dos 100 alunos pertence a uma, e somente uma, dessas categorias. O número de alunos que pertencem a uma determinada categoria é chamado de freqüência dessa categoria. Uma distribuição de freqüências revela como as freqüências estão distribuídas ao longo das várias categorias. A tabela 2.1 é chamada de tabela de distribuição de freqüências ou, simplesmente, tabela de freqüências.

Tabela 2.1Tipo de Ocupação à qual os Alunos Pretendem se Dedicar_____________________________________________________Tipo de Ocupação Número de Alunos_____________________________________________________Empresas/negócios privados 44Governo Federal 16Governo estadual/prefeitura 23Negócio próprio 17____________________________________________________ Soma=100_____________________________________________

Definição

Distribuição de Freqüência para Dados Qualitativos – Uma distribuição de freqüências para dados qualitativos lista todas as categorias, bem como os números de elementos que pertencem a cada uma das categorias.

12

Page 13: Apostila Probabilidade e Estatística 2009

O exemplo 2.1 é uma ilustração de como se constrói uma tabela de distribuição de freqüências para dados qualitativos.

Exemplo 2.1:Uma amostra de 30 empregados de grandes empresas foi selecionada, e esses

empregados foram indagados sobre o quão estressante era o seu trabalho. As respostas desses empregados estão registradas a seguir, em que muito representa muito estressante, mais ou menos representa mais ou menos estressante e nada corresponde a nada estressante.

Construa uma tabela de distribuição de freqüências para esses dados.

Tabela 2.2Distribuição de Freqüências do Estresse no Trabalho____________________________________________________Estresse no Trabalho Marcação Freqüência (f)_____________________________________________________MuitoMais ou menosNada_____________________________________________________ Soma = 30_____________________________________________________

2.2.2 – Distribuições de Freqüências Relativas e Distribuições de Percentagens

A freqüência relativa de uma categoria é obtida pela divisão da freqüência daquela categoria pela soma de todas as freqüências.

Calculando a Freqüência Relativa de uma Categoria

Freqüência relativa de uma categoria = Freqüência daquela categoria/Soma de todas as freqüências

13

Page 14: Apostila Probabilidade e Estatística 2009

A porcentagem para uma categoria é obtida pela multiplicação da freqüência

relativa daquela categoria por 100. Uma distribuição de percentagens lista as percentagens para todas as categorias.

Calculando Percentagens Percentagem = (Freqüência relativa) . 100

Exemplo 2.21) Determine a distribuição de freqüências relativas e a distribuição de percentagens

para os dados apresentados na tabela 2.3.Observe que a soma das freqüências relativas é sempre igual a 1,00 (ou

aproximadamente 1,00, se as freqüências estiverem arredondadas), e a soma das percentagens é sempre igual a 100 ((ou aproximadamente 100, se as percentagens estiverem arredondadas).

Tabela 2.3Distribuição de Freqüências Relativas e Distribuição de Percentagens do Estresse

no TrabalhoEstresse no Trabalho Freqüência relativa PercentagemMuito Mais ou menosNada Soma = 1,00 soma = 100

2.2.3 – Apresentação Gráfica de Dados Qualitativos

Uma distribuição gráfica pode revelar, de imediato, as principais características de um conjunto de dados. O gráfico de barras e o gráfico de pizza são dois tipos de gráficos utilizados para exibir dados qualitativos.

Gráficos de Barras

Para construir um gráfico de barras (também chamado de diagrama de barras), marcamos as várias categorias no eixo horizontal, como na figura 2.1. Observe que todas as categorias estão representadas por intervalos da mesma amplitude. Marcamos as freqüências no eixo vertical. Em seguida, desenhamos uma barra para cada categoria, de maneira tal que a altura da barra represente a freqüência da categoria correspondente. Deixamos uma pequena lacuna entre as barras adjacentes. A figura 2.1 fornece o gráfico de barras para a distribuição de freqüências da tabela 2.2.

14

Page 15: Apostila Probabilidade e Estatística 2009

Definição

Gráfico de Barras – Um gráfico composto de barras cujas alturas representam as freqüências das respectivas categorias é chamado de gráfico de barras.

Gráficos de Pizza

Um gráfico de pizza é mais comumente utilizado para apresentar percentagens, embora pode ser utilizado para exibir freqüências ou freqüências relativas. A pizza (ou círculo) completa representa a amostra total ou população total. Em seguida, dividimos a pizza em diferentes porções, que representam as diferentes categorias.

Definição: Gráfico de Pizza – Um círculo dividido em porções que representam as freqüências relativas, ou as percentagens, de uma população ou de uma amostra, pertencentes a diferentes categorias, é chamado de gráfico de pizza.

Conforme, sabemos, um círculo contém 360 graus. Para construir um gráfico de pizza, multiplicamos 360 pela freqüência relativa de cada categoria, para obter a medida em graus, ou tamanho do ângulo, para a categoria correspondente. A tabela 2.4 mostra os cálculos dos tamanhos dos ângulos para as várias categorias da tabela 2.3.

Tabela 2.4Calculando Tamanhos de Ângulos para o Gráfico de Pizza________________________________________________________________Estresse no Trabalho Freqüência relativa Tamanho do Ângulo________________________________________________________________MuitoMais ou menosNada________________________________________________________________ Soma = 1,000 Soma = 360________________________________________________________________

A figura 2.2 mostra o gráfico de pizza para a distribuição de percentagens da tabela 2.3, que utiliza os tamanhos dos ângulos calculados na Tabela 2.4.

15

Page 16: Apostila Probabilidade e Estatística 2009

2.3 – Organizando e Elaborando Gráficos com dados Quantitativos

2.3.1 – Distribuição de Freqüências

A tabela 2.5 fornece os ganhos semanais correspondentes a 100 empregados de uma grande empresa. A primeira coluna lista as classes, que representam a variável (quantitativa) ganhos semanais. Para dados quantitativos, um intervalo que inclua todos os valores que se posicionem entre dois números, o limite inferior e o limite superior, é chamado de classe. Observe que as classes sempre representam uma variável. Como podemos observar, as classes não se sobrepõem; ou seja, cada valor em relação a ganho pertence a uma, e somente uma, classe. A segunda coluna na tabela lista o número de empregados que apresentam os ganhos dentro de cada classe. Os números listados na segunda coluna são chamados de freqüências, que fornecem o número de valores que pertencem a diferentes classes. As freqüências são representadas por f.

Tabela 2.5Ganhos Semanais de 100 Empregados de uma Empresa___________________________________________________________Ganhos Semanais (dólares) Números de Empregados f___________________________________________________________401 até 600 9601 até 800 22801 até 1000 391001 até 1200 151201 até 1400 91401 até 1600 6___________________________________________________________

Definição

Distribuição de Freqüências para Dados Quantitativos – Uma distribuição de freqüências para dados quantitativos lista todas as classes e o número de valores que pertencem a cada classe. Os dados apresentados no formato de uma distribuição de freqüências são chamados de dados agrupados.

16

Page 17: Apostila Probabilidade e Estatística 2009

Para encontrar o ponto médio entre o limite superior da primeira classe e o limite inferior da segunda classe na tabela 2.5, dividimos a soma desses dois limites por 2. Assim, sendo, esse ponto médio corresponde a

O valor de 600,5 é chamado de fronteira superior da primeira classe e de fronteira inferior da segunda classe. Utilizando essa técnica, podemos converter os limites de classes da tabela 2.5 em fronteiras de classes, que também são chamadas de limites reais de classes. A segunda coluna da Tabela 2.6 lista as fronteiras para a Tabela 2.5.

Definição

Fronteira de Classe – A fronteira de classe é representada pelo ponto médio entre o limite superior de uma classe e o limite inferior da classe seguinte.

A diferença entre as duas fronteiras de uma classe representa a amplitude da classe. A amplitude da classe também é chamada de tamanho de classe.

Tabela 2.6Fronteiras de Classes, Amplitudes de classes e Pontos Médios de Classes para a

tabela 2.5Limites de Classes Fronteiras de Classes Amplitude de Classe Ponto Médio da Classe401 até 600 400,5 até menos que 600,5 200 500,5601 até 800 600,5 até menos que 800,5 200 700,5801 até 1000 800,5 até menos que 1000,5 200 900,51001 até 1200 1000,5 até menos que 1200,5 200 1100,51201 até 1400 1200,5 até menos que 1400,5 200 1300,51401 até 1600 1400,5 até menos que 1600,5 200 1500,5

Encontrado a Amplitude da Classe

Amplitude da Casse = Fronteira superior – Fronteira inferior

Desta maneira, na tabela 2.6,

Amplitude da primeira classe = 600,5 – 400,5 = 200

O ponto médio da classe, ou marco da classe, é obtido pela divisão do resultado da soma dos dois limites (ou das duas fronteiras) de uma classe por 2.

17

Page 18: Apostila Probabilidade e Estatística 2009

Calculando o Ponto Médio da Classe ou Marco da Classe

Ponto médio ou marco da classe = Limite inferior + limite superior/2

Logo, o ponto médio da primeira classe na tabela 2.5, ou na Tabela 2.6, é calculado da seguinte maneira:

Ponto médio da primeira classe = 401+600/2 = 500,5

Observe que na Tabela 2.6, quando expressamos classes utilizando fronteiras de classes, escrevemos até menos que, para garantir que cada valor pertença a uma, e somente uma, classe. Como podemos verificar, a fronteira superior da classe precedente e a fronteira inferior da classe sucessiva representam a mesma coisa.

2.3.2 – Construindo Tabelas de Distribuição de freqüências

Ao construir uma tabela de distribuição de freqüências, precisamos tomar as três importantes decisões a seguir apresentadas.

Número de Classes

De maneira geral, o número de classes para uma tabela de distribuição de freqüências varia desde 5 até 20, dependendo principalmente do número de observações existentes no conjunto de dados.

Uma regra para auxiliar na decisão sobre o número de classes é a fórmula de Sturge:

na qual c representa o número de classes e n representa o número de observações no conjunto de dados. O valor de log n pode ser obtido inserindo-se o valor de n em uma calculadora e pressionando-se a tecla log.

Amplitude da Classe

Calculando a Amplitude da Classe

Amplitude aproximada da classe = Maior valor – Menor valor/Número de Classes

Limite Inferior da Primeira Classe ou Ponto de Partida

Qualquer número conveniente, que seja igual ou menor do que o menor valor no conjunto de dados, pode ser utilizado como o limite inferior da primeira classe.

Exemplo 2.3

18

Page 19: Apostila Probabilidade e Estatística 2009

1) A tabela 2.7, a seguir fornece o total de rebatidas com voltas completas (home e runs) obtidas por todos os jogadores de cada um dos 30 times da Liga Principal de Beisebol durante a temporada de 2002. Construa uma tabela de distribuição de freqüências.

Tabela 2.7Rebatidas com Voltas Completas dos Times da Liga Principal de Beisebol Durante a Temporada de 2002Time Voltas Completas Time Voltas CompletasAnaheim 152 Milwaukee 139Arizona 165 Minnesota 167Atlanta 164 Montreal 162Baltimore 165 New York Mets 160Boston 177 New York Yankees 223Chicago Cubs 200 Oakland 205Chicago White Sox 217 Philadelphia 165Cincinnati 169 Pittsburgh 142Cleveland 192 St. Louis 175Colorado 152 San Diego 136Detroit 124 San Francisco 198Florida 146 Seattle 152Houston 167 Tampa Bay 133Kansas City 140 Texas 230Los Angeles 155 Toronto 187

Obs: Nesses dados, o valor mínimo corresponde a 124 e o valor máximo é igual a 230. Suponha que tomemos a decisão de agrupar esses dados utilizando cinco classes de igual amplitude.

Amplitude aproximada de cada classe =

Agora, arredondamos essa amplitude para um número conveniente – digamos 22. Então, nossas classes serão:

124-145, 146-167, 168-189, 190-211, 212-233

Registramos essas cinco classes na primeira coluna da tabela 2.8, a seguir.

Tabela 2.8Distribuição de Freqüências para os Dados da Tabela 2.7Total de Voltas Completas Marcação f

19

Page 20: Apostila Probabilidade e Estatística 2009

2.3.3 – Distribuição de Freqüências Relativas e Distribuição de Percentagem

Calculando a Freqüência Relativa e a Percentagem

Freqüência Relativa de uma Classe = Freqüência daquela classe/Soma de todas as

freqüências =

Percentagem = (Freqüência relativa) . 100

Exemplo 2.41) Calcule as freqüências relativas e as percentagens para a tabela 2.8.

Tabela 2.9Distribuição de Freqüências Relativas e Distribuição de Percentagens para a Tabela 2.8Total de Voltas Completas Fronteiras de Classes Freqüência Relativa Percentagem

Soma = 0,999 Soma = 99,9%

2.3.4 – Elaborando gráficos com Dados Agrupados

Dados agrupados (quantitativos) podem ser dispostos em um histograma ou em um polígono.

Histogramas

Um histograma é um determinado tipo de gráfico que pode ser utilizado para desenhar uma distribuição de freqüências, uma distribuição de freqüências relativas ou uma distribuição de percentagens. Para desenhar um histograma, primeiramente marcamos as classes no eixo horizontal e as freqüências (ou freqüências relativas, ou percentagens) no

20

Page 21: Apostila Probabilidade e Estatística 2009

eixo vertical. A seguir, desenhamos uma barra para cada classe, de maneira que a sua altura represente a freqüência daquela classe. As barras em um histograma são desenhadas de forma adjacente, uma em relação à outra, sem nenhum espaço entre elas.

Definição

Histograma – Um histograma é um gráfico no qual as classes são marcadas no eixo horizontal, e as freqüências relativas ou as percentagens são marcadas no eixo vertical. As freqüências relativas ou as percentagens são representadas por meio de alturas das barras. Em um histograma, as barras são desenhadas de forma adjacente uma em relação à outra.

As figuras 2.3 e 2.4 mostram o histograma de freqüências relativas, respectivamente, para os dados das Tabelas 2.8 e 2.9. Os dois histogramas parecem iguais, uma vez que representam os mesmos dados. Um histograma de percentagens pode ser desenhado para a distribuição de percentagens da Tabela 2.9, marcando as percentagens no eixo vertical.

Polígonos

Um polígono é um outro dispositivo que pode ser utilizado para apresentar dados quantitativos em forma de gráfico.

Definição

21

Page 22: Apostila Probabilidade e Estatística 2009

Polígono – Um gráfico formado pela junção, por meio de linhas retas, dos pontos médios das partes superiores de barras sucessivas em um histograma é chamado de polígono.

A figura 2.5 mostra o polígono de freqüências de Tabela 2.8.

Para um conjunto de dados muito grande, à medida que o número de classes é aumentado (e a amplitude das classes é diminuída), o polígono de freqüências eventualmente se transforma em uma curva suave. Tal curva é chamada de curva de distribuição de freqüências, ou simplesmente curva de freqüências. A figura 2.6 mostra a curva de freqüências para um grande conjunto de dados, com um grande número de classes.

2.3.5 – Mais sobre Classes e Distribuições de Freqüências

Método “Menos Que” para Descrever Classes

O método menos que é mais apropriado quando um conjunto de dados contém valores fracionários. O exemplo 2.5 ilustra o método menos que.

22

Page 23: Apostila Probabilidade e Estatística 2009

Exemplo 2.5Os dados a seguir fornecem o tempo médio gasto no trajeto de casa para o trabalho (em minutos), em 50 estados. Os dados foram baseados em uma pesquisa feita por amostragem, com 70.000 domicílios, conduzida pelo Census Bureau (USA TODAY, 6 de agosto de 2001).

22,4 18,2 23,7 19,8 26,7 23,4 23,5 22,5 24,3 26,7 24,219,7 27,0 21,7 17,6 17,7 22,5 23,7 21,2 29,2 26,1 22,721,6 21,9 23,2 16,0 16,1 22,3 24,4 28,7 19,9 31,2 22,615,4 22,1 19,6 21,4 23,8 21,9 21,9 15,6 22,7 23,6 20,821,1 25,4 24,9 25,5 20,1 17,1

Construa uma tabela de distribuição de freqüências. Calcule as freqüências relativas e as percentagens para todas as classes.

OBS: O valor mínimo nesse conjunto de dados é 15,4, e o valor máximo, 31,2. Suponha que tenhamos decidido agrupar esses dados utilizando seis classes com igual amplitude.

Tabela 2.10Distribuição de Freqüências, Distribuição de Freqüências Relativas e Distribuição de Percentagens do Tempo Médio Gasto no Trajeto para o TrabalhoTempo Médio Gasto no f Freqüência Relativa PercentagemTrajeto Para o Trabalho (minutos)15 até menos que 18 7 0,14 1418 até menos que 2121 até menos que 2424 até menos que 2727 até menos que 3030 até menos que 33

Soma= 1,00 Soma= 100%

Classes com Valor Único

Se as observações em um conjunto de dados assumirem somente alguns poucos valores (inteiros) distintos, pode ser apropriado preparar uma tabela de distribuição de freqüências utilizando classes com valor único. O exemplo 2.6 exibe tal situação.

Exemplo 2.6

23

Page 24: Apostila Probabilidade e Estatística 2009

A administração pública de uma grande cidade deseja conhecer a distribuição de veículos possuídos por domicílios naquela cidade. Uma amostra de 40 domicílios, aleatoriamente selecionados, a partir dessa cidade, produziu os seguintes dados, sobre o número de veículos possuídos:

4 1 1 2 0 1 1 2 1 11 3 3 0 2 5 1 2 3 42 1 2 2 1 2 2 1 1 14 2 1 1 2 1 1 4 1 3

Construa uma tabela de distribuição de freqüências para esses dados utilizando classes com valor único.

Tabela 2.11Distribuição de Freqüências de Veículos Possuídos______________________________________________Veículos Possuídos Número de Domicílios (f)______________________________________________

_______________________________________________ _______________________________________________

Os dados da Tabela 2.11 também podem ser dispostos em um gráfico de barras, conforme mostra a figura 2.7 a seguir. Para construir um gráfico de barras, marcamos as classes no eixo horizontal, como intervalos, com uma pequena lacuna entre os intervalos consecutivos. As barras representam as freqüências das respectivas classes.

2.4 – FORMATOS DE HISTOGRAMAS

Um histograma pode assumir qualquer formato entre um grande número de formatos. Os mais comuns dentre esses formatos são:

1. Simétrico

24

Page 25: Apostila Probabilidade e Estatística 2009

2. Assimétrico3. Uniforme ou retangular

Um histograma simétrico é idêntico em ambos os lados, em relação a seu ponto central. Os histogramas mostrados na figura 2.8 são simétricos em torno das linhas tracejadas, que representam seus pontos centrais.

Um histograma assimétrico é não-simétrico. Para um histograma assimétrico, a cauda em um dos lados é mais longa do que a cauda do outro.

Um histograma retangular ou uniforme possui a mesma freqüência para cada classe. A Figura 2.10 é uma ilustração de tal caso.

As Figuras 2.11a e 2.11b exibem curvas simétricas de freqüências. As Figuras 2.11c e 2.11d exibem, respectivamente, uma curva de freqüências assimétrica à direita e uma curva de freqüências assimétrica à esquerda.

25

Page 26: Apostila Probabilidade e Estatística 2009

Exercícios:1) Um conjunto de dados sobre gastos mensais (arredondados para o dólar mais

próximo) realizados em lanchonetes, para uma amostra de 500 domicílios, teve um valor mínimo de $3 e um valor máximo de $147. Suponha que desejamos agrupar esses dados em seis classes de igual amplitude.

a) Partindo do pressuposto de que $1 represente o limite inferior da primeira classe, e que $150 seja o limite superior da sexta classe, escreva os limites de classes para todas as seis classes.

b) Determine as fronteiras de classes e as amplitudes de classes.

c) Encontre os pontos médios das classes.

2) No Nixon Corporation fabrica terminais de computador. Os dados a seguir correspondem aos números de terminais de computador produzidos pela empresa para uma amostra de 30 dias.

24 32 27 23 33 33 29 25 23 2821 26 31 22 27 33 27 23 28 2931 35 34 22 26 28 23 35 31 27

26

Page 27: Apostila Probabilidade e Estatística 2009

a) Construa uma tabela de distribuição de freqüências utilizando as classes 21-23, 24-26, 27-29, 30-32 e 33-35.

b) Calcule as freqüências relativas e as percentagens para todas as classes.

c) Construa um histograma e um polígono para a distribuição de percentagens.

d) Para que percentagens dos dias o número de terminais de computador produzidos encontra-se contido no intervalo 27-29?

3) A tabela a seguir fornece o número de crianças de menos de 18 anos para cada uma das 30 famílias aleatoriamente selecionadas.

2 1 2 0 3 1 1 2 2 11 2 0 1 0 2 1 2 0 01 0 0 2 1 2 3 2 0 1

a) Prepare uma tabela de distribuição de freqüências para esses dados utilizando classes de valor único.

b) Calcule as freqüências relativas e as percentagens para todas as classes.

c) Quantas famílias nessa amostra têm duas ou três crianças de menos de 18 anos?

d) Desenhe um gráfico de barras para a distribuição de freqüências.

27

Page 28: Apostila Probabilidade e Estatística 2009

2.5 – DISTRIBUIÇÃO DE FREQUÊNCIAS ACUMULADAS

Definição

Distribuição de Freqüências Acumuladas – Uma distribuição de freqüências acumuladas fornece o número total de valores que se posicionam abaixo da fronteira superior de cada classe.

Em uma tabela de distribuição de freqüências acumuladas cada classe possui o mesmo limite inferior, mas possui o limite superior diferente. O exemplo 2.7 ilustra o procedimento para se preparar uma distribuição de freqüências acumuladas.

Exemplo 2.7Utilizando a distribuição de freqüências da Tabela 2.8, aqui reproduzida, prepare

uma distribuição de freqüências acumuladas para as rebatidas com voltas completas dos times da Liga Principal de Beisebol durante a temporada de 2002.

___________________________________Total de Voltas Completas f___________________________________124-145 6146-167 13168-189 4190-211 4212-233 3

28

Page 29: Apostila Probabilidade e Estatística 2009

___________________________________

Para obter a freqüência acumulada de uma classe, adicionamos a freqüência dessa classe na Tabela 2.8, as freqüências de todas as classes precedentes. AS freqüências acumuladas encontram-se registradas na terceira coluna da Tabela 2.12. A segunda coluna dessa tabela lista as fronteiras de classe.

Tabela 2.12Distribuição de Freqüências Acumuladas para Voltas Completas dos Times de BeisebolLimites de Classes Fronteiras de Classes freqüências Acumuladas124-145 123,5 até menos que 145,5 6124-167 123,5 até menos que 167,5 6+13 = 19124-189 123,5 até menos que 189,5 6+13+4 = 23124-211 123,5 até menos que 211,5 6+13+4+4 = 27124-233 123,5 até menos que 233,5 6+13+4+4+3 = 30

Calculando a Freqüência Relativa Acumulada e a Percentagem Acumulada

Freqüência relativa acumulada = Freqüência acumulada de uma classe/Total de observações no conjunto de dados

Percentagem acumulada = (Freqüência relativa acumulada) . 100

A Tabela 2.13 contém as freqüências relativas acumuladas e as percentagens acumuladas para a Tabela 2.12. Podemos observar, por exemplo, que 76,7% dos times de Liga Principal de Beisebol rebateram um total de 189 vezes, ou menos, com voltas completas.Tabela 2.13Distribuição de Freqüências Relativas Acumuladas e Distribuição de Percentagens Acumuladas para Rebatidas com Voltas Completas dos Times de BeisebolLimites de Classes Freqüências Relativas Acumuladas Percentagens Acumuladas124-145 6/30 = 0,200 20,0124-167 124-189 124-211 124-233

Ogivas

Quando desenhadas em um diagrama, as freqüências acumuladas apresentam uma curva que chamada de ogiva. A figura 2.12 fornece uma ogiva para a distribuição de freqüências acumuladas da Tabela 2.14. Para desenhar a ogiva na figura 2.12, a variável total de voltas completas é marcada no eixo horizontal e as freqüências acumuladas são marcadas no eixo vertical. Em seguida, as marcações são feitas acima das fronteiras superiores de várias classes nas alturas equivalentes às correspondentes freqüências

29

Page 30: Apostila Probabilidade e Estatística 2009

acumuladas. A ogiva é obtida juntando-se os pontos consecutivos por meio de linhas retas. Observe que a ogiva se inicia na fronteira inferior da primeira classe e termina na fronteira superior da última classe.

Definição

Ogiva – Uma ogiva é uma curva desenhada para as distribuições de freqüências acumuladas, juntando-se, por meio de linhas retas, as marcações feitas acima das fronteiras superiores de classes nas alturas equivalentes às freqüências acumuladas das respectivas classes.

2.6 – DISPOSIÇÃO RAMO-E-FOLHA

Uma disposição ramo-e-folha é construída somente para dados quantitativos.

Definição

Disposição ramo-e-folha – Uma disposição ramo-e-folha para dados quantitativos, cada valor é dividido em duas partes – um ramo e uma folha. As folhas para cada ramo são mostradas separadamente em uma disposição.

Exemplo:1) Apresentamos a seguir os resultados de 30 alunos de faculdade em um teste de

estatística.75 52 80 96 65 79 71 87 93 9569 72 81 61 76 86 79 68 50 9283 84 77 64 71 87 72 92 57 98Construa uma disposição ramo-e-folha.

30

Page 31: Apostila Probabilidade e Estatística 2009

2) A disposição ramo-e-folha, a seguir, é preparada para o número de horas que 25 alunos gastaram trabalhando em computadores durante o mês passado.

Prepare uma nova disposição ramo-e-folha agrupando os ramos.

31

Page 32: Apostila Probabilidade e Estatística 2009

Exercícios:1) Considere esta disposição ramo-e-folha:

Escreva o conjunto de dados que é representado por essa disposição.

2) Construa uma disposição ramo-e-folha para os dados a seguir, que fornecem os tempos (em minutos) que 24 clientes gastaram esperando para falar com um representante do serviço de atendimento ao cliente quando telefonaram para resolver problemas relacionados a seu provedor da Internet.

12 15 7 29 32 16 10 14 17 8 19 214 14 22 25 18 6 22 16 13 16 12 20

3) Considere esta disposição ramo-e-folha:

Escreva o conjunto de dados que foi utilizado para construir essa disposição ramo-e-folha.

32

Page 33: Apostila Probabilidade e Estatística 2009

4) A tabela a seguir fornece a distribuição de freqüências dos tempos (arredondados para a hora mais próxima) que 90 fãs gastaram esperando na fila para comprar entradas para um concerto de rock.___________________________________________ Tempo de espera (horas) Freqüência____________________________________________0 até 6 57 até 13 2714 até 20 3021 até 27 2028 até 34 8_____________________________________________

Faça um circulo na resposta correta, em cada uma das seguintes afirmações, que são baseadas na tabela.a) O número de classes na tabela é 5, 30, 90.

b) A amplitude da classe é 6, 7, 34.

c) O ponto médio da terceira classe é 16,5; 17; 17,5.

d) A fronteira inferior da segunda classe é 6,5; 7; 7,5.

e) O limite superior da segunda classe é 12,5; 13; 13,5.

f) O tamanho da amostra é 5, 90, 11.

g) A freqüência relativa da segunda classe é 0,22; 0,41; 0,30.

Lista de Exercícios:

1) Complete a tabela abaixo:

i Classes

1 0 8 42 8 16 103 16 24 144 24 32 9

33

Page 34: Apostila Probabilidade e Estatística 2009

5 32 40 3

2) O posto de saúde de um certo bairro mantém um arquivo com o número de crianças nas famílias que se utilizam do Posto. Os dados são os seguintes:

3 4 3 4 5 16 3 4 5 3 43 3 4 3 5 55 5 6 11 10 21 2 3 1 5 2a) Organize uma tabela de freqüência.

b) Faça a representação gráfica.

3) Um empregado perdeu uma das 10 notas de compras feitas na hora do encerramento. O valor médio de todas as 10 notas era de R$7,20, e as nove notas restantes tinham os valores

R$4,80 R$7,10 R$7,90R$9,55 R$4,45 R$5,72R$7,54 R$8,34 R$9,70

Qual é o valor da nota perdida?

34

Page 35: Apostila Probabilidade e Estatística 2009

4) A tabela abaixo informa os tipos de lazer preferidos por 80 garotos da 1ª série do ensino médio de um colégio.

Lazer Freqüência Absoluta Freqüência RelativaJogar futebol com os amigos 48 aComputador e videogame b cPaquerar no Shopping d eViajar para a praia f g

1,00

Complete a tabela, sabendo que c é o dobro de , que é o quíntuplo de g.

5) A tabela seguinte informa os valores de 160 empréstimos solicitados a um banco por pessoas físicas durante uma semana.

Valor do Empréstimo (em R$) Freqüência Absoluta Freqüência Relativa200 400 a b400 600 60 c600 800 d e800 1000 f 0,05

35

Page 36: Apostila Probabilidade e Estatística 2009

1000 1200 g h

Total

Complete a tabela, sabendo que 52,5% dos empréstimos representavam valores maiores ou

iguais a R$600,00 e que, entre eles, eram inferiores a R$800,00.

6) Os gráficos seguintes mostram a disposição dos alunos das turmas da 3ª série do ensino médio para fazer cursinho pré-vestibular paralelamente a freqüentar a aulas do colégio.

Sabendo que as turmas da manhã contam com 340 alunos e as da tarde com 280 alunos, determine:a) o número total de alunos que não pretendem fazer cursinho;

b) a diferença entre o número de alunos do vespertino e do matutino que pretendem fazer cursinho o ano inteiro.

36

Page 37: Apostila Probabilidade e Estatística 2009

7) Em uma cidade, o mercado de leite é disputado por quatro marcas: X, Y, Z e W. Os resultados de uma sondagem a propósito da marca preferida, realizada com 400 consumidores, estão parcialmente apresentados na tabela e no gráfico seguinte.

____________________________________________Marca de Preferência Freqüência Absoluta ____________________________________________X 230Y 120Z .....W .....___________________________________________ Determine:a) a diferença entre o número de consumidores que preferem Z a W.

b) diferença entre os ângulos correspondentes a X e Y.

3- MEDIDAS DESCRITIVAS NUMÉRICAS

3.1- MEDIDAS DE TENDÊNCIA CENTRAL PARA DADOS NÃO-AGRUPADOS

Uma medida de tendência central fornece o centro de um histograma ou de uma curva de distribuição de freqüências. Esta seção trata de três diferentes medidas de tendência central: a média aritmética, a mediana e a moda. Vamos calcular cada uma dessas medidas para dados não-agrupados. Lembre-se de que os dados que fornecem informações em

37

Page 38: Apostila Probabilidade e Estatística 2009

relação a cada membro da população ou amostra, individualmente, são conhecidos como dados não-agrupados, enquanto dados agrupados são apresentados em forma de tabela de distribuição de freqüência.

3.1.1- Média Aritmética

A média aritmética, também conhecida como média, representa a medida de tendência central mais freqüentemente utilizada. Para os dados não-agrupados, a média aritmética é obtida por meio da divisão da soma de todos os valores pelo número de valores do conjunto de dados.

Média Aritmética = Soma de todos os valores / Número de valores

Calculando a média aritmética para dados não-agrupados - A média aritmética para dados não-agrupados é obtida por meio da divisão da soma de todos os valores pelo número de valores no conjunto de dados. Por conseguinte,

Média aritmética para dados da população:

Média aritmética para dados de amostras:

em que corresponde à soma de todos os valores, N representa o tamanho da população, n corresponde o tamanho da amostra, representa a média aritmética da

população e corresponde à média aritmética da amostra.

Exemplo 3.1A tabela 3.1 fornece o total de folhas de pagamento de 2002, correspondentes a cinco

times da Liga Principal de Beisebol (MLB – Major baseball League).

Tabela 3.1____________________________________________________Time da MLB Total de Folha de Pagamento de 2002 (milhões de dólares)____________________________________________________Anaheim Angels 62Atlanta Braves 93New York Yankees 126St. Louis Cardinals 75Ta,mpa Bay Devil Rays 34__________________________________________________

38

Page 39: Apostila Probabilidade e Estatística 2009

Encontre a média das folhas de pagamento de 2002 desses cinco times da MLB.

Portanto, a média aritmética da folha de pagamento de 2002 desses cinco times da MLB correspondeu a ..............

Exemplo 3.2Os dados a seguir representam as idades de todos os oito empregados de uma

pequena empresa:53 32 61 27 39 44 49 57Encontre a média aritmética da idade desses empregados.

Portanto, a média aritmética da idade de todos os oito empregados dessa empresa é igual a ...........................................

Às vezes, um conjunto de dados pode conter alguns poucos valores demasiadamente pequenos, ou alguns poucos valores demasiadamente grandes. Esses valores são conhecidos como outliers ou valores extremos.

Definição

Outliers ou Valores Extremos – Valores que são demasiadamente pequenos, ou demasiadamente grandes, em relação à maior parte dos valores em um conjunto de dados, são chamados de outliers ou valores extremos.

Exemplo 3.3A tabela 3.2 apresenta uma lista das populações no ano de 2000 (em milhares), dos

cinco estados norte-americanos na costa do Pacífico.Tabela 3.2__________________________________________

39

Page 40: Apostila Probabilidade e Estatística 2009

Estado População (milhares)__________________________________________Washington 5894Oregon 3421Alasca 627Havaí 1212Califórnia 33.872_________________________________________

Portanto, a inclusão da Califórnia causa um aumento equivalente a mais de três vezes o valor da média aritmética, uma vez que a média aritmética muda de 2788,5 mil para 9005,2 mil.

3.1.2 – Mediana

Outra medida importante de tendência central corresponde à mediana.

Definição

Mediana – A mediana representa o valor relativo ao termo posicionado no meio em um conjunto de dados que tenha sido classificado em ordem crescente.

O cálculo da mediana consiste em duas etapas:

1) Classificar o conjunto de dados em ordem crescente.2) Encontrar o termo posicionado no meio.

Posição do termo do meio = .

Podemos redefinir mediana da seguinte maneira:

Valor da Mediana para Dados Não-Agrupados

Mediana = Valor do ésimo termo em um conjunto de dados classificados.

Caso o número de observações em um conjunto de dados seja ímpar, então a mediana é fornecida pelo valor do termo posicionado no meio dos dados classificados. Se o número de observações for par, então a mediana é fornecida pela média dos valores correspondentes aos dois termos do meio.

40

Page 41: Apostila Probabilidade e Estatística 2009

Exemplo 3.4Os dados a seguir fornecem a perda de peso (em libras) de uma amostra de cinco

membros de um clube de saúde ao final de dois meses de associação ao clube.10 5 19 8 3Encontre a mediana.

A mediana da perda de peso para essa amostra de cinco membros desse clube de saúde corresponde a .................................

3.1.3 – Moda

Na estatística, a moda representa o valor mais comum em um conjunto de dados.

Definição

Moda - A moda corresponde ao valor que ocorre com a maior freqüência em um conjunto de dados.

Exemplo 3.5Os dados a seguir fornecem as velocidades (em milhas por hora) de oito carros, que foram parados na I-95 por excesso de velocidade.77 69 74 81 71 68 74 73Encontre a moda.

Exemplo 3.6As rendas do ano passado, para cinco famílias aleatoriamente selecionadas. Foram

$36.150; $95.750; $54.985; $77.490 e $23.740. Encontre a moda.

Exemplo 3.7

41

Page 42: Apostila Probabilidade e Estatística 2009

Os preços de uma mesma marca de aparelho de televisão, em oito lojas, foram registrados como $495; $486; $503; $495; $470; $505; $470 e $499. Encontre a moda.

Exemplo 3.8As idades de 10 alunos aleatoriamente selecionados, a partir de uma sala de aula,

são 21, 19, 27, 22, 29, 19, 25, 21, 22 e 30. Encontre a moda.

3.1.4 – Relações entre a Média Aritmética, a Mediana e a Moda

1) Para um histograma e uma curva de freqüências simétricos, com um único pico, os valores da média aritmética, da mediana e da moda são idênticos e se posicionam no centro da distribuição.

2) Para um histograma e uma curva de freqüências assimétricos à direita, o valor da média aritmética é o maior deles, o valor para a moda é o menor deles, e o valor correspondente à mediana se posiciona entre esses dois valores. (Observe que a moda sempre ocorre no ponto correspondente ao pico). O valor da média aritmética é o maior neste caso, uma vez que é sensível a valores extremos que ocorrem na cauda direita. Esses valores extremos puxam a média aritmética para a direita.

42

Page 43: Apostila Probabilidade e Estatística 2009

3) Caso o histograma e a curva de distribuição sejam assimétricos à esquerda, o valor da média aritmética é o menor deles, e o valor para a moda é o maior deles, com o valor da mediana se posicionando entre esses dois valores. Neste caso, os valores extremos na cauda esquerda puxam a média aritmética para a esquerda.

3.2 – MEDIDAS DE DISPERSÃO PARA DADOS NÃO-AGRUPADOS

Esta seção discute sobre três medidas de dispersão: a amplitude, a variância e o desvio padrão.

3.2.1 – Amplitude

A amplitude representa a medida de dispersão mais simples de calcular. Para obter a amplitude, toma-se a diferença entre o maior valor e o menor valor em um conjunto de dados.

Encontrando a Amplitude para Dados Não-Agrupados

Amplitude = Maior valor-Menor valor

Exemplo 3.9

43

Page 44: Apostila Probabilidade e Estatística 2009

A tabela 3.3 fornece as áreas totais, em milhas quadradas, correspondentes aos quatro estados do lado oeste do Centro-Sul dos Estados Unidos.

Tabela 3.3_____________________________________________Estados Área Total (milhas ao quadrado)_____________________________________________Arkansas 53.182Louisiana 49.651Oklahoma 69.903Texas 267.277____________________________________________

Encontre a amplitude para esse conjunto de dados.

Assim sendo, as áreas totais desses quatro estados encontram-se dispersas ao longo de uma amplitude de ....................milhas quadradas.

3.2.2- Variância e Desvio-Padrão

O desvio-padrão representa a medida de dispersão mais utilizada. O valor relativo ao desvio-padrão nos informa quão próximos os valores de conjunto de dados estão agrupados em torno da média aritmética.

O desvio-padrão é obtido extraindo-se a raiz quadrada positiva da variância. A variância calculada para os dados da população é representada por (lê-se sigma ao quadrado), e a variância calculada para dados de amostras é representada por .

e

em que corresponde à variância da população e corresponde à variância da amostra.

O valor ou nas fórmulas acima é chamado de desvio do valor de x em

relação à média aritmética. A soma dos desvios dos valores de x em relação à média

aritmética é sempre igual a zero; ou seja, e .

Por exemplo, suponha que os resultados de final de semestre, para uma amostra contendo quatro alunos, sejam 82, 95, 67 e 92. Então, a média aritmética do resultado relativo a esses quatro alunos é

44

Page 45: Apostila Probabilidade e Estatística 2009

Os desvio dos quatro resultados em relação à média aritmética são calculados na tabela 3.4. Como podemos observar a partir da tabela, a soma dos desvio dos valores de x

em relação à média aritmética é igual a zero; ou seja, . Por esta razão,

elevamos os desvios ao quadrado para calcular a variância e o desvio-padrão.

Tabela 3.4__________________________

__________________________82 82 – 84 = -295 95 – 84 = +1167 67 – 84 = -1792 92 – 84 = +8

___________________________

Do ponto de vista de cálculos, é mais fácil e mais eficiente utilizar fórmulas de atalho para calcular a variância e o desvio-padrão. Utilizando as fórmulas de atalho, reduzimos o tempo de cálculo e erros decorrentes de arredondamentos. As fórmulas de atalho para se calcular a variância e o desvio-padrão são apresentadas a seguir.

Fórmulas de Atalho para Variância e Desvio-Padrão para Dados Não-Agrupados

e

em que corresponde à variância da população e representa a variância da amostra.

O desvio-padrão é obtido extraindo-se a raiz quadrada positiva da variância.

Desvio-padrão da população: Desvio-padrão da amostra:

Exemplo 3.10Volte aos dados da tabela 3.1 sobre as folhas de pagamento de 2002 (em milhões de

dólares) de cinco times da MLB. Esses dados são aqui reproduzidos.____________________________________________________

45

Page 46: Apostila Probabilidade e Estatística 2009

Time da MLB Total de Folha de Pagamento de 2002 (milhões de dólares)____________________________________________________Anaheim Angels 62Atlanta Braves 93New York Yankees 126St. Louis Cardinals 75Ta,mpa Bay Devil Rays 34__________________________________________________

Encontre a variância e o desvio-padrão para esses dados.

Tabela 3.5____________________________________

____________________________________62931267534____________________________________

____________________________________

Assim sendo, o desvio-padrão das folhas de pagamento de 2002 desses cinco times da MLB corresponde a ...........................

OBS:

1) Os valores da variância e do desvio-padrão nunca são negativos.

2) As unidades de medida da variância são sempre iguais ao quadrado das unidades de medidas dos dados originais. Isso ocorre porque os valores originais são elevados ao quadrado para se calcular a variância.

46

Page 47: Apostila Probabilidade e Estatística 2009

Exemplo 3.11Apresentamos a seguir os rendimentos de 2002 (em milhares de dólares), sem

impostos, para todos os seis empregados de uma pequena empresa.

48,50 38,40 65,50 22,60 79,80 54,60

Calcule a variância e o desvio-padrão para esses dados.

Tabela 3.6____________________________________

____________________________________48,5038,4065,5022,6079,8054,60____________________________________

____________________________________

Por conseguinte, o desvio-padrão dos rendimentos de 2002, para todos os seis empregados da empresa, é ..............

3.2.3 – Parâmetros da População e Estatísticas da Amostra

Uma medida numérica, tal como a média aritmética, a mediana, a moda, a amplitude, a variância ou o desvio-padrão, calculada para um conjunto de dados de uma população, é conhecida como um parâmetro da população, ou simplesmente parâmetro. Uma medida resumida, calculada para um conjunto de dados de uma amostra, é chamada de estatística da amostra, ou simplesmente estatística. Assim sendo, e correspondem a

parâmetros da população, enquanto e correspondem a estatísticas da amostra.

47

Page 48: Apostila Probabilidade e Estatística 2009

3.3 – MÉDIA ARITMÉTICA, VARIÂNCIA E DESVIO-PADRÃO PARA DADOS AGRUPADOS

3.3.1 – Média Aritmética para dados agrupados

As fórmulas utilizadas para calcular a média aritmética para dados agrupados são apresentadas a seguir.

Calculando a Média Aritmética para Dados Agrupados

Média aritmética para dados de populações:

Média aritmética para dados de amostras:

em que m corresponde ao ponto médio e f corresponde à freqüência de uma classe.

Para calcular a média aritmética para dados agrupados, inicialmente encontre o ponto médio de cada classe e, em seguida, multiplique os pontos médios pelas freqüências das classes correspondentes. A soma desses produtos, representada por , fornece uma aproximação para a soma de todos os valores. Para encontrar o valor da média aritmética, divida essa soma pelo número total de observações nos dados.

Exemplo 3.12A tabela 3.7 fornece a distribuição de freqüências dos tempos gastos com transporte

por dia (em minutos), de casa para o trabalho, para todos os 25 empregados de uma empresa.

Tabela 3.7______________________________________________________________Tempo Gasto Diariamente com Transporte Número de (minutos) Empregados______________________________________________________________0 até menos que 10 410 até menos que 20 920 até menos que 30 630 até menos que 40 440 até menos que 50 2______________________________________________________________

48

Page 49: Apostila Probabilidade e Estatística 2009

Calcule a média aritmética para os tempos gastos diariamente com transporte.

Solução: Observe que, na tabela 3.8, m representa os pontos médios das classes.

Tabela 3.8___________________________________________________________________Tempo Gasto Diariamente com Transporte (minutos) ___________________________________________________________________ 0 até menos que 10 4 5 2010 até menos que 20 9 15 13520 até menos que 30 6 25 15030 até menos que 40 4 35 14040 até menos que 50 2 45 90____________________________________________________________________ ____________________________________________________________________

A média aritmética é obtida dividindo-se essa soma pela freqüência total. Por conseguinte,

Assim sendo, os empregados da empresa gastam..........minutos por dia, em média, com transporte de casa para o trabalho.

Exemplo 3.13A tabela 3.9 fornece a distribuição de freqüências do número de pedidos recebidos a

cada dia, durante os últimos 50 dias, no escritório de uma empresa de entrega de encomendas.

Tabela 3.9____________________________________________Número de Pedidos Número de Dias____________________________________________10 12 413 15 1216 18 2019 21 14____________________________________________

Calcule a média aritmética.

49

Page 50: Apostila Probabilidade e Estatística 2009

Solução: Uma vez que o conjunto de dados inclui somente 50 dias, ele representa uma amostra. O valor de é calculado na tabela 3.7.

Tabela 3.10_________________________________________________Número de Pedidos _________________________________________________10 12 4 11 4413 15 1216 18 2019 21 14__________________________________________________

O valor da média aritmética da amostra é

Por conseguinte, esta empresa de entrega de encomendas recebeu uma média de ...........pedidos por dia durante esses 50 dias.

3.3.2 – Variância e Desvio-Padrão para Dados Agrupados

Apresentaremos a seguir o que chamaremos de fórmulas básicas, utilizadas para calcular a variância da população e a variância da amostra para dados agrupados.

e

em que corresponde à variância da população, representa a variância da amostra e corresponde ao ponto médio de uma classe.

Novamente, as fórmulas de atalho são mais eficientes para o cálculo da variância e do desvio-padrão.

Fórmulas de Atalho para a Variância e para o Desvio-Padrão relativas a Dados Agrupados

e

50

Page 51: Apostila Probabilidade e Estatística 2009

em que corresponde à variância da população, representa a variância da amostra e corresponde ao ponto médio de uma classe.

O desvio-padrão é obtido extraindo-se a raiz quadrada positiva da variância.Desvio-padrão da população:

Desvio-padrão da amostra:

Exemplo 3.14Os dados a seguir apresentados da tabela 3.8, fornecem a distribuição de freqüências

dos tempos diários gastos com transporte (em minutos) de casa para o trabalho para todos os 25 empregados de uma empresa.

______________________________________________________________Tempo Gasto Diariamente com Transporte Número de (minutos) Empregados______________________________________________________________0 até menos que 10 410 até menos que 20 920 até menos que 30 630 até menos que 40 440 até menos que 50 2______________________________________________________________

Calcule a variância e o desvio-padrão.

Tabela 3.11_________________________________________________________________________Tempo Gasto Diariamente com Transporte (minutos) _________________________________________________________________________0 até menos que 10 4 5 20 10010 até menos que 20 920 até menos que 30 630 até menos que 40 440 até menos que 50 2

Etapa 1. Calcular o valor de .

51

Page 52: Apostila Probabilidade e Estatística 2009

Etapa 2. Encontre o valor de .

Etapa 3. Calcule a Variância.

=

Etapa 4. Calcule o desvio-padrão.

=

Assim sendo, o desvio-padrão dos tempos gastos diariamente com transporte, para esses empregados, corresponde a ...........minutos.

Exemplo 3.15Os dados a seguir apresentados, reproduzidos da Tabela 3.9, fornecem a distribuição

de freqüências do número de pedidos recebidos a cada dia, durante os últimos 50 dias, no escritório de uma empresa de encomendas.____________________________________________Número de Pedidos ____________________________________________10 12 413 15 1216 18 2019 21 14____________________________________________

Calcule a variância e o desvio-padrão.

Tabela 3.12______________________________________________________________________Número de Pedidos ______________________________________________________________________10 12 4 11 44 48413 15 1216 18 2019 21 14

52

Page 53: Apostila Probabilidade e Estatística 2009

Colocando os valores na fórmula correspondente à variância da amostra, obtemos

=

Portanto o desvio-padrão é igual a

=

Logo, o desvio-padrão do número de mordidas recebidas no escritório desse empresa de entrega de encomendas, durante os últimos 50 dias, é igual a ...........

3.4 – UTILIZAÇÃO DO DESVIO-PADRÃO

Utilizando a média aritmética e o desvio-padrão, podemos encontrar a proporção ou a percentagem das observações totais, que se posicionam dentro de um determinado intervalo em torno da média aritmética. Esta seção discute sucintamente o teorema de Chebyshev e a regra empírica, que demonstram essa utilização do desvio-padrão.

3.4.1 – Teorema de Chebyshev

O teorema de Chebyshev fornece um limite inferior para a área sob a curva entre dois pontos que se encontram em lados opostos da média aritmética e à mesma distância da média aritmética.

Definição

O Teorema de Chebyshev – Para qualquer número k maior que 1, pelo menos

dos valores de dados se posicionam dentro dos limites de k desvios-padrão em

relação à média aritmética. A figura 3.5 ilustra o teorema de Chebyshev.

53

Page 54: Apostila Probabilidade e Estatística 2009

Assim, por exemplo, se , então

Portanto, de acordo com o teorema de Chebyshev, pelo menos 0,75 ou 75% dos valores de um conjunto de dados se posicionam dentro dos limites de dois desvios-padrão em relação à média aritmética. Isso é mostrado na Figura 3.6.

Se , então,

De acordo com o teorema de Chebyshev, pelo menos 0,89 ou 89% dos valores irão se posicionar dentro dos limites de três desvios-padrão em relação à média aritmética. Isso é mostrado na Figura 3.7.

54

Page 55: Apostila Probabilidade e Estatística 2009

Embora nas Figuras 3.5 a 3.7 tenhamos utilizado a notação da população para a média aritmética e para o desvio-padrão, o teorema se aplica tanto a dados de amostras quanto a dados de populações. Observe que o teorema de Chebyshev é aplicável a uma distribuição com qualquer formato. Entretanto, o teorema de Chebyshev pode ser utilizado

somente para . Isso ocorre dessa maneira porque quando , o valor é zero, e

quando , o valor de é negativo.

Exemplo 3.16Constatou-se que a pressão sanguínea sistólica média para 400 mulheres que foram

avaliadas em relação a pressão sanguínea elevada era 187, com um desvio-padrão de 22. Utilizando o teorema de Chebyshev, encontre qual a percentagem mínima de mulheres nesse grupo que apresenta pressão sanguínea sistólica entre 143 e 231.

Sejam e .

Para encontrar a percentagem de mulheres cujas pressões sanguíneas sistólicas encontram entre 143 e 231, a primeira etapa corresponde a determinar o k.

O valor de k é obtido dividindo-se a distância entre a média aritmética e cada um dos pontos, pelo desvio-padrão. Assim sendo,

Portanto de acordo com o teorema de Chebyshev, pelo menos 75% das mulheres apresentam pressão sanguínea sistólica entre 123 e 231. Essa porcentagem é mostrada na Figura 3.8.

3.4.2 – Regra Empírica

Regra Empírica – Para uma distribuição em formato de sino, aproximadamente.1. 68% das observações se posicionam dentro dos limites de um desvio-padrão em

relação à média aritmética.

55

Page 56: Apostila Probabilidade e Estatística 2009

2. 95% das observações se posicionam dentro dos limites de dois desvios-padrão em relação à média aritmética.

3. 99,7% das observações se posicionam dentro dos limites de três desvios-padrão em relação à média aritmética.

A figura 3.9 ilustra a regra empírica. Novamente, a regra empírica se aplica a dados de populações, bem como a dados de amostras.

Exemplo 3.17A distribuição das idades de uma amostra de 5000 pessoas tem formato de sino,

com média aritmética de 40 anos e desvio-padrão de 12 anos. Determine a percentagem aproximada de pessoas que estão entre16 e 64 anos.Solução:

Com base nas informações fornecidas para essa distribuição,

anos e anos

Cada um dos dois pontos, 16 e 64, encontra-se 24 unidades distante da média aritmética. Dividindo 64 por 12, convertemos a distância entre cada um dos dois pontos e a média aritmética, em termos de desvio-padrão. Assim, a distância entre 16 e 40 e entre 40 e 64 é, cada qual, igual a . Conseqüentemente, como mostra a figura 3.10, a área desde 16

até 64 corresponde a área desde até .

3.5 – MEDIDAS DE POSIÇÃO

56

Page 57: Apostila Probabilidade e Estatística 2009

Uma medida de posição determina a posição de um único valor em relação a outros valores em um conjunto de dados de amostra ou um conjunto de dados de população. Existem muitas medidas de posição; entretanto, discutiremos apenas quartis, percentis e classificação de percentis.

3.5.1 – Quartis e Amplitude Interquartil

Quartis são as medidas resumidas que dividem um conjunto de dados classificados em quatro partes iguais. Essas três medidas correspondem ao primeiro quartil (representado por ), ao segundo quartil (representado por ) e ao terceiro quartil (representado por ). Os dados devem ser classificados em ordem crescente antes que os quartis sejam determinados. Os quartis são definidos da seguinte maneira.

Definição

Quartis – Quartis representam três medidas resumidas que dividem um conjunto de dados classificados em quatro partes iguais. O segundo quartil é o mesmo que a mediana para um conjunto de dados. O primeiro quartil representa valor do termo do meio, entre as observações que são menores que a mediana, e o terceiro quartil representa o valor do termo do meio, entre as observações que são maiores que a mediana.

A figura 3.11 descreve as posições dos três quartis.

A diferença entre o terceiro quartil e o primeiro quartil para um conjunto de dados é chamada de amplitude interquartil (AIQ).

Calculando a Amplitude Interquartil – A diferença entre o terceiro quartil e o primeiro quartil fornece a amplitude interquartil; ou seja,

AIQ = Amplitude interquartil =

Exemplo 3.18Os dados a seguir correspondem a idades de nove empregados de uma empresa seguradora:47 28 39 51 33 37 59 24 33

57

Page 58: Apostila Probabilidade e Estatística 2009

a) Encontre os dados dos três quartis. Onde a idade de 28 anos se posiciona em relação às idades desses empregados?

b) Encontre a amplitude interquartil.

3.5.2 – Percentis e Classificação de Percentil

Percentis são as medidas resumidas que dividem um conjunto de dados classificados em 100 partes iguais. Cada conjunto de dados (classificados) tem 99 percentis, que dividem o mesmo em 100 partes iguais. Os dados devem ser classificados em ordem crescente para o cálculo dos percentis. O percentil é representado por , sendo que representa um número inteiro no intervalo entre 1 e 99. Por exemplo, o percentil é representado por

. A figura 3.12 mostra as posições dos 99 percentis.

Logo, o percentil, pode ser definido como um valor em um conjunto de dados tal que cerca de das medições sejam menores que o valor de e cerca de (das medições sejam maiores que o valor de .

58

Page 59: Apostila Probabilidade e Estatística 2009

O valor aproximado do percentil é determinado da maneira explicada a seguir.

Calculando Percentis – O valor (aproximado) do percentil, representado por , é

= Valor do ésimo termo em um conjunto de dados classificados.

Em que representa o número do percentil e representa o tamanho da amostra.

Exemplo 3.19Os dados a seguir fornecem as velocidades, medidas por radar, de 13 carros que

trafegam na rodovia I-84.73 75 69 68 78 69 7476 72 79 68 77 71a) Encontre os valores dos três quartis e a amplitude interquartil.

b) Calcule o valor (aproximado) do percentil.

59

Page 60: Apostila Probabilidade e Estatística 2009

c) Encontre a classificação de percentil de 71.

Exercícios:1) Os dados a seguir apresentados fornecem o número de horas gastas em festas, por 10 alunos de faculdade aleatoriamente selecionados, durante a última semana.7 14 5 0 9 7 10 4 0 8Calcule a média aritmética, a mediana e a moda.

2) Para quaisquer dados, a soma de todos os valores é igual ao produto entre o tamanho da amostra e a média aritmética. Suponha que a média da quantia em dinheiro gasta em compras por 10 pessoas durante uma determinada semana, seja $85,50. Encontre a quantia total em dinheiro, gasta em compras, por essas 10 pessoas.

60

Page 61: Apostila Probabilidade e Estatística 2009

3) Os dados a seguir fornecem o número de pessoas que realizam furtos em lojas, flagradas durante cada uma das oito últimas semanas em uma grande loja de departamentos.7 10 8 3 15 12 6 11

a) Encontre a média aritmética para esses dados. Calcule os desvios dos valores de dados, em relação a média aritmética. A soma desses valores é igual a zero?

b) Calcule a amplitude, a variância e o desvio-padrão.

4) A tabela a seguir fornece a distribuição de freqüências para total de horas gastas fora da sala de aula em exercícios aeróbicos, durante um curso de educação física para adultos, com duração de 12 semanas, por 30 adultos matriculados no curso.

____________________________________________Horas de Exercício Número de adultos____________________________________________

61

Page 62: Apostila Probabilidade e Estatística 2009

0 até menos que 30 130 até menos que 60 660 até menos que 90 1090 até menos que 120 7120 até menos que 150 4150 até menos que 180 2____________________________________________

Encontre a média aritmética, a variância e o desvio-padrão.

Horas de Exercício f

0 até menos que 30 130 até menos que 60 660 até menos que 90 1090 até menos que 120 7120 até menos que 150 4150 até menos que 180 2

5) As vendas brutas de 2002, para todas as empresas de uma grande cidade, tem média aritmética de $2,3 milhões e desvio-padrão de $0,6 milhão. Utilizando o teorema de Chebyshev, encontre a percentagem mínima de empresas da cidade que tiveram vendas brutas em 2002 de:a) $1,1 a $3,5 milhões

b) $0,8 a $3,8 milhões

62

Page 63: Apostila Probabilidade e Estatística 2009

c) $0,5 a $4,1 milhões

Lista de Exercícios:

1) O valor do termo do meio em um conjunto de dados classificados é chamado dea. média aritmética b. mediana c. moda

2) Qual, ou quais, das seguintes medidas resumidas é influenciada por valores extremos?a. média aritmética b. mediana c. moda d. amplitude

3) Qual, ou quais, das medidas resumidas a seguir pode ser calculada para dados qualitativos?a. média aritmética b. mediana c. moda

4) Qual, ou quais, das seguintes medidas resumidas pode ter mais de um valor?a. média aritmética b. mediana c. moda

5) Qual, ou quais, das seguintes medidas resumidas é obtida tomando-se a diferença entre o maior valor e o menor valor de um conjunto de dados?a. variância b. amplitude c. média aritmética

6) Qual das seguintes medidas corresponde à média aritmética dos desvios elevados ao quadrado de valores de x em relação à média aritmética?a. desvio-padrão b. variância da população c. variância da amostra

7) Os valores da variância e do desvio-padrão sãoa. nunca negativos b. sempre positivos c. nunca iguais a zero

8) Uma medida resumida calculada para os dados da população é chamada dea. um parâmetro da população b. uma estatística da amostra c. um valor extremo

63

Page 64: Apostila Probabilidade e Estatística 2009

9) Uma medida numérica calculada para os dados da amostra é chamada dea. um parâmetro da população b. uma estatística da amostra c. box-plot

10) O teorema de Chebyshev pode ser aplicado ema. qualquer distribuiçãob. apenas distribuição em formato de sinoc. apenas distribuições assimétricas

11) A regra empírica pode ser aplicada ema. qualquer distribuiçãob. apenas distribuição em formato de sinoc. apenas distribuições assimétricas

12) O primeiro quartil corresponde a um valor em um conjunto de dados classificados, de maneira tal que cerca dea. 75% dos valores são menores e cerca de 25% são maiores que esse valorb. 50% dos valores são menores e cerca de 50% são maiores que esse valorc. 25% dos valores são menores e cerca de 75% são maiores que esse valor

13) O terceiro quartil corresponde a um valor em um conjunto de dados classificados, de maneira tal que cerca dea. 75% dos valores são menores e cerca de 25% são maiores que esse valorb. 50% dos valores são menores e cerca de 50% são maiores que esse valorc. 25% dos valores são menores e cerca de 75% são maiores que esse valor

14) O 75.º percentil corresponde a um valor em um conjunto de dados classificados, de maneira tal que cerca dea. 75% dos valores são menores e cerca de 25% são maiores que esse valorb. 25% dos valores são menores e cerca de 75% são maiores que esse valor

15) Os dados a seguir fornecem o número de vezes em que 10 pessoas utilizaram seus cartões de crédito durante os últimos três meses.

9 6 28 14 2 18 7 3 16 6

Calcule a média aritmética, a mediana, a moda, a amplitude, a variância e o desvio-padrão.

64

Page 65: Apostila Probabilidade e Estatística 2009

16) A tabela a seguir fornece a distribuição de freqüências dos números de computadores vendidos durante as últimas 25 semanas em uma loja de computadores.____________________________________________Computadores Vendidos Freqüência____________________________________________4 a 9 210 a 15 416 a 21 1022 a 27 628 a 33 3___________________________________________ a. O que representa a coluna de freqüências na tabela?

b. Calcule a média aritmética, a variância e o desvio-padrão.

17) Os carros possuídos por todas as pessoas que vivem em uma cidade tem, em média, 7,3 anos de uso, com desvio-padrão de 2,2 anos.a. Utilizando o teorema de Chebyshev, encontre a percentagem mínima de carros nessa cidade que têmi) 1,8 a 12,8 anos de uso

65

Page 66: Apostila Probabilidade e Estatística 2009

ii) 0,7 a 13,9 anos de uso

b. Utilizando o teorema de Chebyshev, encontre o intervalo que contém os anos de uso de pelo menos 75% dos carros possuídos por todas as pessoas nessa cidade.

18) ) Os anos de uso de carros possuídos por todas as pessoas que vivem em uma cidade apresentam uma distribuição em formato de sino, com média aritmética de 7,3 anos e desvio-padrão de 2,2 anos.Utilizando a regra empírica, encontre a percentagem de carros nessa cidade que têmi) 5,1 a 9,5 anos de uso

66

Page 67: Apostila Probabilidade e Estatística 2009

ii) 0,7 a 13,9 anos de uso

19) Os dados a seguir fornecem o número de vezes em que um detector de metais foi acionado por passageiros em um pequeno aeroporto, durante 15 períodos consecutivos de meia hora, em 1.º de fevereiro de 2003.

7 2 12 13 0 8 1015 3 5 14 20 1 11 4

a. Calcule os três quartis e a amplitude interquartil. Onde o valor de 4 se posiciona em relação a esses quartis?

b. Encontre o valor (aproximado) do 60.º percentil.

c. Calcule a classificação de percentil de 12.

67

Page 68: Apostila Probabilidade e Estatística 2009

20) A média aritmética dos salários semanais de uma amostra de 15 empregados de uma empresa é igual a $435. A média aritmética dos salários semanais de uma amostra de 20 empregados de uma outra empresa é igual a $490. Encontre a média aritmética combinada para esses 35 empregados.

EXERCÍCIOS COMPLEMENTARES

1) O conjunto de dados a seguir fornece os números de anos durante os quais 24 trabalhadores permaneceram em seu emprego atual.

15 12 9 10 5 12 3 7 16 13 11 43 8 7 14 11 8 4 13 2 18 6 19

a) Construa uma distribuição de freqüências. Considere 1 o limite inferior da primeira classe e 4 a amplitude de cada classe.

b) Calcule as freqüências relativas e as percentagens para todas as classes.

c) Que percentagem dos empregados permaneceu em seu emprego atual por oito anos ou menos?

68

Page 69: Apostila Probabilidade e Estatística 2009

d) Desenhe o histograma de freqüências e o polígono.

2) Uma propriedade da média aritmética corresponde ao fato de que, caso conheçamos as médias aritméticas e os tamanhos de amostra de dois (ou mais) conjuntos de dados, podemos calcular a média aritmética combinada de ambos (ou de todos) os conjuntos de dados. A média aritmética combinada para dois conjuntos de dados é calculada por meio da fórmula

Média Aritmética Combinada =

na qual e correspondem aos tamanhos de amostras relativos a dois conjuntos de

dados e correspondem às médias aritméticas dos dois conjuntos de dados,

respectivamente. Suponha que uma amostra contendo 10 livros de estatística fornecesse uma média aritmética de preço correspondente a $95, e uma amostra contendo 8 livros de matemática fornecesse uma média aritmética de preço correspondente a $104. Encontre a média aritmética combinada.

3) A média aritmética da idade de seis pessoas corresponde a 46 anos. As idades correspondentes a cinco dessas seis pessoas são iguais a 57, 39, 44, 51 e 37 anos. Encontre a idade da sexta pessoa.

69

Page 70: Apostila Probabilidade e Estatística 2009

4) A média aritmética aparada é calculada retirando-se uma determinada percentagem dos valores de cada extremidade de um conjunto de dados classificados. A média aritmética aparada é especialmente útil como uma média de tendência central, quando um conjunto de dados contém alguns poucos valores extremos, em cada uma das extremidades. Suponha que os dados a seguir apresentados forneçam as idades de 10 empregados de uma empresa:

47 53 38 26 39 49 19 67 31 23

Para calcular a média aritmética aparada em 10%, inicialmente classifique esses valores de dados em ordem crescente, em seguida, retire 10% dos menores valores e 10% dos maiores valores. A média aritmética dos 80% remanescentes fornecerá uma média aritmética aparada em 10%. A média aritmética dos 8 valores remanescentes corresponderá à média aritmética aparada em 10%. Calcule a média aritmética aparada em 10% para esse conjunto de dados.

5) A seguir são apresentadas as temperaturas (em graus Fahrenheit) observadas durante oito dias de inverno em uma cidade do centro-oeste dos Estados Unidos.

23 14 6 -7 -2 11 16 19

Calcule a amplitude, a variância e o desvio-padrão.

70

Page 71: Apostila Probabilidade e Estatística 2009

6) Os salários anuais de todos os empregados que trabalham para uma empresa têm uma média aritmética de $42350 e um desvio-padrão de $3820. Os anos de escolaridade para os mesmos empregados têm uma média aritmética de 15 anos e um desvio-padrão de 2 anos. A variação relativa nos salários é maior ou menor que a variação relativa correspondente aos anos de escolaridade desses empregados?

Para dados da população =

Para dados de amostra =

7) A média aritmética mensal de amortizações pagas por todos os proprietários de imóveis em uma cidade é igual a $1365, com um desvio-padrão igual a $240.a) Utilizando o teorema de Chebyshev, encontre a percentagem mínima de todos os proprietários de imóveis naquela cidade que pagam uma amortização mensal dei) $885 até $1845

ii) $645 até $2085

71

Page 72: Apostila Probabilidade e Estatística 2009

b) Utilizando o teorema de Chebyshev, encontre o intervalo que contém os pagamentos mensais de amortização de pelo menos 84% de todos os proprietários de imóveis.

8) Os dados a seguir fornecem os pesos (em libras) perdidos por 15 membros em um clube de saúde ao final de dois meses após terem ingressado no clube.

5 10 8 7 25 22 5 1411 10 21 9 8 11 18

a) Calcule os valores dos três quartis e a amplitude interquartil.

b) Calcule o valor (aproximado) de 82.º percentil.

c) Encontre a classificação de percentil de 10.

9) Apresentamos a seguir as jardas conquistadas, durante a temporada de 2002, por 14 RBs (corredores) de 14 times universitários de futebol americano.

745 921 1133 1024 848 775 8001009 1275 857 933 1145 967 995

72

Page 73: Apostila Probabilidade e Estatística 2009

Prepare uma distribuição ramo-e-folha. Arrume em ordem crescente as folhas para cada ramo.

10) Se numa livraria comprou-se 26 mapas a $1,6 cada; e 31 livros a $17,20 cada e 18 cadernos a $9,00 cada, qual é o custo médio por quantidade de artigos?

Média Harmônica =

11) Um estudante obtém as notas 60, 84 e 90 em testes, e 88 no exame final. Calcule a média ponderada das notas se cada teste corresponde a 20% e o exame final corresponde a 40% da nota final.

Média Ponderada =

12) Numa sala de conferência sobre esportes, estão 42 alunos do curso de administração, 37 do curso de economia, 28 do curso de geografia e 19 do curso de ciências contábeis. As percentagens dos alunos que praticam algum esporte, entre os presentes são,

73

Page 74: Apostila Probabilidade e Estatística 2009

respectivamente 82%, 71%, 90% e 54%. Qual a percentagem média dos alunos praticantes de esportes que compareceram a essa conferência.

13) Um produto é vendido em três supermercados por $13,00/kg, $13,20/kg e $13,50/kg. Determine quantos $/kg se paga em média pelo produto?

4 – PROBABILIDADE

4.1 - Experimento, Resultados e Espaço Amostral

Definição

Um experimento corresponde a um processo que, ao ser realizado, resulta em uma e somente uma de muitas observações. Essas observações são conhecidas como resultados do experimento. A coleção de todos os resultados para um experimento é conhecida como espaço amostral.

Um espaço amostral é representado por S. Os elementos de um espaço amostral são conhecidos como pontos da amostra.

A tabela 4.1 apresenta alguns exemplos de experimentos, seus resultados e seus espaços amostrais.

Tabela 4.1Exemplos de Experimentos, Resultados e Espaços AmostraisExperimento Resultados Espaço AmostralLançar uma moeda uma única vez Cara, Coroa S={cara, Coroa}Jogar um dado uma única vez 1, 2, 3, 4, 5, 6 S={1, 2, 3, 4, 5, 6}Jogar na Loteria Ganhar, Perder S={Ganhar, Perder}Selecionar um aluno Homem, Mulher S={Homem, Mulher}

O espaço amostral para um experimento também pode ser ilustrado desenhando-se um diagrama de Venn ou um diagrama de árvore.

Os exemplos 4.1 a 4.3 descrevem a maneira de desenhar esses diagramas para esperimentos estatísticos.

74

Page 75: Apostila Probabilidade e Estatística 2009

Exemplo 4.1Desenhe os diagramas de Venn e de árvore para o experimento sobre o lançamento

único de uma moeda.S={CA, CO}

Exemplo 4.2Desenhe o diagrama de Venn e o diagrama de árvore para o primeiro sobre dois

lançamentos de uma moeda. S={CACA, CACO, COCA, COCO}

Exemplo 4.3Suponha que tenhamos selecionado aleatoriamente duas pessoas, entre os membros

de um clube, e tenhamos observado se a pessoa selecionada a cada vez é um homem ou uma mulher. Escreva todos os resultados para este experimento. Desenhe o diagrama de Venn e o diagrama de árvore para este experimento.

75

Page 76: Apostila Probabilidade e Estatística 2009

4.1.1 – Eventos Simples e Eventos Compostos

Um evento representa um ou mais resultados de um experimento.

Definição

Evento – Um evento corresponde a uma coleção de um ou mais dos resultados de um experimento.

Um evento pode corresponder a um evento simples ou a um evento composto. Um evento simples também é conhecido como evento elementar, e um evento composto é também conhecido como evento múltiplo.

Definição

Evento Simples – Um evento que inclui em, e somente um, dos resultados (finais) de um experimento é conhecido como evento simples, e é geralmente representado por .

O exemplo 4.4 descreve eventos simple.

Exemplo 4.4Reconsidere o exemplo 4.3 sobre a seleção de duas pessoas entre os membros de um

clube, observando a pessoa selecionada a cada vez é homem ou mulher. Cada um dos quatro resultados finais (HH, HM, MH e MM) para este experimento corresponde a um evento simples. Esses quatro eventos podem ser representados por , respectivamente. Portanto,

, , e

Evento Composto

Um evento composto consiste em mais do que um resultado.

76

Page 77: Apostila Probabilidade e Estatística 2009

Definição

Evento Composto – Um evento composto corresponde a uma seleção de mais do que um resultado para um experimento.

Exemplo 4.5Reconsidere o exemplo 4.3, que trata da seleção de duas pessoas entre os membros

de um clube, observando a pessoa selecionada a cada vez corresponde a um homem ou a uma mulher. Seja A o evento no qual no máximo um homem foi selecionado. O evento A irá ocorrer se nenhum homem ou apenas um único homem for selecionado.

A={HM, MH, MM}O diagrama de Venn na figura 4.4 traz a apresentação gráfica do evento composto A.

Exemplo 4.6Em um grupo de pessoas, algumas são favoráveis à engenharia genética, enquanto

outras são contrárias. Duas pessoas são selecionadas aleatoriamente, a partir desse grupo, e são indagadas sobre o fato de serem favoráveis ou contrárias à engenharia. Quantos resultados distintos são possíveis? Desenhe um diagrama de Venn e um diagrama de árvore para este experimento. Liste todos os resultados incluídos em cada um dos seguintes eventos, e mencione se correspondem a eventos simples ou a eventos compostos.(a) Ambas as pessoas são favoráveis à engenharia genética

(b) No máximo uma pessoa é contrária à engenharia genética

(c) Exatamente uma pessoa é favorável à engenharia genética

4.2 – CALCULANDO A PROBABILIDADE

A probabilidade, que fornece a possibilidade de ocorrência de um evento, é representada por P. A probabilidade de que um evento simples venha a ocorrer é

77

Page 78: Apostila Probabilidade e Estatística 2009

representada por , e a probabilidade de um evento composto A venha a ocorrer é representada por P(A).

Definição

Probabilidade – A probabilidade corresponde à medida numérica da possibilidade de que um determinado evento venha a obter.

Duas Propriedades da Probabilidade

1. A probabilidade de um evento sempre se posiciona no intervalo entre 0 e 1.

Um evento que nunca pode ocorrer tem probabilidade igual a zero; esse tipo de evento é conhecido como evento impossível. Para um evento que é certo de ocorrer tem probabilidade igual a 1 e é conhecido como evento certo. Ou seja,

Para um evento impossível Para um evento certo

2. A soma das probabilidades de todos os eventos simples (ou resultados finais) para um experimento, representada por , é sempre igual a 1.

4.2.1 – Três Abordagens Conceituais para a Probabilidade

Probabilidade Clássica

Muitas vezes, vários resultados para um experimento podem ter a mesma probabilidade de ocorrência. Esses resultados são conhecidos como resultados igualmente possíveis ou eventos igualmente possíveis.

Regra da Probabilidade Clássica para se Encontrarem Probabilidades

1/Número total de resultados para o experimento

Número de resultados favoráveis a A/Número total de resultados para o experimento

78

Page 79: Apostila Probabilidade e Estatística 2009

Exemplo 4.7Encontre a probabilidade de se obter cara para um lançamento de uma moeda.

Exemplo 4.8Encontre a probabilidade de se obter um número par em um lançamento de um

dado.

Utilizando a Freqüência Relativa como uma Aproximação da Probabilidade – Caso um experimento seja repetido n vezes e um evento A seja observado f vezes, então, de acordo com o conceito de freqüência relativa de probabilidade,

Exemplo 4.9Dez entre 500 carros aleatoriamente selecionados, fabricados em uma determinada

fábrica de automóveis, são avaliados como sendo abacaxis. Supondo-se que os abacaxis sejam fabricados de maneira aleatória, qual é a probabilidade de que o próximo carro fabricado nessa fábrica de automóveis venha a ser um abacaxi.

Tabela 4.2Distribuição de Freqüências e Distribuição de Freqüências Relativas para a Amostra de Carros_______________________________________________Carro f Freqüência Relativa_______________________________________________PerfeitoAbacaxi______________________________________________ n=500 Soma = 1,00______________________________________________

79

Page 80: Apostila Probabilidade e Estatística 2009

Leis dos Grandes Números – Caso um experimento seja repetido inúmeras vezes, a probabilidade de que um evento obtido a partir da freqüência relativa se aproxima da probabilidade verdadeira ou teórica.

Probabilidade Subjetiva – Representa a probabilidade atribuída a um evento com base no julgamento, na experiência, nas informações e na crença subjetiva.

4.3 – REGRA DE CONTAGEM

Regra de Contagem para Encontrar Resultados Totais – Caso um experimento consista em três etapas, e a primeira etapa possa resultar em m resultados, a segunda etapa em n resultados e a terceira etapa em k resultados, então

Resultados totais para o experimento =

Exemplo 4.10Um futuro comprador de carros pode escolher entre uma taxa de juros fixa e uma

taxa de juros variável, e pode também escolher um prazo de pagamento de 36 meses, 48 meses ou 60 meses. Quantos resultados totais são possíveis?

4.4 – PROBABILIDADE MARGINAL E PROBABILIDADE CONDICIONAL

Probabilidade Marginal – A probabilidade marginal representa a probabilidade de um único evento, sem levar em conta qualquer outro evento. A probabilidade marginal também chamada de probabilidade simples.

Probabilidade Condicional – A probabilidade condicional representa a probabilidade de que um evento venha ocorrer, sabendo-se que um outro evento já tenha ocorrido. Caso A e B sejam dois eventos, a probabilidade condicional de A, sendo conhecida B, é escrita como

, se

, se

80

Page 81: Apostila Probabilidade e Estatística 2009

Exemplo 4.11

Sendo , e , calcular .

Exemplo 4.12A probabilidade de que um aluno aleatoriamente selecionado de uma faculdade seja

quartanista é 0,20, e a probabilidade conjunta de que o aluno esteja se especializando em ciência da computação e seja e seja quartanista é igual a 0,03. Encontre a probabilidade condicional de que um aluno selecionado ao acaso esteja se especializando em ciência da computação, sabendo-se que ele/ela é quartanista.

4.5 – EVENTOS MUTUAMENTE EXCLUDENTES

Definição

Eventos Mutuamente excludentes – Eventos que não podem ocorrer conjuntamente são conhecidos como eventos mutuamente excludentes.

Exemplo 4.13Considere os seguintes eventos para um lançamento de um dado:A = um número par é observado = {2, 4, 6}

81

Page 82: Apostila Probabilidade e Estatística 2009

B = um número ímpar é observado = {1, 3, 5}C = um número menor do que 5 é observado = {1, 2, 3, 4}Os eventos A e B são mutuamente excludentes? Os eventos A e C são mutuamente excludentes?

4.6 - EVENTOS INDEPENDENTES VERSUS EVENTOS DEPENDENTES

Eventos Independentes – Dois eventos são considerados independentes se a ocorrência de um deles não afetar a probabilidade de ocorrência do outro. Em outras palavras, A e B são eventos independentes se

Exemplo 4.14Uma caixa contém um total de 100 CDs que foram fabricados em dois

equipamentos. Desse total, 60 foram fabricados no equipamento I. Do total de CDs, 15 são defeituosos. Dos 60 CDs que foram fabricados no equipamento I, 9 são defeituosos. Sejam D o evento no qual um CD aleatoriamente selecionado é defeituoso e A o evento no qual um CD aleatoriamente selecionado foi fabricado no Equipamento I. Os eventos D e A são independentes?

OBS:1. Dois eventos mutuamente excludentes não podem ser independentes, e vice-

versa?(a) Eventos mutuamente excludentes são sempre dependentes.

(b) Eventos independentes nunca são mutuamente excludentes.

82

Page 83: Apostila Probabilidade e Estatística 2009

2. Eventos dependentes podem, ou não, ser mutuamente excludentes.

4.7 – EVENTOS COMPLEMENTARES

Definição

Eventos Complementares – O complemento do evento A, representado por e

lido como “A barra” ou “complemento de A”, corresponde ao evento que inclui todos os resultados para um experimento, que não estão em A.

Exemplo 4.15Em um grupo de 5000 adultos, 3500 são a favor de leis mais rígidas para o controle

do uso de armas, 1200 são contra essas leis e 300 não têm opinião a respeito. Um adulto é aleatoriamente selecionado nesse grupo. Seja A um evento no qual esse adulto seja a favor de leis mais rígidas para o controle de armas. Qual é o evento complementar de A? Quais são as probabilidades dos dois eventos?

4.8 – INTERSEÇÃO DE EVENTOS E A REGRA DE MULTIPLICAÇÃO

4.8.1 – Interseção de Eventos

A interseção de dois eventos é fornecida pelos resultados que são comuns a ambos.

A interseção dos eventos A e B é representada por , ou .

4.8.2 – Regra de Multiplicação

Probabilidade Conjunta – A probabilidade de interseção de dois eventos é chamada de probabilidade conjunta, e é escrita como

A probabilidade de interseção de dois eventos é obtida multiplicando-se a probabilidade marginal de um evento pela probabilidade condicional do segundo evento. Essa regra é denominada regra de multiplicação.

Regra de Multiplicação para Encontrar a Probabilidade Conjunta – A probabilidade de interseção de dois eventos, A e B, é

83

Page 84: Apostila Probabilidade e Estatística 2009

Exemplo 4.16A tabela 4.3 traz a classificação de todos os empregados de uma empresa por sexo e

graduação em alguma faculdade.

Tabela 4.3Classificação de Empregados por Sexo e Graduação Graduação em Faculdade (G) Não-Graduado na Faculdade (N) TotalMasculino (M) 7 20 27Feminino (F) 4 9 13Total 11 29 40

Caso um desses empregados seja selecionado ao acaso para ser membro do comitê de gerenciamento de empregos, qual é a probabilidade de que esse empregado seja do sexo feminino e graduado em alguma faculdade?

Regra de Multiplicação para Eventos Independentes

Regra da Multiplicação para se Calcular a Probabilidade de Eventos Independentes – A probabilidade da interseção de dois eventos, A e B, é

Exemplo 4.17Um edifício comercial dispõe de dois alarmes contra incêndio. A probabilidade de

que um alarme desse tipo venha a falhar durante um incêndio é igual a 0,02. Encontre a probabilidade de que ambos os alarmes deixem de funcionar em caso de incêndio.

84

Page 85: Apostila Probabilidade e Estatística 2009

Probabilidade Conjunta de Eventos Mutuamente Excludentes – A probabilidade conjunta de dois eventos mutuamente excludentes é sempre igual a zero. Caso A e B sejam dois eventos mutuamente excludentes, então,

Exemplo 4.18Considere os dois eventos a seguir apresentados, para uma ficha cadastral

preenchida por uma pessoa, no intuito de obter financiamento para a compra de automóvel:A = evento no qual a ficha cadastral é aprovadaB = evento no qual a ficha cadastral é reprovada.Qual é a probabilidade conjunta de A e R?

4.9 - UNIÃO DE EVENTOS E A REGRA DE ADIÇÃO

4.9.1 – União de Eventos

A união de dois eventos, A e B, inclui todos os resultados que estão em A ou em B, ou tanto em A quanto em B.

DefiniçãoUnião de Eventos – Sejam A e B dois eventos definidos em um espaço amostral. A

união dos eventos A e B corresponde à compilação de todos os resultados que pertencem a A ou a B, ou tanto a A quanto a B, e é representada por

A ou B,

Exemplo 4.19Um clube de idosos possui 300 membros. Entre eles, 140 são homens; 210 tomam

pelo menos um medicamento de uso permanente; e 95 são homens e tomam pelo menos um medicamento de uso permanente. Descreva a união dos eventos “masculinos” e “tomam pelo menos um medicamento de uso permanente”.

85

Page 86: Apostila Probabilidade e Estatística 2009

4.9.2 – Regra de Adição

Regra de Adição para se Encontrar a Probabilidade de União de Eventos – A probabilidade da união de dois eventos A e B é

Exemplo 4.20O reitor de uma universidade propôs que todos os alunos façam um curso de ética

como requisito para a graduação. Trezentos professores e alunos dessa universidade foram entrevistados acerca da opinião de cada um sobre essa questão. A tabela 4.4 traz a classificação cruzada das respostas desses professores e alunos da universidade.

Tabela 4.4Classificação Cruzada de Respostas A Favor Contra Neutro TotalProfessor 45 15 10 70Aluno 90 110 30 230Total 135 125 40 300

Encontre a probabilidade de que uma pessoa selecionada ao acaso entre essas 300 pessoas seja professor da faculdade, ou seja a favor dessa proposta.

86

Page 87: Apostila Probabilidade e Estatística 2009

Regra de Adição para Eventos Mutuamente Excludentes

A probabilidade da união de dois eventos mutuamente excludentes é fornecida pela soma de suas probabilidades marginais.

Regra de Adição para se Encontrar a Probabilidade da União de Eventos Mutuamente Excludentes – A probabilidade da união de dois eventos mutuamente excludentes, A e B, é

Exemplo 4.21A probabilidade de que uma pessoa seja a favor da engenharia genética é igual a

0,55, e a probabilidade de que a pessoa seja contra é igual a 0,45. Duas pessoas são aleatoriamente selecionadas, e é observado se são a favor ou contra a engenharia genética.(a) Desenhe um diagrama de árvore para este medicamento.(b) Encontre a probabilidade de que pelo menos uma das duas pessoas seja a favor da engenharia genética.

87

Page 88: Apostila Probabilidade e Estatística 2009

EXERCÍCIOS:1) Cinco pacientes, 3 mulheres e 2 homens, estão numa sala, para fazer um exame

médico. Se escolhermos, ao acaso, um paciente de cada vez, qual a probabilidade de considerarmos alternadamente um de cada sexo?

2) Consideremos 2 caixas iguais, uma com 15 frutas, das quais 8 estão verdes e outra com 12 frutas, das quais 8 estão verdes. Selecionamos uma caixa, ao acaso e retiremos uma fruta. Qual a probabilidade de que ela esteja madura?

3) Temos duas estantes iguais: uma com 5 livros, sendo 2 de Matemática e 3 de Português, a outra estante com 6 livros, sendo 1 de matemática e 3 de português. Seleciona-

88

Page 89: Apostila Probabilidade e Estatística 2009

se uma estante, ao acaso, e retira-se um livro. Qual a probabilidade de que ele seja de Matemática?

4) No curso de Biologia, 10% dos alunos foram reprovados em Bioestatística, 12% foram reprovados em Genética e 8% foram reprovados em Bioestatística e Genética ao mesmo tempo. Um estudante do curso é selecionado ao acaso. Se ele foi reprovado em Genética. Qual a probabilidade de que tenha sido reprovado também em Bioestatística?

5) Num ginásio de esportes, 26% dos freqüentadores jogam vôlei, 36% jogam basquete e 12% praticam os dois esportes. Um dos freqüentadores é sorteado para ganhar uma medalha. Sabendo-se que ele joga basquete, qual a probabilidade de que também jogue vôlei?

6) Um conjunto de 50 pessoas num SPA, está formado do seguinte modo:

89

Page 90: Apostila Probabilidade e Estatística 2009

Obesos Não ObesosHomens 18 9Mulheres 15 8

Escolhemos ao acaso uma pessoa. Se for do sexo feminino, qual a probabilidade de que seja obesa?

7) A urna A contém 3 fichas vermelhas e 2 azuis, e a urna B contém 2 vermelhas e 8 azuis. Joga-se uma moeda “honesta”. Se a moeda der cara, extrai-se uma ficha da urna A; se der coroa, extrai-se uma ficha da urna B. Uma ficha vermelha é extraída. Qual a probabilidade de ter saído cara no lançamento?

8) Num certo colégio, 4% dos homens e 1% das mulheres têm mais de 1,75m de altura. 60% dos estudantes são mulheres. Um estudante é escolhido ao acaso e tem mais de 1,75m. Qual a probabilidade de que seja homem?

90

Page 91: Apostila Probabilidade e Estatística 2009

9) A probabilidade de um remédio X curar a doença Y é de . Qual a probabilidade

de que a doença não seja curada pelo remédio X?

10) Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 10 ou maior que 10.

11) A urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada uma. Qual é a probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde?

12) Um lote é formado por 10 peças boas, 4 com defeitos e 2 com defeitos graves. Uma peça é escolhida ao acaso. Calcule a probabilidade de que:a) ela não tenha defeitos graves;

b) ela não tenha defeitos;

c) ela seja boa ou não tenha defeitos graves.

91

Page 92: Apostila Probabilidade e Estatística 2009

13) Uma urna contém 50 bolas idênticas. Sendo as bolas numeradas de 1 a 50, determine a probabilidade de, em uma extração ao acaso:a) obtermos a bola de número 27;

b) obtermos uma bola de número par;

c) obtermos uma bola de número maior que 20;

d) obtermos uma bola de número menor ou igual a 20.

5 - VARIÁVEIS ALEATÓRIAS DISCRETAS E SUAS DISTRIBUIÇÕES DE PROBABILIDADES

5.1 – VARIÁVEIS ALEATÓRIAS

Definição

Variável Aleatória – Uma variável aleatória é uma variável cujo valor é determinado pelo resultado de um experimento aleatório.

Uma variável aleatória pode ser discreta ou contínua.

5.1.1 – Variável Aleatória Discreta

Definição

Variável Aleatória Discreta – Uma variável aleatória que assume valores contáveis é chamada de variável aleatória discreta.

Exemplos:O número de casas em um determinado condomínio.O número de peixes capturados em uma pescaria.O número de clientes que visitam um banco durante qualquer hora especifica.O número de caras obtidas em três lançamentos de uma moeda.

5.1.2 – Variável Aleatória Contínua

Definição

Variável Aleatória Contínua – Uma variável aleatória que pode assumir qualquer valor contido em um ou mais intervalos é chamada de variável aleatória contínua.

Exemplos:A estatura de uma pessoa.

92

Page 93: Apostila Probabilidade e Estatística 2009

O tempo gasto para se fazer uma prova.O peso de um peixe.O preço de uma casa.

5.2 – DISTRIBUIÇÃO DE PROBABILIDADES DE UMA VARIÁVEL ALEATÓRIA DISCRETA

Definição

Distribuição de Probabilidades de uma Variável Aleatória Discreta – A distribuição de probabilidades de uma variável aleatória discreta apresenta todos os valores possíveis que uma variável aleatória pode assumir, bem como suas probabilidades correspondentes.Duas Características de uma Distribuição de Probabilidades – A distribuição de probabilidades de uma variável aleatória discreta tem as duas características a seguir:1. para cada valor de x2.

Exemplo 5.1Cada uma das tabelas a seguir apresenta determinados valores de x e suas

respectivas probabilidades. Determine se cada tabela representa, ou não, uma distribuição de probabilidades válida.a)________________ x P(x)________________

0 0,081 0,112 0,393 0,27

________________

b)________________ x P(x)________________

2 0,253 0,344 0,285 0,13

________________

93

Page 94: Apostila Probabilidade e Estatística 2009

c)________________ x P(x)________________

7 0,708 0,509 - 0,20

________________

Exemplo 5.2A tabela 5.1 apresenta a distribuição de probabilidades do número de defeitos em

uma máquina, apresentados a cada semana, com base em dados do passado.

Tabela 5.1___________________________________________________________Defeitos por semana 0 1 2 3___________________________________________________________Probabilidade 0,15 0,20 0,35 0,30___________________________________________________________

a) Apresente graficamente essa distribuição de probabilidades.

Figura 5.1 – Representação gráfica da distribuição de probabilidades da Tabela 5.1

b) Encontre a probabilidade de que o número de defeitos para esta máquina durante uma determinada semana seja:i. exatamente 2

ii. de 0 a 2

iii. maior do que 1

94

Page 95: Apostila Probabilidade e Estatística 2009

iv. no máximo 1

Exemplo 5.3De acordo com uma pesquisa, 60% de todos os alunos em uma grande universidade

sofrem de ansiedade em relação à matemática. Dois alunos são aleatoriamente selecionados nessa universidade. Seja x o número de alunos dessa amostra que sofrem de ansiedade relativa à matemática. Desenvolva a distribuição de probabilidade de x.

5.3 – MÉDIA ARITMÉTICA DE UMA VARIÁVEL ALEATÓRIA DISCRETA

Média Aritmética de uma Variável Aleatória Discreta – A média aritmética de uma variável aleatória discreta, x, representa o valor que se espera que ocorra por repetição, em média, caso um experimento seja repetido um grande número de vezes. É representado por

e calculada como .

95

Page 96: Apostila Probabilidade e Estatística 2009

A média aritmética de uma variável aleatória discreta, x, é também chamada de valor esperado e é representada por , ou seja,

Exemplo 5.4Na tabela 5.2, x representa o número de defeitos de um equipamento durante uma

determinada semana e P(x) representa a probabilidade do valor correspondente de x.

Tabela 5.2______________________ x P(x)______________________

0 0,151 0,202 0,353 0,30

_____________________

Encontre a média aritmética do número de defeitos apresentados por semana por esse equipamento.

5.4 – DESVIO-PADRÃO DE UMA VARIÁVEL ALEATÓRIA DISCRETA

A fórmula básica para se calcular o desvio-padrão de uma variável aleatória discreta é

No entanto, é mais conveniente utilizar a seguinte fórmula de atalho para calcular o desvio-padrão de uma variável aleatória discreta.

O desvio-padrão de uma variável aleatória discreta x mede a dispersão de sua distribuição de probabilidades e é calculado como

96

Page 97: Apostila Probabilidade e Estatística 2009

Observe que a variância, , de uma variável aleatória discreta é obtida elevando-se ao quadrado o seu desvio-padrão.

Exemplo 5.5A Baier’s Eletronics fabrica peças de computador, que são fornecidas por muitas

empresas de computação. Apesar de dois inspetores de controle de qualidade na Baier’s Eletronics verificarem todas as peças em busca de defeitos antes que sejam transportadas para outra empresa, algumas poucas peças defeituosas efetivamente passam por essas inspeções sem serem detectadas. Seja x o número de peças de computador defeituosas em uma remessa de 400. A tabela a seguir fornece a distribuição de probabilidade de x.

x 0 1 2 3 4 5P(x) 0,02 0,20 0,30 0,30 0,10 0,08

Calcule o desvio-padrão de x.

Solução:A tabela a seguir mostra os cálculos necessários para se encontrar o desvio-padrão de x.

Tabela 5.3Cálculos para Encontrar o Desvio-Padrão

0 0,02 0 0 01 0,20 0,20 1 0,202 0,30 0,60 4 1,203 0,30 0,90 9 2,704 0,10 0,40 16 1,605 0,08 0,40 25 2,00

2,50 7,70

Por conseguinte, espera-se que uma determinada remessa de 400 peças de computador contenha uma média de...........peças defeituosas, com um desvio-padrão de..............

Interpretação do Desvio-PadrãoAprendemos que, de acordo com o teorema de Chebyshev, pelo menos

da área total abaixo da curva se posiciona dentro do limite de k

97

Page 98: Apostila Probabilidade e Estatística 2009

desvios-padrão em relação à média aritmética, sendo k qualquer número maior que 1. Dessa maneira, se , pelo menos 75% da área abaixo de uma curva se posicionam entre

e . No exemplo 5.5,

Portanto,

Utilizando o teorema de Chebyshev podemos afirmar que é esperado que pelo menos 75% das remessas (cada qual contendo 400 peças de computador) contenham de 0,092 a 4,908 peças de computador defeituosas em cada remessa.

5.5 – FATORIAIS E COMBINAÇÕES

5.5.1 – Fatoriais

Definição

Fatoriais – O símbolo n!, que se lê como “n fatorial”, representa o produto de todos os números inteiros desde n até 1. Em outras palavras,

Por definição,

Exemplo 5.6Calcule .

Exemplo 5.7Calcule

5.5.2 – Combinações

Definição

Notação de Combinações – Combinações fornecem o número de maneiras pelas quais x elementos podem ser selecionados a partir de n elementos. A notação utilizada para representar o número total de combinações é

98

Page 99: Apostila Probabilidade e Estatística 2009

que se lê como “o número de combinações de n elementos, selecionados x a cada vez”.

Suponha que existe um total de n elementos, dos quais desejamos selecionar x elementos. Então,

= o número de combinações de n elementos, selecionados x a cada vez

O número total de combinações pode também ser representado pelas seguintes notações:

Número de Combinações – O número de combinações para se selecionar x a partir de n elementos distintos é fornecido pela fórmula

sendo e lidos como “n fatorial”, “x fatorial” e “n menos x fatorial”, respectivamente.

Na fórmula para combinações,

Observe que, em combinações, n é sempre maior ou igual a x. Se n for menor que x, não podemos selecionar x elementos distintos a partir de n.

Exemplo 5.8Uma loja de sorvetes oferece seis sabores de sorvete. Kristen deseja comprar dois

sabores de sorvete. Caso ela aleatoriamente selecione dois sabores entre seis, quantas combinações possíveis existem?

99

Page 100: Apostila Probabilidade e Estatística 2009

Exemplo 5.9Três membros de um júri serão aleatoriamente selecionados entre cinco pessoas.

Quantas combinações diferentes são possíveis?

5.5.3 – Utilizando a Tabela de Combinações

A tabela III no Apêndice C apresenta o número de combinações de n elementos, selecionados x a cada vez. O exemplo a seguir ilustra como ler essa tabela para encontrar combinações.

Exemplo 5.10A Marv & Sons anunciou a contratação de um analista financeiro. A empresa recebeu

formulários de 10 candidatos que parecem igualmente qualificados. A gerente da empresa decidiu chamar apenas três desses candidatos para uma entrevista. Caso esta gerente selecione aleatoriamente 3 candidatos entre 10, quantas seleções totais são possíveis?

Solução:O número total de maneiras de selecionar 3 candidatos entre 10 é fornecido por .Tabela 5.4Determinando o Valor de .

n x 0 1 2 3 ... 201 1 12 1 2 13 1 3 3 1. . . . .. . . . .. . . . .10 1 10 45 120 ... .... . . . . ... .... . . . . ... ...

O número localizado na interseção entre a linha para e a coluna para fornece o valor de , que é

= 120

Logo, o gerente da empresa pode selecionar 3 candidatos entre 10 de 120 maneiras.

100

Page 101: Apostila Probabilidade e Estatística 2009

OBS:Caso o número total de elementos e o número de elementos a serem selecionados

sejam os mesmos, existe apenas uma combinação. Em outras palavras,

Dessa maneira, o número de combinações para se selecionar zero item a partir de n é igual a 1; ou seja,

Por exemplo,

5.6 – A DISTRIBUIÇÃO DE PROBABILIDADES BINOMIAIS

5.6.1 – Experimento Binomial

Condições de um Experimento Binomial – Um experimento binomial deve satisfazer as quatro condições a seguir:1. Existem n testes idênticos.2. Cada teste tem somente dois resultados possíveis.3. As probabilidades dos dois resultados permanecem constantes.4. Os testes são independentes.

Exemplo 5.11Considere o experimento que consiste em 10 lançamentos de uma moeda. Determine se

esta representa, ou não representa, um experimento binomial.

5.6.2 – A Distribuição de Probabilidades Binomiais e a Fórmula Binomial

101

Page 102: Apostila Probabilidade e Estatística 2009

Fórmula Binomial – Para um experimento binomial, a probabilidade de exatamente x sucessos em n testes é fornecida pela fórmula binomial

na qual

n = número total de testesp = probabilidade de sucessoq = 1 – p = probabilidade de insucessox = número de sucessos em n testesn – x = número de insucessos em n testes

Exemplo 5.12Cinco por cento de todos os videocassetes fabricados por uma grande empresa de

produtos eletrônicos são defeituosos. Um inspetor do controle de qualidade seleciona aleatoriamente três aparelhos da linha de produção. Qual é a probabilidade de que exatamente um desses três aparelhos seja defeituoso?

5.6.3 – Utilizando a Tabela de Probabilidades Binomiais

102

Page 103: Apostila Probabilidade e Estatística 2009

Exemplo 5.13Segundo um estudo realizado em 2001 pela Escola de Saúde Púbica da Universidade de

Harvard com alunos universitários, 19,3% dos alunos incluídos no estudo se abstiveram de beber (USA TODAY, 3 de abril de 2002). Suponha que, todos os atuais alunos universitários nos Estados Unidos, 20% se abstenham de beber. Uma amostra aleatória de 6 alunos universitários é selecionada. Utilizando a tabela IV do Apêndice C, responda os seguintes itens:a) Encontre a probabilidade de que exatamente três alunos universitários dessa amostra se abstenham de beber.

Solução:a) Para ler a probabilidade procurada na Tabela IV do Apêndice C, inicialmente determinamos os valores de n, x e p. Por exemplo,n = número de alunos universitários da amostra = 6x = número de alunos universitários, entre seis, que se abstêm de beber = 3p = P(um aluno universitário que se abstêm de beber) = 0,20

Tabela 5.5Determinando P(x = 3) para n = 6 e p = 0,20

Pn x 0,05 0,10 0,20 ... 0,956 0 0,7351 0,5314 0,2621 ... 0,0000

1 0,2321 0,3543 0,3932 ... 0,00002 0,0305 0,0984 0,2458 ... 0,00013 0,0021 0,0146 0,0819 ... 0,00214 0,0001 0,0012 0,0154 ... 0,03055 0,0000 0,0001 0,0015 ... 0,23216 0,0000 0,0000 0,0001 ... 0,7351

Utilizando a Tabela IV ou Tabela 5.5, escrevemos a tabela 5.6, que pode ser utilizada para responder aos itens remanescentes deste exemplo.

103

Page 104: Apostila Probabilidade e Estatística 2009

Tabela 5.6Parte da Tabela IV para n = 6 e p = 0,20______________________________________

p ____________________n x 0,20 ______________________________________6 0 0,2621

1 0,39322 0,24583 0,08194 0,01545 0,00156 0,0001

______________________________________

b) Encontre a probabilidade de que no máximo dois alunos universitários dessa amostra se abstenham de beber.

c) Encontre a probabilidade de que pelo menos três alunos universitários dessa amostra se abstenham de beber.

d) Encontre a probabilidade de que um a três alunos universitários dessa amostra se abstenha de beber.

e) Seja x o número de alunos universitários dessa amostra que se abstenham de beber. Apresente a distribuição de probabilidades de x e desenhe um gráfico de barras para essa distribuição de probabilidades.

104

Page 105: Apostila Probabilidade e Estatística 2009

5.6.4 – Probabilidade de Sucesso e o Formato da Distribuição Binomial

Para qualquer número de testes n:

1. A distribuição de probabilidades binomiais é simétrica se p = 0,50.

2. A distribuição de probabilidades binomiais é assimétrica à direita se p for menor que 0,50.

3. A distribuição de probabilidades binomiais é assimétrica à esquerda se p for maior que 0,50.

1. Sejam n = 4 e p = 0,50. Utilizando a Tabela IV do Apêndice C, apresentamos a distribuição de probabilidades de x na Tabela 5.7 e colocamos a mesma em forma de gráfico na figura 5.1. Como podemos observar na Tabela 5.7 e na figura 5.2, a distribuição de probabilidades é simétrica.

Tabela 5.7Distribuição de probabilidades de x para n = 4 e p = 0,50_______________________________________________

x P(x)_______________________________________________

0 0,06251 0,25002 0,37503 0,25004 0,0625

_______________________________________________

105

Page 106: Apostila Probabilidade e Estatística 2009

2. Sejam n = 4 e p = 0,30 (que é menor que 0,50). A tabela 5.8, que é construída a partir da tabela IV do Apêndice C, e o gráfico de distribuição de probabilidades da Figura 5.3 mostram que a distribuição de probabilidades de x para n = 4 e p = 0,30 é assimétrica à direita.

Tabela 5.8Distribuição de Probabilidades de x para n = 4 e p = 0,30_______________________________________________ x P(x)_______________________________________________

0 0,24011 0,41162 0,26463 0,07564 0,0081

_______________________________________________

3. Sejam n = 4 e p = 0,80 (que é maior que 0,50). A tabela 5.9, que é construída utilizando-se a tabela IV do Apêndice C, e o gráfico de distribuição de probabilidades da Figura 5.4 mostram que a distribuição de probabilidades de x para n = 4 e p = 0,80 é assimétrica à esquerda.

Tabela 5.9Distribuição de Probabilidades de x para n = 4 e p = 0,80_______________________________________________ x P(x)_______________________________________________

106

Page 107: Apostila Probabilidade e Estatística 2009

0 0,00161 0,02562 0,15363 0,40964 0,4096

5.6.5 – Média Aritmética e Desvio-Padrão da Distribuição Binomial

Média Aritmética e Desvio-Padrão de uma Distribuição Binomial – A média aritmética e o desvio-padrão de uma distribuição binomial são

e

em que n corresponde ao número total de testes; p representa a probabilidade de sucesso; e q representa a probabilidade de insucesso.

Exemplo 5.14Em uma pesquisa de opinião da Maritz, realizada com adultos motoristas em julho

de 2002, 45% afirmaram que “freqüentemente” ou “algumas vezes” comem ou bebem enquanto dirigem (USA TODAY, 23 de outubro de 2002). Suponha que este resultado seja verdadeiro para a população atual de todos os adultos motoristas. Uma amostra de 40 adultos motoristas é selecionada. Seja x o número de motoristas dessa amostra que “freqüentemente” ou “algumas vezes” comem ou bebem enquanto dirigem. Encontre a média aritmética e o desvio-padrão da distribuição de probabilidades de x.

107

Page 108: Apostila Probabilidade e Estatística 2009

Portanto, a média aritmética da distribuição de probabilidades de x é.........e o desvio-padrão é................

5.7 – A DISTRIBUIÇÃO DE PROBABILIDADES HIPERGEOMÉTRICAS

Distribuição de Probabilidades Hipergeométricas

SejamN = Número total de elementos na populaçãor = número de sucessos na populaçãoN – r = número de insucessos na populaçãon = número de testes (tamanho da amostra)x = número de sucessos em n testesn – x = número de insucessos em n teste

A probabilidade de x sucessos em n testes é dada por

Exemplo 5.15A Brown Manufacturing fabrica peças de automóveis que são vendidas para

concessionárias. Na semana passada, a empresa remeteu 25 peças de automóveis para uma concessionária. Posteriormente, descobriu que cinco dessas peças eram defeituosas. No momento em que o gerente da empresa conseguiu entrar em contato com a concessionária, quatro peças daquela remessa já haviam sido vendidas. Qual é a probabilidade de que três das quatro peças vendidas fossem perfeitas e uma fosse defeituosa? SoluçãoN = número total de elementos (peças de automóveis) =r = número de sucessos (peças perfeitas) na população =N – r = Número de insucessos (peças imperfeitas) na população =n = número de testes (tamanho da amostra) =x = número de sucessos quatro testes =n – x = número de insucessos em quatro testes =

Utilizando a fórmula hipergeométrica, a probabilidade desejada é calculada da seguinte maneira:

108

Page 109: Apostila Probabilidade e Estatística 2009

Portanto, a probabilidade de que os três das quatro peças vendidas sejam perfeitas e uma seja defeituosa é igual a .....................

5.8 - A DISTRIBUIÇÃO DE PROBABILIDADES DE POISSON

Condições para Aplicar a Distribuição de Probabilidades de Poisson – As três condições a seguir devem ser satisfeitas para que seja aplicada a distribuição de probabilidades de Poisson.

1. x deve ser uma variável aleatória discreta

2. As ocorrências devem ser aleatórias

3. As ocorrências devem ser independentes

Fórmula de Distribuição de Probabilidades de Poisson – De acordo com a distribuição de probabilidades de Poisson, a probabilidade de x ocorrências em um intervalo é

em que (pronuncia-se lambda) representa a média aritmética do número de ocorrências no intervalo e o valor de é aproximadamente 2,71828.

Exemplo 5.16Em média, um domicilio recebe 9,5 chamadas telefônicas de telemarketing por

semana. Utilizando a fórmula da distribuição de Poisson, encontre a probabilidade de que um domicílio aleatoriamente selecionado receba exatamente seis chamadas telefônicas de telemarketing durante uma determinada semana.

Solução:Seja a média aritmética do número de chamadas telefônicas recebidas por um

domicilio por semana. Então, . Seja x o número de chamadas telefônicas de telemarketing recebidas por um domicilio durante uma determinada semana. Vamos encontrar a probabilidade de x = 6. Substituindo todos os valores na fórmula de Poisson, obtemos

Para realizar esses cálculos, podemos encontrar o valor de 6! Na tabela II do Apêndice C e o valor de utilizando a tecla em uma calculadora, ou utilizando a Tabela V.

109

Page 110: Apostila Probabilidade e Estatística 2009

Exemplo 5.17Uma máquina de levar roupas em uma lavanderia apresenta defeito, em média, três

vezes por mês. Utilizando a fórmula da distribuição de probabilidades de Poisson, encontre a probabilidade de que durante o próximo mês esta máquina venha a apresentara) exatamente dois defeitos

SoluçãoSeja a média aritmética do número de defeitos por mês e x o número efetivo de

defeitos observados durante o mês seguinte para esta máquina. Então,

A probabilidade de que exatamente dois defeitos venham a ser observados durante o próximo mês é

b) no máximo um defeito

A probabilidade de que no máximo um defeito venha a ser observado durante o próximo mês é dada pela soma das probabilidades de zero defeito e de um defeito. Portanto,

(no máximo 1 defeito) =

OBS:Um ponto importante em relação à distribuição de probabilidades de Poisson

corresponde ao fato de que os intervalos para e x devem ser iguais. Caso não sejam iguais, a média aritmética, , deve ser redefinida para tornar iguais os intervalos.

Exemplo 5.18A empresa de Remessas Postais de Cyntia oferece um exame gratuito de seus

produtos por um período de sete dias. Caso não esteja completamente satisfeito, o cliente pode devolver o produto dentro desse período e obter um reembolso total. Segundo registros do passado da empresa, uma média de 2 entre cada 10 produtos vendidos por essa empresa é devolvida para fins de reembolso. Utilizando a fórmula da distribuição de probabilidades de Poisson, encontre a probabilidade de que exatamente 6 dos 40 produtos vendidos por essa empresa em um determinado dia venham a ser devolvidos para reembolso.

110

Page 111: Apostila Probabilidade e Estatística 2009

Portanto, a probabilidade de que exatamente 6 produtos entre 40 vendidos em um determinado dia venham a ser devolvidos é igual a .......................

Observe que o exemplo 5.19 representa efetivamente um problema binomial, com p = 2/10 = 0,20; n = 40 e x = 6. Em outras palavras, a probabilidade de sucesso (ou seja, a probabilidade de que um produto seja devolvido) é igual a 0,20 e o número de testes (produtos vendidos) é igual a 40. Desejamos encontrar a probabilidade de seis sucessos (devoluções). No entanto, utilizamos a distribuição de Poisson para selecionar este problema. Isso é conhecido como utilizar a distribuição de Poisson como uma aproximação para a distribuição binomial. Podemos, também, utilizar a distribuição binomial para encontrar essa probabilidade da seguinte maneira:

Logo, a probabilidade é igual a 0,1246 quando utilizamos a distribuição binomial.

Como podemos observar, simplificar os cálculos agora apresentados para a fórmula binomial é bastante complicado quando n é grande. É bem mais fácil solucionar este problema utilizando a distribuição de Poisson. Como regra geral, caso represente um problema binomial, com mas , podemos utilizar a distribuição de Poisson como uma aproximação para a distribuição binomial. No entanto, se e , preferimos utilizar a distribuição normal como uma aproximação para a distribuição binomial.

5.8.1 – Utilizando a Tabela de Probabilidades de Poisson

Exemplo 5.19Em média, duas novas contas são abertas, por dia, em uma agência do Imperial

Savings Bank. Utilizando a Tabela VI do Apêndice C, encontre a probabilidade de que, em um determinado dia, o número de novas contas abertas nesse banco venha a sera) exatamente 6

b) no máximo 3

c) pelo menos 7

Solução:a) Sejam

média aritmética do número de novas contas abertas por dia nesse banconúmero de novas contas abertas neste banco em um determinado dia

e

111

Page 112: Apostila Probabilidade e Estatística 2009

Tabela 5.10Parte da Tabela VI para x 1,1 1,2 2,0

0 0,13531 0,27072 0,27073 0,18044 0,09025 0,03616 0,01207 0,00348 0,00099 0,0002

_________________________________________________________________________

b) A probabilidade de que no máximo três novas contas sejam abertas em um determinado dia é obtida somando-se as probabilidades de 0, 1, 2 e 3 novas contas. Logo, utilizando a Tabela VI do Apêndice C, ou Tabela 5.10, obtemos

P(no máximo 3) =

c) A probabilidade de que pelo menos 7 novas contas sejam abertas em um determinado dia é obtida somando-se as probabilidades de 7, 8 e 9 novas contas. Observe que 9 representa o último valor de x para na Tabela VI do Apêndice C, ou na Tabela 5.10. Portanto, 9 representa o último valor de x, cuja probabilidade está incluída na soma. Entretanto, isso não significa que, em um determinado dia, mais do que nove novas contas não possam ser abertas. Significa simplesmente que a probabilidade de 10 ou mais contas é próxima de zero. Logo,

P(pelo menos 7) =

5.8.2 – Média Aritmética e Desvio-Padrão da Distribuição de Probabilidades de Poisson

Para a distribuição de probabilidades de Poisson, a média aritmética e a variância são ambas iguais a e o desvio-padrão é igual a . Ou seja, para a distribuição de probabilidades de Poisson,

112

Page 113: Apostila Probabilidade e Estatística 2009

EXERCÍCIOS1) A tabela a seguir fornece a distribuição de probabilidades de uma variável

aleatória discreta de x.

x 0 1 2 3 4 5P(x) 0,03 0,17 0,22 0,31 0,15 0,12

Encontre as seguintes probabilidades:a)

b)

c)

e) A probabilidade de que x assuma um valor menor do que 3.

f) A probabilidade de que x assuma um valor maior do que 3.

g) A probabilidade de que x assuma um intervalo entre 2 e 4.

2) Seja x o número de erros que aparecem em uma página aleatoriamente selecionada de um livro. A tabela a seguir apresenta a distribuição de probabilidades de x.

x 0 1 2 3 4P(x) 0,73 0,16 0,06 0,04 0,01

Encontre a média aritmética e o desvio-padrão de x.

3) Um departamento de língua inglesa em uma universidade possui 16 professores. Dois dos professores serão aleatoriamente selecionados para representar o departamento em um comitê. De quantas maneiras o departamento pode selecionar 2 professores entre 16. Utilize a fórmula apropriada.

113

Page 114: Apostila Probabilidade e Estatística 2009

4) Em uma pesquisa de opinião realizada com adultos pelo Instituto Gallup em dezembro de 2001, 80% dos entrevistados afirmaram sentirem-se estressados “freqüentemente” ou “algumas vezes” em seu dia-a-dia (USA TODAY, 24 de janeiro de 2002). Suponha que essa percentagem seja verdadeira para a atual população de todos os adultos. Utilizando a tabela de probabilidades binomiais (Tabela IV do Apêndice C), encontre a probabilidade de que o número de adultos em uma amostra aleatória de 15 adultos que se sentem estressados freqüentemente ou algumas vezes sãoa) no máximo 9

b) pelo menos 11

c) 10 a 12

5) Na Express House Delivery Service, fornecer serviços de alta qualidade aos clientes representa a prioridade máxima da gerência. A empresa garante uma restituição de todo o valor cobrado caso uma encomenda que a empresa esteja entregando não chegue ao destino no tempo especificado. Sabe-se, com base em dados do passado, que apesar de todos os esforços, 4% das encomendas remetidas por essa empresa não chegam ao destino no tempo especificado. Suponha que uma empresa remeta 20 encomendas por meio da Express House Delivery Service em um determinado dia.

a) Encontre a probabilidade de que exatamente 1 dessas 20 encomendas não chegue ao destino no tempo especificado.

b) Encontre a probabilidade de que no máximo 1 dessas 20 encomendas não chegue ao destino no tempo especificado.

114

Page 115: Apostila Probabilidade e Estatística 2009

6) A Dawn Corporation tem 12 empregados que ocupam posições gerenciais. Entre eles, sete são do sexo feminino e cinco são do sexo masculino. A empresa está planejando enviar 3 desses 12 gerentes a uma conferência. Caso 3 gerentes sejam aleatoriamente selecionados entre 12,

a) Encontre a probabilidade de que todos os 3 sejam do sexo feminino.

b) Encontre a probabilidade de que no Maximo 1 seja do sexo masculino.

7) Um domicilio recebe uma média de 1,7 e-mail indesejado por dia. Encontre a probabilidade de que esse domicilio venha a receber exatamente três e-mails não-desejados em um determinado dia. Utilize a fórmula da distribuição de Poisson.

115

Page 116: Apostila Probabilidade e Estatística 2009

8) Em média, 12,5 quartos permanecem desocupados por dia em um grande hotel. Encontre a probabilidade de que, em um determinado dia, exatamente três venham a ficar desocupados. Utilize a fórmula da distribuição de Poisson.

6 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS E A DISTRIBUIÇÃO NORMAL

6.1 – DISTRIBUIÇÃO DE PROBABILIDADES CONTÍNUAS

116

Page 117: Apostila Probabilidade e Estatística 2009

A curva da distribuição de probabilidades de uma variável aleatória contínua é também conhecida como função de densidade das probabilidades dessa variável.

A distribuição de probabilidades de uma variável aleatoriamente continua possui as duas características a seguir apresentadas:

1. A probabilidade de que x assuma um valor em qualquer intervalo se posiciona no espaço de 0 a 1.

2. A probabilidade total de todos os intervalos (mutuamente excludentes), dentro dos quais x pode assumir um determinado valor, é igual a 1,0.

Figura 6.1 – Área entre dois pontos sob uma curva

Figura 6.2 – Área total sob uma curva da distribuição de probabilidades

A probabilidade de que uma variável aleatória continua, x, assuma um valor dentro de um determinado intervalo, é fornecida com base na área sob a curva, entre os dois limites do intervalo, conforme mostrado na Figura 6.3. A área sombreada sob a curva, desde a até b, nessa figura, fornece a probabilidade de que x se posicione no intervalo de a até b, ou seja,

Área sob a curva, de a a b.

117

Page 118: Apostila Probabilidade e Estatística 2009

Figura 6.3 – Área sob a curva representando uma probabilidade

A probabilidade de que uma variável aleatória continua, x, assuma um único valor é sempre igual a zero. Isso é verdadeiro porque a área correspondente a uma linha que representa um único ponto é igual a zero. Por exemplo, caso x represente a estatura de uma estudante do sexo feminino, aleatoriamente selecionada a partir daquela universidade, então, a probabilidade de que esta estudante tenha exatamente 67 polegadas de altura é igual a zero, ou seja,

Figura 6.4 – A probabilidade de um único valor de x é zero

Em geral, se a e b forem dois dos valores que x pode assumir, então

e

Com base nisso, podemos deduzir que, para uma variável aleatória continua,

6.2 – DISTRIBUIÇÃO NORMAL

118

Page 119: Apostila Probabilidade e Estatística 2009

A distribuição de Probabilidades Normal – Uma distribuição de probabilidades normal, quando colocada em um gráfico, fornece uma curva em formato de sino, de maneira que

1. A área total sob a curva é igual a 1,0.

2. A curva é simétrica em torno da média aritmética.

3. As duas caudas da curva se estendem até o infinito.

Figura 6.5 – Distribuição normal com média aritmética e desvio-padrão .

Uma distribuição normal possui as três características a seguir:

1. A área total sob uma curva da distribuição normal é igual a 1,0 ou 100%, conforme mostra a figura 6.6.

Figura 6.6 – Área total sob uma curva da normal

119

Page 120: Apostila Probabilidade e Estatística 2009

2. Uma curva da distribuição normal é simétrica em torno da média aritmética. Conseqüentemente, 1/2 da área total sob uma curva da distribuição normal se posiciona no lado esquerdo da média aritmética e 1/2 se posiciona no lado direito da média aritmética.

Figura 6.7 – Uma curva da normal é simétrica em torno da média aritmética

3. As caudas de uma curva da distribuição normal se estendem infinitamente em ambas as direções sem tocar ou cruzar o eixo horizontal. Embora uma curva da distribuição normal nunca encontre o eixo horizontal, além dos pontos representados por e , ela se torna tão próxima deste eixo que a área sob a curva além desses pontos, em ambas as direções, pode ser considerada como praticamente igual a zero.O valor de determina o centro de uma curva da distribuição normal no eixo horizontal, e o valor de fornece a dispersão da curva da distribuição normal.

Figura 6.8 – As áreas da curva da normal além de .

As três curvas da distribuição normal desenhadas na figura 6.9 possuem a mesma média aritmética, mas diferentes desvios-padrão.

Em contrapartida, as três curvas da distribuição normal apresentadas na Figura 6.10 possuem diferentes médias aritméticas, mas o mesmo desvio-padrão.

120

Page 121: Apostila Probabilidade e Estatística 2009

Figura 6.10 – Três curvas de distribuição normal, com diferentes médias aritméticas mas com o mesmo desvio-padrão

6.3 – DISTRIBUIÇÃO NORMAL PADRONIZADA

Definição

Distribuição Normal Padronizada – A distribuição normal, com e é chamada de distribuição normal padronizada.

As unidades para a curva da distribuição normal padronizada são representadas por e são chamadas de valores de z ou resultados de z. Essas unidades são chamadas também de unidades-padrão ou resultados-padrão.

Figura 6.11 – Curva da distribuição normal padronizada

121

Page 122: Apostila Probabilidade e Estatística 2009

DefiniçãoValores de z ou Resultados de z – As unidades marcadas no eixo horizontal da

curva da normal padronizada são representadas por z e são chamadas de valores de z ou resultados de z. Uma valor específico de z fornece a distância entre a média aritmética e o ponto representado por z em termos do desvio-padrão.

Aprendemos anteriormente que a área total sob uma curva de distribuição normal é igual a 1,0. Aprendemos também que, em decorrência da simetria, a área em cada um dos lados da média aritmética corresponde a 0,5. Este fato é demonstrado na Figura 6.12.

OBS:Embora os valores de z no lado esquerdo da média aritmética sejam negativos, a

área sob a curva é sempre positiva.

A área sob a curva da normal padronizada, entre quaisquer dois pontos, pode ser interpretada como a probabilidade de que z assuma um valor dentro daquele intervalo.

Figura 6.12 – Área sob a curva da normal padronizadaExemplo 6.1Encontre a área sob a curva da normal padronizada entre e .

SoluçãoDividimos o número 1,95 em duas partes: 1,9 (o digito anterior à casa decimal e o

digito posterior à casa decimal) e 0,05 (o segundo digito depois da casa decimal). (Observe que 1,95 = 1,9 + 0,05 .) Para encontrar a área desejada, sob a curva da normal padronizada, localizamos 1,9 na coluna correspondente a z, no lado esquerdo da tabela VII, e 0,05 na linha correspondente a z na parte superior da Tabela VII. O valor no qual a linha para 1,9 e a coluna para 0,05 fazem uma interseção fornece a área sob a curva da normal padronizada, entre z = 0 e z = 1,95.Tabela 6.1Área sob a curva da Normal Padronizada, desde z = 0 até z = 1,95z 0,00 0,01 ... 0,05 ... 0,090,0 0,0000 0,0040 ... 0,0199 ... 0,03590,1 0,0398 0,0438 ... 0,0596 ... 0,07530,2 0,0793 0,0832 ... 0,0987 ... 0,1141. . . ... . ... .. . . ... . ... .. . . ... . ... .1,9 0,4713 0,4719 ... 0,4744 ... 0,4767. . . ... . ... .

122

Page 123: Apostila Probabilidade e Estatística 2009

. . . ... . ... .

. . . ... . ... .3,0 0,4987 0,4987 .. 0,4989 ... 0,4990

A área entre z = 0 e z = 1,95 pode ser interpretada como a probabilidade de que z assuma um valor entre 0 e 1,95; ou seja,

Área entre 0 e 1,95 =

Figura 6.13 – Área entre z = 0 e z = 1,95

Conforme mencionado anteriormente, a probabilidade de que uma variável aleatória contínua assuma um único valor é igual a zero. Por conseguinte,

e

Assim sendo,

Exemplo 6.2Encontre a área sob a curva da normal padronizada, desde z = -2,17 até z = 0.

Solução:Uma vez que a distribuição normal é simétrica em torno da média aritmética, a área desde z = -2,17 até z = 0 é igual à área desde z = 0 até z = 2,17, conforme mostra a Figura 6.14.

123

Page 124: Apostila Probabilidade e Estatística 2009

Figura 6.14 – Área desde z = 0 até z = 2,17 igual à área desde z = -2,17 até z = 0.

Para encontrar a área desde z = -2,17 até z = 0, procuramos a área desde z = 0 até z = 2,17, na tabela de distribuição normal padronizada (Tabela VII).

Figura 6.15 – Área desde z = -2,17 até z = 0.

A área desde z = -2,17 até z = 0 fornece a probabilidade de que z se posicione no intervalo –2,17 até 0; ou seja,

Área desde –2,17 até 0 =

Exemplo 6.3Encontre as seguintes áreas sob a curva da normal padronizada.a) Área à direita de z = 2,32

SoluçãoPara encontrar a área à direita de z = 2,32, inicialmente encontramos a área entre z = 0 e z = 2,32. Em seguida, subtraímos esta área de 0,5, que corresponde à área total à direita de z = 0.

Figura 6.16 – Área à direita de z = 2,32.

A área à direita de z = 2,32 fornece a probabilidade de que z seja maior do que 2,32. Por conseguinte,

Área à direita de 2,32 =

124

Page 125: Apostila Probabilidade e Estatística 2009

b) Área à esquerda de z = -1,54SoluçãoPara encontrar a área sob a curva da normal padronizada, à esquerda de z = -1,54, inicialmente encontramos a área entre z = -1,54 e z = 0 e, em seguida, subtraímos esta área de 0,5, que representa à área total à esquerda de z = 0.

Figura 6.17 – Área à esquerda de z = -,154.

A área à esquerda de z = -1,54 fornece a probabilidade de que z seja menor do que –1,54. Por conseguinte,

Área à esquerda de –1,54 =

Exemplo 6.4Encontre as seguintes probabilidades para a curva da normal padronizada.a)

Figura 6.18 – Encontrando

Portanto, a probabilidade procurada é

Área entre 1,19 e 2,12 =

b)

125

Page 126: Apostila Probabilidade e Estatística 2009

Figura 6.19 – Encontrando

Portanto, a probabilidade procurada é

Área entre -1,56 e 2,31 =

c)

Figura 6.20 – Encontre

Portanto, a probabilidade procurada é

Área à direita de -0,75 =

Utilizando a tabela da distribuição normal, podemos agora verificar a regra empírica da seguinte maneira:

1. A área total contida em uma unidade de desvio-padrão em relação à média aritmética é igual a 68,26%. Esta área é fornecida por meio da soma das áreas entre z = -1,0 e z = 0, e entre z = 0 e z = 1,0. Conforme mostrado na figura 6.15, cada uma dessas duas áreas corresponde a 0,3413, ou 34,13%. Conseqüentemente, a área total entre z = -1,0 e z = 1,0 é igual a 68,26%.

Figura 6.21 – Área contida em uma unidade de desvio-padrão em relação à média aritmética.

2. A área total contida em duas unidades de desvio-padrão em relação à média aritmética é igual a 95,44%. Esta área é fornecida pela soma das áreas entre z = -2,0 e z = 0,

126

Page 127: Apostila Probabilidade e Estatística 2009

e entre z = 0 e z = 2,0. Cada uma dessas duas áreas é igual a 0,4772 ou 47,72%. Por conseguinte, a área total entre z = -2,0 e z = 2,0 é igual a 95,44%.

Figura 6.22 – Área contida em duas unidades de desvios-padrão em relação à média aritmética.

3. A área total contida em três unidades de desvio-padrão em relação à média aritmética é igual a 99,74%. Esta área é fornecida pela soma das áreas entre z = -3,0 e z = 0, e entre z = 0 e z = 3,0. Cada uma dessas duas áreas é igual a 0,4987 ou 49,87%. Por conseguinte, a área total entre z = -3,0 e z = 3,0 é igual a 99,74%.

Figura 6.23 - Área contida em três unidades de desvios-padrão em relação à média aritmética.

Exemplo 6.5Encontre as seguintes probabilidades para a curva da normal padronizada.a) SoluçãoUma vez que z = 5,67 é maior do que 3,09, e não pode ser encontrado na Tabela VII, a área sob a curva da normal padronizada, entre z = 0 e z = 5,67, pode ser aproximada para 0,5.

Figura 6.24 – Área entre z = 0 e z = 5,67.

127

Page 128: Apostila Probabilidade e Estatística 2009

A probabilidade procurada é

Área entre 0 e 5,67 = aproximadamente 0,5

Observe que a área entre z = 0 e z = 5,67 não é exatamente 0,5, mas muito próxima de 0,5

b)

SoluçãoA área entre z = -5,35 e z = 0 corresponde aproximadamente 0,5. Conseqüentemente, a área sob a curva da normal padronizada, à esquerda de z = -5,35, é aproximadamente igual a zero.

Figura 6.25 – Área à esquerda de z = -5,35.

A probabilidade procurada é

Área à esquerda de –5,35 =

6.4 – PADRONIZANDO UMA DISTRIBUIÇÃO NORMAL

Convertendo um valor de x em um Valor de z – Para uma variável aleatória normal x, um determinado valor de x pode ser convertido em seu valor correspondente de z utilizando-se a fórmula

onde e correspondem à média aritmética e ao desvio-padrão da distribuição normal de x, respectivamente.

128

Page 129: Apostila Probabilidade e Estatística 2009

Exemplo 6.6Faça com que x seja uma variável aleatória contínua, que possua uma distribuição

normal, com uma média aritmética de 50, e um desvio-padrão de 10. Converta os seguintes valores de x em valores de z.a) x = 55

SoluçãoPara a distribuição normal fornecida, e .

Figura 6.26 – Valor de z para x = 55.

b) x = 35

SoluçãoUma vez que x = 35 encontra-se do lado esquerdo da média aritmética, seu valor de z é negativo.

129

Page 130: Apostila Probabilidade e Estatística 2009

Figura 6.27 – Valor de z para x = 35

OBS:O valor de z para um valor de x que seja maior que é positivo, o valor de z para

um valor de x que seja igual a é zero, e o valor de z para um valor de x que seja menor que é negativo.

Exemplo 6.7Faça com que x seja uma variável aleatória continua, que seja normalmente

distribuída, com uma média aritmética de 25 e um desvio-padrão de 4. Encontre a áreaa) entre x = 25 e x = 32

SoluçãoO valor de z para x = 25 é igual a zero, uma vez que representa a média aritmética da distribuição normal. O valor de x = 32 é

Figura 6.28 – Área entre x = 25 e x = 32

b) entre x = 18 e x = 34SoluçãoInicialmente, calculamos os valores de z para x = 18 e x = 34, da seguinte maneira:

Para x = 18:

Para x = 34:

130

Page 131: Apostila Probabilidade e Estatística 2009

Figura 6.29 – Área entre x = 18 e x = 34.

6.5 – APLICAÇÕES DA DISTRIBUIÇÃO NORMAL

Exemplo 6.8A vida útil de uma calculadora fabricada pela Texas Instruments possui uma

distribuição normal, com uma média aritmética de 54 meses, e um desvio-padrão de 8 meses. A companhia garante que qualquer calculadora que comece a apresentar defeitos, dentro do período de 36 meses após a compra, será substituída por uma nova calculadora. Que percentagem aproximada de calculadoras fabricadas por essa empresa espera-se que tenham de ser substituídas?

Figura 6.30 – Área à esquerda de x = 36.

A probabilidade de que qualquer calculadora, aleatoriamente selecionada, fabricada pela Texas Instruments, venha a começar a apresentar defeitos dentro do período de 36 meses após a compra é igual a .............. Portanto, é esperado que ..........das calculadoras venham a ser substituídas.

6.6 – DETERMINANDO OS VALORES DE Z E DE X QUANDO UMA ÁREA SOB A CURVA DA DISTRIBUIÇÃO NORMAL É CONHECIDA

Vamos encontrar o valor correspondente de z ou x quando uma área sob a curva da distribuição normal é conhecida.

131

Page 132: Apostila Probabilidade e Estatística 2009

Exemplo 6.10Encontre um ponto z tal que a área sob a curva da normal padronizada, entre 0 e z,

seja 0,4251 e o valor de z seja positivo.SoluçãoConforme mostrado na figura 6.31, desejamos encontrar o valor de z tal que a área entre 0 e z seja 0,4251.

Figura 6.31 – Encontrando o valor de z.

Para encontrar o valor desejado de z, localizamos 0,4251 no corpo da tabela da distribuição normal, Tabela VII do Apêndice C. Em seguida, lemos os números na coluna e na linha para z, que correspondem a 0,4251. Conforme mostrado na Tabela, esses números são 1,4 e 0,04, respectivamente. Combinando esses dois números, obtemos o valor desejado de z = 1,44.

Encontrando um Valor de x para uma Distribuição Normal – Para uma curva da normal, com valores conhecidos de e , e para uma determinada área sob a curva, entre a média aritmética e x, o valor de x é calculado como

Exemplo 6.12Quase todos os alunos do curso secundário que pretendem entrar na faculdade

fazem o teste SAT. Em 2002, a média aritmética do resultado do SAT (na prova oral e na prova de matemática) de todos os alunos foi de 1020. Debbie está planejando fazer o teste em breve. Suponha que os resultados do SAT, para todos os alunos que fazem este teste com Debbie, venham a ter uma distribuição normal, com uma média aritmética de 1020, e um desvio-padrão de 153. Qual deve ser o resultado de Debbie neste teste, de maneira que somente 10% de todas as pessoas que estão fazendo o exame façam mais pontos do que ela?

132

Page 133: Apostila Probabilidade e Estatística 2009

Figura 6.32 – Encontrando um valor de x.

Portanto, caso Debbie faça ...........pontos no SAT, é esperado que somente cerca de 10% de todas as pessoas que estarão fazendo o exame venham a fazer mais pontos do que ela.

6.7 – A APROXIMAÇÃO DA NORMAL PARA A DISTRIBUIÇÃO BINOMIAL

A Distribuição Normal como uma Aproximação para a Distribuição Binomial – Geralmente, a distribuição normal é utilizada como uma aproximação para a distribuição binomial, quando e são ambos maiores do que 5, ou seja, quando

e

Definição

Fator de Correção para Continuidade – A soma 0,5 ao valor, ou valores, de x e/ou a subtração de 0,5 do valor, ou valores, de x, quando a distribuição normal é utilizada como uma aproximação para a distribuição binomial, onde x representa o número de sucessos em n testes, é chamada de fator de correção para continuidade.

Exemplo 6.13Em uma pesquisa recente, realizada pela revista Money, 80% das mulheres (casadas

ou solteiras) entrevistadas afirmaram que possuem agora um maior conhecimento sobre investimentos do que tinham há apenas cinco anos atrás (Money, junho de 2002). Suponha que esse resultado seja verdadeiro para a população atual de todas as mulheres. Qual é a probabilidade de que, em uma amostra aleatória de 100 mulheres, 72 a 76 delas venham a afirmar que sabem mais sobre investimentos agora do que há apenas cinco anos atrás?

SoluçãoFaça com que n represente o número total de mulheres na amostra; x corresponde ao número de mulheres na amostra que afirmaram que possuem maior conhecimento sobre investimentos agora do que há cinco anos atrás; e p seja a probabilidade de que uma mulher afirme que possui maior conhecimento sobre investimentos agora do que há apenas cinco anos atrás. Então, este corresponde a um problema binomial, com

n = p = q =

Desejamos encontrar a probabilidade de 72 a 76 sucessos em 100 testes. Uma vez que n é grande, é mais fácil aplicar a aproximação da normal do que utilizar a fórmula binomial. Podemos verificar que np e nq são ambos maiores do que 5. A média aritmética e o desvio-padrão da distribuição binomial são

133

Page 134: Apostila Probabilidade e Estatística 2009

Para realizar a correção para continuidade, subtraímos 0,5 de 72 e somamos 0,5 de 76, para obter o intervalo de 71,5 a 76,5. Com base na área sob a curva da distribuição normal, desde x = 71,5 até x = 76,5.

Para x = 71,5:

Para x = 76,5:

Figura 6.33 – Área desde x = 71,5 até x = 76,5.

Portanto, a probabilidade de que 72 a 76 mulheres, em uma amostra aleatória de 100 mulheres, afirmaram que possuem mais conhecimento sobre investimentos agora do que tinham há cinco anos atrás é aproximadamente .....................

EXERCÍCIOS1) Encontre a área sob a curva da normal padronizadaa) entre z = 0 e z = 1,95

b) entre z = 1,15 e z = 2,37

134

Page 135: Apostila Probabilidade e Estatística 2009

c) desde z = -1,53 até z = -2,88

d) desde z = -1,67 até z = 2,44

2) Encontre a área sob a curva da normal padronizadaa) à direita de z = 1,56

b) à esquerda de z = -1,97

3) Determine as seguintes probabilidades para a distribuição normal padronizada.a)

b)

4) Encontre o valor de z para cada um dos seguintes valores de x, para uma distribuição normal com e .

135

Page 136: Apostila Probabilidade e Estatística 2009

a)

b)

c)

d)

5) Encontre as seguintes áreas sob a curva da distribuição normal, com e .a) Área entre x = 20 e x = 27

b) Área entre x = 23 e x = 25

c) Área desde x = 9,5 até x = 17

6) Faça com que x seja uma variável aleatória contínua, que seja normalmente distribuída, com uma média aritmética de 25 e um desvio-padrão de 6. Encontre a probabilidade de que x assuma um valora) entre 29 e 35

b) entre 22 e 33

136

Page 137: Apostila Probabilidade e Estatística 2009

7) Faça com que x represente o tempo necessário para completar uma corrida. Suponha que x seja distribuído de maneira aproximadamente normal, com uma média aritmética de 190 minutos e um desvio-padrão de 21 minutos. Se um corredor for selecionado ao acaso, qual é a probabilidade de que este corredor venha a completar essa corridaa) em menos de 150 minutos?

b) em 205 até 245 minutos?

8) O U.S. Bureau of Labor Statistic (Departamento de Estatísticas do Trabalho dos EUA) conduz pesquisas periódicas com o intuito de coletar informações sobre o mercado de trabalho. De acordo com uma dessas pesquisas, a média de salários dos trabalhadores do comércio varejista foi de $10 por hora em agosto de 2002 (Bureau of Labor Statistics News, 18 de setembro de 2002). Suponha que os salários por hora desses trabalhadores, em agosto de 2002, possuam uma distribuição normal, com uma média aritmética de $10 e um desvio-padrão de $1,10. Encontre a probabilidade de que os salários por hora de um trabalhador do comércio varejista, aleatoriamente selecionado, em agosto de 2002, sejaa) mais que $12

b) entre $8,50 e $10,80

137

Page 138: Apostila Probabilidade e Estatística 2009

9) De acordo com registros de uma empresa de serviços de energia elétrica da área de Boston, a média aritmética do consumo de energia elétrica para todos os domicílios, durante o inverno, é igual a 1650 quilowatts-hora por mês. Suponha que o consumo mensal de energia elétrica durante o inverno, por parte de todos os domicílios nessa área, possua uma distribuição normal, com uma média aritmética de 1650 quilowatts-hora e desvio-padrão de 320 quilowatts-hora.a) Encontre a probabilidade de que o consumo mensal de energia elétrica durante o inverno, por parte de um domicílio aleatoriamente selecionado dessa área, seja inferior a 1850 quilowatts-hora.

b) Que percentagem dos domicílios nessa área possui um consumo de energia elétrica de 900 até 1340 quilowatts-hora.

10) A media do resultado da prova de matemática do SAT foi 516 em 2002. Suponha que os resultados da prova de matemática de todos os alunos que fizeram o SAT em 2002 tivessem sido normalmente distribuídos, com uma média aritmética de 516 e um desvio-padrão de 90.a) Que percentagem dos alunos fez mais do que 600 pontos nessa prova?

b) Que percentagem dos alunos fez mais do que 450 pontos nessa prova?

138

Page 139: Apostila Probabilidade e Estatística 2009

c) Uma faculdade técnica de elite exige que o resultado da prova de matemática do SAT de um aluno seja 700 ou mais, de modo que esse aluno possa ser considerado apto para fins de matrícula. Que percentagem de alunos que fizeram o SAT em 2002 será apta para ser matriculada nessa faculdade?

11) Faça com que x seja uma variável aleatória contínua, que segue uma distribuição normal, com uma média aritmética de 200 e um desvio-padrão de 25. Encontre o valor de x, tal que a área sob a curva da normal, à esquerda de x, seja aproximadamente 0,6330.

7. DISTRIBUIÇÕES DE AMOSTRAGEM

7.1- DISTRIBUIÇÕES DA POPULAÇÃO E DISTRIBUIÇÃO DE AMOSTRAGEM

7.1.1- Distribuição da População

139

Page 140: Apostila Probabilidade e Estatística 2009

Definição: A distribuição da população representa a distribuição de probabilidade dos dados da população.

Suponha que existam somente cinco alunos em um curso avançado de estatística, e que os resultados das provas semestrais para esses cinco alunos sejam

70 78 80 80 95

Faça com que x represente o resultado correspondente a um aluno. Utilizando classes de valor único (uma vez que existem cinco valores de dados, não é necessário agrupá-los). Podemos construir a distribuição de freqüências dos resultados, na forma apresentada na Tabela 7.1, juntamente com as freqüências relativas de classes, que são obtidas por meio da divisão das freqüências de classes pelo tamanho da população. A Tabela 7.2, que representa as probabilidades correspondentes aos vários valores de x, ilustra a distribuição de probabilidades da população. Observe que essas probabilidades são iguais as freqüências relativas.

Tabela 7.1Distribuição de Freqüências da População e DistribuiçãoDe Freqüências Relativas da População_________________________________________________x f Freqüência Relativa_________________________________________________70 1 1/5 = 0,2078 1 1/5 = 0,2080 2 2/5 = 0,4095 1 1/5 = 0,20_________________________________________________

N = 5 Soma = 1,00_________________________________________________

Tabela 7.2Distribuição de Probabilidades da População____________________________________x P(x)____________________________________70 0,2078 0,20

140

Page 141: Apostila Probabilidade e Estatística 2009

80 0,4095 0,20______________________________________

______________________________________

Os valores da média aritmética e o desvio-padrão, calculados para a distribuição de probabilidades da Tabela 7.2, fornecem os valores dos parâmetros da população, e . Esses valores são e

7.1.2 – Distribuição da Amostragem

Definição: A distribuição de probabilidades de é chamada de distribuição de amostragem de . Ela representa os vários valores que pode assumir, bem como a probabilidade de cada valor de .

Em geral, a distribuição de probabilidades de uma estatística da amostra é chamada de distribuição de amostragem dessa estatística.

Reconsidere a população relativa aos resultados semestrais correspondentes a cinco alunos, fornecidos na Tabela 7.1. Considere todas as amostras possíveis, com três resultados cada, que possam ser selecionados sem reposição a partir daquela população.

Número total de amostras =

7.2 - ERROS DE AMOSTRAGEM E ERROS NÃO INERENTES À AMOSTRAGEM

7.2.1 - Erro de Amostragem

Definição: Representa a diferença entre o valor de uma estatística da amostra e o valor do parâmetro correspondente da população. No caso da média aritmética,

Erro de amostragem =

considerando-se que a amostra seja aleatória e que nenhum erro não inerente à amostragem tenha sido cometido.7.2.2 – Erros Não Inerentes à Amostragem

Definição: Os erros que ocorrem na coleta, no registro e na tabulação de dados são chamados de erros não inerentes à amostragem.

141

Page 142: Apostila Probabilidade e Estatística 2009

Exemplo 7.1Reconsidere a população relativa aos cinco resultados fornecidos na Tabela 7.1.

Suponha que uma amostra de três resultados seja selecionada a partir dessa população e que essa amostra inclua os resultados 70, 80 e 95. Encontre o erro de amostragem.

Solução:A média aritmética da população é

A média aritmética para essa amostra é

Conseqüentemente,

Erro de amostragem =

7.3 – MÉDIA ARITMÉTICA E DESVIO-PADRÃO DE

Definição: A média aritmética da distribuição de amostragem de e o desvio-padrão da distribuição de amostragem de são chamados de média aritmética de de desvio-padrão de e são representados por e , respectivamente.

Média Aritmética da Distribuição de Amostragem de : A média aritmética da distribuição de amostragem de é sempre igual a média aritmética da população. Dessa maneira,

O desvio-padrão de é igual ao desvio-padrão da população, dividido pela raiz quadrada do tamanho da amostra; ou seja,

Esta fórmula para o desvio-padrão de permanece verdadeira somente quando a amostragem é feita sem reposição, a partir de uma população finita, ou é feita com ou sem reposição, a partir de uma população infinita. Essas duas condições podem ser substituídas pela condição de que a fórmula anterior permaneça verdadeira, se o tamanho da amostra for pequeno quando comparado com o tamanho da população. O tamanho da amostra é considerado pequeno quando comparado com o tamanho da população caso o tamanho da amostra seja igual ou menor do que 5% do tamanho da população – ou seja, se,

Se esta condição não for satisfeita, utilizamos a seguinte fórmula para calcular

142

Page 143: Apostila Probabilidade e Estatística 2009

onde o fator

é chamado de fator de correção de população finita.

Na maior parte das aplicações práticas, o tamanho da amostra é pequeno, comparado ao tamanho da população. Conseqüentemente, na maior parte dos casos, a

fórmula utilizada para calcular é .

Desvio-Padrão da Distribuição de Amostragem de : O desvio-padrão da distribuição de amostragem de é

onde representa o desvio-padrão da população, e n é o tamanho da amostra. Esta fórmula

é utilizada quando , onde N é o tamanho da população.

Exemplo 7.2A média aritmética do salário, por hora, para todos os 5000 empregados que

trabalham em uma grande empresa, é de $17,50, e o desvio-padrão é $2,90. Faça com que seja a média aritmética do salário, por hora, para uma amostra aleatória de determinados

empregados, selecionados a partir dessa empresa. Encontre a média aritmética de e o desvio-padrão de para uma amostra com tamanho de

(a) 30

(b)75

(c)200

143

Page 144: Apostila Probabilidade e Estatística 2009

7.4 – FORMATO DA DISTRIBUIÇÃO DE AMOSTRAGEM DE

O formato da distribuição de amostragem de relaciona-se aos seguintes dois casos:1. A população a partir da qual as amostras são extraídas tem uma distribuição normal.2. A população a partir da qual as amostras são extraídas não tem uma distribuição normal.

7.4.1 – Fazendo Amostragem a Partir de uma População Normalmente Distribuída

Quando a população a partir da qual as amostras são extraídas é normalmente distribuída, com sua média aritmética igual a , e seu desvio-padrão igual a , então

1. A média aritmética de , , é igual à média aritmética da população, .

2. O desvio-padrão de , , é igual a , considerando .

3. O formato da distribuição de amostragem de é normal, seja qual for o valor de n.

Distribuição de Amostragem de Quando a População Possui uma Distribuição Normal: Caso a população, a partir da qual as amostras são extraídas, seja normalmente distribuída, com uma média aritmética , e desvio-padrão , então a distribuição de amostragem da média aritmética da amostra, , também será normalmente distribuída, com a média aritmética e o desvio-padrão a seguir apresentados, independentemente do tamanho da amostra:

e

Exemplo 7.3Em um recente teste do SAT, a média aritmética dos resultados para todos os candidatos foi igual a 1020. Considere que a distribuição dos resultados do SAT, para todos os candidatos, seja normal, com uma média aritmética de 1020 e um desvio-padrão de 153. Faça com que

seja a média aritmética dos resultados para o SAT, para uma amostra aleatória de determinados candidatos. Calcule a média aritmética e o desvio-padrão de , e descreva o formato de sua distribuição de amostragem quando o tamanho da amostra for(a) 16

144

Page 145: Apostila Probabilidade e Estatística 2009

(b) 50

(c) 1000

145

Page 146: Apostila Probabilidade e Estatística 2009

7.4.2 – Fazendo Amostragem a Partir de uma População que Não Seja Normalmente Distribuída

O formato da distribuição de amostragem de é deduzido a partir de um teorema muito importante, chamado de teorema do limite central.

Teorema do limite central: De acordo com o teorema do limite central, para uma amostra de tamanho grande, a distribuição de amostragem de é aproximadamente normal, independentemente do formato da distribuição da população. A média aritmética e o desvio-padrão da distribuição de amostragem de são

e

O tamanho da amostra é usualmente considerado como sendo grande, se

De acordo com o teorema do limite central,

1. Quando , o formato da distribuição de amostragem de é aproximadamente normal, independentemente do formato da distribuição da população.

2. A média aritmética de , , é igual à média aritmética da população, .

3. O desvio-padrão de , , é igual a , considerando .

Exemplo 7.4A média aritmética dos aluguéis pagos por todos os inquilinos em uma grande cidade é de $1550, com um desvio-padrão de $225. Entretanto, a distribuição da população de aluguéis, para todos os inquilinos nessa cidade, é assimétrica à direita. Calcule a média aritmética e o desvio-padrão de , e descreva o formato de sua distribuição de amostragem, quando o tamanho da amostra é(a) 30

146

Page 147: Apostila Probabilidade e Estatística 2009

(b) 100

7.5 – APLICAÇÕES DA DISTRIBUIÇÃO DE AMOSTRAGEM DE

Segundo o teorema do limite central, para grandes amostras, a distribuição de amostragem de é aproximadamente normal. Com base nesse resultado, podemos fazer as seguintes afirmações em relação a para grandes amostras. As áreas sob a curva de , mencionadas nessas afirmações, são encontradas a partir da tabela da distribuição normal.

1. Se extrairmos todas as possíveis amostras de mesmo tamanho (grande), a partir de uma população, e calcularmos a média aritmética para cada uma dessas amostras, então aproximadamente 68,26% das médias aritméticas das amostras estarão dentro dos limites de uma unidade de desvio-padrão em relação à média aritmética da população.

147

Page 148: Apostila Probabilidade e Estatística 2009

2. Se extrairmos todas as possíveis amostras de mesmo tamanho (grande), a partir de uma população, e calcularmos a média aritmética para cada uma dessas amostras, então aproximadamente 95,44% das médias aritméticas das amostras estarão dentro dos limites de duas unidades de desvio-padrão em relação à média aritmética da população.

3. Se extrairmos todas as possíveis amostras de mesmo tamanho (grande), a partir de uma população, e calcularmos a média aritmética para cada uma dessas amostras, então aproximadamente 99,74% das médias aritméticas das amostras estarão dentro dos limites de três unidades de desvio-padrão em relação à média aritmética da população.

Exemplo 7.5Considere que os pesos de todas as embalagens de uma determinada marca de biscoitos sejam distribuídos normalmente, com uma média aritmética de 32 onças e um desvio-padrão de 0,3 onças. Encontre a probabilidade de que a média aritmética do peso, , para uma amostra aleatória de 20 embalagens dessa marca de biscoitos, venha a estar entre 31,8 e 31,9 onças. Obs.: 1 onça equivale a 28,35 g.

148

Page 149: Apostila Probabilidade e Estatística 2009

OBS:Valor de z para um valor de : O valor de z para um valor de é calculado como

7.6 – PROPORÇÃO DA POPULAÇÃO E PROPORÇÃO DA AMOSTRA

Proporção da População e Proporção da Amostra: A proporção da população e a

proporção da amostra, representada por p e , respectivamente, são calculadas como

e

ondeN = número total de elementos na populaçãon = número total de elementos na amostraX = número total de elementos na população, que possuem uma característica especifica.x = número total de elementos na amostra, que possuem uma característica especifica.

Exemplo 7.6Suponha que um total de 789.654 famílias resida em uma cidade e 563.282 delas possuam casa própria. Uma amostra de 240 famílias é selecionada a partir dessa cidade, e 158 delas possuem casa própria. Encontre a proporção de famílias na população e na amostra, que possuem casa própria.

Erro de amostragem?

149

Page 150: Apostila Probabilidade e Estatística 2009

7.7 – MÉDIA ARITMÉTICA, DESVIO-PADRÃO E FORMATO DA

DISTRIBUIÇÃO DE AMOSTRAGEM DE

7.7.1 – Distribuição de Amostragem

Definição: A distribuição de probabilidades da proporção da amostra, , é chamada de

sua distribuição de amostragem. Ela fornece os vários valores que pode assumir, bem

como suas propriedades.

Exemplo 7.7A Boe Consultant Associates possui cinco empregados. A tabela 7.3 fornece os nomes desses cinco empregados, e informações em relação a seu conhecimento sobre estatística.Tabela 7.3Informações sobre os Cinco Empregadosda Boe Consultant Associates______________________________________Nome Conhece Estatística______________________________________Ally simJohn nãoSusan nãoLee simTom sim_____________________________________

Se definirmos a proporção da população, p, como a proporção de empregados que conhecem estatística, então

Agora, suponha que extraiamos todas as amostras possíveis, com três empregados cada, e calculemos a proporção de empregados, para cada amostra, que conhece estatística. O número total de amostras de tamanho três, podem ser extraídas dessa população de cinco empregados é,

Número total de amostras =

A tabela 7.4 apresenta essas 10 amostras possíveis, e a proporção de empregados que conhecem estatística, para cada uma dessas amostras. Observe que arredondamos os

valores de para duas casas decimais.

Utilizando a Tabela 7.4, preparamos a distribuição de freqüências de , conforme

registrado na Tabela 7.5, juntamente com as freqüências relativas de classes, que são obtidas pela divisão entre as freqüências de classes e o tamanho da população. As

150

Page 151: Apostila Probabilidade e Estatística 2009

freqüências relativas são utilizadas como probabilidades, e estão apresentadas na tabela 7.6.

Esta tabela fornece a distribuição de amostragem de .

Tabela 7.4Todas as Amostras Possíveis de Tamanho 3,

e os Valores de para cada Amostra

__________________________________________________

Amostra Proporção que Conhece Estatística

___________________________________________________Ally, John, Susan 1/3 = 0,33Ally, John, Lee 2/3 = 0,67Ally, John, Tom 2/3 = 0,67Ally, Susan, Lee 2/3 = 0,67Ally, John, Tom 2/3 = 0,67Ally, Lee, Tom 3/3 = 1,00John, Susan, Lee 1/3 = 0,33John, Susan, Tom 1/3 = 0,33John, Lee, Tom 2/3 = 0,67Susan, Lee, Tom 2/3 = 0,67___________________________________________________

Tabela 7.5

Distribuição de Freqüências e Distribuição de Freqüências Relativas

Quando o Tamanho da Amostra é 3_______________________________________________________________

f Freqüência Relativa

_______________________________________________________________0,33 3 3/10 = 0,300,67 6 6/10 = 0,601,00 1 1/10 = 0,10_______________________________________________________________

Soma = 1,00______________________________________________________________

Tabela 7.6

Distribuição de Amostragem de

Quando o Tamanho da Amostra é 3____________________________________

P( )

____________________________________0,33 0,30

151

Page 152: Apostila Probabilidade e Estatística 2009

0,67 0,601,00 0,10___________________________________

__________________________________

7.7.2 – Média Aritmética e Desvio-Padrão de

Média Aritmética da Proporção da Amostra: A média aritmética da proporção da

amostra, , é representada por , e é igual à proporção da população, p. Dessa maneira,

A proporção da amostra, , é chamada de estimador da proporção da população, p.

Desvio-Padrão da Proporção da Amostra: O desvio-padrão da proporção da

amostra, , é representado por , e é fornecido pela fórmula

onde p é a proporção da população, , e n é o tamanho da amostra. Esta fórmula é

utilizada quando , onde N é o tamanho da população.

Entretanto, se for maior do que 0,05, então é calculado como segue:

onde o fator

é chamado de fator de correção de população finita.

7.7.3 – Formato da Distribuição de Amostragem de

O formato da distribuição de amostragem de é deduzido a partir do teorema do

limite central.

152

Page 153: Apostila Probabilidade e Estatística 2009

Teorema do Limite Central para a Proporção da Amostra: De acordo com o

teorema do limite central, a distribuição de amostragem de é aproximadamente normal

para uma amostra de tamanho suficientemente grande. No caso da proporção, o tamanho da amostra é considerado como suficientemente grande se np e nq forem ambos maiores do que 5, ou seja, se

Exemplo 7.8A Pesquisa Nacional das Matrículas de Alunos nos EUA mostrou que 87% dos calouros e quartanistas classificaram a sua experiência na faculdade como “boa” ou “excelente” (USA TODAY, 12 novembro de 2002). Considere esse resultado como verdadeiro para a

população atual de todos os calouros e quartanistas. Faça com que seja a proporção de

calouros e quartanistas, em uma amostra aleatória de 900 calouros e quartanistas que

mantêm esse ponto de vista. Encontre a média aritmética e o desvio-padrão de e

descreva o formato de sua distribuição de amostragem.

7.8 – APLICAÇÕES DA DISTRIBUIÇÃO DE AMOSTRAGEM DE

Exemplo 7.9De acordo com uma pesquisa da Universidade de Michigan, realizada em 2002, somente cerca de um terço dos norte-americanos esperavam que os cinco anos seguintes trouxessem tempos de contínua felicidade (The New York Times, 11 de novembro de 2002). Considere que 33% da atual população de todos os norte-americanos mantenham essa opinião. Faça

com que seja a proporção, em uma amostra aleatória de 800 norte-americanos que irão

manter essa opinião. Encontre a probabilidade de que o valor de esteja entre 0,35 e

0,37.

153

Page 154: Apostila Probabilidade e Estatística 2009

OBS:

Valor de z para um valor de : O valor de z para um valor de é calculado como

Exemplo 7.10Maureen Webster, que está concorrendo para a prefeitura em uma grande cidade, declara que é favorita de 53% de todos os eleitores registrados naquela cidade. Considere que esta afirmação seja verdadeira. Qual a probabilidade de que, em uma amostra aleatória de 400 eleitores registrados, extraída a partir daquela cidade, menos do que 49% venham a votar a favor de Maureen Webster?

154

Page 155: Apostila Probabilidade e Estatística 2009

LISTA DE EXERCÍCIOS1) A média aritmética mensal dos custos relativos a medicamentos com receita médica, para todos os cidadãos idosos em uma cidade, é igual a $233, com um desvio-padrão correspondente a $72. Faça com que seja a média aritmética de tais custos para uma amostra aleatória de 25 cidadãos idosos dessa cidade. Encontre a média aritmética e o desvio-padrão da distribuição de amostragem de .

2) Suponha que o desvio-padrão dos custos de recrutamento por jogadora, para todas as jogadoras de basquete recrutadas por todas as universidades públicas no centro-oeste dos EUA, seja $405. Faça com que seja a média aritmética dos custos de recrutamento para uma amostra de um determinado número de tais jogadoras. Qual tamanho de amostra irá fornecer um desvio-padrão de igual a $45?

3) Os GPAs para todos os 5540 alunos matriculados em uma universidade possuem uma distribuição aproximadamente normal, com uma média aritmética de 3,02 e um desvio-padrão de 0,29. Faça com que seja a média aritmética do GPA para uma amostra aleatória de 48 alunos, selecionada a partir dessa universidade. Encontre a média aritmética e o desvio-padrão de , e comente sobre o formato de sua distribuição de amostragem.

4) De acordo com estimativas do U.S. Bureau of Labor Statistics, a média dos salários dos trabalhadores na construção civil era de $18,96 por hora, em agosto de 2002 (Bureau of Labor Statistics News, 18 de setembro de 2002). Considere que os salários atuais de todos os trabalhadores na construção civil sejam normalmente distribuídos, com uma média

155

Page 156: Apostila Probabilidade e Estatística 2009

aritmética igual a $18,96 por hora e um desvio-padrão igual a $3,60 por hora. Encontre a probabilidade de que a média aritmética dos salários, por hora, de uma amostra aleatória de 25 trabalhadores na construção civil,a) esteja entre $18 e $20 por hora

b) seja maior do que a média aritmética da população em $1,5 ou mais.

5) As dividas com cartão de crédito para todos os alunos de faculdade possuem uma distribuição que é assimétrica à direita, com uma média aritmética de $1840 e um desvio-padrão de $453. Encontre a probabilidade de que a média aritmética das dividas com cartão de crédito, para uma amostra aleatória de 36 alunos de faculdade, venha a

156

Page 157: Apostila Probabilidade e Estatística 2009

a) estar entre $1750 e $1950

b) ser menor que $1700

6) As estaturas de todos os adultos em uma grande cidade possuem uma distribuição que é assimétrica à direita, com uma média aritmética de 68 polegadas (aproximadamente 1,73m) e um desvio-padrão de 4 polegadas (aproximadamente 0,10m). Encontre a probabilidade de que a média aritmética das estaturas de uma amostra aleatória de 100 alunos, selecionados a partir dessa cidade,a) seja menor do que 67,8 polegadas

b) esteja entre 67,5 polegadas e 68,7 polegadas

157

Page 158: Apostila Probabilidade e Estatística 2009

c) seja menor do que a média aritmética da população, em 0,5 polegadas ou mais

7) Em uma pesquisa com trabalhadores, realizada pela International Communications Research para a J. Howard & Associates, 39% afirmaram que o mérito era a chave para a promoção, enquanto que outros indicaram antiguidade, amizade ou sorte (USA TODAY, 2 de outubro de 2002). Considere que 39% de todos os atuais trabalhadores sintam que o

mérito seja a chave para a promoção, e que seja a proporção de trabalhadores, em uma

amostra aleatória de 300 trabalhadores, que mantenham esse ponto de vista. Encontre a

probabilidade de que o valor de

a) esteja entre 0,35 e 0,45

b) seja maior do que 0,36

158

Page 159: Apostila Probabilidade e Estatística 2009

8) A Brooklyn Corporation fabrica CDs. É conhecido que a máquina que é utilizada para fabricar esses CDs produz 6% de CDs defeituosos. O inspetor de controle de qualidade seleciona uma amostra de 100 CDs a cada semana e os inspeciona em relação a estarem perfeitos ou defeituosos. Se 8% ou mais, dentre os CDs na amostra, forem defeituosos, o processo é interrompido e a máquina é ajustada. Qual é a probabilidade de que, com base em uma amostra de 100 CDs, o processo venha a ser interrompido para ajustar a máquina?

8. ESTIMATIVA DA MÉDIA ARITMÉTICA E DA PROPORÇÃO

159

Page 160: Apostila Probabilidade e Estatística 2009

8.1 – ESTIMATIVA: UMA INTRODUÇÃO

Estimativa: É a atribuição de um valor, ou valores, a um parâmetro de uma população, com base em um valor da estatística correspondente da amostra.

A estatística da amostra, utilizada para estimar um parâmetro da população, é chamada de estimador.

O procedimento de estimativa envolve as seguintes etapas:1. Selecionar uma amostra.2. Coletar as informações necessárias a partir de membros da amostra.3. Calcular o valor da estatística da amostra.4. Atribuir valor (ou valores) ao parâmetro correspondente da população.

8.2- ESTIMATIVAS DE PONTO E ESTIMATIVAS DE INTERVALO

8.2.1 – Uma Estimativa de Ponto

Definição

Estimativa de Ponto: O valor de uma estatística da amostra, que é utilizado para estimar um parâmetro da população, é chamado de estimativa de ponto.

Para a estimativa da média aritmética da população, a margem de erro é calculada da seguinte maneira:

Margem de erro = ou

Ou seja, encontramos o desvio-padrão da média aritmética da amostra e multiplicamos por 1,96. Nesse caso, representa um estimador de ponto de .

8.2.2 – Uma Estimativa de Intervalo

Definição

Estimativa de Intervalo: Na estimativa de intervalo, um intervalo é construído em torno da estimativa de ponto, e é afirmado que esse intervalo é passível de conter o parâmetro correspondente da população.

Nível de Confiança e Intervalo de Confiança: Cada intervalo é construído com relação a um determinado nível de confiança, e é chamado de intervalo de confiança. O nível de confiança associado a um intervalo de confiança declara a dimensão da confiança que

160

Page 161: Apostila Probabilidade e Estatística 2009

temos de que esse intervalo contém o verdadeiro parâmetro da população. O nível de confiança é representado por .

Embora qualquer valor correspondente ao nível de confiança possa ser escolhido para construir um intervalo de confiança, os valores mais comuns são 90%, 95% e 99%. Os coeficientes de confiança correspondentes são 0,90; 0,95 e 0,99.

8.3 – ESTIMATIVA DE INTERVALO DA MÉDIA ARITMÉTICA DE UMA POPULAÇÃO: AMOSTRAS GRANDES

Quando o tamanho da amostra for 30 ou mais, iremos utilizar a distribuição normal para construir um intervalo de confiança para . Sabemos, com base no capitulo 7,

que o desvio-padrão de é . No entanto, caso o desvio-padrão da população, ,

não seja conhecido, então utilizamos o desvio-padrão da amostra, , substituindo . Conseqüentemente, utilizamos

para . Observe que o valor de representa uma estimativa de ponto de .

Intervalo de Confiança para para Grandes Amostras: O intervalo de confiança para é

se é conhecido se não é conhecido

onde e

O valor de , aqui utilizado, é lido a partir da tabela da distribuição normal padronizada para o nível de confiança especificado.

O valor de (ou , quando não é conhecido), na fórmula do intervalo de confiança, é chamado de erro máximo da estimativa e é representado por .

Definição

Erro Máximo da Estimativa para : O erro máximo da estimativa para , representado por , corresponde ao valor que é subtraído e adicionado ao valor de , de modo a obter um intervalo de confiança para . Por conseguinte,

ou

Exemplo 8.1Uma editora acabou de publicar um novo livro didático para faculdade. Antes de a empresa decidir sobre o preço pelo qual deverá vender esse livro didático, ela deseja conhecer o

161

Page 162: Apostila Probabilidade e Estatística 2009

preço médio de todos os livros desse tipo no mercado. O departamento de pesquisas da empresa extraiu uma amostra de 36 livros didáticos similares e coletou informações em relação a seus preços. Essas informações produziram uma média aritmética de preço de $70,50 para essa amostra. Sabe-se que o desvio-padrão dos preços de todos esses livros didáticos é igual a $4,50.(a) Qual a estimativa de ponto da média aritmética do preço de todos esses livros didáticos para faculdade? Qual a margem de erro para essa estimativa?

(b) Construa um intervalo de confiança de 90% para a média aritmética do preço de todos esses livros didáticos para faculdade.

8.4 – ESTIMATIVA DE INTERVALO DA MÉDIA ARITMÉTICA DE UMA POPULAÇÃO: AMOSTRAS PEQUENAS

Condições nas Quais a Distribuição É Utilizada para Construir um Intervalo de Confiança em Torno de

A distribuição é utilizada para construir um intervalo de confiança em torno de se

1. A população a partir da qual a amostra é extraída é (aproximadamente) distribuída de maneira normal

2. O tamanho da amostra é pequeno (ou seja, n<30)

3. O desvio-padrão da população, , não é conhecido. 8.4.1 – A distribuição

162

Page 163: Apostila Probabilidade e Estatística 2009

Definição

A Distribuição : A distribuição representa um tipo especifico de distribuição em formato de sino, com uma menor altura e uma maior dispersão em comparação com a distribuição normal padronizada. À medida que o tamanho da amostra torna-se maior, a distribuição se aproxima da distribuição normal padronizada. A distribuição possui somente um único parâmetro, conhecido como graus de liberdade . A média aritmética da distribuição é igual a 0 (zero) e o desvio-padrão é igual a .

A figura abaixo mostra a distribuição normal padronizada e a distribuição para 9 graus de liberdade. O desvio-padrão da distribuição normal padronizada é 1,0, e o desvio-padrão da distribuição é

Exemplo 8.2Encontre o valor de para 16 graus de liberdade e uma área de 0,05 na cauda direita de uma curva da distribuição .

Solução:Na Tabela VIII do Apêndice C, localizamos 16 na coluna de graus de liberdade (com o título ) e 0,05 na linha correspondente a Área na cauda direita sob a curva da distribuição no topo da tabela. O valor localizado na interseção entre a linha correspondente a 16 e a

coluna correspondente a 0,05, que corresponde a 1,746, fornece o valor desejado de .

8.4.2 – Intervalo de Confiança para Utilizando a Distribuição

Quando as três condições a seguir se mantêm verdadeiras, utilizamos a distribuição para construir um intervalo de confiança para a média aritmética da população, .

163

Page 164: Apostila Probabilidade e Estatística 2009

1. A população a partir da qual a amostra é extraída é (aproximadamente) distribuída de maneira normal.

2. O tamanho da amostra é pequeno (ou seja, n<30).

3. O desvio-padrão da população, , não é conhecido.

Intervalo de Confiança para para Amostras Pequenas: O intervalo de confiança de corresponde a

onde

O valor de é obtido a partir da tabela da distribuição para graus de liberdade e para o nível de confiança especificado.

Exemplo 8.3O Dr. Moore desejava estimar a média aritmética do nível de colesterol para todos os adultos do sexo masculino que moram em Hartford. Ele extraiu uma amostra de 25 adultos do sexo masculino de Hartford e descobriu que a média aritmética do nível de colesterol para esta amostra correspondia a 186, com um desvio-padrão igual a 12. Considere que os níveis de colesterol para todos os adultos do sexo masculino em Hartford sejam aproximadamente distribuídos de maneira normal. Construa um intervalo de confiança de 95% para a média aritmética, .

Exemplo 8.4Vinte e cinco adultos aleatoriamente selecionados, que compram livros para leitura em geral, foram questionados em relação à quantia em dinheiro que geralmente gastam em livros por ano. A amostra produziu uma média aritmética de $1450 e um desvio-padrão de

164

Page 165: Apostila Probabilidade e Estatística 2009

$300 para essas despesas anuais. Considere que essas despesas, para todos os adultos que compram livros para leitura em geral, possuam uma distribuição aproximadamente normal. Determine um intervalo de confiança de 99% para a média aritmética correspondente da população.

8.5 - ESTIMATIVA DE INTERVALO DA PROPORÇÃO DE UMA POPULAÇÃO: AMOSTRAS GRANDES

Com base no capitulo 7, sabemos que, para grandes amostras:

1. A distribuição de amostragem da proporção da amostra, , é (aproximadamente)

normal.

2. A média aritmética, , da distribuição de amostragem de é igual à proporção da

população, p.

3. O desvio-padrão, da distribuição de amostragem da proporção da amostra, , é

, onde .

Estimador do Desvio-Padrão de : O valor de , que fornece uma estimativa de

ponto de , é calculado como

A proporção da amostra, , representa o estimador de ponto da população

correspondente, p. Da mesma maneira que no caso da média aritmética, sempre que utilizamos a estimativa de ponto para a proporção da população calculamos a margem de erro associada àquela estimativa de ponto. Para a estimativa da proporção da população, a margem de erro é calculada da seguinte maneira:

165

Page 166: Apostila Probabilidade e Estatística 2009

Margem de erro:

Ou seja, encontramos o desvio-padrão da proporção da amostra e multiplicamos esse valor por 1,96. O intervalo de confiança ( para p é construído utilizando-se a fórmula a seguir apresentada.

Intervalo de Confiança para a Proporção da População, p: O intervalo de confiança para a proporção da população, p, é

O valor de , utilizado neste caso, é obtido a partir da tabela da distribuição normal

padronizada para o nível de confiança especificado e .

Exemplo 8.5De acordo com uma pesquisa realizada em 2002 pela Findlaw.com, 20% dos norte-americanos necessitaram de consultoria jurídica durante o ano anterior, com o objetivo de solucionar questões espinhosas, como custódias de filhos e litígios entre locador e locatório (CBS. MarketWatch.com, 6 de agosto de 2002). Suponha que uma amostra recente de 1000 adultos norte-americanos tenha mostrado que 20% deles precisaram de consultoria jurídica durante o ano anterior para resolver essas questões civis.(a) Qual é a estimativa de ponto da proporção da população? Qual é a margem de erro dessa estimativa?

(b) Encontre, com um nível de confiança de 99%, a percentagem de todos os adultos norte americanos que precisaram de consultoria jurídica durante o ano de 2001 para resolver questões civis.

166

Page 167: Apostila Probabilidade e Estatística 2009

Exemplo 8.6De acordo com a análise de uma pesquisa de opinião realizada pelo grupo CNN-USA TODAY-Gallup, em outubro de 2002, “o estresse tornou-se uma parcela comum da vida diária nos Estados Unidos. As demandas de trabalho, família e afazeres domésticos representam um fardo na vida norte-americano típico”. De acordo com essa pesquisa, 40% dos norte-americanos incluídos na pesquisa indicaram que possuíam uma quantidade de tempo limitada para relaxar (Gallup.com, 8 de novembro de 2002). A pesquisa foi baseada em uma amostra de nível nacional de 1502 adultos aleatoriamente selecionados, com idade de 18 anos ou mais. Construa um intervalo de confiança de 95% para o proporção da população correspondente.

8.6 – DETERMINANDO O TAMANHO DA AMOSTRA PARA A ESTIMATIVA DA MÉDIA ARITMÉTICA

OBS: Aprendemos que é chamado de erro máximo da estimativa para .

Como sabemos, o desvio-padrão da média aritmética da amostra é igual a . Portanto,

podemos escrever o erro máximo da estimativa para como

167

Page 168: Apostila Probabilidade e Estatística 2009

Determinando o Tamanho da Amostra para a Estimativa de : Sendo conhecido o nível de confiança e o desvio-padrão da população, o tamanho da amostra que irá produzir um erro máximo predeterminado, , da estimativa do intervalo de confiança de , é

Exemplo 8.7Uma associação de ex-alunos deseja estimar a média aritmética das dívidas de alunos graduados este ano. Sabe-se que o desvio-padrão da população das dívidas dos alunos graduados este ano corresponde a $11.800. De que tamanho deve ser a amostra selecionada de maneira tal que a estimativa, com um nível de confiança de 99%, esteja contida no intervalo de $800 em relação à média aritmética da população.

8.7 – DETERMINANDO O TAMANHO DA AMOSTRA PARA A ESTIMATIVA DA PROPORÇÃO

Determinando o Tamanho da Amostra para a Estimativa de p: Sendo conhecidos o nível de confiança e os valores de p e q, o tamanho da amostra que irá produzir um erro máximo predeterminado, , da estimativa do intervalo de confiança de p é

Exemplo 8.8A Lombard Electronics Company acabou de instalar uma nova máquina que fabrica uma peça que é utilizada em relógios. A empresa deseja estimar a proporção de peças defeituosas produzidas por essa máquina. O gerente da empresa deseja que essa estimativa esteja dentro de 0,02 em relação à proporção da população para um nível de confiança de 95%. Qual é a estimativa mais conservadora do tamanho da amostra que irá limitar o erro máximo em até 0,02 em relação à proporção da população?

168

Page 169: Apostila Probabilidade e Estatística 2009

Exemplo 8.9Considere novamente o exemplo 8.8. Suponha que uma amostra preliminar de 200 peças produzidas por essa máquina tenha mostrado que 7% delas seja defeituosas. Que tamanho de amostra a empresa deve selecionar de maneira tal que o intervalo de confiança de 95% para p esteja contido em 0,02 em relação à proporção da população?

LISTA DE EXERCÍCIOS1) O desvio-padrão para uma população é . Uma amostra de 36 observações selecionadas a partir desta população forneceu uma média aritmética igual a 74,8.a) Construa um intervalo de confiança de 90% para .

169

Page 170: Apostila Probabilidade e Estatística 2009

b) Construa um intervalo de confiança de 95% para .

c) Determine um intervalo de confiança de 99% para .

2) De acordo com a revista Money, o patrimônio líquido dos domicílios nos EUA, em 2002, correspondia a $355.000 (Money, outubro de 2002). Suponha que essa média aritmética seja baseada em uma amostra aleatória de 500 domicílios e que o desvio-padrão da amostra seja de $125.000. Construa um intervalo de confiança de 99% para a média aritmética do patrimônio líquido dos domicílios nos EUA em 2002.

3) De acordo com a revista CFO, um típico diretor executivo financeiro ganhou, em 2001, $961.000 (Business Week, 16 de setembro de 2002). Suponha que essa média aritmética seja baseada em uma amostra aleatória de 60 diretores executivos financeiros e que o desvio-padrão da amostra seja $180.000.a) Qual é a estimativa de ponto da média aritmética correspondente da população?

170

Page 171: Apostila Probabilidade e Estatística 2009

b) Construa um intervalo de confiança de 90% para a média aritmética correspondente da população.

4) Encontre o valor de para a distribuição correspondente a cada um dos seguintes itens.a) Área na cauda direita = 0,05 e

b) Área na cauda esquerda = 0,025 e

c) Área na cauda esquerda = 0,001 e

5) Suponha, para uma amostra selecionada a partir de uma população normalmente distribuída; que e .a) Construa um intervalo de confiança de 90% para considerando .

b) Construa um intervalo de confiança de 90% para considerando . A amplitude do intervalo de confiança de 90% é menor do que a amplitude do intervalo de confiança de 95% calculado no item a?

171

Page 172: Apostila Probabilidade e Estatística 2009

6) Uma amostra aleatória de 16 passageiros de uma companhia aérea no aeroporto de Bay City mostrou que a média aritmética do tempo gasto em espera na fila para o check-in no guichê foi de 31 minutos, com um desvio-padrão de 7 minutos. Construa um intervalo de confiança de 99% para a média aritmética do tempo gasto esperando em fila por parte de todos os passageiros naquele aeroporto. Considere que esses tempos de espera para todos os passageiros sejam normalmente distribuídos.

7) Uma empresa deseja estimar a média aritmética do peso líquido de suas caixas do cereal Top Taste. Uma amostra de 16 dessas caixas produziu uma média aritmética do peso líquido equivalente a 31,98 onças, com um desvio-padrão de 0,26 onça. Construa um intervalo de confiança de 95% para a média aritmética do peso líquido de todas as caixas do cereal Top Taste. Considere que o peso líquido de todas essas caixas de cereais possua uma distribuição normal.

8) Em uma pesquisa realizada pela At-a-Glance Communications, 611 trabalhadores de escritório foram questionados em relação ao tempo que levavam para responder a um e-mail (USA TODAY, 7 de maio de 2002). Trinta e seis por cento deles afirmaram que respondem a e-mails tão logo retornam para suas mesas. Suponha que esses 611 trabalhadores de escritório perfaçam uma amostra aleatória de todos os trabalhadores de escritório nos Estados Unidos.

172

Page 173: Apostila Probabilidade e Estatística 2009

a) Qual é a estimativa de ponto da proporção correspondente da população? Qual é a margem de erro associada a essa estimativa de ponto?

b) Encontre um intervalo de confiança de 95% para a proporção correspondente da população.

173

Page 174: Apostila Probabilidade e Estatística 2009

9 – TESTES DE HIPÓTESES EM RELAÇÃO À MÉDIA ARITMÉTICA E EM RELAÇÃO À PROPORÇÃO

9.1 - INTRODUÇÃO

O teste de hipótese é uma técnica para a realização de inferência estatística, isto é, a partir de dados amostrais pode-se generalizar conclusões sobre a população.

Uma hipótese estatística é uma suposição ou afirmação relativa a uma ou mais populações.

Exemplo 9.1A proporção de crianças do sexo masculino nascidos em certa localidade é diferente de 0,5.O teste de hipótese consiste em verificar se a afirmação é verdadeira ou falsa.

9.1.1– Duas Hipóteses

Hipótese Nula: Uma hipótese nula corresponde a uma afirmação (ou declaração a um determinado parâmetro da população, que é presumida como verdadeira, até que seja declarada falsa.

A hipótese alternativa, em nosso exemplo estatístico, será de que a afirmação da empresa é falsa, e que suas latas de refrigerante contêm em média, menos do que 12 onças de refrigerante – ou seja, onças. A hipótese será escrita como

(A afirmação da empresa é falsa)

Hipótese Alternativa: Uma hipótese alternativa é uma afirmação em relação a um determinado parâmetro da população, que será verdadeira se a hipótese nula for falsa.

9.1.2 – Dois Tipos de Erros

Erro do Tipo I: Um erro do tipo I ocorre quando uma hipótese nula verdadeira é rejeitada. O valor de representa a probabilidade de cometer este tipo de erro; ou seja,

é rejeitada | é verdadeira)

O valor de representa o nível de significância para o teste.

Apesar de qualquer valor pode ser atribuído a , os valores comumente utilizados são: 0,01; 0,025; 0,05; e 0,10. Usualmente, o valor atribuído a não excede 0,10 (ou 10%).

Erro do Tipo II: Um erro do tipo II ocorre quando uma hipótese nula falsa não é rejeitada. O valor de representa a probabilidade de cometer um Erro do tipo II; ou seja,

não é rejeitada | falsa)

O valor de é chamado de eficácia do teste. Ele representa a probabilidade de que não seja cometido um Erro do tipo II.

174

Page 175: Apostila Probabilidade e Estatística 2009

Os dois tipos de erro que ocorrem nos testes de hipóteses são dependentes entre si. Não podemos diminuir o valor de e o valor de , simultaneamente, para um teste de hipótese com um tamanho fixo de amostra.Diminuir o valor de irá aumentar o valor de , enquanto diminuir o valor de irá aumentar o valor de .

9.1.3 – Caudas de um Teste

Definição

Caudas do Teste: Um teste bicaudal possui regiões de rejeição em ambas as caudas; um teste com cauda à esquerda possui a região de rejeição na cauda esquerda; e um teste com cauda à direita possui a região de rejeição na cauda direita da curva de distribuição.

Um Teste Bicaudal

De acordo com U.S. Bureau of the Census, a média aritmética do tamanho das famílias nos Estados Unidos correspondia a 3,18 em 1998. Um pesquisador deseja verificar se esta média aritmética se alterou ou não, desde 1998. A palavra-chave, neste caso, é alterou. A média aritmética do tamanho da família terá se alterado caso a média aritmética tenha aumentado ou diminuído ao longo do período desde 1998. Este é um exemplo de teste bicaudal. Faça com que seja a atual média aritmética do tamanho das famílias para todas as famílias. As duas possíveis decisões são:

1. A média aritmética do tamanho das famílias não se alterou – ou seja, .

2. A média aritmética do tamanho das famílias se alterou – ou seja, .

Escrevemos a hipótese nula e a hipótese alternativa para este teste como

(A média aritmética do tamanho das famílias não se alterou) (A média aritmética do tamanho das famílias se alterou)

Um teste com cauda à Esquerda

A hipótese nula e a hipótese alternativa para este teste podem ser escritos como

175

Page 176: Apostila Probabilidade e Estatística 2009

onças (A média aritmética não é menor que 12 onças)onças (A média aritmética é menor que 12 onças)

Considerando como verdadeira, possui uma distribuição normal, para uma amostra grande, com sua média aritmética igual a 12 onças (o valor de em ). Rejeitaremos se o valor de , obtido a partir da amostra, se posicionar na região de rejeição; não rejeitaremos caso ocorra o contrário.

Um Teste com Cauda à Direita

Escrevemos a hipótese nula e a hipótese alternativa para este teste como (A média aritmética dos salários iniciais atuais não é maior que $25.735)(A média aritmética dos salários iniciais atuais é maior que $25.735)

Novamente, supondo que seja verdadeira, possui uma distribuição normal, para uma amostra grande, com sua média aritmética correspondente a $25.735 (o valor de

em ). Rejeitaremos se o valor de , obtido a partir da amostra, se posicionar na região de rejeição. De outra maneira, não rejeitaremos .

A Tabela 9.1 resume a discussão anterior sobre a relação entre os sinais em e e as caudas de um teste.

176

Page 177: Apostila Probabilidade e Estatística 2009

9.2 – TESTES DE HIPÓTESES EM RELAÇÃO A PARA AMOSTRAS GRANDES UTILIZANDO A ABORDAGEM DO VALOR-P

Definição:

Valor-p: O valor-p é o menor nível de significância no qual a hipótese nula é rejeitada.

Utilizando a abordagem do valor-p, rejeitamos a hipótese nula se

valor-p ou valor-p

e não rejeitamos a hipótese nula se

valor-p ou valor-p

Para um teste bicaudal, o valor-p é fornecido com base na área na cauda da curva da distribuição de amostragem, que se posiciona além do valor observado para a estatística da amostra. A Figura 9.5 mostra o valor-p para um teste com cauda à direita em relação a

Para um teste bicaudal, o valor-p é duas vezes a área na cauda da curva da distribuição de amostragem que se posiciona além do valor observado da estatística da amostra. A figura 9.6 mostra o valor-p para um teste bicaudal. Cada uma das áreas nas duas caudas fornece metade do valor-p.

177

Page 178: Apostila Probabilidade e Estatística 2009

Calculando o Valor de para : Para uma amostra grande, o valor de para , para um teste de hipótese em relação a , é calculado como segue:

se é conhecido

se é não é conhecido

onde

e

O valor calculado de para , utilizando a fórmula, é também chamado de valor observado de z.

Em seguida, encontramos a área sob a cauda da curva da distribuição normal, que se posiciona além deste valor de . Esta área fornece o valor-p, ou metade do valor-p, dependendo do fato de tratar-se de um teste unicaudal ou de um teste bicaudal.

Um procedimento de teste de hipóteses que utiliza a abordagem do valor-p envolve as quatro etapas a seguir.

Etapas para Realizar um Teste de hipóteses Utilizando à Abordagem do Valor-p

1. Declare a hipótese nula e a hipótese alternativa2. Selecione a distribuição que será utilizada3. Calcule o valor-p4. Tome uma decisão

Exemplo 9.2Na Cânon Food Corporation, foram necessários, em média, 50 minutos para os novos trabalhadores aprendessem uma tarefa correspondente ao processamento de alimentos. Recentemente, a empresa instalou uma nova máquina de processamento de alimentos. O supervisor da empresa deseja saber se a média aritmética do tempo gasto pelos novos trabalhadores, para aprender o procedimento de processamento de alimentos nesta nova máquina, é diferente de 50 minutos. Uma amostra de 40 trabalhadores mostrou que levava, em média, 47 minutos para que eles aprendessem o procedimento de processamento dos alimentos nesta nova máquina, com um desvio-padrão correspondente a 7 minutos.

178

Page 179: Apostila Probabilidade e Estatística 2009

Encontre o valor-p correspondente ao teste de que a média aritmética do tempo de aprendizado para o procedimento de processamento de alimentos na nova máquina seja diferente de 50 minutos. Qual seria sua conclusão, se

Solução:Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar.

Etapa 3. Calcule o valor-p.

9.3 – TESTES DE HIPÓTESES EM RELAÇÃO À MÉDIA ARITMÉTICA DA POPULAÇÃO: AMOSTRAS GRANDES

Estatística do Teste: Nos testes de hipóteses em relação a , para amostras grandes, a variável aleatória

ou

179

Page 180: Apostila Probabilidade e Estatística 2009

onde

e

é chamada de estatística do teste. A estatística do teste pode ser definida como uma regra ou critério, que é utilizado para tomar a decisão, seja para rejeitar, seja para não rejeitar a hipótese nula.

Um procedimento de teste de hipóteses que utiliza um nível de significância predeterminado envolve as cinco etapas a seguir apresentadas.]

Etapas para Desenvolver um Teste de Hipóteses com Predeterminado

1. Declare a hipótese nula e a hipótese alternativa.2. Selecione a distribuição a utilizar.3. Determinar a região de rejeição e a região de não-rejeição.4. Calcule o valor da estatística do teste.5. Tome uma decisão.

Exemplo 9.3A Companhia Telefônica TIV fornece serviços de telefonia de longa distância em uma determinada área. De acordo com os registros da empresa, a média da duração de todas as chamadas de longa distância feitas por intermédio da empresa em 1999 foi de 12,44 minutos. A gerência da empresa deseja verificar se a média aritmética da duração das chamadas atuais de longa distância é diferente de 12,44 minutos. Uma amostra de 150 dessas chamadas, realizadas por meio desta empresa, produziu uma média aritmética da duração equivalente a 13,71 minutos, com um desvio-padrão correspondente a 2,65 minutos. Utilizando o nível de significância de 5%, você pode concluir que a média aritmética da duração de todas as chamadas atuais de longa distância é diferente de 12,44 minutos?Solução:Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar

Etapa 3. Determine a região de rejeição e a região de não-rejeição.

180

Page 181: Apostila Probabilidade e Estatística 2009

Etapa 4. Calcule o valor da estatística do teste.

Etapa 5. Tome uma decisão.

Exemplo 9.4De acordo com uma pesquisa salarial da National Association of Colleges and Employers (Associação Nacional de Faculdades e Empregadores), o salário médio oferecido aos formados em ciências da computação que obtiveram a graduação em maio de 2002, era igual a $50.352 (Journal of Accountancy, setembro de 2002). Suponha que este resultado seja verdadeiro para todos os formados em ciências da computação que tenham se graduado em maio de 2002. Uma amostra aleatória de 200 formandos em ciências da computação, que se graduaram neste ano, mostrou que a eles era oferecida uma média aritmética de salário correspondente a $51.750, com um desvio-padrão igual a $5240. Utilizando o nível de significância de 1%, você pode concluir que a média aritmética dos salários dos graduados este ano em ciências da computação seja maior do que $50.352?

181

Page 182: Apostila Probabilidade e Estatística 2009

Solução:Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar

Etapa 3. Determine a região de rejeição e a região de não-rejeição.

Etapa 4. Calcule o valor da estatística do teste.

Etapa 5. Tome uma decisão.

182

Page 183: Apostila Probabilidade e Estatística 2009

Exemplo 9.5O prefeito de uma grande cidade afirma que a média do patrimônio liquido das famílias que vivem naquela cidade é de, pelo menos, $300.000. Uma amostra aleatória de 100 famílias, selecionadas a partir daquela cidade, produziu uma média aritmética do patrimônio líquido correspondente a $288.000, com um desvio-padrão equivalente a $80.000. Utilizando o nível de significância de 2,5%, você pode concluir que a afirmação do prefeito é falsa?Solução:Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar

Etapa 3. Determine a região de rejeição e a região de não-rejeição.

Etapa 4. Calcule o valor da estatística do teste.

183

Page 184: Apostila Probabilidade e Estatística 2009

Etapa 5. Tome uma decisão.

9.4 – TESTES DE HIPÓTESES EM RELAÇÃO À MÉDIA ARITMÉTICA DE UMA POPULAÇÃO: AMOSTRAS PEQUENAS

Condições nas Quais a Distribuição é Utilizada para Realizar Testes de Hipóteses em Relação a : A distribuição é utilizada para conduzir um teste de hipóteses em relação a

se1. O tamanho da amostra for pequeno (2. A população a partir da qual a amostra é extraída dor distribuída de maneira (aproximadamente) normal.3. O desvio-padrão da população, , for desconhecido.

O procedimento que é utilizado para realizar testes de hipóteses em relação a , no caso de amostras pequenas, é similar ao teste de hipóteses para amostras grandes. Realizamos as mesmas cinco etapas, e a única diferença corresponde a utilizar a distribuição em lugar da distribuição normal.

Estatística do teste: O valor da estatística do teste para a média aritmética da amostra, , é calculado como

onde

O valor de , calculado para utilizando esta fórmula, é também chamado de valor observado de .

184

Page 185: Apostila Probabilidade e Estatística 2009

Exemplo 9.6Um psicólogo afirma que a média aritmética da idade na qual as crianças começam a andar corresponde a 12,5 meses. Carol desejava verificar se essa afirmação é verdadeira. Ela extraiu uma amostra aleatória de 18 crianças e descobriu que a média aritmética da idade na qual essas crianças começam a andar era de 12,9 meses, com um desvio-padrão correspondente a 0,80 mês. Utilizando o nível de significância de 1%, você pode concluir que a média aritmética da idade na qual todas as crianças iniciam a andar seja diferente de 12,5 meses? Considere que as idades nas quais todas as crianças começam a andar tenham uma distribuição aproximadamente normal.Solução:Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar

Etapa 3. Determine a região de rejeição e a região de não-rejeição.

Etapa 4. Calcule o valor da estatística do teste.

185

Page 186: Apostila Probabilidade e Estatística 2009

Etapa 5. Tome uma decisão.

Exemplo 9.7A Grand Auto Corporation produz baterias automotivas. A empresa afirma que as suas baterias de primeira linha, Never Die, são boas, em média, no mínimo até 65 meses. Uma agência de proteção ao consumidor testou 15 de tais baterias no sentido de verificar esta afirmação. A agência descobriu que a média aritmética da vida útil dessas 15 baterias era de 63 meses, com um desvio-padrão de 2 meses. No nível de significância de 5%, você pode concluir que a afirmação da empresa é verdadeira? Considere que a vida útil da tais baterias tenha uma distribuição aproximadamente normal.Solução:Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar

Etapa 3. Determine a região de rejeição e a região de não-rejeição.

186

Page 187: Apostila Probabilidade e Estatística 2009

Etapa 4. Calcule o valor da estatística do teste.

Etapa 5. Tome uma decisão.

9.5 - TESTES DE HIPÓTESES EM RELAÇÃO À PROPORÇÃO DE UMA POPULAÇÃO: AMOSTRAS GRANDES

Estatística do Teste: O valor da estatística do teste para a proporção da amostra, , é

calculada como

onde

O valor de p utilizado nesta fórmula é aquele utilizado na hipótese nula, o valor de q é igual a .

O valor de , calculado para utilizando a fórmula anterior, também é chamado de valor

observado de .

187

Page 188: Apostila Probabilidade e Estatística 2009

Exemplo 9.8Em uma pesquisa realizada pelo National Center for Womem and Aging (Centro Nacional para Mulheres e a Idade) na Universidade Brandeis, 51% das mulheres acima de 50 anos afirmaram que o envelhecimento não é tão ruim quanto elas haviam esperado (USA TODAY, 19 de novembro de 2002). Suponha que esse resultado mantenha-se verdadeiro em relação à população de 2002 para todas as mulheres com idade de 50 anos ou mais. Em uma amostra aleatória de 400 mulheres, com idade de 50 anos ou mais, 54% disseram que o envelhecimento não é tão ruim quanto elas tinham esperado. Utilizando o nível de significância de 1%, você pode concluir que a percentagem atual das mulheres com idade de 50 anos ou mais acreditam que o envelhecimento não é tão ruim quanto elas tinham esperado seja diferente da percentagem correspondente a 2002?Solução:Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar

Etapa 3. Determine a região de rejeição e a região de não-rejeição.

Etapa 4. Calcule o valor da estatística do teste.

188

Page 189: Apostila Probabilidade e Estatística 2009

Etapa 5. Tome uma decisão.

Exemplo 9.9Quando está operando apropriadamente, uma máquina utilizada para fazer chips para calculadoras não produz mais do que 4% de chips defeituosos. Sempre que a máquina produz mais de 4% de chips defeituosos, ela necessita de um ajuste. Para verificar se a máquina está operando apropriadamente, o departamento de controle de qualidade da empresa freqüentemente extrai amostras de chips e os inspeciona para determinar se eles estão perfeitos, ou se estão defeituosos. Uma dessas amostras aleatórias de 200 chips, recentemente extraída da linha de produção, continha 14 chips defeituosos. Teste, no nível de significância de 5%, se a máquina precisa, ou não, de ajuste.Solução:Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar

Etapa 3. Determine a região de rejeição e a região de não-rejeição.

189

Page 190: Apostila Probabilidade e Estatística 2009

Etapa 4. Calcule o valor da estatística do teste.

Etapa 5. Tome uma decisão.

Exercícios:1) De acordo com a U.S. Bureau of Labor Statistics, existiam 8,1 milhões de pessoas desempregadas, com 16 anos de idade ou mais, em agosto de 2002. A duração média do desemprego para estas pessoas era de 16,3 semanas (Bureau of Labor Statistics News, 6 de setembro de 2002). Suponha que uma recente amostra aleatória, de 400 desempregados norte-americanos, com idade de 16 anos ou mais, tenha fornecido uma média aritmética da duração do desemprego igual a 16,9 semanas, com um desvio-padrão de 4,2 semanas. Encontre o valor-p para o teste de hipóteses, com a hipótese alternativa de que a média aritmética atual da duração do desemprego, para todos os desempregados norte-americanos, com 16 ou mais, exceda 16,3 semanas. Você irá rejeitar a hipótese nula com ?

190

Page 191: Apostila Probabilidade e Estatística 2009

2) Um estudo afirma que todos os adultos gastam, em média, 14 horas ou mais, em trabalhos domésticos, durante um final de semana. Um pesquisador deseja verificar se esta afirmação é verdadeira. Uma amostra aleatória de 200 adultos, extraída por este pesquisador, mostrou que estes adultos gastam, em média, 13,75 horas em trabalhos domésticos, durante um fim de semana, com um desvio-padrão igual a 3,0 horas. Encontre o valor-p para o teste de hipóteses com a hipótese alternativa de que todos os adultos gastam menos do que 14 horas em trabalhos domésticos durante um fim de semana. Você irá rejeitar a hipótese nula com ?

3) Realize os seguintes testes de hipóteses:

a) , , , , .

191

Page 192: Apostila Probabilidade e Estatística 2009

b) , , , , .

a) , , , , .

4) Uma empresa franqueadora de restaurantes possui uma política de abrir novos restaurantes somente naquelas áreas que tiverem uma média aritmética de renda domiciliar correspondente a pelo menos $35.000 por ano. A empresa atualmente está avaliando uma área para abrir um novo restaurante. O departamento de pesquisas da empresa extraiu uma amostra de 150 domicílios, a partir da daquela área, e descobriu que a média aritmética da renda desses domicílios é igual a $33.400 por ano, com um desvio-padrão de $5400.a) Utilizando o nível de significância de 1%, você concluiria que a empresa não deveria abrir um restaurante nessa área?

b) Qual seria sua decisão no item a se a probabilidade de cometer um Erro do Tipo I fosse zero? Explique.

192

Page 193: Apostila Probabilidade e Estatística 2009

5) Um estudo afirma que todos os moradores em casas gastam, em média, 8 horas ou mais em limpeza da casa e jardinagem durante um final de semana. Um pesquisador desejava verificar se esta afirmação era verdadeira. Uma amostra aleatória de 200 moradores de casas, extraída por este pesquisador, mostrou que eles gastam, em média, 7,68 horas em tais atividades, durante um final de semana, com um desvio-padrão de 2,1 horas.a) Utilizando o nível de significância de 1%, você pode concluir que seja falsa a afirmação de que todos os moradores em casas gastam, em média, 8 horas ou mais em tais atividades durante um fim de semana?

b) Faça o teste do item a utilizando o nível de significância de 2,5%. A sua decisão é diferente daquela do item a? Comente sobre os resultados dos itens a e b?

6) Um reitor de uma universidade afirma que a média aritmética do tempo gasto em festas por todos os alunos naquela universidade não é maior do que 7 horas por semana. Uma amostra aleatória de 20 alunos, extraída a partir daquela universidade, mostrou que os alunos gastaram, em média, 10,50 horas participando de festas na semana anterior, com um desvio-padrão de 2,3 horas. Considerando que o tempo gasto participando de festas por todos os alunos naquela universidade, seja distribuído de maneira aproximadamente normal, teste, no nível de significância de 2,5%, se a afirmação do reitor é, ou não, verdadeira. Explique, com suas palavras, a sua conclusão.

193

Page 194: Apostila Probabilidade e Estatística 2009

7) Um fabricante de refrigerantes afirma que suas latas de 12 onças (aproximadamente 355 ml) não contêm, em média, mais do que 30 calorias. Uma amostra aleatória de 16 latas deste refrigerante, que foram analisadas em relação a calorias, continha uma média aritmética correspondente a 32 calorias, com um desvio-padrão equivalente a 3 calorias. Suponha que o número de calorias, em latas de refrigerante de 12 onças, seja normalmente distribuído. As afirmações da amostra apóiam a hipótese alternativa de que a afirmação do fabrificante é falsa? Utilize um nível de significância de 5%. Explique, com suas palavras, a sua conclusão.

8) Considere versus para uma população que seja normalmente distribuída.a) Uma amostra aleatória de 25 observações extraídas a partir desta população produziu uma média aritmética da amostra igual a 77 e um desvio-padrão igual a 8. Utilizando

, você rejeitaria a hipótese nula?

b) Uma amostra aleatória de 25 observações extraídas a partir desta população produziu uma média aritmética da amostra igual a 86 e um desvio-padrão igual a 6. Utilizando

, você rejeitaria a hipótese nula?

9) Considere versus .

194

Page 195: Apostila Probabilidade e Estatística 2009

a) Uma amostra aleatória de 400 observações produziu uma proporção da amostra igual a 0,42. Utilizando , você rejeitaria a hipótese nula?

b) Outra amostra aleatória de 400 observações, extraída a partir da mesma população, produziu uma proporção da amostra igual a 0,39. Utilizando , você rejeitaria a hipótese nula?

10) De acordo com o sétimo relatório anual da Employment Policy Foundation (Fundação para Políticas de Emprego), institulado Challenges Facing the American Workplace ( Desafios que Enfrentam os Ambientes de Trabalho Norte-Americanos), as mulheres ocupavam 49% das funções de gerência e das funções burocráticas em 2000 (The Hartford Courant, 2 de setembro de 2002). Suponha que uma amostra aleatória recente de 200 de tais funções tenha descoberto que 52% delas eram ocupadas por mulheres. Você pode concluir que a percentagem de tais funções que sejam ocupadas por mulheres, atualmente, exceda 49%? Utilize .

195

Page 196: Apostila Probabilidade e Estatística 2009

11) Uma empresa de reembolso postal afirma que pelo menos 60% de todos os pedidos são postados dentro de 48 horas. De tempos em tempos, o departamento de controle de qualidade da empresa verifica se essa promessa é totalmente cumprida. Recentemente, o departamento de controle de qualidade dessa empresa extraiu uma amostra de 400 pedidos e descobriu que 208 deles foram postados dentro do período de 48 horas após a colocação dos pedidos.a) Testando no nível de significância de 1%, você pode concluir que a afirmação da empresa é verdadeira?

b) Qual seria sua decisão no item a se a probabilidade de cometer um Erro do tipo I fosse zero? Explique.

10- Análise de Regressão

196

Page 197: Apostila Probabilidade e Estatística 2009

197

Page 198: Apostila Probabilidade e Estatística 2009

REFERÊNCIAS BIBLIOGRÁFICAS:

BARBETTA, Pedro A. et alli. Estatística para cursos de Engenharia e Informática. São

Paulo. Atlas, 2008.

CRESPO, Antônio A. Estatística fácil. São Paulo: Saraiva, 2002.

MANN, Prem S. Introdução à Estatística. Tradução Eduardo Bendito Curtolo, Tereza C.

P. de Souza. Rio de Janeiro: LTC, 2006.

FONSECA, Jairo Simon & MARTINS, Gilberto de Andrade. Curso de Estatística. São

Paulo: Atlas, 1988, 3ª.ed.

GONÇALVES, C. F. F. Estatística. Londrina: Ed. UEL, 2002.

198

Page 199: Apostila Probabilidade e Estatística 2009

MEYER, P. L. Probabilidade, Aplicações à Estatística. Rio de Janeiro: Ao Livro Técnico

S. A., 1983.

MOORE, D. A estatística básica e sua pratica. Rio de Janeiro: LTC Editora, 2005. 482 p.

MORETTIN, P. A. Introdução à estatística para as ciências exatas. São Paulo. Atual

Editora, 1981. 211 p.

SPIEGEL, Murray R. Estatística. São Paulo: McGraw-Hill, 1993, 3ª.ed.

199