44
5/9/2018 ApostilaEstatsticaeProbabilidade-slidepdf.com http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 1/44 1 Apostila de Estatística e Probabilidade Profª Cristiane Leitão  Capítulo I - Conceitos Iniciais

Apostila Estatística e Probabilidade

  • Upload
    vybol

  • View
    790

  • Download
    1

Embed Size (px)

Citation preview

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 1/44

1

Apostila de Estatística e Probabilidade

Profª Cristiane Leitão 

Capítulo I - Conceitos Iniciais

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 2/44

2

1.1. EstatísticaA Estatística está interessada nos métodos científicos para coleta,

organização, resumo, apresentação e análise de dados, bem como na obtençãode conclusões válidas e na tomada de decisões razoáveis baseadas em taisanálises.

A Estatística tem por objetivo, fornecer métodos e técnicas para lidarmos,

racionalmente com situações sujeitas a incertezas. Bioestatística é a Estatísticaaplicada as Ciências Médicas e Biológicas.

1.2. População e amostra. Estatística indutiva e descritivaAo coletar os dados referentes às características de um grupo de objetos

ou indivíduos, tais como as alturas e pesos dos estudantes de umauniversidade ou os números de parafusos defeituosos ou não produzidos poruma fábrica em certo dia, é muitas vezes impossível ou impraticável observartodo o grupo, especialmente se for muito grande. Em vez de examinar todo ogrupo, denominado população ou universo, examina-se uma pequena partechamada amostra.

Se uma amostra é representativa de uma população, conclusõesimportantes sobre a população podem ser inferidas de sua análise.

 

1.3.VariáveisUma variável é o conjunto de resultados possíveis de um fenômeno.

 Tratando-se de estatística de variável, é possível distinguir duas categorias devariável:

• Qualitativa – quando seus valores são expressos por atributos.Esse tipo de variável, se divide ainda em:

Variável Nominal – quando este atributo não admite uma

ordenação.Ex: Cor dos olhos (pretos, castanhos, azuis, etc)Variável Ordinal – quando este atributo admite algum tipo de

ordenação.Ex: Classe social (alta, média ou baixa)

• Quantitativa – quando seus valores são expressos por números.Esse tipo de variável, se divide ainda em:Variável Contínua – quando seus valores são expressos por

números que podem assumir, teoricamente, qualquer valor entre doislimites.

Ex: peso corporal, altura...

Variável Discreta – quando seus valores são expressos pornúmeros pertencentes a um conjunto enumerável.Ex: quantidade de alunos de uma turma, número de crianças de uma

família.

Os dados que podem ser descritos por meio de uma variável discreta oucontínua são chamados dados discretos ou dados contínuos, respectivamente.O número de crianças em cada uma de 1.000 famílias é um exemplo de dadosdiscretos, enquanto o peso de 100 estudantes universitários é um exemplo de

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 3/44

3

dados contínuos. Em geral, as medições dão origem a dados contínuos,enquanto as enumerações ou contagens resultam em dados discretos.

ESTATÍSTICA DESCRITIVA

Vamos apresentar os principais conceitos sobre o levantamento de dados;destacar as técnicas de apresentação, por meio de tabelas e gráficos; ofereceras medidas próprias para análises e as técnicas usadas para a interpretaçãodos dados numéricos.

Fases do Método Estatístico

Método é um conjunto de meios dispostos convenientemente para se chegara um fim que se deseja. O Método Estatístico usa o conjunto de meioslistados abaixo, para uma tomada de decisão.As fases dos método estatístico:•Definição do problema;•Planejamento;•Coleta dos dados;•Crítica dos dados;•Apresentação dos dados;•Análise e Interpretação dos dados.

A Estatística Descritiva pode ser resumida do diagrama:

 

1.4. Coleta de dadosApós a definição do problema a ser estudado e o estabelecimento do

planejamento da pesquisa (forma pela qual os dados serão coletados;cronograma das atividades; custos envolvidos; exame das informações;delineamento da amostra etc.), o passo seguinte é a coleta de dados, queconsiste na busca ou compilação dos dados das variáveis, componentes dofenômeno a ser estudado.

1.5. Crítica dos dadosObjetivando a eliminação dos erros capazes de provocar futuros enganos

de apresentação e análise, procede-se a uma revisão crítica dos dados,suprindo os valores estranhos ao levantamento.

Coleta de

dados

Crítica de

dadosApresenta-

ção dos

dados

Tabelas

Gráficos

Análise

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 4/44

4

1.6. Apresentação dos dadosApós a crítica, convém organizarmos os dados de maneira prática e

racional, para o melhor entendimento do fenômeno que se está estudando. Osdados, geralmente, são apresentados de duas formas: Tabelas e/ou Gráficos.

1.6.1. TabelasÉ um quadro que resume informações. A elaboração de tabelas obedece à

uma resolução do Conselho Nacional de Estatística. Uma tabela deveapresentar o cabeçalho, o corpo e o rodapé.

O cabeçalho deve conter o suficiente para que sejam respondidas asseguintes questões: o quê? (referente ao fato), onde? (relativo ao lugar) equando? (correspondente à época).

O corpo é representado por colunas e subcolunas dentro das quais serãoregistrados os dados.

O rodapé é reservado para as observações pertinentes, bem como aidentificação da fonte dos dados.

1.6.2. Séries EstatísticasDenominamos série estatística a organização de dados referentes a uma

mesma ordem de classificação. Geralmente, as séries estatísticas sãorepresentadas por meio de tabelas.

Conforme o critério de agrupamento, as séries classificam-se em: Temporal, Geográfica, Específica e Distribuição de Freqüências.

Série Temporal (Cronológica, Evolutiva ou Histórica) – É a sérieestatística em que os dados são observados segundo a época deocorrência.

  Vendas da Empresa Alfa –2001 a 2008

Ano Vendas (emR$)

2001200220032004200

5200620072008

2.181,003.948,005.642,007.550,00

10.000,0011.728,0018.790,0029.076,00

  Fonte: Departamento de Vendas da Empresa

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 5/44

5

Série Geográfica (ou de Localização) – É a série estatística em queos dados são observados segundo a localidade de ocorrência.

INSS – Empresas fiscalizadas em 1990.Regiões Empresas

fiscalizadasNorteNordesteSudesteSulCentro-Oeste

7.495107.783281.20753.66115.776

  Fonte: Mensário Estatístico

  Série Específica (ou categórica) – É a série estatística em que osdados são agrupados segundo a modalidade da ocorrência.

Matrícula no Ensino do Terceiro Grau- Brasil 1975Áreas de Ensino Matricula

sCiências BiológicasCiências Exatas e

 TecnologiaCiências AgráriasCiências HumanasLetrasArtesDuas ou mais áreas

32.10965.949

2.419148.8429.8837.464

16.323

Fonte: Serviço de Estatística da Educação e Cultura

Distribuição de Freqüências – É a série estatística em que osdados são agrupados com suas respectivas freqüências absolutas.

Obs: Freqüência é o número de “elementos” que pertencem a uma

determinada classe.Por se tratar do tipo mais importante de série estatística, a estudaremosisoladamente no próximo capítulo.

1.6.3. GráficosO gráfico estatístico é uma forma de apresentação dos dados estatísticos,

cujo o objetivo inicial é o de produzir em geral, uma impressão mais rápida do

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 6/44

6

fenômeno em estudo. A representação gráfica de um fenômeno deve obedecera certos requisitos fundamentais, para ser realmente útil:

Simplicidade – o gráfico deve ser destituído de detalhes de importânciasecundária, que possam levar o observador a uma análise errônea.Clareza – o gráfico deve possibilitar uma correta interpretação dos

valores representativos do fenômeno em estudo.Veracidade – o gráfico deve sempre expressar a verdade sobre o

fenômeno em estudo.

Os principais gráficos indicados para a representação de uma sérieestatística são:

• Gráfico em linhas• Gráficos em barras verticais ou horizontais• Gráfico em setores

- Gráficos em Linhas

NÚMERO DE PESSOAS, ACIMA DE 40 ANOS ATENDIDAS NO SETOR DECARDIOLOGIA DO HOSPITAL SÃO JORGE (RS) NO 1o. SEMESTRE DE

CADA ANO (1994/1999)

0

200

400

600

800

1000

1200

1 2 3 4 5 6

ANOS

   N

    Ú   M   E   R   O    D

   E   P   E   S   S

 

- Gráficos em Colunas (barras verticais)

0

20

40

60

80

100

Trim.

Trim.

Trim.

Trim.

Leste

Oeste

Norte

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 7/44

7

Obs: Geralmente os gráficos de barras verticais são chamados tambémde gráficos em colunas.

- Gráfico em Barras (barras horizontais)

CRIANÇAS NÃO-VACINADAS CONTRA APÓLIO - BRASIL / 1989

0 100.000 200.000 300.000 400.000 500.000 600.000

Sul

Centro-Oeste

Norte

Sudeste

Nordeste

   R   E   G   I   Õ

NÚMERO DE CRIANÇAS

- Gráficos em Setores: É a representação gráfica de uma sérieestatística, em um círculo, por meio de setores. É utilizado principalmentequando se pretende comparar cada valor da série com o total. Para construirdivide-se o círculo em setores, cujas áreas serão proporcionadas aos valores dasérie. Essa divisão pode ser obtida pela solução da regra de três.

  Total ----360 graus

Parte ---- X graus

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 8/44

8

AS ARMAS CONTRAO FUMO - CANADÁ/ 1990

28%

24%

21%

14%

13%

Goma de mascar com nicotina

Internamentos emhospital

Acupuntura

Hipnose

Injeções deClonidina

- Cartogramas

É a representação sobre uma carta geográfica.Este gráfico é empregado quando o objetivo é o de figurar osdados estatísticos diretamente relacionados com áreas geográficas oupolíticas.

- Gráfico Polar: É a representação de uma série estatística por meio deum polígono. Geralmente usamos para apresentação de séries temporais. Paraconstruí-lo, divide-se uma circunferência em tantos arcos iguais quantos foremos dados a representar. Pelos pontos de divisas traçam-se raios. Em cada raio érepresentado um valor da série, marcando-se um ponto cuja distância aocentro é diretamente proporcional a esse valor . A seguir unem-se os pontos.

0

100

200

300

JAN

FEV

MAR

ABR

MAI

JUN

JUL

AGO

SET

OUT

NOV

DEZ

- PictogramasSão construídos a partir de figuras representativas da intensidade do

fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção dopúblico leigo, pois sua forma é atraente e sugestiva. Os símbolos devem serauto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 9/44

9

visão geral do fenômeno, e não de detalhes minuciosos. Veja o exemploabaixo:

 

Fonte: IBGE

Exercícios

1) A Tabela abaixo mostra o número de toneladas de trigo e de milhoproduzidos na fazenda Cris, durante os anos de 1980 a 1990.

Anos   Toneladas detrigo   Toneladas demilho19801981198219831984

1985198619871988198

200185225250240195210225250230

235

7590

1008580

10011010595

110

100

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 10/44

10

91990

Com referência a esta tabela, determine o ano, ou anos, durante os quais:a) foi produzido o menor número de toneladas de trigo;

b) foi produzido o maior número de toneladas de milho;c) ocorreu o maior declínio na produção de trigo;d) foi produzido o mesmo número de toneladas de trigo;e) a produção total de trigo e milho foi máxima.

2) Exprimir os dados de produção de trigo e de milho do Problema 1 empercentagem da produção anual total no ano de 1980, e representargraficamente as percentagens, utilizando o gráfico de setores:

3) A tabela abaixo apresenta as vendas da Empresa X no ano de 2008.

Meses VendasR$

 JanFev

MarçoAbrilMaio

 Junho JulhoAgosto

Setembro

OutubroNovembr

oDezembr

o

1.000.000,00

800.000,00

1.500.000,00

300.000,00

2.000.000,00

500.000,00

800.000,00

1.000.000,00

1.300.000,00

1.800.000,00

2.000.000,00

3.000.000,00Fonte: Dep de Vendas

Capítulo II - Distribuição de Freqüências

a) Qual a porcentagem das vendas em janeirorelação a venda anual da empresa?

b) Qual a porcentagem das vendas em dezemem relação a venda anual da empresa?

c) Em que mês houve uma maior queda percenas vendas? De quanto foi essa queda?

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 11/44

11

Por se tratar do tipo de tabela mais importante para a EstatísticaDescritiva, faremos um estudo completo sobre as distribuições de freqüências,incluindo sua construção.Uma distribuição de freqüências pode ser:

• Distribuição de freqüências sem intervalos de classes.

• Distribuição de freqüências com intervalos de classes.

Representação da AmostraA seguir definiremos alguns procedimentos comuns para a representação

das distribuições de freqüências:

1. Dados brutos ou Tabela Primitiva – É o conjunto de dadosnuméricos obtidos após a crítica dos valores coletados não ordenadosnumericamente.Ex1.: Os dados abaixo, representam a taxa de glicose, em miligramas por100ml de sangue, em uma amostra de 42 ratos machos da raça Wistar, com 20dias de idade.

88,5 97,5 80,0 97,0 85,0 80,5 88,092,0 88,5 92,5 94,5 100,5 94,0 89,085,5 85,0 95,0 89,0 87,0 94,0 87,598,5 84,5 95,5 99,0 84,0 93,0 103,591,0 91,0 86,0 91,5 87,0 90,5 86,087,0 90,0 88,0 89,5 83,5 89,5 96,5

2. Rol – É o conjunto de dados após sua ordenação numérica.80,0 85,0 87,0 89,0 91,0 94,0 97,0

80,5 85,5 87,5 89,0 91,0 94,0 97,583,5 86,0 88,0 89,5 91,5 94,5 98,584,0 86,0 88,0 89,5 92,0 95,0 99,084,5 87,0 88,5 90,0 92,5 95,5 100,585,0 87,0 88,5 90,5 93,0 96,5 103,5

3. Amplitude total ou “range” (R) - É a diferença entre o maior e omenor valor observados. R = 103,5 – 80,0 = 23,5

4. Números de classes (K ) – não há uma fórmula exata para o cálculodo número de classes. Uma boa aproximação é a Regra de Sturges:

  n K  log22,31 ⋅+≅ onde n é o tamanho da amostra

No nosso exemplo temos:

 

1 3, 22 log 42

1 3,22 1,62 1 5, 2164

6,2164 pode-se utilizar K= 6 ou K= 7

 K 

 K 

 K 

≅ + ⋅≅ + ⋅ = +≅

5. Amplitude das classes (h) – É o tamanho de classes   K  Rh ÷≅  

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 12/44

12

É mais apropriado que aproximamos o número de classes e a amplitude dasclasses para o maior número inteiro. Assim, se 23,5 7 3,36h h≅ ÷ ⇒ = . Usamos h

= 4.

6. Freqüência absoluta ( i F  ) – É o número de vezes que o elemento

aparece na amostra.Exemplo de uma distribuição de freqüência com variável discreta.

 

Obs: X representa a variável ∑ =n F i onde n = tamanho da amostra

Exemplo de distribuição de freqüência para variável contínua:Classes F  i

80 |----- 8484 |----- 8888 |----- 9292 |----- 9696 |----- 100

100 |----- 104

31113852

Total (n) 42

7. Freqüência absoluta acumulada ( )ac

 F  - É a soma das freqüênciasdos valores inferiores ou iguais ao valor dado.

8. Limites das classes80 |----- 84 compreende todos os valores entre 80 e 84 excluindo o

84.

9. Pontos médios das classes ( i x ) – É a média aritmética entre olimite superior e o inferior da classe. Assim se a classe for 80 |----- 84,teremos:

 80 84

822

i x+

= =

10. Freqüência relativa ( ) ou ( )i ri f f   - A freqüência relativa de um valor

é dada porn

 F   f   i

i = , ou seja, é a porcentagem daquele valor da amostra.

Obs: ∑ =1i

  f  

i X   i F 

222324283334

222112

∑ 1

0

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 13/44

13

Montando a distribuição do nosso exemplo:Classes F  i  x i F ac f i

80 |----- 8484 |----- 8888 |----- 9292 |----- 9696 |----- 100

100 |----- 104

31113852

8286909498

102

31427354042

0,070,260,310,190,120,05

Total (n) 42 ---- ---- 1

11. Histograma – É a representação gráfica de uma distribuição defreqüência por meio de retângulos.

12. Polígono de freqüência – É a representação da distribuição pormeio de um polígono.

Exemplo 1: As notas de 35 estudantes de uma classe estão descritas a seguir:0,0 – 0,0 – 1,0 – 1,5 – 2,0 - 2,0 – 2,5 – 3,5 – 3,5 – 4,04,0 – 4,0 – 4,0 – 4,5 – 4,5 – 4,5 – 5,0 – 5,0 – 5,0 – 5,05,0 – 5,5 – 5,5 – 5,5 – 6,0 – 6,0 – 6,0 – 6,5 – 6,5 – 7,07,0 – 7,5 – 8,0 – 8,0 – 8,5Determinar:

a) as distribuições de freqüênciasb) amplitude totalc) qual a porcentagem dos alunos que tiveram nota menor que

4,0?d) o histograma e o polígono de freqüência.

Exemplo 2: Dado um rol de 50 notas, agrupar os elementos em classes:30 – 35 – 35 – 39 – 41 – 41 – 42 – 45 – 47 - 4850 – 52 – 53 – 54 – 55 – 55 – 57 – 59 – 60 – 6061 – 64 – 65 – 65 – 65 – 66 – 66 – 66 – 67 – 6869 – 71 – 73 – 73 – 74 – 74 – 76 – 77 – 77 – 7880 – 81 – 84 – 85 – 85 – 88 – 89 – 91 – 94 – 94

Polígono de freqüência

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 14/44

14

Solução: Amplitude total: R = 94 – 30 = 64Nº de classes: 50log22,31 ⋅+≅ K    ≅ 1 + 3,22 .(1,7) 7≅

Amplitude das classes:  K  Rh ÷≅ 1014,9764 ≅≅÷≅

Classesi F 

ac F  i  f   i x

30 |– 4040 |– 5050 |– 6060 |– 7070 |– 8080 |– 9090 |–100

46813973

4101831404750

0,080,120,160,260,180,1

40,06

35455565758

595

∑ 50

1

Exemplo 3: Os pesos de 40 alunos estão relacionados a seguir:45 – 49 – 50 – 53 – 53 – 53 – 54 – 57 – 58 – 5859 – 60 – 60 – 60 – 62 – 63 – 63 – 64 – 64 – 6565 – 66 – 67 –67 – 68 – 68 – 69 – 70 – 71 – 7272 – 73 – 74 – 75 – 76 – 80 – 81– 81– 83 – 93

Construir a tabela de distribuição de freqüência . Dado 6,140log ≅ .

Exemplo 4: Complete a tabela abaixo com os seus elementos e determine:Estaturas de 80 pacientes da Clínicade Fisioterapia São José (SP) - 1997

Estatura (cm) Fi 

150 |----- 156156 |----- 162162 |----- 168168 |----- 174174 |----- 180

180 |----- 186186 |----- 192192 |----- 198

718221510

521

Total (n) 80Fonte: Clínica São José

Capítulo III - Medidas de Posição

a) o ponto médio da sexta classe;b) a freqüência absoluta da quarta classe;c) a freqüência relativa em percentual da c

com maior número de pacientes;d) a freqüência acumulada da quinta classee) o número de pacientes cuja altura não a

180 cm;f) a percentagem de pacientes cuja altura atinge 168cm;

g) a percentagem de pacientes cuja altura e ultrapassa 162 cm, mas é inferior a 19

h) a classe do 52º paciente.

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 15/44

15

O estudo que fizemos sobre distribuições de freqüências, até agora,permite-nos descrever, de modo geral o comportamento de uma variável.Ocorre, todavia que trabalhar com uma distribuição de freqüências completa,muitas vezes, é difícil, razão pela qual costuma-se lançar mão de determinadasmedidas. Essas medidas sumarizam certas características importantes dadistribuição de freqüências. Há diversas medidas que possibilitam condensar

as informações dentro da fase analítica da Estatística Descritiva. Dentre asmedidas de posição mais importantes estão as medidas de tendência central.

3.1. Índices ou notação por índiceO símbolo i

 X  (lê-se “ X índice i) representa qualquer um dos N valores,

 N21 X......,,, X   X   . A letra i, em i X  , pode representar qualquer dos números1,2,3,...,N, é denominada índice. Evidentemente, pode ser usada qualqueroutra letra além de i, como j, k , p ou s.

3.2. Notação de Somatório

O símbolo1

 N 

i

i

 X =

∑ é usado para representar a soma de todos os i X  desde i

=1 atéij = N, isto é, por definição

1

 N 

i

i

 X =

∑ =  N21 X...... +++ X  X 

3.3. Medidas de Tendência Central

As medidas de tendência central recebem tal denominação pelo fato de os

dados observados tenderem, em geral, a se agrupar em torno dos valorescentrais.

Dentre as medidas de tendência central, destacamos:

• média ( ) X  ou (Ma)

• moda µ( ) X  ou (Mo)

• mediana °( ) X  ou (Md)

A média aritmética é, de modo geral, a mais importante e mais comum detodas as mensurações numéricas descritivas.

Estas medidas podem ser calculadas, tanto para dados não agrupados emclasses, quanto para dados agrupados em classes.

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 16/44

16

3.3.1. Dados não agrupados em classes

- Média AritméticaA média aritmética, ou média, de um conjunto de N números

 N  X   X   X   ,....,, 21 é representado por  X   (lê-se “x barra”) e é definida por

   X  = 1 2 1.....

 N 

i

 N i

 X   X X X  

 N N 

=+ + +

= ∑  

Ex: A média aritmética dos números 8, 3, 5,12,10 é:

   X  = 6,75

38

5

1012538==

++++

Propriedade da Média AritméticaA soma algébrica dos desvios de um conjunto de números, em relação à

média aritmética, é zero.Ex: Os desvios dos números 8, 3, 5, 12, 10, em relação à sua média aritmética7,6 são: 8 – 7,6 ; 3 –7,6; 5 – 7,6 ; 12 – 7,6 ; 10 – 7,6 ou 0,4 ; –4,6 ; –2,6 ; 4,4 ;2,4 com soma algébrica igual a zero.

- Moda

A moda de um conjunto de números é o valor que ocorre com maiorfreqüência, ou seja, é o valor mais comum. A moda pode não existir e, mesmoque exista pode não ser única.

Ex1: O conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 13 tem moda 9.Ex2: O conjunto 3, 5, 8, 10, 12, 15, 17 não tem moda.Ex3: O conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tem duas modas 4 e 7.

Uma distribuição que não tem moda é denominada amodal.Uma distribuição que tem apenas uma moda é denominada unimodal.

- Mediana

A mediana de um conjunto de números, organizados em ordem degrandeza (isto é, em um rol) , é o valor central ou a média aritmética dos doisvalores centrais.

* Quando o tamanho da amostra é ímpar, a mediana será o elemento de

ordem1

2

+n.

Ex1: O conjunto dos números 3, 4, 5, 6, 7, 8, 8 tem mediana 6.Pois é o elemento que ocupa a 4ª posição, basta ver que n = 7, então

1 7 14

2 2

+ += =

n, ou seja, 4ª posição.

* Quando o tamanho da amostra é par, a mediana será a média dos

elementos de ordens2

ne 1

2+

n.

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 17/44

17

Ex2: O conjunto dos números 5, 5, 7, 9, 11, 12, 15, 18 tem mediana

102

119=

+.

Pois é a média dos elementos que ocupam a 4ª e 5ª posição, basta ver

que n = 8, então

2

n=

84

2

= e 1

2

+n

=8

1 4 1 5

2

+ = + = , ou seja 4ª e 5ª posições.

Geometricamente, a mediana é o valor de X (abscissa) correspondente àvertical que divide o histograma em duas partes de áreas iguais. Esse valor de

 x , é às vezes, representado por~

 X  .

3.3.2. Dados agrupados em classes

- Média AritméticaSe estivermos trabalhando com uma distribuição de freqüências com

intervalos de classes, para calcularmos a média aritmética dessa distribuição,utilizaremos a seguinte fórmula:

  i i x F 

 X n

⋅= ∑

- ModaSe estivermos trabalhando com uma distribuição de freqüências com

intervalos de classes, para calcularmos a moda dessa distribuição, utilizaremosa seguinte fórmula:

  µ 1

1 2

oo

 D h X L

 D D

⋅= +

+Onde: o L - limite inferior da classe modal

  1 D - freqüência da classe modal menos freqüência da classeanterior

  2 D - freqüência da classe modal menos freqüência da classeposterior

  oh - amplitude da classe modalObs: Classe Modal – classe com maior freqüência.

- Mediana

Se estivermos trabalhando com uma distribuição de freqüências comintervalos de classes, para calcularmos a mediana dessa distribuição,utilizaremos a seguinte fórmula:

  ° 2

iant 

d d 

 F  Fac

  X L h F 

−= + ⋅

Onde: d  L - limite inferior da classe mediana

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 18/44

18

ant  Fac - freqüência acumulada na classe anterior à classe mediana

  d h - amplitude da classe mediana

  d  F  - freqüência da classe mediana

Obs: Classe Mediana – classe que contém o elemento2

i F ∑ =2

n, chamado

Elemento Mediano.

- Separatrizes

São medidas que dividem uma seqüência ordenada de dados em partesque contêm a mesma quantidade de elementos. As separatrizes, por sua vez,se dividem em:

• quartis;• decis;• percentis.

Os Quartis dividem a série em quatro partes, cada uma representa 25%da série. Os quartis são:

1º Quartil ( 1Q ) – é o termo precedido por 25% dos termos da série

2º Quartil ( 2Q ) – coincide com a mediana.

3º Quartil ( 3Q ) – é o termo precedido de 75% dos termos da série.

Os Decis dividem em 10 partes, representadas por 10% da série. Os decissão:

1º Decil ( 1 D ) – é o termo precedido por 10% dos termos da série2º Decil ( 2 D ) – é o termo precedido por 20% dos termos da série.

3º Decil ( 3 D ) – é o termo precedido de 30% dos termos da série, e etc.

Os Percentis dividem em 100 partes de 1% da série. Os percentis são:9921 ,....,, P  P  P  .

Cálculo das separatrizes em uma Distribuição de Freqüências

A fórmula para se determinar o termo de uma série que represente uma

Separatriz é análoga à fórmula usada para a determinação da Mediana. Atémesmo porque, a Mediana é ela própria uma Separatriz.

Qualquer Separatriz é determinada pela fórmula:

−= + ⋅o ant  

 s s

 s

  P FacS L h

 F 

Onde: S – Separatriz desejada   s L - limite inferior da classe que contém a separatriz.

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 19/44

19

ant  Fac - freqüência acumulada na classe anterior à classe quecontém a separatriz   sh - amplitude da classe que contém a separatriz.

   s F  - freqüência da classe que contém a separatriz.

  P – posição da separatriz, sendo P calculado por 100 100i

o

i F i n P  ⋅ ⋅= =∑

, sendo i o número percentual da separatriz.

Exercício 1: Calcule a média aritmética, a moda, a mediana e os percenits 25e 75.

Classes F  i  x i  x i⋅ F i F ac

80 |----- 8484 |----- 88

88 |----- 9292 |----- 9696 |----- 100

100 |----- 104

311

13852

Total (n) 42

Exercício 2: A tabela abaixo representa as taxas de colesterol (mg/dl) de 90indivíduos da Cidade de Framingham, EUA em 1998.

Classes Fi 

100 |----- 150150 |----- 200200 |----- 250250 |----- 300300 |----- 350350 |----- 400400 |----- 450450 |----- 500

224351410311

Total (n) 90Agora, pede-se:

a) média aritmética

b) modac) medianad) acima de qual taxa encontram-se 80% dos indivíduos? Qual o

percentil correspondente?

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 20/44

20

Capítulo IV - Medidas de Dispersão

Servem para verificarmos a representatividade das medidas de posição,pois é muito comum encontrarmos séries que, apesar de terem mesma média,

são compostas de maneira distinta.Assim para as séries:

a) 20, 20, 20, 20, 20b) 15, 10, 20, 25, 30temos 20== ba X  X  .

Note que os valores da série “a” se concentram totalmente na média 20,enquanto que os valores da série “b” se dispersam em torno do mesmo valor.Ou seja, a série “a” não apresenta dispersão entre os valores e os valores dasérie “b” estão dispersos em torno de 20. Vamos agora medir o grau deconcentração ou dispersão dos dados em torno da média.

- Desvio Médio e Variância

Desvio Médio – Neste caso considera-se o módulo de cada desvio)( X   X  

i− , evitando com isso que ∑ =0id  . Assim o Desvio Médio é dado por:

 N 

 F d 

 N 

 F  X  X  DM 

iiii ∑∑ ⋅=

⋅−=

 Trata-se da média aritmética dos desvios considerados em módulos.

Variância – Neste caso considera-se o quadrado de cada desvio 2)( X  X i − ,

evitando com isso que ∑ =0id  . Assim, a definição da variância é dada por:

 N  F d 

 N  F  X  X  iiii

∑∑⋅

=⋅−

=

22

2 )(σ 

Obs:  2σ   indica variância e lê-se sigma ao quadrado e  X  é a média da

população.Para o caso do cálculo da variância de valores amostrais é conveniente

usarmos a seguinte fórmula:

1

)(2

2

⋅−=

∑ N 

 F  X  X S 

ii

Como podemos notar, as diferenças entre as fórmulas são: para o caso davariância populacional 2

σ   , utiliza-se a média populacional  X   tendo como

denominador o tamanho da população N. Para o cálculo da variância amostral2

S  , utiliza-se a média amostral  X   tendo no denominador o tamanho daamostra menos um.

 Temos também outras fórmulas para o cálculo da variância:

( )

−= ∑∑

 N 

 F  X  F  X 

 N 

ii

ii

2

22 1σ  

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 21/44

21

( )

−= ∑

∑ N 

 F  X  F  X 

 N S 

ii

ii

2

22

1

1

- Desvio Padrão

O Desvio Padrão de um conjunto de dados é uma medida que nos fornecea variação dos valores em relação à média aritmética.

Para o cálculo do Desvio Padrão deve-se primeiramente determinar ovalor da variância e, em seguida extrair a raiz quadrada desse resultado.

2σ  σ  = é o desvio padrão populacional2

S S = é o desvio padrão amostral

- Coeficiente de Variação

 Trata-se de uma medida relativa de dispersão, útil para a comparação em

termos relativos do grau de concentração em torno da média de sériesdistintas. É dado por:

C.V = X 

σ  

ou .S 

C V  X 

=

Obs: Geralmente multiplica-se a coeficiente de variação por 100, paradarmos o resultado em porcentagem.

Para classificarmos uma distribuição em relação à sua variabilidade,usaremos o seguinte critério:

• Baixa dispersão: CV ≤ 15%• Média dispersão: 15% < CV < 30%• Alta dispersão: CV ≥ 30%

Exercícios:

1) Dada a distribuição de freqüência:Classes Fi 

100 |----- 150150 |----- 200200 |----- 250250 |----- 300300 |----- 350

524261510

Total (n) 80

Pede-se:a) construir o histograma e o polígono de frequênciab) calcular a médiac) calcular a medianad) calcular o desvio médioe) determinar a variância e o desvio-padrão amostralf) qual é o coeficiente de variaçãog) D2 , P75 , Q1

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 22/44

22

2) Na série abaixo que representa o peso de um grupo de 440 pessoas,determinar:

Classes Fi  Fa

c

60 |--- 6666 |--- 7272 |--- 7878 |--- 8484 |---| 90

120

180

804020

120

300

380

420

440

 

∑440

a) Média, Mediana e Modab) A separatriz que representa o 3º quartilc) A separatriz que representa o 9º decild) Acima de que peso estão situadas 20% das pessoase) A variância e o Desvio Padrão Amostralf) O coeficiente de variação e sua classificação

3) Uma pesquisa realizada em uma certa comunidade, com relação a uma

amostra de 500 pessoas revelou a seguinte série com relação a idade dapopulação:

Classes Fi  Fa

c

0 |--- 1212 |--- 2424 |--- 3636 |--- 4848 |---| 60

60140

180

8040

60200

380

460

500

 

∑500

Determine:a) A idade médiab) A idade que aparece com maior freqüênciac) A idade mediana

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 23/44

23

d) A separatriz que representa o 4º Decile) Acima de que idade estão 25% da comunidadef) O Desvio Médio e sua interpretaçãog) A Variânciah) O Desvio Padrão e sua interpretaçãoi) O Coeficiente de Variação e classifique o grau de dispersão.

4) Dada a Distribuição abaixo:Tempo de auditoria de uma empresa

 Tempo deauditoria(em Min)

NºBalançosFi

10 |-----2020 |----- 3030 |----- 4040 |----- 5050 |-----| 60

53121020

 Total (n) 50

Determine:a) O tempo médio dos balançosb) A Modac) A Medianad) O percentil 20 e sua interpretaçãoe) O desvio médio e sua interpretação

f) O desvio padrão e sua interpretaçãog) O coeficiente de variação e sua classificação

Capítulo V – Medidas de Assimetria e Curtose

5.1. Observações sobre a Distribuição Normal

Muitas medidas extraídas de pesquisas na área biomédica, medidas deprodutos fabricados em série e também os erros de algumas medidas dãoorigem a gráficos semelhantes ao apresentado na figura abaixo. Todas essasmedidas têm distribuições que se aproximam da Distribuição Normal.

A Distribuição Normal é uma distribuição conhecida e muito estudada,

tendo inclusive todas as suas probabilidades calculadas. Assim, é importantesabermos se uma distribuição está próxima da Normal, pois, neste casorecairíamos em uma distribuição muito conhecida, onde poderíamos estudar adistribuição inicial utilizando a distribuição normal.

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 24/44

24

5.2. Assimetria

Denominamos assimetria o grau de deslocamento lateral de umadistribuição em relação a uma distribuição simétrica, denominadadistribuição normal.

- Coeficiente de Assimetria de Pearson

Este coeficiente determina o grau de deslocamento lateral de umadistribuição normal e será calculado através da fórmula:

As =°( )3 X X 

- Classificação quanto à Assimetria

Para classificarmos uma distribuição quanto a intensidade de suaassimetria, usaremos o seguinte critério:

• Assimetria muito fraca: 0 < |As| ≤ 0,5• Assimetria fraca: 0,5 < |As| ≤ 1,5• Assimetria forte: |As| > 1,5

Distribuição assimétrica para a

esquerda (ou distribuição

assimétrica negativa): Amédia, e a mediana estão à

esquerda da moda, isto é, As <

0.

Distribuição simétrica (ou

assimetria nula): A média,

a moda e a mediana

coincidem, isto é, As = 0

Distribuição assimétrica para a

direita (ou distribuição

assimétrica positiva): A média,

e a mediana estão à direita damoda, isto é, As > 0.

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 25/44

25

Obs: Se uma distribuição de freqüência for assimétrica muito forte, a medidade posição mais adequada para ser utilizada é a mediana.

- Curtose

Denominamos curtose o grau de achatamento de uma distribuição emrelação a uma distribuição simétrica, denominada curva normal.

- Coeficiente de Curtose

Este coeficiente determina o grau de achatamento de uma distribuiçãonormal e será calculado através da fórmula:

K =( )

75 25

90 102

 P P 

 P P 

−⋅ −

- Classificação quanto à Curtose

Para classificarmos uma distribuição quanto à curtose, usaremos oseguinte critério:

K = 0,263 → distribuição mesocúrtica (achatamento normal)K < 0,263 → distribuição leptocúrtica (achatamento pequeno)K > 0,263 → distribuição platicúrtica (achatamento grande)

Exercício: Uma pesquisa sobre a renda anual familiar realizada com umaamostra de 1000 pessoas na cidade de Tangará resultou na seguintedistribuição de freqüência. Calcule a assimetria e a curtose com as suasclassificações.

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 26/44

26

Salário Anual (Em R$1000)

Fi 

0,00 |---- 10,0010,00 |----20,0020,00 |----30,0030,00 |----40,0040,00 |----50,0050,00 |----60,0060,00 |----70,0070,00 |----80,00

25030020012060402010

Total 1000

Capítulo VI – Correlação e Regressão Linear

6.1. Análise de Regressão Linear e de CorrelaçãoEsta parte da Estatística, lida com uma amostra (parte de uma população)

de dados emparelhados, o objetivo principal da análise de regressão é predizer

o valor de uma variável (a variável dependente), dado que seja conhecido ovalor de uma variável associada (variável independente). A equação deregressão é a fórmula algébrica pela qual se determina o valor previsto davariável dependente.

6.2. Equação de Regressão Linear para dados de uma amostra:

  xY a bX  = +

 xY   é o valor estimado da variável dependente, dado um valor específico

da variável independente X 

a é o ponto de interseção da linha de regressão linear com o eixo Y ( X =0)b é a declividade (inclinação) da linha de regressão

6.3. Método dos Mínimos Quadrados para ajustar uma linha deregressão:

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 27/44

27

Pelo critério dos mínimos quadrados, a linha (e a equação) de regressãoque melhor ajusta é aquela que é mínima a soma dos quadrados dos desviosentre os valores observados e estimados da variável dependente.

As fórmulas de cálculo pelas quais os valores de a e b da equação linearpodem ser determinados, de tal forma que satisfaça o critério dos mínimosquadrados é:

  22

 −=−

∑∑

  XY n X Y  b

  X n X  

 

a Y b X  = −onde:

 X  é a média aritmética dos valores da variável X , isto é,    =      

∑ X  X 

n;

Y é a média aritmética dos valores da variável Y , isto é,    =      ∑Y Y 

n.

Uma vez formulada a equação de regressão, podemos utilizá-la paraestimar o valor da variável dependente Y dado um valor da variávelindependente X . Contudo, tal estimação deve ser feita apenas dentro dointervalo de variações dos valores amostrais.

6.4. Coeficiente de Correlação Linear de Pearson:

O coeficiente de correlação linear de Pearson (r ), mede o grau derelacionamento linear entre os valores de duas variáveis em uma amostra.Para calcularmos o coeficiente de correlação de Pearson, entre duas variáveis( X e Y ), usaremos a fórmula abaixo:

( ) ( )2 22 2 

−=

 − −    

∑ ∑ ∑∑ ∑ ∑ ∑

n XY X Y  r 

n X X n Y Y  

Obs.:i) Devemos arredondar o coeficiente de correlação linear (r ) para

três casas decimaisii) O valor de r poderá variar de -1 a 1, isto é, -1 ≤  r  ≤ 1.iii) Se r  > 0, diremos que a correlação linear é positiva.iv) Se r  < 0, diremos que a correlação linear é negativa.v) Se r  = 0, diremos que não existe correlação linear entre as

variáveis.

6.5. Diagrama de Dispersão:

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 28/44

28

É um gráfico no qual cada ponto plotado representa um par observado devalores para as variáveis dependente e independente.

Variável independente – X Variável dependente – Y A forma da relação representada pelo diagrama de dispersão pode ser

curvilínea em lugar de linear, o que não trataremos aqui.

Exemplos:

  0 1r < ≤   1 0r − ≤ <

Uma linha de regressão com uma inclinação positiva, indica uma relaçãodireta entre as variáveis;

Uma linha de regressão com uma inclinação negativa, indica uma relaçãoinversa entre as variáveis; e

Uma inclinação nula indica que a s variáveis não estão relacionadas.Além disso a extensão da dispersão dos pontos com relação à linha de

regressão indica o grau de relacionamento entre as variáveis.

6.6. Erro Padrão de Estimação e intervalos de prediçãoO erro padrão de estimação é uma medida das diferenças (ou distâncias)

entre os valores amostrais Y  observados e os valores preditos  xY  obtidosatravés da reta de regressão. Este erro será calculado através da seguintefórmula:

  ( )2

2

 x

YX 

Y Y S 

n

−=

−∑

 Para fins de cálculos, é mais conveniente uma versão alternativa da

fórmula que não requer a determinação do desvio entre casa valor observado

de Y e o valor sobre a linha de regressão x

Y  , é ela:

 2

2YX 

Y a Y b XY  S 

n

− −=−

∑ ∑ ∑O erro padrão de estimação YX S  , pode ser usado para estabelecer um

intervalo de predição para a variável dependente, dado um valor específico davariável independente:

   x YX  Y t S ±   → Intervalo de predição para a variável dependente Y . Os graus

de liberdade para a distribuição t são n-2 .

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 29/44

29

Quando 30n ≥ , podemos utilizar a distribuição normal:

   x YX  

Y n S ±

Exercícios:

1) Um analista toma uma amostra aleatória de 10 carregamentosrecentes por caminhão feitos por uma companhia e anota a distância emquilômetros e o tempo de entrega ao meio-dia mais próximo:

Carregamentoamostrado

1 2 3 4 5 6 7 8 9 10

Distância X , em km

 Tempo de Entrega Y ,em dias

825

3,5

215

1,0

1070

4,0

550

2,0

480

1,0

920

3,0

1350

4,5

325

1,5

670

3,0

1215

5,0

a) Construir o diagrama de Dispersãob) Determinar a Equação de regressão de mínimos quadradosc) Usando a equação de regressão desenvolvida acima, estimar o tempo

de entrega para um carregamento para 1.000 Km.

  Resp: x

Y  =

3,72 dias

d) Esta equação de regressão poderia ser usada para estimar o tempo deentrega para um carregamento de 2.500 Km?e) Calcular o erro padrão de estimação para o problema de análise do

tempo de entrega.  Resp: YX S  = 0,42f) Calcular o Coeficiente de Correlaçãog) Construir um intervalo estimado de predição de 95% para o tempo de

entrega, envolvendo um carregamento para 1.000 Km, sem considerara incerteza associada com a própria posição da linha de regressão.

  Resp:  x YX  

Y t S ± = 3,72 ± (2,306).(0,42) = 3,72 ± 0,96 =

2,76 a 4,68 dias

2) A tabela abaixo apresenta dados de uma amostra referentes aonúmero de horas de estudo fora de classe para determinados alunos de umcurso de Estatística de 3 semanas, bem como suas notas obtidas em umaprova no final do curso:

EstudanteAmostrado

1 2 3 4 5 6 7 8

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 30/44

30

Horas de estudo, X 20

16

34

23

27

32

18

22

Nota na prova, Y 64

61

84

70

88

92

72

77

a) Construir o diagrama de Dispersãob) Determinar a Equação de regressão de mínimos quadrados

Resp:

40 1,5= +Y X 

c) Usando a equação de regressão desenvolvida acima, estimar a nota naprova de um aluno que estudou 30 horas fora da classe

  Resp: xY  = 85

d) Esta equação de regressão poderia ser usada para estimar a nota deum aluno que estudo 40 horas fora de classe? Porquê?

e) Calcular o erro padrão de estimação.f) Construir um intervalo estimado de predição de 90% para a nota na

prova, dado que o aluno estudou 30 horas fora da classe.

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 31/44

31

Capítulo VII – Probabilidade

7.1. Exemplos de Experimentos Não-Determinísticos (aleatórios)

Experimentos Aleatórios (E) são aquelas que, mesmo repetidos várias

vezes sob condições semelhantes, apresentam resultados imprevisíveis.

  :1 E   Jogue um dado e observe o número mostrado na face de cima.

:2 E   Jogue uma moeda quatro vezes e observe o número de caras

obtido.

:3 E   Jogue uma moeda quatro vezes e observe a seqüência de caras

e coroas.

:4 E  Em uma linha de produção, fabrique peças em série e conte o

número de peças defeituosas produzidas em um período de 24 horas.

5: E  Peças são fabricadas até que 10 peças perfeitas sejam

produzidas. O número total de peças fabricadas é contado.

6: E  De uma urna, que só contém bolas pretas, tira-se uma bola e

verifica-se sua cor.

7.2. O Espaço Amostral

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 32/44

32

Definição: Para cada experimento  E  do tipo que estamos considerando,

definiremos o espaço amostral como o conjunto de todos os resultados

possíveis de E. Geralmente representamos esse conjunto por S.

Vamos considerar cada um dos experimentos acima e descrever um

espaço amostral para cada um deles. O espaço amostral iS  se refere ao

experimento i E  .

:1S  { }6,5,4,3,2,1

:2

S  { }4,3,2,1,0

=

c o r o ao uc a r aa p a r e ç ac o n f o r m e

 ,o uc a d ao n d e,,,f o r m ad a  p o s s í v e i ss e q u ê n c i a sa st o d a s :

4321

3

T  H aaaaaS 

i

{ } N S  ,....,2,1,0 :4 , onde N é o número máximo que pode ser

produzido em 24 horas.

{ }5: 10,11,12,.....S 

{ }6: bola pretaS 

A fim de descrever um espaço amostral associado a um experimento,

devemos ter uma idéia bastante clara daquilo que estamos mensurando ou

observando. Por isso, devemos falar de “um’ espaço amostral associado a um

experimento e não de “o” espaço amostral.

7.3. Eventos

Outra noção fundamental é o com eito de evento. Um evento A (relativo a

um particular espaço amostral S, associado a um experimento E) é

simplesmente um conjunto de resultados possíveis. Na terminologia de

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 33/44

33

conjuntos, um evento é um subconjunto de um espaço amostral. Qualquer

resultado individual pode ser considerado como um evento.

{ }6,4,2é,istoocorre,númeroUm: 11 = A A .

{ }2:2 A ; isto é duas caras ocorrem.

{ }THHH  HTHH  HHTH  HHHT  HHHH  A  ,,,,:3 ; isto é, mais caras do que

coroas ocorrem.

{ }0:4 A ; isto é, todas as peças são perfeitas.

Agora, poderemos empregar as várias técnicas de combinar conjuntos

(isto é, eventos), os quais já apresentamos anteriormente.

a) Se A e B forem eventos,  B A ∪ será o evento que ocorrerá

se, e somente se, A ou B (ou ambos) ocorrerem.

 b) Se A e B forem eventos,  B A ∩ será o evento que ocorrerá

se, e somente se, A e B ocorrerem.

c) Se A for um evento A será o evento que ocorrerá se, e

somente se, A não ocorrer.

d) Se n A A A ,....,, 21 for qualquer coleção finita de eventos,

então, i

n

i A1=∪ será o evento que ocorrerá se, e somente se,

ao menos um dos eventos i A ocorrer.

e) Sen

 A A A ,....,, 21

for qualquer coleção finita de eventos,

então, i

n

i A1=∩ será o evento que ocorrerá se, e somente se,

todos os eventos i A ocorrerem.

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 34/44

34

f) Suponha que S represente o espaço amostral associado a

algum experimento E, e que executamos E duas vezes.

Então, S S × poderá ser empregado para representar todos

os resultados dessas duas repetições. Portanto,

( ) S S  s s ×∈21 , significa que 1 s resultou quando E foi

executado a primeira vez e 2 s , quando foi executado a

segunda vez.

Definição: Dois eventos A e B são denominados mutuamente excludentes,se eles não puderem ocorrer juntos. Escrevemos isso como ∅=∩ B A , isto é, a

interseção de A e B é o conjunto vazio.

7.4. Noções Fundamentais de Probabilidade

Definição: Seja E um experimento. Seja S um espaço amostral associado a

E. A cada evento A associaremos um número real representado por P(A) e

denominado probabilidade de A, que satisfaça as seguintes propriedades:

(1) 1)(0 ≤≤ A P  .

(2) P(S) = 1.

(3) Se A e B forem eventos mutuamente excludentes,

( ) )()( B P  A P  B A P  +=∪

(4) Se n A A A ,....,, 21 ,.... forem dois a dois eventos mutuamente

excludentes, então,

  ( ) ......)(.....)()( 211 ++++=∪∞

= ni A P  A P  A P  P 

Teorema 1: Se for o conjunto vazio, então 0)( =∅ P  .

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 35/44

35

0)()()()(

)()(

=∅⇒=∅+

=∅∪

=∅∪

 P  A P  P  A P 

 A P  A P 

 A A

Teorema 2: Se  A o evento complementar de A, então )(1)( A P  A P  −= .

Teorema 3: Se A e B forem dois eventos quaisquer , então

)()()()( B A P  B P  A P  B A P  ∩−+=∪ .

Teorema 4: Se A, B e C forem três eventos quaisquer , então

)()()()()()()()( C  B A P C  B P C  A P  B A P C  P  B P  A P C  B A P  ∩∩+∩−∩−∩−++=∪∪ .

Teorema 5: Se )()(então, B P  A P  B A ≤⊂ .

7.5. Probabilidade de um evento ocorrer:

O método de avaliar P( A) é freqüentemente enunciado da seguinte

maneira:casosdetotalnº

Aafavoráveiscasosdenº)( = A P  .

7.6. Probabilidade Condicionada

Vamos examinar agora a diferença entre extrair peças de um lote ao

acaso, com ou sem reposição.

C/ reposição S/ reposição

7 V

2 bolas

A = {1ª bola extraída é B}

B = {2ª bola extraída é B}

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 36/44

36

10

3)(

10

3)(

=

=

 B P 

 A P 

 

=

=

o c on ã oAs e 9

3

o c o r rAs e 92

)(

1 0

3)(

 B P 

 A P 

Definição: Sejam A e B dois eventos associados a um experimento.

Denotaremos P( A/B) a probabilidade condicionada do evento B dado que o

evento A ocorreu, e definimos como:

0)(, )(

)()/(

0)(, )(

)()/(

>∩

=

>∩

=

 B P  B P 

 B A P  B A P 

 A P  A P 

 A B P  A B P 

Teorema da Multiplicação

)()/()(

)()/()(

 B P  B A P  B A P 

 A P  A B P  B A P 

⋅=∩

⋅=∩

•  1)/(0 ≤≤ B A P 

•  1)/( = AS  P 

•  ∅=∩+=∪ 212121  se )/()/()/( B B A B P  A B P  A B B P 

•  ∅=∩+++=∪∪∪   jinn B B P(B A B P  A B P  A B B B P   se /A).....)/()/()/.....(2121

Ex1: Suponha que o escritório possua 100 máquinas de calcular. Algumas

dessas máquinas são elétricas (E), enquanto outras manuais (M); e algumassão novas (N) e outras usadas (U). A tabela abaixo dá o número de máquina decada categoria. Uma pessoa entra no escritório, pega uma máquina ao acaso,e descobre que é nova. Qual será a probabilidade de que seja elétrica?

P(E/N) = ?E M

N 40

30

70

U 2 1 30

7

4)/(

70

40)/(

)(

)()/(

=

=

∩=

 N  E  P 

 N  E  P 

 N  P 

 N  E  P  N  E  P 

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 37/44

37

0 060

40

100

Definição: Dizemos que os eventos k  B B B ,....,, 21 representam uma

partição do espaço amostral S quando:

a)   ji B B   ji ≠∅=∩   para,

b) S  Bi =∪

c) 0)( >i B P   

Por exemplo: Na jogada de um dado:

}6{

}5,4,3{

}2,1{

3

2

1

=

=

=

 B

 B

 B

 

Representam uma partição. Como os i B são eventos mutuamente

excludentes, podemos escrever:

)(.....)()()( 21 k  B A P  B A P  B A P  A P  ∩++∩+∩=

Assim;

Ex2: Consideremos o lote de 20 peças defeituosas e 80 não defeituosas,

do qual extrairemos duas peças sem reposição. Sejam A e B os eventos:

 A = {a primeira peça extraída é defeituosa}

B = {a segunda peça extraída é defeituosa}

Podemos agora calcular P(B), assim:

)()/()()/()( A P  A B P  A P  A B P  B P  ⋅+⋅=

B1

B2

B3

B4

)()/(.....)()/()()/()( 2211 k k  B P  B A P  B P  B A P  B P  B A P  A P  ⋅++⋅+⋅=

Teorema da Probabilidade Total

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 38/44

38

99

20)/(

99

19)/(

5

4

5

11)(

5

1

100

20)(

=

=

=−=

==

 A B P 

 A B P 

 A P 

 A P 

5

1

5

4

99

20

5

1

99

19)( =⋅+⋅= B P 

Ex3: Uma determinada peça é manufaturada por três fábricas, digamos 1,

2 e 3. Sabe-se que 1 produz o dobro de peças que 2, e 2 e 3 produzem o

mesmo número de peças. Sabe-se também que 2% das peças produzidas por 1

e 2 são defeituosas, enquanto 4% daquelas produzidas por 3 são defeituosas.

 Todas as peças produzidas são colocadas em um depósito, e depois uma peça

é extraída ao caso. Qual é a probabilidade de que essa peça seja defeituosa?

Vamos introduzir os seguintes eventos:

D = {a peça é defeituosa}

1 B = {a peça provém de 1}

2 B = {a peça provém de 2}

3 B = {a peça provém de 3}Pede-se P(D), então podemos escrever:

1 1 2 2 3 3( ) ( / ) ( ) ( / ) ( ) ( / ) ( ) P D P D B P B P D B P B D B P B= ⋅ + ⋅ + ⋅

4

1)( 

2

1

4

1.2)( 

4

1)(

1)(4

1)()()(2

1)()()(

312

2

222

321

====

=

=++

=++

 B P  B P  B P 

 B P 

 B P  B P  B P 

 B P  B P  B P 

1

2

3

( / ) 0,02

( / ) 0,02

( / ) 0,04

1 1 1( ) 0, 02. 0, 02. 0, 04. 0, 01 0, 01 0, 005 0, 025

2 4 4

  P D B

  P D B

  P D B

 P D

===

= + + = + + =

 P ( D) =0,025

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 39/44

39

Suponha agora que a peça retirada é defeituosa. Calcular a probabilidade

dela ter sido manufaturada pela fábrica 1?

11

( )( / )

( )

  P B D P B D

 P D

∩= ?

7.7.Teorema de Bayes

Seja k  B B B ,......,, 21 uma partição do espaço amostral S e seja A um

evento associado a S. Aplicando a definição de probabilidade condicionada,

podemos escrever:

∑=

=k 

  j  j  j

iii

 B P  B A P 

 B P  B A P  A B P 

1 )()./(

)()./()/(

Este resultado é conhecido como Teorema de Bayes.

Assim voltando ao problema anterior:

1 11

( / ). ( ) 0,02 . 1/ 2( / ) 0,4

( ) 0,025

 P D B P B P B D

 P D= = =

Ex 1) Dadas 5 caixas , contendo bolas brancas e bolas pretas. Temosduas caixas do tipo I, duas caixas do tipo II e uma caixa do tipo III; a caixa dotipo I possui 2 bolas brancas e 4 bolas pretas, a caixa do tipo II possui 3 bolasbrancas e 3 bolas pretas e a caixa do tipo III só possui bolas brancas. Seretirarmos ao acaso uma bola branca, qual a probabilidade dessa bola tervindo da caixa III?

 37,5%

7.8. Eventos Independentes 

Dois eventos A e B são eventos independentes quando estão inteiramentenão relacionados. Saber que B ocorreu não fornece qualquer informação sobre

a ocorrência de A.

Assim a probabilidade absoluta (ou não condicionada) P( A) é igual à

probabilidade condicionada P( A/B).

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 40/44

40

Daí poderíamos dizer que A e B serão independentes se, e somente se,

P( A/B) = P( A) e

P(B/ A) = P(B).

Assim:

)()()()/()(

)()()()/()(

 A P  B P  A P  A B P  B A P 

 B P  A P  B P  B A P  B A P 

⋅=⋅=∩

⋅=⋅=∩

Logo:

Definição:  A e B serão eventos independentes se, e somente se,

)()()( B P  A P  B A P  ⋅=∩ .

Exercícios

1) Um grupo de 50 elementos apresenta a seguinte composição:

Homens MulheresMenores

15 5

Adultos 18 12

Um elemento é escolhido ao acaso. Pergunta-se:a) Sabendo-se que o elemento escolhido é adulto, qual a probabilidade de

ser homem?b) Dada que a escolhida é mulher, qual é a probabilidade de ser menor?c) Qual a probabilidade de ser menor e mulher? 

a) 60% b) 29% c) 10%

2) Em uma fábrica de parafusos, as máquinas A, B e C produzem 35%, 40% e25% do total produzido, respectivamente. Da produção de cada máquina, 6%,5% e 3%, respectivamente, são parafusos defeituosos. Escolhe-se ao acaso umparafuso e verifica-se ser defeituoso. Qual será a probabilidade de que oparafuso venha da máquina A? Da B? Da C?

  P(A/D) = 43,3% P(B/D) = 41,2% P(C/D) = 15,5%3) Dada 6 caixas todas contendo bolas brancas e bolas pretas, temos 2 caixasdo tipo I, 3 caixas do tipo II e 1 caixa do tipo III. A caixa I possui 2 bolas

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 41/44

41

brancas e 4 bolas pretas, a caixa II possui 3 bolas brancas e 3 bolas pretas e acaixa III só possui bolas brancas. Se extrairmos uma bola ao acaso everificamos que ela é preta. Qual a probabilidade dessa bola ter vindo da caixaII?

 53%

4) Suponha que você tenha duas moedas em seu bolso, sabe-se que uma é

honesta e a outra apresenta duas cara. Extraindo ao acaso uma moeda e

 jogando-a obtém-se cara. Qual a probabilidade da moeda ser honesta?

33,33%

 

5) Em um certo colégio, 5% dos homens e 2% das mulheres têm mais do que

1,80m de altura. Por outro lado, 60% dos estudantes são homens. Se um

estudante é selecionado aleatoriamente e tem mais de 1,80m de altura, qual aprobabilidade de que o estudante seja mulher?

6) Suponha que 5% das pessoas com sangue tipo O sejam canhotas, 10% das

pessoas com outro tipo de sangue sejam canhotas, e 40% das pessoas tenham

sangue tipo O. Selecionando um canhoto aleatoriamente, qual a probabilidade

dele ter sangue tipo O? 25%

7) Suponha que 70% das pessoas com olhos castanhos, 20% das pessoas comolhos verdes e 5% das pessoas com olhos azuis tenham todas cabelos

castanhos. Suponha ainda que 75% das pessoas tenham olhos castanhos, 5%

tenham olhos azuis e 20% tenham olhos verdes. Qual é a probabilidade de

uma pessoa de cabelos castanhos, escolhida ao acaso, ter olhos verdes?

8) Segundo a OMS existem dois exames (A e B) para detectar o vírus HPV.

Além disso, informou-se que as probabilidades de ser detectado

adequadamente a existência do vírus valem 0,90 e 0,95, se utilizado o exameA e B respectivamente. Por ser mais barato 70% das brasileiras optam por

fazer o exame A. Dessa forma:

a) Qual a probabilidade de uma brasileira não ser detectada(adequadamente) como tendo o vírus HPV?8,5% 

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 42/44

42

b) Que percentual das brasileiras, que foram detectadas como tendo HPV,optaram pelo exame B?31,15% 

9) Um lote é formado de 25 artigos bons, 10 com defeitos menores e 5 com

defeitos graves. Um artigo é escolhido ao acaso. Ache a probabilidade de que:a) ele não tenha defeitos?

62,5% b) ele não tenha defeitos graves?

87,5%c) ele ou seja perfeito ou tenha defeitos graves?

75%

10) Três jornais, A, B e C são publicados em uma cidade e uma recentepesquisa entre os leitores indica o seguinte:

20% lêem A26% lêem B14% lêem C8% lêem A e B5% lêem A e C4% lêem B e C2% lêem A,B e C

Para um adulto escolhido ao acaso, calcule a probabilidade de que:a) ele não leia qualquer dos jornais?

55% b) ele leia exatamente um dos jornais?

32%c) ele leia somente o jornal A ?

9%d) ele leia pelo menos dois jornais?

13%e) ele leia apenas dois jornais?

11%f) ele leia pelo menos um jornal?

45% 

11) Um aluno responde a um exame de múltipla escolha no qual cada questãotem quatro alternativas das quais uma resposta é correta. A probabilidade de

que ele saiba a resposta correta é de 60%. Caso contrário, ele seleciona aocaso uma resposta entre as quatro possíveis. Se o aluno seleciona a respostacorreta para uma questão, qual é a probabilidade de que ele realmente saiba aresposta correta? 86%

12) Uma clínica especializada trata de 3 tipos de moléstias; X, Y e Z. 50% dosque procuram a clínica são portadores de X, 40% são portadores de Y e 10% deZ. As probabilidades de cura, nesta clínica, são:

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 43/44

43

moléstia X: 0,8moléstia Y: 0,9moléstia Z: 0,95

Um enfermo saiu curado desta clínica. Qual a probabilidade de que ele

tenha sofrido a moléstia Y?42%

13) A probabilidade de um indivíduo de classe A comprar um carro é3

4, de

classe B é1

6e de classe C é

1

20. A probabilidade do indivíduo de classe A

comprar um carro da marca D é

1

10 ; de B comprar da marca D é

3

5 e de C é

3

10

. Em certa loja comprou-se um carro da marca D. Qual a probabilidade de que

o indivíduo da classe B o tenha comprado?

52,63%

14) Suponha que esteja em curso uma eleição com dois candidatos, João e

Pedro. Dos habitantes da cidade, 23

apóiam Pedro, mas 59

dos habitantes do

interior apóiam João. Metade dos habitantes vivem no interior e metade na

cidade. Se você inicia uma conversa com um eleitor que se revela a favor de

Pedro, qual é a probabilidade desse eleitor viver no interior?

40%

15) Os analistas de acidentes de trânsito afirmam que a probabilidade de ummotorista provocar um acidente vale 3/4 se ingerir alguma bebida alcoólica e1/4 , caso contrário. É sabido que no RJ (durante os fins de semana) 60% dosmotoristas se servem de bebidas alcoólicas. Com essas informações:

a) Qual a probabilidade de um motorista do RJ não sofrer acidente no fimde semana?b) E sabendo que houve um acidente grave no RJ no sábado à noite, qual

a probabilidade do motorista ter ingerido bebida alcoólica?

5/9/2018 Apostila Estat stica e Probabilidade - slidepdf.com

http://slidepdf.com/reader/full/apostila-estatistica-e-probabilidade 44/44

44

16) Wallace, ao volante de seu conversível, encontra-se em uma encruzilhadanuma zona rural. Ele sabe que uma dessas estradas leva à cidade maispróxima, para onde ele deseja ir, e que a outra leva até uma fazenda vizinha,porém não sabe qual é a correta a seguir. Na encruzilhada ele encontra quatrocamponeses A, B, C e D que conhecem bem a estrada, e decide dirigir-se aoacaso a um deles para perguntar qual estrada deve seguir. O que ele não sabe

é que, enquanto A fala sempre a verdade, B fala a verdade só 70% das vezes,C 50% das vezes e D sempre mente.

a) Determine a probabilidade de Wallace ser enviado ao caminho certo.b) Se ele descobrir que foi enviado ao caminho errado, qual a probabilidade

de que o camponês B tenha sido o que lhe deu a informação?

c) Mesma pergunta para o camponês C.

Capítulo VIII – Distribuição Normal