144
Probabilidade e Estatística Probabilidade e Estatística i

Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

  • Upload
    lenhan

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Probabilidade e Estatística

i

Page 2: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Sumário

1 Estatística Descritiva 1

1.1 Conceitos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 Definições importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Tabelas Estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2.1 Série Cronológica ou Temporal . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2.2 Série Geográfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2.3 Série Específica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3 Distribuição de Frequência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3.1 Construção de uma distribuição de frequência . . . . . . . . . . . . . . . . . 4

1.4 Gráficos Estatísticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4.1 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4.2 Polígono de Frequência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4.3 Gráfico de Linhas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.4.4 Gráfico de Colunas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.4.5 Gráfico em Barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.4.6 Gráfico de Setores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.5 Medidas de Posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.5.1 Média Aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.5.2 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.5.3 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.6 Medidas de Dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.6.1 Amplitude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.6.2 Desvio Médio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.6.3 Variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

1.6.4 Desvio Padrão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

1.6.5 Coeficiente de Variação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

1.7 Atividades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

ii

Page 3: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

2 Teoria dos Conjuntos e Contagem 23

2.1 Teoria dos Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.1.1 Comparação entre conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.1.2 União de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.1.3 Interseção de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.1.4 Diferença entre conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.1.5 Complementar de um conjunto . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.1.6 Propriedades entre as relações entre conjuntos . . . . . . . . . . . . . . . . . 27

2.2 Contagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.2.1 Regra da multiplicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.2.2 Regra da adição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.2.3 Permutação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.2.4 Arranjos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.2.5 Combinações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.2.6 Binômio de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.3 Atividades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3 Definições Básicas 34

3.1 Fundamentos de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.2 Noções de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.3 Espaços Amostrais Finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.4 Resultados Equiprováveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.5 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.5.1 Teorema da Multiplicação . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.5.2 Teorema da Probabilidade Total . . . . . . . . . . . . . . . . . . . . . . . . 41

3.5.3 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.6 Eventos Independentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.7 Atividades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4 Variáveis Aleatórias e Suas Distribuições 47

4.1 Variáveis Aleatórias Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.2 Variáveis Aleatórias Contínuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4.3 Função de Distribuição Acumulada . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.4 Variáveis Aleatórias Mistas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.5 Funções de Variáveis Aleatórias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.6 Atividades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

iii

Page 4: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

5 Esperança de uma Variável Aleatória 61

5.1 Variáveis aleatórias independentes . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

5.2 Esperança matemática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

5.3 Esperança de uma Função de Variável Aleatória . . . . . . . . . . . . . . . . . . . . 63

5.4 Propriedades da Esperança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.5 Variância de uma variável aleatória . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.6 Propriedades da variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5.7 Atividades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

6 Principais Distribuições Discretas 72

6.1 A Distribuição Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

6.2 A Distribuição Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

6.3 A Distribuição Geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

6.3.1 Perda de Memória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

6.4 A Distribuição Pascal (ou Binomial Negativa) . . . . . . . . . . . . . . . . . . . . . 79

6.4.1 Generalização do Binômio de Newton . . . . . . . . . . . . . . . . . . . . . 79

6.4.2 Distribuição Pascal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

6.5 Distribuição Hipergeométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

6.6 Distribuição Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

6.6.1 Aproximação da distribuição binomial pela Poisson . . . . . . . . . . . . . . 87

6.6.2 Distribuição Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

6.7 Atividades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

7 Principais Distribuições Contínuas 93

7.1 Distribuição Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

7.2 A Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

7.2.1 Padronização e Tabulação da Distribuição Normal . . . . . . . . . . . . . . 95

7.2.2 Aproximação da Distribuição Binomial pela Normal . . . . . . . . . . . . . 97

7.3 A Distribuição Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

7.3.1 Perda de Memória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

7.4 A Distribuição Gama . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

7.4.1 A Função Gama . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

7.4.2 Distribuição Gama . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

7.5 Atividades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

iv

Page 5: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

8 Introdução à Inferência Estatística 105

8.1 Definições Básicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

8.2 Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

8.2.1 Tipos de Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

8.2.2 Distribuição Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

8.2.2.1 Distribuição Amostral da Média . . . . . . . . . . . . . . . . . . . 108

8.2.2.2 Teorema Central do Limite . . . . . . . . . . . . . . . . . . . . . 109

8.2.2.3 Distribuição Amostral da Proporção . . . . . . . . . . . . . . . . 110

8.2.2.4 Distribuição Amostral da Diferença entre Médias . . . . . . . . . 111

8.2.2.5 Distribuição Amostral da Diferença entre Proporções . . . . . . . 111

8.3 Inferência Estatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

8.3.1 Estimação Pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

8.3.2 Propriedades dos Estimadores . . . . . . . . . . . . . . . . . . . . . . . . . 112

8.3.3 Alguns Estimadores Pontuais Importantes . . . . . . . . . . . . . . . . . . . 113

8.3.3.1 Estimador para a Média . . . . . . . . . . . . . . . . . . . . . . . 113

8.3.3.2 Estimador para a Variância . . . . . . . . . . . . . . . . . . . . . 114

8.3.3.3 Estimador para a Proporção . . . . . . . . . . . . . . . . . . . . . 114

8.3.4 Estimação Intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

8.3.5 Intervalo de Confiança para a Média . . . . . . . . . . . . . . . . . . . . . . 115

8.3.6 Intervalo de Confiança para a Proporção . . . . . . . . . . . . . . . . . . . . 116

8.3.7 Intervalo de Confiança para a Diferença de Médias . . . . . . . . . . . . . . 116

8.4 Regressão e Correlação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

8.4.1 Correlação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

8.4.1.1 Diagrama de Dispersão . . . . . . . . . . . . . . . . . . . . . . . 118

8.4.1.2 Coeficiente de Correlação de Pearson . . . . . . . . . . . . . . . . 120

8.4.2 Regressão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

8.4.2.1 O Poder Explicativo do Modelo . . . . . . . . . . . . . . . . . . . 124

8.5 Atividades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

A Apêndice - Tabela da Distribuição Normal 130

9 Índice Remissivo 132

v

Page 6: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Prefácio

BAIXANDO A VERSÃO MAIS NOVA DESTE LIVRO

Acesse https://github.com/edusantana/estatistica-livro/releases para verificar se há umaversão mais o Histórico de revisões, na início do livro, para verificar o que mudou entreuma versão e outra.

Este livro foi desenvolvido para a introdução do tema Probabilidade e Estatística, não tendo a ambiçãode englobar toda esta vasta área do conhecimento humano. Probabilidade e Estatística são as áreasdo conhecimento humano que lidam com a incerteza. Ambas lidam com experimentos em que existealguma variável (ou variáveis) que não temos controle, e portanto, mesmo mantendo as mesmascondições, um experimento pode fornecer vários resultados diferentes.

Probabilidade e Estatística podem ser vistas como ciências inversas. Quando se estuda probabilidade,conhecemos o modelo em estudo completamente, e estamos interessados em saber como os resul-tados do experimento se comportam (por exemplo, saber qual a probabilidade de sair um resultadoespecífico). Já na estatística, temos um conjunto de dados, mas não sabemos qual o modelo proba-bilístico que gerou estes dados, e portanto, tenta-se descobrir, a partir destes dados, qual o modeloprobabilístico que gerou estes dados.

Fenômenos aleatórios estão cada vez mais presentes em nossas vidas, e cada vez mais estamos inte-ressados em tentar entender estes fenômenos. Gráficos estatísticos estão cada vez mais presentes emnotícias, e é importante saber interpretar esses gráficos corretamente. Quando vemos os resultados deuma pesquisa eleitoral, é bom sabermos interpretar o seu significado, etc.. Vale a pena citar tambémque ferramentas estatísticas são utilizadas pelos bancos, para definir o rendimento em fundos de in-vestimento ou poupança, também são utilizadas pelas seguradoras para definir qual o valor do seguroque você tem que pagar (na prática eles calculam o seu risco), etc..

Para um aluno, probabilidade e estatística podem ser úteis da seguinte forma: i) são úteis para realizarpesquisa científica; ii) são úteis caso o aluno queira trabalhar em banco, seguradora, montadoras,instituições financeiras em geral, controle de qualidade da produção de algum item, etc..; iii) são úteisno dia-a-dia.

Finalizamos essa primeira parte do prefácio mostrando um exemplo de como a probabilidade podemostrar como a nossa intuição nos engana. Suponha que temos uma sala com 50 pessoas. Quala probabilidade de que pelo menos duas delas façam aniversário no mesmo dia do ano? Quandofalamos dia do ano, estamos falando dia e mês, não apenas dia. Temos 365 dias (vamos desconsideraro ano bissexto) e 50 pessoas. A intuição nos diz que essa probabilidade não deve ser muito grande.Entretanto, esta probabilidade é de 97%!

vi

Page 7: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Público alvo

O público alvo desse livro são os alunos de Licenciatura em Computação, na modalidade à distância1. Ele foi concebido para ser utilizado numa disciplina de Probabilidade e Estatística.

Como você deve estudar cada capítulo

• Leia a visão geral do capítulo

• Estude os conteúdos das seções

• Realize as atividades no final do capítulo

• Verifique se você atingiu os objetivos do capítulo

NA SALA DE AULA DO CURSO

• Tire dúvidas e discuta sobre as atividades do livro com outros integrantes do curso

• Leia materiais complementares eventualmente disponibilizados

• Realize as atividades propostas pelo professor da disciplina

Caixas de diálogo

Nesta seção apresentamos as caixas de diálogo que poderão ser utilizadas durante o texto. Confira ossignificados delas.

NotaEsta caixa é utilizada para realizar alguma reflexão.

DicaEsta caixa é utilizada quando desejamos remeter a materiais complementares.

ImportanteEsta caixa é utilizada para chamar atenção sobre algo importante.

1Embora ele tenha sido feito para atender aos alunos da Universidade Federal da Paraíba, o seu uso não se restringea esta universidade, podendo ser adotado por outras universidades do sistema UAB.

vii

Page 8: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

CuidadoEsta caixa é utilizada para alertar sobre algo que exige cautela.

AtençãoEsta caixa é utilizada para alertar sobre algo potencialmente perigoso.

Os significados das caixas são apenas uma referência, podendo ser adaptados conforme as intençõesdos autores.

Vídeos

Os vídeos são apresentados da seguinte forma:

Figura 1: Como baixar os códigos fontes: http://youtu.be/Od90rVXJV78

NotaNa versão impressa irá aparecer uma imagem quadriculada. Isto é o qrcode(http://pt.wikipedia.org/wiki/C%C3%B3digo_QR) contendo o link do vídeo. Caso você tenhaum celular com acesso a internet poderá acionar um programa de leitura de qrcode paraacessar o vídeo.Na versão digital você poderá assistir o vídeo clicando diretamente sobre o link.

Compreendendo as referências

As referências são apresentadas conforme o elemento que está sendo referenciado:

Referências a capítulosPrefácio [vi]

viii

Page 9: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Referências a seções“Como você deve estudar cada capítulo” [vii], “Caixas de diálogo” [vii].

Referências a imagensFigura 2 [ix]

NotaNa versão impressa, o número que aparece entre chaves “[ ]” corresponde ao número dapágina onde está o conteúdo referenciado. Na versão digital do livro você poderá clicar nolink da referência.

Feedback

Você pode contribuir com a atualização e correção deste livro. Ao final de cada capítulo você seráconvidado a fazê-lo, enviando um feedback como a seguir:

Feedback sobre o capítuloVocê pode contribuir para melhoria dos nossos livros. Encontrou algum erro? Gostaria desubmeter uma sugestão ou crítica?Para compreender melhor como feedbacks funcionam consulte o guia do curso.

NotaA seção sobre o feedback, no guia do curso, pode ser acessado em: https://github.com/-edusantana/guia-geral-ead-computacao-ufpb/blob/master/livro/capitulos/livros-contribuicao.adoc.

Figura 2: Exemplo de contribuição

ix

Page 10: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Capítulo 1

Estatística Descritiva

OBJETIVOS DO CAPÍTULO

Ao final deste capítulo você deverá ser capaz de:

• Conhecer os conceitos básicos da estatística e, principalmente, a diferença entre popu-lação e amostra

• Construir uma tabela estatística

• Conhecer os tipos de variáveis estatísticas

• Construir um histograma

• Identificar e entender o significado dos gráficos estatísticos

• Conhecer e saber calcular as principais medidas de posição

• Conhecer e saber calcular as principais medidas de dispersão

1.1 Conceitos Básicos

A Estatística é a ciência voltada para a construção de técnicas e métodos que permitem tomar decisõesnos mais deferentes setores do conhecimento. O que hoje se conhece por Estatística, é justamenteesse conjunto de ferramentas de pesquisa que envolve, entre outros, o planejamento do experimentoa ser realizado, a coleta qualificada dos dados, os processos de inferência estatística, bem como aanálise e o processamento das informações coletadas.

1.1.1 Definições importantes

Na estatística temos algumas definições importantes:

• População: Qualquer conjunto de informação que tenha entre si uma característica comum quedelimite os elementos pertencentes a ela.

• Amostra: É um subconjunto de elementos pertencentes a uma população.

• Variável: Dados referêntes a uma característica de interesse, coletados a partir de uma amostra.

• Censo: Exame de todos os elementos da população.

1 / 135

Page 11: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

População

Amostra

Figura 1.1: População e Amostra

Variá

vel

Figura 1.2: Exemplo de variável

Temos dois tipos de variáveis:

Qualitativa

Nominal : sexo, cor dos olhos.

Ordinal : classe social, grau de instrução.

Quantitativa

Discreta : número de filhos.

Continua : altura, peso, salário.

2 / 135

Page 12: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

1.2 Tabelas Estatísticas

Na estatística é fundamental aprendermos a representar os dados que serão analisados por meio detabelas.

Uma tabela deve apresentar a seguinte estrutura:

• Cabeçalho;

• Corpo;

• Rodapé.

O cabeçalho deve conter o suficiente para que sejam respondidas as questões:

• O que está representado?

• Onde ocorreu?

• Quando ocorreu?

Além disso, a tabela é um quadro que resume um conjunto de dados dispostos segundo linhas ecolunas de maneira sistemática.

1.2.1 Série Cronológica ou Temporal

Um exemplo muito comum e muito útil de tabela é dado pelas séries temporais. Uma série temporalconsiste em uma sequência numérica cujos valores variam com o tempo.

Abaixo vemos como inserir os dados de uma série temporal em uma tabela:

Vendas da Companhia Alfa: 2007-2009

Anos Vendas em R$ 1.000,002007 11.4252008 18.2582009 15.798

Fonte: Departamento de Marketing.

1.2.2 Série Geográfica

Muitas vezes o dado de interesse pode depender a posição geográfica de onde foram coletados. As-sim, uma série geográfica consiste em uma sequência numérica obtidas em diferentes regiões em umdeterminado instante do tempo.

Empresas Fiscalizadas em 2008

Regiões Número de EmpresasNorte 11.425

Nordeste 18.258Sudeste 28.157

Sul 15.798Centro-Oeste 9.236

Fonte: Mensário Estatístico.

3 / 135

Page 13: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

1.2.3 Série Específica

Uma série importante é formada por dados agrupados por alguma espécie ou característica comum.Assim, uma série específica é uma série numérica agrupada por tipo. Temos o exemplo abaixo:

Matrículas na Pós-graduação da UFPB - 2008

Áreas de Ensino MatrículasCiências Biológicas 125

Ciências Exatas e Tecnologia 158Ciências Humanas 128

Fonte: Serviço de Educação e Cultura.

1.3 Distribuição de Frequência

Uma distribuição de frequência é uma tabela que contém um resumo dos dados obtido em uma amos-tra.

A distribuição é organizada em formato de tabela, e cada entrada da tabela contém a frequência dosdados em um determinado intervalo, ou em um grupo.

Abaixo vemos um exemplo simplificado de tabela de distribuição de frequência:

Altura dos Alunos da UFPB - 2008

Alturas em metros Número dos Alunos1,50 |− 1,60 51,60 |− 1,70 151,70 |− 1,80 171,80 |− 1,90 3

Fonte: Serviço de Saúde.

Na próxima subseção aprenderemos a construir uma distribuição de frequência completa.

1.3.1 Construção de uma distribuição de frequência

Para ilustrar como se constrói uma distribuição de frequência, nós vamos considerar um exemploespecífico.

Assim, suponha que uma pesquisa foi feita, e o seguinte conjunto de dados foi obtido:

• Dados Brutos:

24-23-22-28-35-21-23-33-34-24-21-25-36-26-22-30-32-25-26-33-34-21-31-25-31-26-25-35-33-31.

A primeira coisa que fazemos é ordenar os dados do menor para o maior, formando o rol de dados:

• Rol de dados:

21-21-21-22-22-23-23-24-25-25-25-25-26-26-26-28-30-31-31-31-32-33-33-33-34-34-34-35-35-36.

Em seguida, calculamos a amplitude total, ou seja, o maior valor obtido na amostra subtraído domenor valor obtido na amostra:

4 / 135

Page 14: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

• Amplitude Total R:

R = 36−21 = 15.

Vamos agora definir as variáveis de interesse, ou seja, para cada valor distinto obtido na amostra,atribuiremos uma variável diferente:

• Variável Xi:

X1 = 21, X2 = 22, X3 = 23, X4 = 24, etc.

O próximo passo é calcular a frequência absoluta das variáveis, ou seja, vamos calcular quantas vezescada valor aparece na sequência. Por exemplo, o valor 21 aparece 3 vezes, o valor 22 aparece 2 vezes,etc.. Assim, obtemos:

• Frequência Absoluta Fi

F1 = 3, F2 = 2, F3 = 2, F4 = 1, etc. Vamos calcular, agora, o tamanho amostral, ou seja, onúmero de observações obtidas na amostra.

Desta forma, temos:

• Tamanho Amostral n:

n = 30.

Queremos, agora, dividir a amostra em uma quantidade de grupos que formarão os intervalos. Cadagrupo é chamado de classe, assim, queremos definir o número de classes a ser considerado na tabelade distribuição de frequência:

• Número de Classes K:

– K = 5 para n≤ 25 e K ≈√

n, para n > 25.

– Fórmula de Sturges K ≈ 1+3,22logn.

Logo, pela primeira regra temos K =√

30 ≈ 5,48 ≈ 6, e pela segunda regra K ≈ 1+ 3,22log30 ≈5,75≈ 6. Desta forma, em ambos os casos temos K = 6, que será o valor considerado.

O próximo passo é saber o comprimento de cada intervalo a ser considerado, ou seja, calcular aamplitude de cada classe. Queremos que todas as classes tenham a mesma amplitude e portanto,temos:

• Amplitude das Classes h:

h =RK.

Daí, para o nosso caso, h = 156 = 2,5≈ 3.

Vamos agora definir os limites das classes. Ou seja, definir os intervalos propriamente ditos. Paratanto, começamos com o menor valor obtido da amostra, ou equivalentemente, o primeiro valor dorol de dados, e vamos somando a amplitude para definir cada limite de intervalo:

5 / 135

Page 15: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

• Limites das Classes:

21|−2424|−2727|−3030|−3333|−3636|−39

Em seguida, calculamos os pontos médios das classes, que nada mais é que a média aritmética entreos limites das classes:

• Pontos Médios das Classes pmi:

pm1 =21+24

2= 22,5, pm2 =

24+272

= 25,5, ,etc.

Agora, calculamos as frequências dos dados em cada intervalo e, chamada de frequência absoluta, etambém a frequência acumulada, chamada de frequência absoluta acumulada, que considera a somadas frequências dos intervalos anteriores até o intervalo considerado:

• Frequência Absoluta Acumulada Fac:

Classes pmi Fi Fac21|−24 22,5 7 724|−27 25,5 8 1527|−30 28,5 2 1730|−33 31,5 4 2133|−36 34,5 8 2936|−39 37,5 1 30

Total - 30 -

Em seguida, inclui-se as frequências relativas dos dados, ou seja, para cada intervalo calcula-se fi =Fi/n. A frequência relativa, nos informa a proporção dos dados que pertencem a um determinadointervalo.

• Frequência Relativa fi:

Classes pmi Fi Fac fi21|−24 22,5 7 7 0,2324|−27 25,5 8 15 0,2727|−30 28,5 2 17 0,0730|−33 31,5 4 21 0,1333|−36 34,5 8 29 0,2736|−39 37,5 1 30 0,03

Total - 30 - 1,00

Para finalizar, calculamos a frequência acumulada relativa, ou seja, calculamos para cada intervalofac = Fac/n:

6 / 135

Page 16: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

• Frequência Relativa Acumulada fac:

Classes pmi Fi Fac fi fac21|−24 22,5 7 7 0,23 0,2324|−27 25,5 8 15 0,27 0,5027|−30 28,5 2 17 0,07 0,5730|−33 31,5 4 21 0,13 0,7033|−36 34,5 8 29 0,27 0,9736|−39 37,5 1 30 0,03 1,00

Total - 30 - 1,00 -

1.4 Gráficos Estatísticos

1.4.1 Histograma

O histograma é uma representação gráfica da distribuição de frequência. O histograma é formadopor uma justaposição de retângulos de bases com mesmo comprimento. O comprimento da baseé justamente a amplitude do intervalo e a altura do retângulo é dada pela frequência absoluta dointervalo.

Assim, uma vez feita a distribuição de frequência, a construção do histograma é uma tarefa muitosimples.

Abaixo vemos um exemplo de histograma:

Classes

Fi

0 5 10 15 20 25 30 35

01

23

4

Figura 1.3: Histograma

1.4.2 Polígono de Frequência

O polígono de frequência é uma representação gráfica obtida após ligar os pontos médios de cadaclasse entre si. Se já tivermos um histograma, basta ligar os pontos médios das bases superiores dosretângulos.

7 / 135

Page 17: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Abaixo vemos um exemplo de polígono de frequência obtido a partir de um histograma:

Classes

Fi

5 10 15 20

02

46

8

Figura 1.4: Polígono de Frequência Obtido a Partir de um Histograma

Abaixo vemos um exemplo contendo apenas o polígono de frequência:

6 8 10 12 14 16 18

02

46

8

Classes

Fi

Figura 1.5: Polígono de Frequência Obtido a Partir de um Histograma

1.4.3 Gráfico de Linhas

Suponha que temos duas variáveis, por exemplo, podemos ter os dados de uma série temporal, dondeuma variável seria o valor obtido, e a outra variável seria a data em que o valor foi obtido. Outra

8 / 135

Page 18: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

possibilidade seria colocar dados de uma série geográfica, onde uma variável seria formada pelosdados e a outra seria a localização geográfica.

O gráfico de linhas então é formado construindo pontos no plano (a partir das duas variáveis) e, emseguida, estes pontos são ligados por segmentos de retas.

Abaixo vemos um exemplo de gráfico de linhas de uma série temporal

Período

Re

nd

ime

nto

2006 2008 2010 2012 2014

−4

00

20

60

10

0

Figura 1.6: Gráfico de linhas

1.4.4 Gráfico de Colunas

Um gráfico de colunas é formado por uma coleção de colunas, com bases de mesmo comprimento, eigualmente espaçados. O eixo horizontal do gráfico consiste das diferentes categorias consideradas, eo eixo vertical é proporcional ao valor do dado.

Abaixo vemos um exemplo de gráfico de colunas:

9 / 135

Page 19: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

3 4 5

Pessoas por categoria

Categorias

02

46

81

01

4

Figura 1.7: Gráfico de colunas

1.4.5 Gráfico em Barras

O gráfico em barras pode ser entendido como uma variação do gráfico de colunas. De fato, o gráficoem barras é formado por uma coleção de barras, de mesma altura e igualmente espaçadas. Entre-tanto, neste caso o eixo vertical representa as diferentes categorias consideradas e o eixo horizontal éproporcional ao valor dado.

Abaixo vemos um exemplo de gráfico em barras:

Ba

ixa

dia

Alta

Pessoas por classe

0 2 4 6 8 10 12 14

Figura 1.8: Gráfico em barras

10 / 135

Page 20: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

1.4.6 Gráfico de Setores

O gráfico de setores, que também é popularmente conhecido como gráfico pizza, é um gráfico emque um círculo é dividido em setores (que podem ser pensados como as fatias da pizza), onde cadasetor representa uma categoria considerada pelo conjunto de dados, e os ângulos dos setores sãoproporcionais aos valores dos dados em cada categoria. Assim, quanto maior o valor obtido, maiorserá o ângulo do setor (e assim, maior será a fatia da pizza).

Abaixo vemos um exemplo de gráfico de setores:

Centro−OesteSudeste

Sul

Norte

Nordeste

Figura 1.9: Gráfico de setores

1.5 Medidas de Posição

As medidas de posição são valores que representam a tendência de concentração dos dados observa-dos.

As mais importantes são as medidas de tendência central. As três medidas de tendência central maisutilizadas são: média aritmética, moda e mediana.

1.5.1 Média Aritmética

É um valor que representa uma característica do conjunto de dados. Essa característica é tal que asoma dos dados é preservada. A média é obtida a partir de todos os elementos da distribuição e dotamanho da amostra n.

Notação: representamos a média de um conjunto de dados por X (lê-se x barra).

Cálculo da Média Aritmética +

• Dados não agrupados (brutos) - média aritmética simples.

11 / 135

Page 21: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

No caso de uma lista de dados não-agrupados, calculamos a média aritmética pela fórmula:

X =n

∑i=1

Xi

n.

Exemplo 1.1 Exemplo de cálculo de média aritmética com dados brutosConsidere os dados 2,3,7 e 8. Então, n = 4 e

X =2+3+7+8

4=

204

= 5.

• Dados agrupados - média aritmética ponderada.

No caso em que temos os dados agrupados, ou seja, sabemos a frequência de cada observação, ocálculo da média aritmética pode ser simplificado. Assim, a média aritmética pode ser cálculada pelafórmula:

X =n

∑i=1

Xi ·Fi

n.

Exemplo 1.2 Exemplo de cálculo de média aritmética ponderadaConsidere a seguinte tabela:

Tempo de Serviço (Xi) Fi Xi ·Fi4 3 126 5 308 10 80

Total 18 122

Assim, X = 12218 = 6,78.

• Dados agrupados em intervalos - média aritmética ponderada

No caso em que temos os dados agrupados em intervalos, utilizamos a média aritmética ponderada,onde os pesos são dados pelo ponto médio do intervalo. Assim, a média aritmética é calculada pelafórmula:

X =n

∑i=1

Xi · pmi

n,

Exemplo 1.3 Exemplo de cálculo de médias com dados agrupados em intervalosConsidere a seguinte tabela:

Anos (Xi) Fi pmi Xi · pmi0 ` 4 4 2 84 ` 8 10 6 608 ` 12 7 10 70Total 21 - 138

Assim, X = 13821 = 6,57.

12 / 135

Page 22: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

1.5.2 Moda

Definimos a moda de um conjunto de dados como o valor mais frequente deste conjunto.

Notação: representamos a moda de um conjunto de dados por Mo.

Exemplo 1.4 Exemplo de modas

• 1, 2, 4, 5 e 8 - não existe valor mais frequente - não existe moda (Amodal).

• 2, 2, 3, 7 e 8 - Mo = 2 (Unimodal).

• 1, 1, 10, 5, 5, 8, 7, 2 - Mo = 1 e 5 (Bimodal).

• Dados agrupados - Neste caso, a moda é definida como “classe modal”, isto é, a classe com amaior frequencia.

Exemplo 1.5 Exemplo de cálculo de classe modalConsidere a seguinte tabela:

Tempo de Serviço (Xi) Fi4 36 58 10

Total 18

Assim, Mo = 8 (F3).

• Dados agrupados em intervalos: Neste caso, utiliza-se a fórmula de Czuber:

Mo = lMo +

[h(FMo−Fant)

2FMo− (Fant +FPos)

],

onde:

• h é a amplitude intervalar,

• FMo é a frequência da classe modal,

• lMo é o limite inferior da classe modal,

• Fant é a frequência da classe anterior à classe modal,

• FPos é a frequência da classe posterior à classe modal.

13 / 135

Page 23: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Exemplo 1.6 Exemplo de cálculo de moda pela fórmula de CzuberConsidere a seguinte tabela:

Anos (Xi) Fi0 ` 4 44 ` 8 10

8 ` 12 7Total 21

Assim, h = 4,FMo = 10, lMo = 4,Fant = 4 e Fpos = 7. Daí

Mo = 4+[

4 · (10−4)2 ·10− (4+7)

]= 6,67.

1.5.3 Mediana

Definimos a mediana de um conjunto de dados como o valor que divide um conjunto de dados (orde-nados) em duas partes com a mesma quantidade de dados.

Notação: representamos a mediana de um conjunto de dados por Md.

O elemento mediano (EMd) aponta o local (nos dados) onde a mediana está localizada. A medianaserá o valor assumido na posição EMd.

• Dados não agrupados (brutos)

– No caso de dados brutos, se o tamanho amostral (n) é ímpar, temos que EMd = (n+1)/2.

– Note que no caso tamanho amostral é par, teremos dois valores possíveis para o elemento medi-ano: n/2 e n/2+1. Neste caso a mediana será a média dos valores assumidos nestas posições.

Exemplo 1.7 Exemplo de cálculo de mediana para dados brutos

• 1, 2, 4, 5 e 8. Como n é ímpar, temos EMd = 3, e Md = 4.

• 2, 2, 3, 7, 8 e 10. Aqui n é par, assim EMd,1 = 6/2= 3 e EMd,2 = 6/2+1= 4. Daí Md= (3+7)/2=5.

• Dados agrupados

Neste caso, olhar a frequência acumulada ajuda a encontrar a médiana.

• Caso 1: n ímpar.

14 / 135

Page 24: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Exemplo 1.8 Exemplo de cálculo de mediana com dados agrupados para n ímparConsidere a seguinte tabela:\vfill

Faltas (Xi) Fi Fac2 1 13 7 84 3 11

Total 11 -

Como n = 11, temos que EMd = (11+ 1)/2 = 6. Daí Md = 3. Note que a frequência acumuladaindica que nas posições de 2 até 8 temos o valor 3.

• Caso 2: n par.

Exemplo 1.9 Exemplo de cálculo de mediana com dados agrupados para n parConsidere a seguinte tabela:

Tempo de Serviço (Xi) Fi Fac4 3 36 5 88 10 18

Total 18

Neste caso n = 18, daí temos EMd,1 = 18/2 = 9 e EMd,2 = 18/2+1 = 10. Portanto Md = (8+8)/2 =8. Note, novamente, que a frequência acumulada indica que nas posições de 9 até 18 temos o valor 8.

• Dados agrupados em intervalos

Neste caso, utilizamos EMd = n/2 independentemente de n ser par ou ímpar.

A classe mediana é a primeira classe tal que Fac ≥ EMd.

Portanto, definimos a mediana pela fórmula

Md = lMd +h ·[

EMd−Fac,ant

FMd

],

onde,

• lMd é o limite inferior da classe mediana,

• h é a amplitude do intervalo,

• Fac,ant é a frequência acumulada da classe anterior à classe mediana,

• FMd é a frequência da classe mediana.

15 / 135

Page 25: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Exemplo 1.10 Exemplo do cálculo da mediana para dados agrupados em intervalosConsidere a seguinte tabela:

Anos (Xi) Fi Fac0 ` 4 4 44 ` 8 10 148 ` 12 7 21Total 21

Assim, EMd = 21/2 = 10,5, e desta forma temos que a segunda classe é a classe mediana. DaílMd = 4,h = 4,Fac,ant = 4 e FMd = 10. Portanto,

Md = 4+4 ·[

10,5−410

]= 6,6.

1.6 Medidas de Dispersão

• As medidas de dispersão medem o grau de variabilidade dos elementos de uma distribuição;

• O valor zero indica ausência de dispersão;

• A dispersão aumenta à medida que aumenta o valor da medida de dispersão.

Exemplo 1.11 Exemplo de motivação para as medidas de dispersãoNotas de alunos em cinco avaliações, UFPB, 2009.

Alunos Notas MédiaAntônio 5 5 5 5 5 5

João 6 4 5 4 6 5José 10 5 5 5 0 5

Pedro 10 10 5 0 0 5

Observa-se que: * As notas de Antônio não variaram;

• As notas de João variaram menos do que as notas de José;

• As notas de Pedro variaram mais do que as notas de todos os outros alunos.

Principais Medidas de Dispersão:

• Amplitude,

• Desvio Médio,

• Variância,

• Desvio Padrão,

• Coeficiente de Variação.

16 / 135

Page 26: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

1.6.1 Amplitude

A amplitude nos fornece uma idéia do campo de variação dos elementos. Mais precisamente, elafornece a maior variação possível dos dados.

A amplitude é dada pela fórmulaA = Xmax−Xmin.

Exemplo 1.12 Exemplo de cálculo de amplitudeNo exemplo anterior:

AAntônio = 0; AJoão = 2; AJosé = 10; APedro = 10.

NotaA amplitude não mede bem a dispersão dos dados porque, usam-se apenas os valoresextremos, ao invés de utilizar todos os elementos da distribuição.

1.6.2 Desvio Médio

Desejando-se medir a dispersão dos dados em relação a média, parece interessante a análise dosdesvios em torno da média. Isto é, análise dos desvios:

di = (Xi−X).

Mas a soma de todos os desvios é igual a zero. Isto é:

n

∑i=1

di =n

∑i=1

(Xi−X) = 0.

Logo, será preciso encontrar uma maneira de se trabalhar com os desvios sem que a soma dê zero.Dessa forma, define-se o desvio médio.

• Dados não agrupados (brutos):

Neste caso, calculamos o desvio médio como:

DM =n

∑i=1

|di|n

=n

∑i=1

|Xi−X |n

.

NotaVeja que os desvios foram considerados em módulo, evitando-se assim que a soma fossenula.

• Dados agrupados:

17 / 135

Page 27: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

DM =n

∑i=1

|di| ·Fi

n=

n

∑i=1

|Xi−X | ·Fi

n.

NotaXi representa um valor individual, no caso de uma distribuição de frequência simples, ou oponto médio da classe (pmi), no caso de uma distribuição de frequência em classes.

Importante

• O desvio médio é mais vantajoso que a amplitude, visto que leva em consideração todosos valores da distribuição.

• No entanto, não é tão frequentemente empregado, pois não apresenta propriedades ma-temáticas interessantes.

1.6.3 Variância

A variância é a medida de dispersão mais utilizada. É o quociente entre a soma dos quadrados dosdesvios e o número de elementos. Assim, temos a seguinte definição de variância populacional:

• Dados não agrupados - (brutos):

Neste caso, a variância é dada pela fórmula:

σ2 =

N

∑i=1

d2i

N=

N

∑i=1

(Xi−X)2

N.

• Dados agrupados:

Aqui, podemos utilizar a frequência para simplificar a fórmula:

σ2 =

N

∑i=1

d2i ·Fi

N=

N

∑i=1

(Xi−X)2 ·Fi

N.

Notaσ2 indica a variância populacional e lê-se sigma ao quadrado ou sigma dois. Neste caso,X e N da formúla representam a média populacional e o tamanho populacional, respectiva-mente.

Temos ainda a seguinte definição de variância amostral:

• Dados não agrupados - (brutos):

Neste caso, a fórmula é dada por

S2 =n

∑i=1

d2i

n−1=

n

∑i=1

(Xi−X)2

n−1

18 / 135

Page 28: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

• Dados agrupados:

Podemos, novamente, utilizar as frequências para simplificar a fórmula:

S2 =n

∑i=1

d2i ·Fi

n−1=

n

∑i=1

(Xi−X)2 ·Fi

n−1.

NotaXi representa um valor individual, no caso de uma distribuição de frequência simples, ou oponto médio da classe (pmi), no caso de uma distribuição de frequência em classes.

ImportanteFórmulas práticas para os cálculos das variâncias são dadas a seguir:

σ2 =

1N

[ N

∑i=1

X2i ·Fi−

(∑Ni=1 Xi ·Fi)

2

N

]ou

S2 =1

n−1

[ n

∑i=1

X2i ·Fi−

(∑ni=1 Xi ·Fi)

2

n

]que foram obtidas por transformações nas respecitivas fórmulas originais.

1.6.4 Desvio Padrão

Temos também outra medida de dispersão, que é a raiz quadrada da variância, chamada de desviopadrão. Assim,

σ =√

σ2 é o desvio desvio padrão populacional

eS =√

S2 é o desvio desvio padrão amostral.

NotaPara o cálculo do desvio padrão deve-se primeiramente determinar o valor da variância e,em seguida, extrair a raiz quadrada desse resultado.

Exemplo 1.13 Exemplo de cálculo das medidas de dispersãoCalcular a amplitude, o desvio médio, a variância e o desvio padrão da seguinte distribuição amostral:

Xi Fi5 27 38 59 4

11 2Total 16

19 / 135

Page 29: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

• Cálculo da amplitude:

A = Xmax−Xmin = 11−5 = 6.

• Cálculo do desvio médio:

Primeiramente é preciso do valor da média. Assim,

Xi Fi Xi ·Fi5 2 107 3 218 5 409 4 36

11 2 22Total 16 129

X =n

∑i=1

Xi ·Fi

n=

12916

= 8,06.

Para o cálculo do DM são abertas novas colunas:

Xi Fi Xi ·Fi |Xi−X |= |di| |di| ·Fi5 2 10 |5−8,06|= 3,06 6,127 3 21 |7−8,06|= 1,06 3,188 5 40 |8−8,06|= 0,06 0,309 4 36 |9−8,06|= 0,94 3,76

11 2 22 |11−8,06|= 2,94 5,88Total 16 129 - 19,24

Portanto,

DM =n

∑i=1

|di|n

=19,24

16= 1,20.

• Cálculo do variância amostral:

Observe que o cálculo será facilitado, pois sabe-se que: n = 16; ∑Xi ·Fi = 129. Resta encontrar∑X2

i ·Fi. Para tanto, uma nova coluna é considerada na tabela.

Xi Fi Xi ·Fi X2i ·Fi

5 2 10 507 3 21 1478 5 40 3209 4 36 324

11 2 22 242Total 16 129 1083

Portanto,

S2 =1

n−1

[ n

∑i=1

X2i ·Fi−

(∑ni=1 Xi ·Fi)

2

n

]=

116−1

[1083− (129)2

16

]=

115

[1083− 16641

16

]=

115

[17328−1664116

]=

68715 ·16

= 2,86.

Logo, a variância amostral S2 = 2,86.

20 / 135

Page 30: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

• Cálculo do desvio padrão amostral:

Como S =√

S2, logo S =√

2,86 = 1,69.Dessa forma, podemos observar que a distribuição possui média 8,06. Isto é, seus valores estão emtorno de 8,06 e seu grau de concentração é de 1,2, medido pelo desvio médio e de 1,69, medido pelodesvio padrão.

1.6.5 Coeficiente de Variação

Trata-se de uma medida relativa de dispersão útil para a comparação em termos relativos do grau deconcentração em torno da média de séries distintas. É dado por

CV =SX×100.

onde, S é o desvio padrão amostral e X é a média amostral.

O coeficiente de variação é expresso em porcentagens.

Exemplo 1.14 Exemplo de cálculo do coeficiente de variaçãoNuma empresa, o salário médio dos homens é de R$ 4.000,00, com desvio padrão de R$ 1.500,00, eo das mulheres é em média de R$ 3.000,00, com um desvio padrão de R$ 1.200,00. Então:

• Para os homens:

CV =1.5004.000

×100 = 37,5%.

• Para as mulheres:

CV =1.2003.000

×100 = 40%.

Logo, podemos concluir que os salários da mulheres apresenta maior dispersão relativa do que o doshomens.

Diz-se que a distribuição possui pequena variabilidade, ou dispersão, quando o coeficiente der até10%; média dispersão quando estiver acima de 10% até 20%; e grande dispersão quando superar20%. Alguns analistas consideram:

• Baixa dispersão: CV ≤ 15%;

• Média dispersão: 15% <CV < 30%;

1.7 Atividades

1. Em um estado, foram pedidos para 35 empresas os números de empregados demitidos no ano de2013. Os resultados informados pelas empresas estão dados abaixo:

35-30-30-45-41-48-64-41-47-56-43-36-45-40-33-49-37-34-56

40-41-37-45-48-34-52-25-53-41-38-41-37-45-35-41.

a) Construa uma tabela de distribuição de frequência para estes dados.

21 / 135

Page 31: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

b) Construa um histograma para estes dados.

2. Construa uma tabela de distribuição de frequência e histograma para o seguinte conjunto de dados:

26-9-7-5-9-6-3-4-19-25-5-20-21-9-30-8-18-3-22-14-25-1-18-14-24.

3. Calule a média aritmética dos dados da questão 1.

4. Calcule a média aritmética dos dados da questão 2.

5. Calcule a moda dos dados da questão 1.

6. Calcule a moda dos dados da questão 2.

7. Calcule a mediana dos dados da questão 1.

8. Calcule a mediana dos dados da questão 2.

9. Calcule o desvio médio dos dados da questão 1.

10. Calcule o desvio médio dos dados da questão 2.

11. Calcule a variância amostral e populacional dos dados da questão 1.

12. Calcule a variância amostral e populacional dos dados da questão 2.

13. Calcule o coeficiente de variação dos dados da questão 1.

14. Calcule o coeficiente de variação dos dados da questão 2.

RESPOSTAS

3. 41,8 4. 13,8 5. 41 6. 9 7. 41 8. 14 9. 6,33 10. 5,52 11. Variânciaamostral = 67,75. Variância populacional = 65,81. 12. Variância amostral = 76,83.Variância populacional = 73,76. 13. 19,69%. 14. 63,52%.

Feedback sobre o capítuloVocê pode contribuir para melhoria dos nossos livros. Encontrou algum erro? Gostaria desubmeter uma sugestão ou crítica?Para compreender melhor como feedbacks funcionam consulte o guia do curso.

22 / 135

Page 32: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Capítulo 2

Teoria dos Conjuntos e Contagem

OBJETIVOS DO CAPÍTULO

Ao final deste capítulo você deverá ser capaz de:

• Entender o que é um conjunto, um elemento de um conjunto

• Entender as relações entre conjuntos

• Conhecer os principais métodos de contagem

• Saber a diferença entre combinação e arranjo e como aplicar essas definições em pro-blemas práticos

• Conhecer o binômio de Newton

O objetivo deste capítulo é apresentar os pré-requisitos necessários para estudar probabilidade.

2.1 Teoria dos Conjuntos

Conjunto é uma coleção de objetos. A natureza desses objetos é arbitrária, ou seja, podemos terconjunto de qualquer coisa. Por exemplo, podemos ter conjuntos de pessoas; conjuntos de números;conjuntos de letras; podemos ter até conjuntos de conjuntos!

Nós representaremos conjuntos por letras maiúsculas A,B,C, . . ..

Chamamos os objetos que formam o conjunto de elementos. Assim, para descrever um conjunto,basta listar seus elementos. Existem três maneiras de descrever os elementos de um conjunto A:

• Listando os elementos. Por exemplo, A = 1,2,3,4, . . .;

• Descrevendo os elementos. Por exemplo, A é o conjunto de todos os números inteiros;

• Colocando condições. A = x;x é número real e 0≤ x≤ 1.

NotaÉ importante observar a notação. Sempre escreveremos os elementos que formam um con-junto entre chaves. O ponto-e-vírgula, quando estiver entre chaves deve ser lido como “talque”. Por exemplo, no conjunto A = x;x é número real e 0≤ x≤ 1, lemos, A é o conjuntodos números reais tais que 0≤ x≤ 1.

23 / 135

Page 33: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Quando o objeto x é elemento do conjunto A, dizemos que x pertence a A, e escrevemos x ∈ A.Analogamente, se x não é elemento do conjunto A, dizemos que x não pertence a A, e escrevemosx /∈ A.

Existe um conjunto que não possui nenhum elemento. Esse conjunto especial é chamado de conjuntovazio e é denotado por /0.

ImportanteÉ muito importante notar que o conjunto vazio /0 não possui nenhum elemento, portanto nãohá chaves na sua notação. O conjunto /0 NÃO é o conjunto vazio, e sim um conjunto comum elemento, e esse elemento é o conjunto vazio.

2.1.1 Comparação entre conjuntos

Sejam A e B dois conjuntos. Dizemos que A é subconjunto de B, e escrevemos, A⊂B se todo elementode A é elemento de B. Ou seja, se sempre que x ∈ A, temos que x ∈ B. Se existe x ∈ A tal que x /∈ B,dizemos que A não é subconjunto de B, e escrevemos A 6⊂ B.

Exemplo 2.1 Exemplo de comparação entre conjuntosSejam A = 1,2,3,4,5, B = 2,4 e C = 3,5,7.Então, temos que B⊂ A, mas C 6⊂ A, A 6⊂C, A 6⊂ B, C 6⊂ B e B 6⊂C.

ExercícioMostre que para todo conjunto A, o conjunto vazio é subconjunto de A, ou seja, que /0⊂ A.

SoluçãoSuponha que /0 6⊂ A, então por definição, isso significa que existe x ∈ /0 tal que x 6∈ A. Como /0não possui nenhum elemento, é impossível encontrar o tal elemento x.

Portanto, a afirmação /0 6⊂ A é falsa. Isso mostra que /0⊂ A.

Definição: Igualdade de conjuntosDizemos que os conjuntos A e B são iguais, e escrevemos A = B, se todo elemento de A éelemento de B e todo elemento de B é elemento de A.

Equivalentemente, temos que A = B se, e somente se, A⊂ B e B⊂ A.

2.1.2 União de conjuntos

Suponha que temos dois conjuntos A e B. Podemos definir um terceiro conjunto, chamado de conjuntounião de A e B, formado pelos elementos de A e pelos elementos de B. Matematicamente, escrevemos

A∪B = x;x ∈ A ou x ∈ B.

24 / 135

Page 34: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Exemplo 2.2 Exemplo de união de conjuntosSejam A = 1,2,3,4,5, B = 2,4 e C = 3,5,7.Então, A∪B = 1,2,3,4,5,

NotaSe A⊂ B, então todo elemento de A já é elemento de B, e portanto A∪B = B.

De maneira geral, dados conjuntos A1,A2,A3, . . ., definimos o conjunto formado pela união dos con-juntos A1,A2, . . ., como o conjunto que contém todos os elementos de A1, de A2, etc.. Matematica-mente, temos:

∞⋃i=1

Ai = x; existe i tal que x ∈ Ai.

ExercícioForneça a definição da união de n conjuntos A1,A2, . . . ,An.

SoluçãoDefinimos a união de n conjuntos A1, . . . ,An, como o conjunto formado pelos elementos deA1, . . . ,An, ou seja, é o conjunto

n⋃i=1

Ai = x;x ∈ A1 ou x ∈ A2, . . . , ou x ∈ An.

2.1.3 Interseção de conjuntos

Suponha que temos dois conjuntos A e B. Considere agora o conjunto formado pelos objetos que sãoelementos de A e também são elementos de B. Este conjunto é chamado de conjunto interseção de Ae B. Escrevemos este conjunto, matematicamente, como

A∩B = x;x ∈ A e x ∈ B.

Exemplo 2.3 Exemplo de interseção de conjuntosSejam A = 1,2,3,4,5, B = 2,4 e C = 3,5,7.Então, A∩B = 2,4, A∩C = 3,5 e B∩C = /0.

NotaSe A⊂ B, então todo elemento de A é elemento de B, assim os elementos que estão em Ae B, são os elementos de A. Ou seja, A∩B = A.

25 / 135

Page 35: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

De maneira geral, dados conjuntos A1,A2,A3, . . ., definimos a interseção entre os conjuntosA1,A2,A3, . . . como o conjunto formado pelos elementos que estão simultaneamente em todos osconjuntos. Escrevemos esse conjunto matematicamente como

∞⋂i=1

Ai = x;x ∈ A1,x ∈ A2, . . ..

ExercícioForneça a definição da interseção de n conjuntos A1,A2, . . . ,An.

SoluçãoDefinimos a interseção de n conjuntos A1, . . . ,An, como o conjunto formado pelos elementosque estão simultaneamente A1, . . . ,An, ou seja, é o conjunto

n⋂i=1

Ai = x;x ∈ A1 e x ∈ A2, . . . , e x ∈ An.

2.1.4 Diferença entre conjuntos

Suponha que temos dois conjuntos A e B. Considere agora o conjunto formado por objetos que sãoelementos de B, mas não são elementos de A. Esse conjunto é chamado de B menos A, e é denotadopor B\A. Matematicamente, temos

B\A = x;x ∈ B e x /∈ A.

Exemplo 2.4 Exemplo de diferença de conjuntosSejam A = 1,2,3,4,5, B = 2,4 e C = 3,5,7.Então, A\B = 1,3,5, A\C = 1,2,4, B\C = 2,4, B\A = /0, C \A = 7 e C \B = 3,5,7.

2.1.5 Complementar de um conjunto

Um caso particular e importante de diferenças de conjunto é o complementar. Esta definição é parti-cularmente útil no curso de probabilidade.

Suponha que temos um conjunto de referência, digamos M. Dado qualquer conjunto A ⊂M, defini-mos o complementar de A (em M), como o conjunto Ac = M \A.

AtençãoQuando está claro no contexto quem é o conjunto de referência, o conjunto Ac é referidoapenas como complementar de A.

O complementar de A é descrito como o conjunto dos elementos que não pertencem a A. Fica claroque é o conjunto dos elementos que não pertencem a A, mas pertencem ao conjunto de referência M.

26 / 135

Page 36: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

2.1.6 Propriedades entre as relações entre conjuntos

Valem as seguintes identidades entre união, interseção e complementação entre conjuntos:\\

• A∪ (B∩C) = (A∪B)∩ (A∪C);

• A∩ (B∪C) = (A∩B)∪ (A∩C);

• A∩ /0 = /0;

• A∪ /0 = A;

• (A∩B)c = Ac∪Bc;

• (A∪B)c = Ac∩Bc;

• (Ac)c = A.

2.2 Contagem

Vamos agora introduzir técnicas de contagem.

2.2.1 Regra da multiplicação

A primeira técnica é conhecida como regra da multiplicação. Para ilustrar a técnica, considere oseguinte exemplo:

Exemplo 2.5 Exemplo para ilustrar a regra da multiplicaçãoFernando possui 10 pares de meias e 3 pares de sapatos. Sabendo que Fernando pode utilizarqualquer par de meia com qualquer sapato, de quantas formas diferentes, ele pode combinar pares demeias com sapatos?

Vamos começar colocando rótulos nos sapatos: sapato 1, sapato 2 e sapato 3. O sapato 1 pode serusado com 10 pares de meias; o sapato 2 também pode ser usado com 10 pares de meias; e o sapato3 também pode ser usado com 10 pares de meias. Portanto, como Fernando pode utilizar o sapato 1,o sapato 2 e o sapato 3, ele poderá fazer 10+10+10 = 30 combinações diferentes entre pares de meiase sapatos.

Resumindo, cada sapato pode ser associado a 10 pares de meias, e como temos 3 sapatos, o total decombinações é 30 = 3 ·10. Por isso o nome regra da multiplicação. Pois multiplicamos o número desapatos pelo número de pares de meias.

A regra geral é dada por:

Regra da multiplicaçãoSuponha que temos 2 tipos de objetos: tipo 1 e tipo 2. Suponha que cada objeto do tipo 1 podeser combinado com todos os objetos do tipo 2. Assim, se temos n objetos de tipo 1 e m objetosde tipo 2, teremos n ·m combinações possíveis entre objetos de tipo 1 e objetos de tipo 2.

27 / 135

Page 37: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

2.2.2 Regra da adição

Vamos agora ilustrar outra técnica de contagem, que é conhecida como a regra da adição. Paramotivar, considere o seguinte exemplo:

Exemplo 2.6 Exemplo para ilustrar a regra da adiçãoPaulo tem 15 blusas de manga comprida e 10 blusas de manga curta e apenas uma calça. Sabendoque Paulo não usa duas blusas ao mesmo tempo, de quantas formas ele pode se vestir?

Como Paulo só possui uma calça, o que determina a quantidade de formas de se vestir é a quantidadede blusas. Como Paulo possui 25 = 10+15 blusas, segue que Paulo pode se vestir de 25 formasdiferentes.

Assim, como Paulo não pode usar uma blusa de manga comprida e outra de manga curta ao mesmotempo, segue que temos que escolher uma única blusa entre o total de blusas que é dada pela somaentre a quantidades de blusas de manga comprida e blusas de manga curta.

A regra geral é dada por:

Regra da adiçãoSuponha que temos objetos de dois tipos, digamos tipo 1 e tipo 2. Suponha que temos n objetosdo tipo 1 e m objetos do tipo 2. Temos então n+m formas de escolher um objeto (de qualquertipo) entre os objetos disponíveis.

Outra forma de escrever essa regra é a seguinte: suponha que temos n formas de executaruma tarefa usando o procedimento 1, e m formas de executar essa mesma tarefa usando oprocedimento 2. Sabendo que não podemos usar os dois procedimentos conjuntamente, estatarefa pode ser realizada de n+m formas diferentes.

2.2.3 Permutação

Suponha que temos k objetos organizados em uma determinada ordem. Se mudarmos a ordem emque estes objetos estão colocados, dizemos que fizemos uma permutação entre esses objetos. Umapergunta importante é saber qual o número de permutações possíveis entre estes k objetos. Parailustrarmos a ideia considere o seguinte exemplo:

Exemplo 2.7 Exemplo de permutaçõesQuantas filas diferentes podemos formar com Pedro, Paulo, Carlos e João?

Também poderíamos escrever a pergunta como: Qual o número de permutações possíveis entrequatro pessoas?

Vamos enumerar as posições: primeira, segunda, terceira e quarta. Para a primeira posição temos4 escolhas possíveis. Agora, supondo que já escolhemos a primeira posição, qualquer que seja aprimeira pessoa escolhida, temos possibilidades para a segunda posição. Analogamente, temos 2possibilidades para a terceira posição e apenas uma para a quarta.

Pela regra da multiplicação, temos 4 ·3 ·2 ·1 = 24 possibilidades.

28 / 135

Page 38: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

NotaçãoO número n! é chamado de fatorial de n e é dado por

n! = n · (n−1) · (n−2) · · ·3 ·2 ·1.

Por exemplo, 6! = 6 ·5 ·4 ·3 ·2 ·1. No exemplo anterior, o número de possibilidades é 4! = 24.

Finalmente, temos a regra da permutação:

PermutaçõesSuponha que temos n objetos, então o número de permutações desses n objetos é n!.

2.2.4 Arranjos

Suponha que temos n objetos, de quantas formas podemos escolher k objetos entre esses n objetos,sabendo que a ordem em que esses objetos são escolhidos importa?

O número de formas é chamado de número de arranjos. Considere o seguinte exemplo:

Exemplo 2.8 Exemplo de arranjosSuponha que uma corrida de rua tem 1000 atletas inscritos. Quantos pódios podemos formar comesses 1000 atletas?

Um pódio consiste de três pessoas, ordenadas pelo campeão, vice-campeão e terceiro lugar. Assim,temos 1000 formas de escolher o campeão, 999 formas de escolher o vice-campeão e 998 formas deescolher o terceiro lugar. Portanto, temos 1000 ·999 ·998 pódios possíveis.

Note que 1000 ·999 ·998 = 1000!997! .

Assim, a regra dos arranjos é:

ArranjoSuponha que temos n objetos disponíveis. Então, o número de formas de escolher k objetos,onde a ordem em que os objetos foram escolhidos importa, é dada por

An,k =n!

(n− k)!.

No exemplo anterior, podemos pensar nas pessoas como 1000 objetos, e queríamos escolher 3 objetos,onde a ordem importa (a ordem determina o campeão, vice-campeão e terceiro lugar), e portanto onúmero de formas é A1000,3 =

1000!997! .

2.2.5 Combinações

Suponha que estamos no mesmo cenário dos arranjos, ou seja, temos n objetos e queremos escolherk objetos. Entretanto, suponha que a ordem não importa mais. Assim, só estamos interessados nonúmero de formas de escolher os k objetos, mas a ordem em particular pela qual os objetos foramescolhidos não importa. O número de tais formas é dado pelo número de combinações possíveis.

Considere o seguinte exemplo:

29 / 135

Page 39: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Exemplo 2.9 Exemplo de combinaçõesSuponha que uma empresa possui 1000 funcionários, e que o presidente da empresa gostaria de sabero número de equipes de 3 pessoas que podem ser formadas com esses 1000 funcionários. Qual onúmero que o presidente procura?

Note que este exemplo é muito parecido com o dos arranjos, inclusive temos 1000 “objetos” equeremos escolher 3. Entretanto o fato da ordem não importar muda tudo.

Como em uma equipe a ordem das pessoas não importa, devemos levar essa informação emconsideração.

Vamos então fingir que a ordem importa, então a quantidade de formas seria A1000,3 =1000!997! . Observe

agora que para cada equipe de formada por 3 pessoas, temos 3! pódios possíveis a se formar. Destaforma, se C é o número de equipes de 3 pessoas que podemos formar com 1000 funcionários, então3! ·C é o número de pódios que podemos formar com 1000 pessoas, pois cada equipe fornece 3!pódios (aqui utilizamos a regra da multiplicação).

Como sabemos que o número de pódios possíveis é A1000,3 =1000!997! , segue que C =

A1000,33! = 1000!

3!997! .

Assim, temos a regra geral das combinações:

CombinaçãoSuponha que temos n objetos e queremos escolher k objetos, onde a ordem em que os objetosforam escolhidos não importa. Então temos Cn,k =

n!k!(n−k)! formas de escolher esses k objetos.

Cn,k é chamado o número de combinações de n, k-a-k.

NotaEste número de combinações possui uma notação especial, a saber,

(nk

)= n!

k!(n−k)! , e sãochamados de coeficientes binomiais.

CuidadoObserve que em geral o número de arranjos é bem maior que o número de combinações.De fato, temos que

An,k = k!Cn,k.

Portanto, é importante não confundir arranjos com combinações porque os resultados podemser muito diferentes.

2.2.6 Binômio de Newton

Sejam a,b números reais, e seja n um número natural. Então, temos que

(a+b)n = (a+b)(a+b) · · ·(a+b)︸ ︷︷ ︸n termos

.

30 / 135

Page 40: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

É fácil saber, pela distributividade, que o resultado da multiplicação será uma soma da forma:

(a+b)n = (a+b) · · ·(a+b) =C0an +C1an−1b+ · · ·Cnbn.

Assim, queremos determinar quais são os valores de Ci, para i = 0, . . . ,n. Observe que Ci é o nú-mero de termos da forma an−ibi que aparecem após a expansão do termo (a+ b)n. Este número édado pelo número de formas em que podemos escolher (n− i) parcelas da multiplicação iguais a a(automaticamente as i parcelas restantes serão de termos iguais a b). Como a ordem das parcelas nãoimporta, o número de formas é justamente o número de combinações de n, (n− i)-a-(n− i), e é dadopor Ci =Cn,(n−i) =

n!(n−i)!i! =Cn,i =

(ni

).

Portanto, temos a fórmula do binômio de Newton:

(a+b)n =

(n0

)an + · · ·+

(ni

)an−ibi + · · ·+

(nn

)bn =

n

∑i=0

(ni

)an−ibi.

2.3 Atividades

1. Verdadeiro ou Falso?

a. a,a,b,c= a,b,c;

b. a,a= a;

c. a ∈ a,a;

d. a ⊂ a,a;

e. a ⊂ a,a;

f. a,b ⊂ a,a,b;

g. a,b ∈ a,a,b;

h. b ∈ a,a,b;

i. /0 ∈ /0;

j. /0 = /0;

k. /0⊂ /0;

l. /0 ⊂ /0;

m. /0 ∈ /0;

n. /0= /0.

2. Sejam A = 1,2,3,4,5,6,7, B = 4,5,6,7 e C = 5,6,7. Determine os seguintes con-juntos:

a. A\ /0;

b. A\A;

31 / 135

Page 41: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

c. A\C;

d. C \A;

e. A\B;

f. B\A;

g. B\C.

3. Seja M = 1,2,3,4,1,2,3,4. Sejam A = 1,2,3,4 e B = 1,2,3,4.

a. Mostre que A e B são subconjuntos de M, e conclua que podemos falar sobre o complementarde A e sobre o complementar de B (ambos com relação a M);

b. Determine os conjuntos: Ac, Bc, A∪Bc, Ac∪B, Ac∪Bc, A∪B, A∪Ac e B∪Bc.

c. Determine os conjuntos: A∩B, Ac∩B, Ac∩Bc, A∩Bc, A∩Ac e B∩Bc.

4. Quantas palavras contendo 3 letras diferentes podem ser formadas com um alfabeto de 26 letras?

5. Para fazer uma viagem João Pessoa-Salvador-João Pessoa, posso ir de carro, ônibus ou avião. Dequantos modos posso escolher os transportes se não desejo usar na volta o mesmo meio de transporteda ída?

6. Quantos são os gabaritos possíveis de um teste de 10 questões de múltipla escolha, com cincoalternativas por questão?

7. De quantos modos 3 pessoas podem sentar-se em 5 cadeiras em fila?

8. O departamento de computação científica de uma universidade possui 20 professores. De quantosmodos podem ser escolhidos um chefe de departamento, um coordenador da gradução e um coorde-nador de pós-graduação?

9. Quantos são os anagramas da palavra CAPÍTULO?

10. Quantos são os anagramas da palavra CAPÍTULO que têm a letra C no primeiro lugar E a letra Ano segundo lugar E a letra P no terceiro lugar?

11. João tem 10 frutas diferentes e deseja fazer vários tipos de saladas de frutas, onde cada saladacontém exatamente 4 frutas. Quantos tipos de saladas de frutas ele pode fazer?

12. Em uma prova, o estudante deve escolher exatamente 7 questões entre 10 disponíveis. Quantasescolhas ele tem?

13. De quantos modos podemos escolher 6 pessoas, incluindo pelo menos duas mulheres, em umgrupo de 7 homens e 4 mulheres?

RESPOSTAS

1. a) V; b) F; c) V; d) V; e) V; f) F; g) V; h) F; i) V; j) F; k) V; l) F; m)V; n) F.

2. a) 1,2,3,4,5,6,7; b) /0; c) 1,2,3,4,5,6,7; d) 5,6,7; e)1,2,3,6,7; f) 6,7; g) 5.3. Seja M = 1,2,3,4,1,2,3,4. Sejam A = 1,2,3,4 e B =1,2,3,4.

32 / 135

Page 42: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

a. Justifique!;

b. Ac = B, Bc = A, A∪Bc = A, Ac ∪B = B, Ac ∪Bc = M, A∪B = M, A∪Ac = M,B∪Bc = M.

c. A∩B = /0, Ac∩Bc = /0, A∩Ac = /0 e B∩Bc = /0.

4. 26 ·25 ·24 = 15600. 5. 6. 6. 510 = 9765625. 7. 60. 8. 6840. 9. 8! = 40320. 10.5! = 120. 11. 210. 12. 120. 13. 371.

Feedback sobre o capítuloVocê pode contribuir para melhoria dos nossos livros. Encontrou algum erro? Gostaria desubmeter uma sugestão ou crítica?Para compreender melhor como feedbacks funcionam consulte o guia do curso.

33 / 135

Page 43: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Capítulo 3

Definições Básicas

OBJETIVOS DO CAPÍTULO

Ao final deste capítulo você deverá ser capaz de:

• As principais definições da probabilidade

• Reconhecer um modelo com resultados equiprováveis e modelos com resultados quenão são equiprováveis

• Entender e saber aplicar o conceito de probabilidade condicional

• Saber enunciar e aplicar o teorema da probabilidade total e o teorema de Bayes

• Saber a definição e intuição de eventos independentes

Modelos Matemáticos

• Modelo Determinístico: Um modelo no qual as condições impostas ao modelo determinamo resultado do experimento.

• Modelo Probabilístico: Modelos nos quais, mesmo mantendo as mesmas condições, o re-sultado do experimento pode variar. Isso se deve a um fator aleatório o qual não podemoscontrolar.

Experimento aleatórioConsiste em um experimento em que, mesmo mantendo as mesmas condições, o resultado doexperimento pode variar.

Exemplo 3.1 Exemplos de experimentos aleatórios

1. Lançar um dado e observar o resultado.

2. Jogar três moedas e contar o número de vezes que o resultado foi cara.

3. Medir o número de nascimentos na cidade de João Pessoa na última hora.

34 / 135

Page 44: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

3.1 Fundamentos de Probabilidade

Definição: Espaço amostralEspaço amostral é o conjunto de todos os resultados possíveis de um experimento. Denotamoso conjunto de todos os resultados por Ω.

Exemplo 3.2 Espaços amostrais associados aos exemplos anteriores

1. Ω = 1,2,3,4,5,6;

2. Ω = 0,1,2,3;

3. Ω = 0,1,2,3, . . .,Ω = 0,1,2, ...,7000000000, . . ..

NotaObserve que no último exemplo tivemos mais de uma opção de espaço amostral. Isto nãocontradiz a definição de espaço amostral. De fato, podemos ter mais de uma opção de es-paços amostrais, o importante é que cada uma dessas opções contenha todos os resultadospossíveis.

Definição: EventoSeja Ω o espaço amostral de um experimento. Todo conjunto A⊂ Ω tal que podemos calculara probabilidade de A é chamado de evento.

Destacamos dois eventos importantes:

1. Ω é chamado de evento certo;

2. /0 é chamado de evento impossível.

NotaO conjunto de todos os eventos possui uma estrutura chamada de σ -álgebra. Apesar dadefinição de σ -álgebra ser muito simples, não há necessidade de estudarmos σ -álgebras,pois todos os conjuntos que utilizaremos ao longo do livro serão eventos. Além disso, asaplicações onde é realmente necessário o uso de σ -álgebras fogem do escopo deste livro.

Como cada evento é um conjunto, vale a pena descrever os eventos obtidos após realizarmos asoperações clássicas de conjuntos entre eventos.

35 / 135

Page 45: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Exemplo 3.3 Eventos

• A∪B: é o evento “A ou B”;

• A∩B: é o evento “A e B”;

• Ac: é o evento “não ocorrência de A”;

• A⊂ B: significa que se o evento A ocorre, então o evento B ocorre.

• A∩B = /0: significa que A e B são eventos mutuamente excludentes, ou seja, a ocorrência de Aimplica que B não ocorre, e a ocorrência de B implica que A não ocorre.

Definição: PartiçãoDado um espaço amostral Ω, uma partição P = Aα ,α ∈ I de Ω é uma coleção de eventos,Aα , indexados por α , tais que:

• Para todo α 6= β , Aα ∩Aβ = /0;

•⋃

α∈I Aα = Ω.

Portanto, temos que os eventos de uma partição são dois-a-dois mutuamente excludentes e sua uniãoé todo o espaço amostral.

Exemplo 3.4 Exemplo de partiçãoSe Ω = 1,2,3,4, então A1,A2, onde A1 = 1,2,3 e A2 = 4, é uma partição de Ω.

3.2 Noções de Probabilidade

Definição: Medida de ProbabilidadeSeja E um experimento. Seja Ω um espaço amostral, e seja E um evento de Ω. Dizemos queP é uma medida probabilidade em Ω se para todo evento A, temos que P(A) é um númeronão-negativo, chamado de probabilidade de A, tal que

• 0≤ P(A)≤ 1;

• P(Ω) = 1;

• (Aditividade finita) Se A e B forem eventos mutuamente excludentes, temos que P(A∪B) =P(A)+P(B);

• (Aditividade contável) Se Ai, i = 1,2,3, . . . forem eventos dois-a-dois mutuamente excluden-tes, então,

P( ∞⋃

i=1

Ai

)=

∑i=1

P(Ai).

Provaremos agora algumas consequências desta definição.

TeoremaSeja /0 o conjunto vazio, então P( /0) = 0.

36 / 135

Page 46: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

DemonstraçãoPara qualquer evento A, podemos escrever A = A∪ /0. Como A e /0 são mutuamente excludentes,decorre da aditividade finita que P(A) = P(A∪ /0) = P(A)+P( /0). Desta forma, P( /0) = 0.

TeoremaSeja Ac o evento complementar de A. Então P(Ac) = 1−P(A).

DemonstraçãoPodemos escrever Ω = A∪Ac. Além disso, A e Ac são mutuamente excludentes. Portanto, pelaaditividade finita, temos que 1 = P(Ω) = P(A∪Ac) = P(A)+P(Ac). Desta forma, segue queP(Ac) = 1−P(A).

TeoremaSejam A e B dois eventos quaisquer. Então P(A∪B) = P(A)+P(B)−P(A∩B).

DemonstraçãoTemos que A∪B = A∪ (B∩Ac) (faça um desenho) e B = (A∩B)∪ (B∩Ac). Desta forma,temos que como A e B∩Ac são mutuamente excludentes, vale P(A∪B) = P(A)+P(B∩Ac).

Por outro lado, temos que A∩B e B∩Ac também são mutuamente excludentes. Portanto, segueque P(B) = P(A∩B)+P(B∩Ac)⇒ P(B∩Ac) = P(B)−P(A∩B).

Juntando as duas equações, obtemos que

P(A∪B) = P(A)+P(B)−P(A∩B).

Mais geralmente temos o

Teorema (Princípio da inclusão e exclusão)Sejam A1,A2, . . . ,An n eventos quaisquer. Então,

P(A1∪A2∪·· ·∪An) =n

∑i=1

P(Ai)−∑i< j

P(Ai∩A j)

+ ∑i< j<k

P(Ai∩A j∩Ak)+ · · ·+(−1)n−1P(A1∩·· ·∩An).

TeoremaSejam A e B dois eventos. Suponha que A⊂ B, então P(A)≤ P(B).

DemonstraçãoTemos que B = A∪ (B∩Ac), com A e B∩Ac sendo mutuamente excludentes.

Desta forma,P(B) = P(A)+P(B∩Ac). Por outro lado, P(B∩Ac)≥ 0.

Portanto, temos que P(B)≥ P(A).

ExercícioMostre que a coleção de intervalos (n,n+1] : n ∈R é uma partição do conjunto dos númerosreais R.

SoluçãoDenote por [x] a parte inteira do número real x. Temos que para todo x real, vale

x ∈ ([x]−1, [x]]∪ ([x], [x]+1].

37 / 135

Page 47: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Portanto, vale x ∈⋃

n∈Z(n,n+1], ou seja, R⊂

⋃n∈Z

(n,n+1].

Por outro lado, ∀n ∈ Z,(n,n+1]⊂ R. Daí⋃

n∈Z(n,n+1]⊂ R. Portanto, concluímos que

R=⋃

n∈Z(n,n+1].

3.3 Espaços Amostrais Finitos

Seja Ω um espaço amostral associado a um experimento aleatório E com um número finito de resul-tados possíveis. Então Ω pode ser escrito da seguinte forma: Ω = ω1, . . . ,ωn, para algum númeronatural n.

A cada evento simples ωi, i = 1, . . . ,n, associamos um número pi, i = 1, . . . ,n de tal forma que duascondições sejam satisfeitas:

1. pi ≥ 0 para todo i = 1, . . . ,n;

2. p1 + · · ·+ pn = 1.

Assim, definimos a probabilidade da ocorrência do resultado ωi, i = 1, . . . ,n como sendo P(ωi) =pi.

Suponha que tenhamos um evento A consistindo de k resultados possíveis, ou seja, A= ω j1 , . . . ,ω jk,onde j1, . . . , jk assumem valores entre 1 e n. Pela propriedade da aditividade contável, a probabilidadedo evento A é dada por

P(A) = P(ω j1)+ · · ·+P(ω jk) = p j1 + · · ·+ p jk .

ExercícioSuponha que somente três resultados sejam possíveis em um experimento, a saber, a1,a2 e a3.Além disso, suponha que a1 seja duas vezes mais provável de ocorrer do que a2, o qual, porsua vez, é duas vezes mais provável de ocorrer do que a3. Determine as probabilidades deocorrência de a1,a2 e a3.

SoluçãoSejam p1, p2 e p3 as probabilidades de ocorrências de a1,a2 e a3, respectivamente. Então,temos do enunciado que p1 = 2p2 e que p2 = 2p3. Como sabemos que p1 + p2 + p+ 3 = 1,temos que 4p3 +2p3 + p3 = 1, ou seja, p3 = 1/7.

Isto fornece p1 = 4/7, p2 = 2/7 e p3 = 1/7.

3.4 Resultados Equiprováveis

Suponha que temos um experimento com n resultados possíveis e que todos esses resultados sejamequiprováveis, isto é, todos os resultados possuem a mesma probabilidade de ocorrência. Neste caso,dizemos que o experimento possui resultados equiprováveis. Digamos que os resultados possíveis doexperimento são a1, . . . ,an.

38 / 135

Page 48: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Sejam p1, p2, . . . , pn as probabilidades de ocorrências dos eventos a1,a2, . . . ,an, respectivamente. En-tão, como todos os resultados possuem a mesma probabilidade de ocorrência, temos que p1 = p2 =· · ·= pn = p.

Além disso, sabemos que p1 + · · ·+ pn = 1, ou seja, np = 1, o que por sua vez implica que p = 1/n.

Utilizando a propriedade de aditividade contável da probabilidade podemos concluir o seguinte resul-tado: Seja A um evento que contém k resultados possíveis, então P(A) = k/n.

Este método de avaliar a probabilidade do evento A normalmente é enunciado da seguinte maneira:

P(A) =número de resultados favoráveis a A

número de resultados possíveis.

ExercícioUm dado é lançado e todos os resultados são igualmente prováveis. O evento A ocorrerá se, esomente se, um número maior do que 4 aparecer, isto é, A = 5,6. Calcule P(A).

SoluçãoComo temos 6 resultados possíveis e 2 resultados favoráveis, temos que P(A) = 2/6 = 1/3.

3.5 Probabilidade Condicional

Suponha que temos a seguinte situação: Um lote é formado por 100 monitores de computador. Foiverificado que neste lote, temos 80 monitores em perfeito estado e 20 monitores defeituosos. Suponhaque dois monitores são retirados do lote ao acaso. Considere então os eventos:

A = O primeiro monitor é defeituoso e B = O segundo monitor é defeituoso.

Suponha que a retirada dos monitores seja com reposição. Isto é, o primeiro monitor é retirado,verifica-se se é defeituoso ou não, e é colocado de volta ao lote. Neste cenário, temos 20 casosfavoráveis ao evento A, entre 100 casos possíveis, e 20 casos favoráveis ao evento B, também entre100 casos possíveis. Desta forma, no cenário com reposição, temos que P(A) = P(B) = 1/5.

Entretanto temos um segundo cenário possível: que a retirada dos monitores seja feita sem reposição,isto é, o primeiro monitor é retirado, verifica-se se este é defeituoso, e em seguida um segundo monitoré retirado (sem que o primeiro seja devolvido ao lote), donde após a retirada, verifica-se se o segundomonitor é defeituoso ou não.

Neste cenário, ainda temos 20 casos favoráveis ao evento A e 100 casos possíveis. No entanto, parao evento B o problema não se torna fácil, pois não sabemos se no momento da retirada do segundomonitor teremos 19 casos favoráveis ou 20 casos favoráveis. Isto dependerá se o evento A ocorreu ounão. A única coisa certa é que temos 99 casos possíveis para o evento B.

A fim de resolver este problema vamos introduzir um novo conceito, o de probabilidade condicional.Assim que tivermos desenvolvido a teoria o suficiente para resolver o problema acima, terminaremosa solução dele.

Definição: Probabilidade condicionalSejam agora, A e B dois eventos associados a um experimento E. Suponha que P(A)> 0, entãodenotamos por P(B|A) a probabilidade do evento B ocorrer condicionada à ocorrência do eventoA. Esta probabilidade condicional é definida como

P(B|A) = P(A∩B)P(A)

.

39 / 135

Page 49: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

CuidadoVale a pena relembrar que na probabilidade condicional P(B|A) estamos supondo queP(A)> 0.

ImportanteSempre que calculamos a probabilidade condicional P(B|A), o que estamos fazendo na prá-tica é reduzir o espaço amostral original Ω para um espaço amostral de eventos favoráveis àocorrência do evento A. Esse espaço amostral é chamado de espaço amostral reduzido.

ExercícioDois dados equilibrados (onde todos os resultados são equiprováveis) são lançados. Os resul-tados são registrados como o par ordenado (x1,x2), onde x1 representa o resultado obtido nolançamento do primeiro dado, e x2 representa o resultado do lançamento do segundo dado. Con-sideremos os eventos: A = (x1,x2);x1 + x2 = 10 e B = (x1,x2);x1 > x2. Calcule P(A|B) eP(B|A).

SoluçãoEscrevendo os eventos A,B e A∩B explicitamente, temos que

A = (5,5),(4,6),(6,4),

B = (2,1),(3,1),(4,1),(5,1),(6,1),(3,2),(4,2),(5,2),(6,2),(4,3),(5,3),(6,3),(5,4),(6,4),(6,5)

eA∩B = (6,4).

O número de casos totais é 36, pois temos 6 casos possíveis para o primeiro lançamento e 6casos possíveis para o segundo lançamento.

Assim, como os resultados são todos equiprováveis, temos que

P(A) = 336 = 1

12 ,P(B) =1536 = 5

12 e P(A∩B) = 136 .

Assim, segue que

P(A|B) = P(A∩B)P(B) = 1/36

5/12 = 115 e P(B|A) = P(A∩B)

P(A) = 1/361/12 = 1

3 .

3.5.1 Teorema da Multiplicação

A mais importante consequência da definição da probabilidade condicional é obtida ao escrevermos:

P(A∩B) = P(A|B)P(B) ou equivalentemente, P(A∩B) = P(B|A)P(A).

Estas igualdades são chamadas de Teorema da multiplicação ou Teorema do produto.

Existe uma generalização para mais de dois eventos e ela é a seguinte: Dados eventos A1,A2, . . . ,An,temos que

P(A1∩A2∩·· ·∩An) = P(A1)P(A2|A1)P(A3|A1∩A2) · · ·P(An|A1∩·· ·∩An−1).

40 / 135

Page 50: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

ExercícioUma caixa contém 4 lâmpadas boas e 2 queimadas. Retira-se ao acaso 3 lâmpadas sem reposi-ção. Calcule a probabilidade dessas 3 lâmpadas serem boas.

SoluçãoSejam os eventos Ai = A i-ésima lâmpada é boa, para i = 1,2,3. Queremos calcular a proba-bilidade do evento A1∩A2∩A3. Sabemos, pelo teorema da multiplicação, que

P(A1∩A2∩A3) = P(A1)P(A2|A1)P(A3|A1∩A2).

Vamos então calcular cada uma dessas probabilidades separadamente.

Inicialmente, temos 4 resultados favoráveis ao evento A1, entre 6 resultados possíveis, logoP(A1) =

46 = 2

3 .

Agora, vamos considerar o espaço amostral reduzido para calcular P(A2|A1). Dado que A1ocorreu, e como estamos sem reposição, para a retirada da segunda lâmpada teremos 3 lâmpa-das boas, e um total de 5 lâmpadas. Logo, P(A2|A1) =

35 .

Analogamente, para calcular P(A3|A1∩A2), observe que se $A_1$ e $A_2$ ocorreram, entãopara a retirada da terceira lâmpada, teremos 2 lâmpadas boas e um total de 4 lâmpadas. Destaforma,

P(A3|A1∩A2) =24 = 1

2 .

Finalmente, juntando estas probabilidades obtemos que

P(A1∩A2∩A3) =23

35

12 = 1

5 .

3.5.2 Teorema da Probabilidade Total

Seja Ω o espaço amostral de um experimento E, e seja B1,B2, . . . ,Bk uma partição de Ω. Assim, dadoum evento A qualquer, temos que

A = (A∩B1)∪ (A∩B2)∪·· ·∪ (A∩Bk).

Observe que como os eventos A∩ B1,A∩ B2, . . . ,A∩ Bk são dois-a-dois mutuamente excludentes,podemos aplicar a aditividade contável da probabilidade, que é válida para eventos mutuamente ex-cludentes, e escrever

P(A) = P(A∩B1)+ · · ·+P(A∩Bk).

Essa forma acima é chamada a primeira forma do Teorema da probabilidade total. Vamos agorapara a segunda forma. Escrevendo cada termo P(A∩Bi) = P(A|Bi)P(Bi) e, daí, obtemos a segundaforma do teorema da probabilidade total:

P(A) = P(A|B1)P(B1)+ · · ·+P(A|Bk)P(Bk).

Agora já temos teoria suficiente para resolver o problema dos monitores apresentado no início daseção:

ExercícioConsideremos o exemplo do lote com 20 monitores defeituosos e 80 monitores em perfeitoestado, no qual extraímos duas peças sem reposição, e queremos calcular a probabilidade doevento B = O segundo monitor é defeituoso.

41 / 135

Page 51: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

SoluçãoRelembre a definição do evento A: A =O primeiro monitor é defeituoso.

Pelo teorema da probabilidade total, segue que

P(B) = P(B|A)P(A)+P(B|Ac)P(Ac).

Já sabemos que P(A) = 15 . Isto fornece também, pela propriedade do complementar P(Ac) =

1−P(A) = 45 .

Vamos calcular agora P(B|A) e P(B|Ac) separadamente.

Dado que o evento A ocorreu, e sabendo que estamos sem reposição, para o segundo monitor,teremos 99 monitores disponíveis e entre eles, apenas 19 são defeituosos. Assim, P(B|A) = 19

99 .

Analogamente, temos que se Ac ocorreu, então o primeiro monitor escolhido estava em per-feito estado. Assim, neste cenário, para a escolha do segundo monitor, teremos 20 monitoresdefeituosos disponíveis entre o total de 99 monitores. Assim P(B|Ac) = 20

99 .

Juntando todas as informações, temos que

P(B) =1999

15+

2099

45=

80+1999 ·5

=15.

Então, curiosamente, apesar das contas serem completamente diferentes, e de estarmos semreposição, neste caso, as probabilidades também são iguais. Note que isso é uma coincidênciae não ocorre em geral.

CuidadoNote que embora no exemplo acima as probabilidades com reposição e sem reposição coin-cidiram, isto não ocorre sempre!

3.5.3 Teorema de Bayes

Assim como no teorema da probabilidade total, seja Ω um espaço amostral associado a um experi-mento E, e seja B1,B2, . . . ,Bk uma partição de Ω.

Temos então, pela definição da probabilidade condicional que

P(Bi|A) =P(A∩Bi)

P(A), i = 1,2, . . . ,k.

Usando o teorema da multiplicação, temos que P(A∩Bi) = P(A|Bi)P(Bi). Além disso, pelo teoremada probabilidade total, temos que P(A) = ∑

kj=1 P(A|B j)P(B j).

Portanto, juntando essas fórmulas com a definição da probabilidade condicional, obtemos:

P(Bi|A) =P(A|Bi)P(Bi)

∑ j=1 P(A|B j)P(B j), i = 1, . . . ,k.

Esta fórmula é conhecida como Teorema de Bayes.

ExercícioNuma turma de ciências da computação da UFPB, 1% dos homens e 4% das mulheres possuemmenos de 1,60m de altura. Além disso, 60% dos estudantes são homens. Se um estudante éselecionado ao acaso e é verificado que tem menos de 1,60m de altura. Qual é a probabilidadedesse estudante ser homem?

42 / 135

Page 52: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

SoluçãoDefina os eventos

A = Estudantes com menos de 1,60m, M = Estudantes do sexo feminino e H = Estudan-tes do sexo masculino.

Pelo enunciado, sabemos que P(A|H) = 0,01, P(A|M) = 0,04, P(H) = 0,6 e P(M) = 1−P(H) = 0,4.

Além disso, pelo teorema de Bayes, segue que

P(H|A) = P(A|H)P(H)

P(A|H)P(H)+P(A|M)P(M)=

0,01 ·0,60,01 ·0,6+0,04 ·0,4

=3

11.

3.6 Eventos Independentes

Considere dois eventos A e B quaisquer de um mesmo espaço amostral Ω. Dois eventos A e B sãoindependentes quando a probabilidade de ocorrer um dos eventos não é modificada pela ocorrênciado outro. Ou seja, dizemos que A e B são independentes quando P(A|B) = P(A) ou P(B|A) = P(B).

Assim, se A e B são eventos independentes, então

P(A∩B) = P(A)P(B).

NotaObserve que se vale a recíproca dessa última afirmação, ou seja, se vale a identidade acima,então os eventos são independentes.

ExercícioSuponha que um dado equilibrado seja jogado duas vezes. Sejam os eventos: A = o primeirodado mostra um número par e B = o segundo dado mostra o número 5 ou 6. CalculeP(A),P(B),P(A∩B),P(A|B) e P(B|A).

SoluçãoEscrevendo explicitamente, temos que

Ω = (1,1),(1,2),(1,3), . . . ,(6,6), onde Ω possui 36 elementos,

A = (2,1),(2,2),(2,3),(2,4),(2,5),(2,6),(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6),

onde A possui 18 elementos,

B = (1,5),(2,5),(3,5),(4,5),(5,5),(6,5),(1,6),(2,6),(3,6),(4,6),(5,6),(6,6),

onde B possui 12 elementos, e A∩B = (2,5),(2,6),(4,5),(4,6),(6,5),(6,6), onde A∩Bpossui 6 elementos.

Portanto, temos que

P(A) = 1836 = 1

2 ,P(B) =1236 = 1

3 e P(A∩B) = 636 = 1

6 .

Observemos que P(A∩B) = 16 = 1

213 = P(A)P(B). Logo, pelo que vimos acima, os eventos são

independentes e desta forma, P(A|B) = P(A) = 12 , e P(B|A) = P(B) = 1

3 .

Podemos também verificar diretamente:

P(A|B) = P(A∩B)P(B) = 1/6

1/3 = 12 e P(B|A) = P(A∩B)

P(A) = 1/61/2 = 1

3 .

43 / 135

Page 53: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Podemos generalizar este resultado para n eventos. Isto fornece a seguinte definição:

Definição: n eventos independentesSejam A1,A2, . . . ,An eventos em um mesmo espaço amostral Ω. Dizemos que A1, . . . ,An sãoeventos independentes se, e somente se, para k = 2,3, . . . ,n, e todas as escolhas possíveis deíndices i1, . . . , ik, onde cada i j é um número entre 1 e n, e eles são diferentes, vale a igualdade

P(Ai1 ∩Ai2 ∩·· ·∩Aik) = P(Ai1) · · ·P(Aik).

NotaNeste caso, temos 2n−n−1 relações a serem verificadas.

ExercícioSuponha que um par de moedas honestas sejam lançadas. Considere os eventos: A = carana primeira moeda, B = cara na segunda moeda e C = cara em exatamente uma moeda.Mostre que os eventos A,B e C são dois-a-dois independentes, mas não são independentes.

SoluçãoObserve que Ω = (cara,cara),(cara,coroa),(coroa,cara),(coroa,coroa). Note que Ω possui 4elementos.

Temos que A = (cara,cara),(cara,coroa), B = (cara,cara), (coroa,cara), C =(cara,coroa),(coroa,cara). Além disso, segue que A ∩ B = (cara,cara), A ∩ C =(cara,coroa), B∩C = (coroa,cara).

Portanto, temos que P(A) = 24 = 1

2 ,P(B) =24 = 1

2 ,P(C) = 24 = 1

2 . Por outro lado, temos quelatexmath:[P(A∩B) = 1

4 = 12 ·

12 = P(A)P(B), P(A∩C) = 1

4 = 12 ·

12 = P(A)P(C) e P(B∩C) =

14 = 1

2 ·12 = P(B)P(C).

Isso mostra que os eventos A,B e C são dois-a-dois independentes. Entretanto, temos queA∩B∩C = /0, e desta forma,

P(A∩B∩C) = 0 6= 18 = P(A)P(B)P(C).

Logo, os eventos A,B e C não são independentes.

3.7 Atividades

1. Sejam A,B e C três eventos em um espaço de probabilidade. Expresse os seguintes eventos emtermos de A,B e C:

a. Apenas A ocorre;

b. A e B ocorrem, mas C não ocorre;

c. Os três eventos ocorrem;

d. Pelo menos um dos três ocorrem;

e. Nenhum dos três ocorrem;

44 / 135

Page 54: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

f. Exatamente um dos três ocorre;

2. Extraem-se 4 cartas de um baralho com 52 cartas. Qual é a probabilidade de que duas sejamvermelhas e duas sejam pretas?

3. Qual a probabilidade de que os aniversários de 12 pessoas sejam em meses diferentes?

4. Quatro números são sorteados ao acaso, sem reposição, do conjunto 0,1,2, . . . ,9. Calcule aprobabilidade de que:

a. Os quatro números sorteados podem ser ordenados de forma consecutiva, por exemplo,1,2,3,4.

b. Todos sejam maiores do que 5.

c. O número 0 seja escolhido.

d. Pelo menos um seja maior do que 7.

e. Todos sejam ímpares.

5. Sejam A e B dois eventos em um espaço de probabilidade tais que P(A) = 1/2, P(B) = 1/4 eP(A∩B) = 1/5. Calcule as probabilidades dos seguintes eventos:

a. A não ocorre;

b. B não ocorre;

c. Pelo menos um entre A e B ocorrem;

d. A não ocorre e B sim;

e. B não ocorre e A sim;

f. Ocorre exatamente um de A e B;

g. Não ocorre nenhum de A e B;

h. Pelo menos um de A e B não ocorre.

6. Escolhe-se ao acaso um número entre 1 e 50. Sabendo que o número é primo, qual é a probabilidadede que seja ímpar?

7. Em um programa de auditório o participante lança um dado honesto 6 vezes. Ele ganha um prêmiode participação se obtiver o mesmo número pelo menos duas vezes, e ganha um prêmio milionário sea face 6 aparecer pelo menos quatro vezes. Qual a probabilidade de que o participante:

a) Ganhe o prêmio de participação?

b) Ganhe o prêmio milionário?

c) Tenha ganho o prêmio milionário dado que ganhou o prêmio de participação?

8. Em um curso preparatório para o vestibular, 1/3 dos estudantes são do sexo masculino e 2/3 sãodo sexo feminino. A proporção dos rapazes que estudam matemática é 20% e apenas 10% das moçasestudam matemática. Obtenha as probabilidades de que:

a) Um estudante escolhido ao acaso estude matemática.

45 / 135

Page 55: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

b) Um estudante de matemática escolhido ao acaso seja do sexo feminino.

9. Lança-se um dado duas vezes. Considere os eventos:

A = Foi obtido 2 ou 5 no primeiro lançamento

eB = A soma das faces obtidas nos dois primeiros lançamentos é pelo menos 7.

A e B são independentes?

10. Dois estudantes, Pedro e Paulo, estão matriculados na turma de Probabilidade e Estatística. Pedrocomparece a 80% das aulas e Paulo comparece a 60%. Suas presenças nas aulas são independentes.Calcule a probabilidade de que, em determinado dia:

a) pelo menos um dos estudantes compareça a aula.

b) apenas um deles esteja presente.

RESPOSTAS

1. a) A∩Bc ∩Cc b) A∩B∩Cc c) A∩B∩C d) A∪B∪C e) (A∪B∪C)c f)(A∩Bc∩Cc)∪ (Ac∩B∩Cc)∪ (Ac∩Bc∩C)

2. (262 )(

262 )

(524 )

. 3. 12!1212 . 4. a) 7

(104 )

b) 1/210 c) 2/5 d) 2/3 e) 1/42

5. a) 1/2 b) 3/4 c) 11/20 d) 1/20 e) 3/10 f) 7/20 g) 9/20 h) 4/5

6. 14/15 7. a) 319/324 b) 203/23328 c) 7/792

8. a) 2/15 b) 1/2 9. Sim 10. a) 0,92 b) 0,44

Feedback sobre o capítuloVocê pode contribuir para melhoria dos nossos livros. Encontrou algum erro? Gostaria desubmeter uma sugestão ou crítica?Para compreender melhor como feedbacks funcionam consulte o guia do curso.

46 / 135

Page 56: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Capítulo 4

Variáveis Aleatórias e Suas Distribuições

OBJETIVOS DO CAPÍTULO

Ao final deste capítulo você deverá ser capaz de:

• Saber a definição de variável aleatória

• Saber identificar variáveis aleatórias discretas

• Entender o que é e como calcular a função de probabilidade de uma variável aleatóriadiscreta

• Saber identificar variáveis aleatórias contínuas

• Entender o que é e como calcular a função de densidade de uma variável aleatóriacontínua

• Saber a definição e como calcular a função de distribuição acumulada

• Saber a relação entre a função de distribuição acumulada e função de probabilidade (nocaso de variáveis aleatórias discretas)

• Saber a relação entre a função de distribuição acumulada e função de densidade (nocaso de variáveis aleatórias contínuas)

• Saber a definição e exemplos de variáveis aleatórias mistas

• Entender o que são e como trabalhar com funções de variáveis aleatórias

Imaginemos que existe a definição de que a temperatura de João Pessoa é considerada quente se émaior do que 27 graus Celsius, é considerada confortável se está entre 20 e 27 graus Celsius, e éconsiderada fria se é menor do que 20 graus Celsius. Suponha que nosso espaço amostral para oexperimento medir a temperatura de João Pessoa pela manhã. Suponha que nosso espaço amostral,que contém todos os resultados possíveis para a temperatura, é Ω = R. Se queremos determinar se atemperatura é fria, confortável ou quente, a melhor ferramenta para isso é definir uma função X : Ω→fria,confortável,quente. Ou seja, uma função que associa a cada valor de temperatura, a quantidadefria, confortável ou quente. Por exemplo, X(10) = frio; X(34) = quente, e X(22) = confortável.Neste exemplo, foram medidas temperaturas, 10, 34 e 22, respectivamente.

Essa função X que utilizamos é o que chamamos de uma variável aleatória. Ou seja, é um rótulo quedamos para os valores possíveis no espaço amostral.

Na prática, o mais comum é utilizar variáveis aleatórias, onde associamos cada valor do espaço amos-tral a um número real, ao invés de um conjunto arbitrario. Isso se deve ao fato, de que existem muitas

47 / 135

Page 57: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

distribuições de probabilidade conhecidas tomando como valores números reais. Portanto, ao consi-derar uma variável aleatória que toma valores reais, estamos pegando um problema de probabilidadegenérico, e transformando num problema de probabilidade de números reais, e assim podemos utilizartoda a teoria de distribuições discretas e contínuas para resolver o problema.

Desta forma, mais precisamente, temos a

Definição: Variável AleatóriaSeja Ω um espaço amostral e seja X : Ω→ R uma função X que associa a cada elemento ω ∈Ω

um número real X(ω) ∈ R.

Exemplo 4.1 Exemplo de variável aleatóriaSuponha que sorteamos 3 pessoas em João Pessoa e observamos se é homem ou mulher. Suponha quequeremos saber o número de mulheres sorteadas. Para isso, defina a variável aleatória X : Ω→R, ondeX pode assumir os valores, 0,1,2 e 3. Se denotamos homem por H e mulher por M, temos que Ω =MMM,MMH,MHM,HMM,MHH,HMH,HHM,HHH, e portanto X(MMM) = 3,X(MMH) =X(MHM) = X(HMM) = 2,X(MHH) = X(HMH) = X(HHM) = 1,X(HHH) = 0.

Definição: Imagem InversaSeja Ω um espaço amostral e seja X : Ω→R uma variável aleatória. Dado qualquer subconjuntoB ⊂ R, definimos a imagem inversa de B pela variável aleatória X como o conjunto X−1(B) =ω ∈Ω;X(ω)∈ B. Ou seja, X−1(B) consiste dos elementos de Ω que são levados no conjuntoB pela variável aleatória X .

A partir da imagem inversa de X−1(B) podemos construir uma nova medida de probabilidade induzidapela variável aleatória X .

Definição: Probabilidade induzida pela variável aleatória XDefinimos a probabilidade P(X ∈ B) como sendo P(X−1(B)), ou seja, como a probabilidade doevento X−1(B). Da mesma forma, definimos P(X = a) como sendo P(X−1(a)), ou seja, aprobabilidade da variável aleatória assumir o valor a.

ExercícioEscreva o que significa P(X ≤ b) para algum número real b.

SoluçãoSeguindo a mesma ideia da definição, temos que P(X ≤ b) deve ser definido como a probabili-dade de X ser menor ou igual a b, assim, é a probabilidade de X pertencer ao intervalo da reta(−∞,b]. Portanto, P(X ≤ b) = P(X−1((−∞,b])).

ExercícioSuponha que na cidade de João Pessoa, temos a mesma quantidade de homens e de mulhe-res, e que cada sorteio de pessoas é feito com reposição e independentemente do(s) sorteio(s)anterior(es). Seja X a variável aleatória que indica o número de mulheres sorteadas. Calcule:P(X = 0),P(X = 1),P(X = 2) e P(X ≤ 2).

SoluçãoTemos que P(X = 0) = P(HHH) = 1

8 ; P(X = 1) = P(HHM,HMH,MHH) = P(HHM)+

P(HMH) +P(MHH) = 38 ; P(X = 2) = P(HMM,MHM,MMH) = P(HMM) +P(MHM) +

P(MMH) = 38 . Finalmente,

P(X ≤ 2) = P(X = 0)+P(X = 1)+P(X = 2) =18+

38+

38=

78.

48 / 135

Page 58: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Poderíamos também ter resolvido utilizando a técnica de tomar complementares. Como X sópode assumir valores 0,1,2 e 3, temos que,

P(X ≤ 2) = 1−P(X > 2) = 1−P(X = 3) = 1−P(MMM) = 1− 18=

78.

4.1 Variáveis Aleatórias Discretas

Como falamos anteriormente, nosso objetivo em considerar variáveis aleatórias tomando como va-lores números reais, se deve ao fato de haver uma teoria bem completa em torno dessas variáveisaleatórias. Dentre as variáveis aleatórias reais, existem dois grandes grupos: as variáveis aleatóriasdiscretas e as variáveis aleatórias contínuas. Nosso objetivo nesta seção consiste em definir, e apre-sentar vários exemplos de variáveis aleatórias discretas.

Definição: Variável aleatória discretaSeja Ω um espaço amostral e seja X : Ω→ R uma variável aleatória. Se existe uma sequêncianúmeros a1,a2,a3, . . ., tais que X só pode assumir um dos valores dessa sequência. Entãodizemos que X é uma variável aleatória discreta.

NotaNote que apesar da sequência a1,a2,a3, . . . ser uma sequência infinita, o conjunto de valorespossíveis para a variável aleatória X pode ser finito ou infinito enumerável. Por infinito enu-merável, nós queremos dizer um conjunto infinito que pode ser indexado pelo conjunto dosnúmeros naturais, ou seja, pelo qual podemos escrever uma sequência numérica cobrindotodos os números.

No caso de variáveis aleatórias discretas, sabemos que vale a seguinte identidade:

P(X ∈ a1,a2,a3, . . .) = 1,

pois X necessariamente só assume valores nesse conjunto a1,a2,a3, . . .. Portanto, utilizando aaditividade contável da medida de probabilidade, obtemos

1 = P(X ∈ a1,a2,a3, . . .) =∞

∑i=1

P(X = ai),

e portanto temos que ∑∞i=1 P(X = ai) = 1, e além disso, sabemos que para cada i, vale P(X = ai)≥ 0.

Estes fatos motivam a seguinte definição:

Definição: Função de probabilidadeSeja Ω um espaço amostral e seja X : Ω→R uma variável aleatória discreta, e seja a1,a2,a3, . . . ,o conjunto de valores possíveis de X . Definimos a função de probabilidade da variável aleatóriaX como uma função p(ai), que associa a cada ai a probabilidade da variável aleatória X assumiro valor ai, isto é, definimos p(ai) = P(X = ai).

NotaPelo que já vimos, uma função de probabilidade satisfaz as seguintes propriedades: . paratodo i, p(xi)≥ 0; . ∑

∞i=1 p(xi) = 1.

49 / 135

Page 59: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

ExercícioSuponha que uma urna contém 6 bolas azuis e 4 bolas vermelhas. Quatro bolas são tiradasaleatoriamente da urna, com reposição, e é observada a cor da bola, antes da bola ser devolvidaà urna. Seja X a variável aleatória que indica o número de bolas vermelhas que foram retiradasda urna. Obtenha a função de probabilidade de X .

SoluçãoDenote por V a bola vermelha e por A, a bola azul. Pelas informações do problema, temos quea probabilidade de se retirar uma bola vermelha é 4

10 e a de se retirar uma bola azul é 610 .

Assim, P(V ) = 410 = 0,4 e P(A) = 6

10 = 0,6.

O espaço amostral do problema é dado por

Ω = VVVV,VVVA,VVAV,VAVV,AVVV,VVAA,VAVA,VAAV,AVAV,AAVV,AVVA,VAAA,AVAA,AAVA,AAAV,AAAA.

É fácil ver que o conjunto de valores possíveis para a variável aleatória X é 0,1,2,3,4.Assim:

p(0) = P(X = 0) = P(AAAA) = (0,6)4;

p(1) = P(X = 1) = P(AAAV,AAVA,AVAA,VAAA)= P(AAAV )+P(AAVA)+P(AVAA)+P(VAAA)= (0,6)30,4+(0,6)30,4+(0,6)30,4+(0,6)30,4 = 4(0,6)30,4;

p(2) = P(X = 2) = P(VVAA,VAVA,VAAV,AVAV,AAVV,AVVA)= P(VVAA)+P(VAVA)+P(VAAV )+P(AVAV )+P(AAVV )+P(AVVA)= (0,6)2(0,4)2 +(0,6)2(0,4)2 +(0,6)2(0,4)2

+ (0,6)2(0,4)2 +(0,6)2(0,4)2 +(0,6)2(0,4)2

= 6(0,6)2(0,4)2;

p(3) = P(X = 3) = P(VVVA,VVAV,VAVV,AVVV )= P(VVVA)+P(VVAV )+P(VAVV )+P(AVVV )= (0,4)30,6+(0,4)30,6+(0,4)30,6+(0,4)30,6= 4(0,4)30,6;

finalmente, p(4) = P(X = 4) = P(VVVV ) = (0,4)4.

4.2 Variáveis Aleatórias Contínuas

As variáveis contínuas são aquelas na qual a variável aleatória pode assumir uma quantidade não-enumerável de valores. Isto faz com que a probabilidade de assumir um valor específico seja 0. Ouseja, se X é uma variável aleatória contínua, para todo número real a, temos que P(X = a) = 0. Aintuição para este fato inusitado, é que temos tantos valores possíveis para X , que faz com que aprobabilidade de assumir um valor em particular seja 0. Neste caso, a probabilidade de X assumir umvalor é trocada pela probabilidade de X pertencer a um intervalo da reta. Além disso, no cálculo daprobabilidade, a soma é “trocada” por uma integral, conforme veremos na próxima definição.

Definição: Variável Aleatória ContínuaDizemos que X é uma variável aleatória contínua se existe uma função real f : R→ R, a qualchamamos de função de densidade de X , que satisfaz as seguintes condições:

50 / 135

Page 60: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

• Para todo x real, f (x)≥ 0;

•∫

−∞

f (x)dx = 1;

• Se f (x) satisfaz as duas primeiras condições, então temos que para quaisquer a e b, −∞ <

a < b < ∞, vale P(a≤ X ≤ b) =∫ b

af (x)dx.

NotaNote portanto, que pela definição, para checar se uma função f (x) é uma função de densi-dade é suficiente verificar duas coisas:

1. se para todo x real, temos f (x)≥ 0;

2. se∫

−∞

f (x)dx = 1.

ImportanteComo mencionamos anteriormente, a definição de variável aleatória contínua implica quepara todo a real, P(X = a) = 0. De fato, como X possui uma função de densidade f , temosque

P(X = a) =∫ a

af (x)dx = 0.

Uma consequência deste fato é que P(a≤ X ≤ b) = P(a < x < b) = P(a < x≤ b) = P(a≤ X < b).

ExercícioSuponha que X seja uma variável aleatória contínua com a função de densidade

f (x) =

2x, 0 < x < 1;0, caso contrário.

.

a. Mostre que f (x) é uma função de densidade;

b. Calcule P(X ≤ 1/2);

c. Calcule P(X ≤ 1/2|1/3≤ X ≤ 2/3) (probabilidade condicional).

Soluçãoa. Temos da definição de f (x) que para todo x real, f (x) ≥ 0. Basta verificar agora que∫

−∞f (x)dx = 1. Note que f (x) = 0 fora do intervalo [0,1], e portanto∫

−∞

f (x)dx =∫ 1

02xdx = x2∣∣1

0 = 1.

Assim, f (x) é função de densidade

b.P(X ≤ 1/2) =

∫ 1/2

02xdx = x2

∣∣∣1/2

0=

14.

51 / 135

Page 61: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

c.P(X ≤ 1/2|1/3≤ X ≤ 2/3) = P(1/3≤X≤1/2)

P(1/3≤X≤1/2)

=

∫ 1/21/3 2xdx∫ 2/31/3 2xdx

=x2∣∣∣1/2

1/3

x2

∣∣∣2/3

1/3

= 5/363/9

= 512 .

4.3 Função de Distribuição Acumulada

Na teoria matemática da probabilidade é possível mostrar que, dada uma variável aleatória X , a pro-babilidade de qualquer evento pode ser obtida a partir das probabilidades P(X ≤ a), onde a é númeroreal. Ou seja, conhecendo P(X ≤ a) para todo a real, significa dizer que conhecemos P(X ∈ A) paraqualquer evento A. Este resultado é um importante resultado de Teoria da Medida, e mostra o quãorica é a função F(a) = P(X ≤ a). Por conta disso, ela recebe um nome:

Definição: Função de Distribuição AcumuladaSeja Ω um espaço amostral, e seja X : Ω→ R uma variável aleatória discreta ou contínua.Defina a função FX : R→ R dada por FX(a) = P(X ≤ a), onde a é número real. FX é denomi-nada a função de distribuição acumulada da variável aleatória X , ou simplesmente função dedistribuição.

• Se X for uma variável aleatória discreta, então

FX(a) = ∑j;a j≤a

p(a j),

onde a soma é feita sobre os indíces j, tais que a j ≤ a.

• Se X for uma variável aleatória contínua, então

FX(a) =∫ a

−∞

f (x)dx.

ExercícioSeja X uma variável aleatória discreta tomando valores 0,1 e 2. Suponha que sua função deprobabilidade é dada por p(0) = 1/2, p(1) = 1/3 e p(2) = 1/6. Obtenha FX .

SoluçãoSe a < 0, então FX(a) = P(X < a) ≤ P(X < 0) = 0. Como FX(a) = P(X ≤ a) ≥ 0, segue quepara todo a < 0, FX(a) = 0.

Suponha agora, 0≤ a < 1, então FX(a) = P(X ≤ a) = P(X = 0) = p(0) = 1/2.

Seja agora, 1 ≤ a < 2. Então, FX(a) = P(X ≤ a) = P(X = 0)+P(X = 1) = p(0)+ p(1) =1/2+1/3 = 5/6.

Finalmente, se a≥ 2, então FX(a) = P(X ≤ a) = P(X ≤ 2) = 1.

52 / 135

Page 62: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Assim,

FX(a) =

0, a < 01/2, 0≤ a < 1,5/6, 1≤ a < 2,1, a≥ 2.

.

ExercícioSeja X uma variável aleatória contínua com função de densidade

f (x) =

2x, 0 < x < 1;0, caso contrário.

.

Já sabemos que f é função de densidade por um exercício anterior. Obtenha sua função dedistribuição FX .

SoluçãoTemos que se a < 0, então P(X ≤ a)≤ P(X < 0) = 0. Assim, para a < 0, temos FX(a) = 0.

Para 0≤ a≤ 1, temos

P(X ≤ a) =∫ a

02xdx = x2∣∣a

0 = a2.

Assim, para 0≤ a≤ 1, vale FX(a) = a2.

Finalmente, se a > 1, então P(X ≤ a) = P(X ≤ 1) = 1.

Portanto, para a > 1, segue FX(a) = 1.

Desta forma,

FX(a) =

0, 0≤ a < 0,a2, 0≤ a≤ 1,1, a≥ 1.

.

NotaObserve que se a≤ b, então sempre que X(ω)≤ a, teremos X(ω)≤ a≤ b, o que implica,X(ω)≤ b. Assim, vale a inclusão de conjuntos ω ∈Ω;X(ω)≤ a ⊂ ω ∈Ω;X(ω)≤ b.Logo, P(X ≤ a)≤ P(X ≤ b).Portanto, temos que se a ≤ b, então FX(a) ≤ FX(b), ou seja, FX é uma função não-decrescente.

NotaÉ possível mostrar que para qualquer variável aleatória X , vale lima→−∞ FX(a) = 0 elima→∞ FX(a) = 1.

ImportanteNote ainda que se X é uma variável aleatória discreta com conjunto de valores possíveisdado por a1,a2,a3, . . ., ordenados de tal forma que a1 < a2 < a3 < a4 < .. ., então temosque

p(ai) = P(X = ai) = P(X ≤ ai)−P(X ≤ ai−1) = FX(ai)−FX(ai−1).

Ou seja, podemos obter a função de probabilidade de X a partir da função de distribuição deX desta forma.

53 / 135

Page 63: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

NotaNote que esta última observação nos diz que se temos uma função de distribuição de umavariável aleatória discreta, então o conjunto de valores que a variável aleatória X pode as-sumir é exatamente o conjunto dos pontos de descontinuidade da função de distribuição FX .Assim, se a1 é o menor ponto de descontinuidade de X , então P(X = a1) = FX(a1), e depoisdisso, se FX é descontínua no ponto ai, então teremos que P(X = ai) = FX(ai)−FX(ai−1).

ExercícioSuponha que X é uma variável aleatória discreta com função de distribuição FX dada por

FX(a) =

0, a < 0,1/4, 0≤ a < 1,1/2, 1≤ a < 2,1, a≥ 2.

Obtenha a função de probabilidade p(ai).

SoluçãoOs pontos de descontinuidade da função de distribuição FX são 0, 1 e 2. Portanto, pelo quevimos, temos que p(0) = FX(0) = 1/4, p(1) = FX(1)−FX(0) = 1/2−1/4 = 1/4, e finalmente,p(2) = FX(2)−FX(1) = 1−1/2 = 1/2.

Temos um resultado análogo para variáveis aleatórias contínuas.

ImportanteSeja agora X uma variável aleatória contínua. Então, vale que

FX(x) =∫ x

−∞

f (t)dt.

Ou seja, estamos dizendo que FX é uma primitiva para a função de densidade f . Destaforma, podemos “recuperar” a função de densidade, a partir da função de distribuição, porsimples derivação em todos os pontos em que FX for derivável:

f (a) =dFX(a)

da= F ′X(a).

ExercícioSuponha que X é uma variável aleatória contínua com função de distribuição FX dada por

FX(a) =

0, a < 0,1− e−a, a≥ 0.

.

Obtenha a função de densidade f (x).

54 / 135

Page 64: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

SoluçãoSabemos que a função de densidade f (x) é dada pela derivada da função de distribuição emtodos os pontos em que esta for derivável.

Assim, se x < 0, temos que f (x) = F ′X(x) = 0. Se x > 0, então f (x) = F ′X(x) = e−x. Em x = 0,FX não é derivável, então podemos supor f (x) = 0, já que o valor de uma função em um únicoponto não altera o valor da integral.

Portanto, a função de densidade f da variável aleatória X é dada por

f (x) =

0, 0≤ x≤ 0,e−x, x > 0.

.

4.4 Variáveis Aleatórias Mistas

Podemos ter também um terceiro tipo de variável aleatória: a variável aleatória mista. Ela consisteem uma variável aleatória cuja probabilidade é uma mistura entre as variáveis aleatórias contínuas ediscretas. Assim, se X é uma variável aleatória mista, então existem números reais a1,a2,a3, . . . , taisque para algum i, P(X = ai)> 0, e tais que

∑i=1

P(X = ai) = p < 1,

ou seja, isso garante que ela tem esse comportamento da variável aleatória discreta, mas não é umavariável aleatória discreta, pois a soma não é igual a 1.

Assim, seja FX a função de distribuição da variável aleatória X . Definimos a parte discreta da funçãode distribuição de X como Fd

X (x) = ∑i;ai≤x P(X = ai). Defina p(ai) = P(X = ai), então dizemos quea função p é a função de probabilidade da parte discreta da variável aleatória X .

NotaNote que se X fosse uma variável aleatória discreta, teríamos FX = Fd

X .

Agora, defina FcX(x) = FX(x)−Fd

X (x), a parte contínua da função de distribuição da variável aleatória

X . Assim, se X é uma variável aleatória mista, existe uma função f (t)≥ 0, tal que FcX(x)=

∫ x

−∞

f (t)dt,

e∫

−∞

f (t)dt = 1− p. Dizemos que a função f é a função de densidade da parte contínua de X .

NotaObserve então que se X é uma variável aleatória discreta, então Fc

X(x) = 0, para todo x; ese X é uma variável aleatória contínua, então Fd

X (x) = 0, donde temos FX(x) = FcX(x).

Portanto, podemos concluir que FX(x) = FcX(x)+Fd

X (x), ou seja, vale:

FX(x) = P(X ≤ x) =∫ x

−∞

f (t)dt + ∑i;ai≤x

P(X = ai).

55 / 135

Page 65: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Assim, suponha que é dada uma função de distribuição FX de uma variável aleatória mista X , e quequeremos encontrar a função de probabilidade da parte discreta de X , e a função de densidade daparte contínua de X .

Para tanto, começamos procurando por pontos de descontinuidade de FX . Suponha que temos ospontos a1,a2, . . ., então, para encontrar a função de probabilidade da parte discreta de X , basta calcularpara cada i, o número p(ai) = P(X = ai) = P(X ≤ ai)−P(X < ai).

Uma vez, encontrada a função de probabilidade da parte discreta de X , definimos FcX(x) = FX(x)−

FdX (x), e obtemos a função de densidade da parte contínua de X por derivação: f (x) = Fc

X′(x), ou seja,

derivamos a parte contínua da função de distribuição FX .

ExercícioSeja X uma variável aleatória mista com função de distribuição

FX(x) =

0, x≤ 0,x, 0 < x < 1/2,1,x≥ 1/2.

Obtenha a função de probabilidade da parte discreta de X e a função de densidade da partecontínua de X .

SoluçãoObserve que FX só possui apenas um ponto de descontinuidade no ponto x = 1/2. Assim, temosque a função de probabilidade da parte discreta é dada por p(1/2) = P(X ≤ 1/2)−P(X <1/2) = FX(1/2)−P(X < 1/2) = 1−1/2 = 1/2. Pois, como para x < 1/2, vale, P(X < x) = x,temos, P(X < 1/2) = 1/2.

Portanto, temos que se x < 1/2, então FdX (x) = 0, e se x≥ 1/2, então Fd

X (x) = 1/2. Daí, se x <1/2, Fc

X(x) = FX(x)−FdX (x) = x, e se x≥ 1/2, temos Fc

X(x) = FX(x)−FdX (x) = 1−1/2 = 1/2.

Desta forma, temos que

FcX(x) =

0, x≤ 0,x, 0 < x < 1/2,1/2,x≥ 1/2.

.

Assim, derivando, obtemos que a função de densidade da parte contínua de X é dada por

f (x) =

0, x≤ 0 ou x≥ 1/2,1, 0 < x < 1/2.

.

4.5 Funções de Variáveis Aleatórias

Definição: Função de uma Variável AleatóriaSeja X uma variável aleatória tomando valores reais. Seja Im(X) = X(Ω) = X(ω);ω ∈ Ωa imagem de X , ou seja, o conjunto dos valores que a variável aleatória X pode assumir. Sejag : Im(X)→ R uma função real. Então, a função Y = g(X) é uma nova variável aleatória, edizemos que Y é uma função da variável aleatória X .

56 / 135

Page 66: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Relembre a definição de imagem inversa: para um subconjunto dos reais A⊂ R a imagem inversa deA pela função g é o conjunto g−1(A) = x ∈ Im(X);g(x) ∈ A.Assim, temos que para todo evento A ⊂ R, vale P(Y ∈ A) = P(g(X) ∈ A) = P(X ∈ g−1(A)). Por-tanto, podemos calcular probabilidades com relação à variável aleatória Y a partir diretamente deprobabilidades envolvendo apenas a variável aleatória X .

Exemplo 4.2 Exemplo de função de variável aleatória discretaSeja X uma variável aleatória discreta tomando valores no conjunto 1,2,3, . . .. Suponha que P(X =n) = (1/2)n. Defina a função g : 1,2,3, . . . → R dada por f (2k) = 1, k = 1,2,3, . . ., e f (2k−1) =−1, para k = 1,2,3, . . .. Ou seja, g(x) é igual a 1 se x é par, e é igual a -1 se x é ímpar. Desta forma,definindo Y = g(X), temos que

Y =

1, se X for par,−1, se X for ímpar.

Assim, temos que P(Y = 1) = P(g(X) = 1) = P(X ∈ g−1(1)). Note que g(x) = 1 se, e somente se,x é par, ou seja, g−1(1) = 2,4,6, . . .. Assim,

P(Y = 1) = P(X ∈ 2,4,6, . . .) = (1/2)2 +(1/2)4 +(1/2)6 + · · ·= 1/4+(1/4)2 +(1/4)3 + · · ·= 1/4

1−1/4 = 1/3.

Por outro lado, P(Y =−1) = 1−P(Y = 1) = 1−1/3 = 2/3.Observe que outra forma equivalente de calcular P(Y = 1), seria observar que Y = 1 se, e somente se,X é par, e portanto Y = 1= X ∈ 2,4,6, . . .. E portanto, P(Y = 1) = P(X ∈ 2,4,6, . . .).

Exemplo 4.3 Exemplo de função de variável aleatória contínuaSeja X uma variável aleatória contínua com função de densidade dada por f (x) = 2x, se x ∈ (0,1), e0 caso contrário. Seja Y = 3X + 1. Vamos encontrar a função de densidade de Y , que denotaremospor fY (y).Primeiramente, note que como Im(X) = (0,1), e assim Im(Y ) = (1,4). Observe, agora, que P(Y ≤y) = P(3X + 1 ≤ y). Sabemos que 3X + 1 ≤ y se, e somente se, X ≤ (y− 1)/3. Portanto, valeFY (y) = P(3X +1≤ y) = P(X ≤ (y−1)/3) = FX((y−1)/3).Finalmente, se y≤ 0, então FY (y) = P(Y ≤ y) = 0, e se y≥ 4, temos FY (y) = P(Y ≤ y) = 1. Portanto,se y < 0, então fY (y) = F ′Y (y) = 0, e se y > 4, então fY (y) = F ′Y (y) = 0.Agora, se y ∈ (1,4), temos que FY (y) = FX((y−1)/3), e portanto, pela regra da cadeia

fY (y) = F ′Y (y) = F ′X((y−1)/3) ·1/3 = f ((y−1)/3) ·1/3 =2((y−1)/3)

3=

2(y−1)9

.

ExercícioConsidere X variável aleatória contínua com a densidade do exemplo anterior. Seja g(x) = e−x.Obtenha a função de densidade de Y = g(X) = e−X , fY (y).

SoluçãoComo Im(X) = (0,1), temos que Im(Y ) = (1/e,1). Assim, se y < 1/e, então FY (y) = P(Y ≤y) = 0, e se y > 1, então FY (y) = P(Y ≤ y) = 1. Isto implica que se y < 1/e, fY (y) = F ′Y (y) = 0,e se y > 1, temos fY (y) = F ′Y (y) = 0.

Falta considerarmos y ∈ (1/e,1). Assim, temos que Y ≤ y se, e somente se, e−X ≤ y, que porsua vez, vale se, e somente se, X ≥ − ln(y). Portanto, FY (y) = P(Y ≤ y) = P(X ≥ − ln(y)) =1−FX(− ln(y)). Onde temos que

P(X ≥− ln(y)) = 1−P(X <− ln(y)) = 1−P(X ≤− ln(y)) = 1−FX(− ln(y)),

57 / 135

Page 67: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

pois P(X =− ln(y)) = 0, já que X é uma variável aleatória contínua.

Desta forma, obtemos, usando a regra da cadeia, que para y ∈ (1/e,1),

fY (y) = F ′Y (y) = (1−FX(− ln(y))′ =− fX(− ln(y)) · −1y

=−2ln(y)

y.

ExercícioSeja X uma variável aleatória contínua com função de densidade f . Seja Y = X2. Encontre afunção de densidade da variável aleatória Y , fY .

SoluçãoObserve que X2 ≥ 0. Daí, se y < 0, segue que FY (y) = P(Y ≤ y) = 0, e portanto, para y < 0,vale fY (y) = 0.

Suponha agora que y≥ 0, e note que Y ≤ y se, e somente se, X2 ≤ y. Esta última desigualdadevale se, e somente se, X2− y ≤ 0. Resolvendo essa inequação, obtemos que X2− y ≤ 0 se,e somente se, X ≥ −√y e X ≤ √y. Assim, vale a igualdade entre os conjuntos Y ≤ y =−√y≤ X ≤√y.Portanto, como X é variável aleatória contínua, segue que,

FY (y) = P(Y ≤ y) = P(−√y≤ X ≤√y) = P(X ≤√y)−P(X <−√y) = FX(√

y)−FX(−√

y).

Daí, pela regra da cadeia, vale que

F ′Y (y) = f (√

y) · 12√

y− f (−√y) · −1

2√

y=

12√

y( f (√

y)+ f (−√y)) .

Portanto, fY (y) = 12√

y

(f (√

y)+ f (−√y)).

4.6 Atividades

1. Seja X uma variável aleatória discreta com função de probabilidade dada por

p(x) = cx, x = 1, . . . ,6.

Encontre:

a) o valor de c;

b) a probabilidade de X ser um número ímpar.

2. Seja X uma variável aleatória discreta com função de probabilidade dada por

p(x) =c4x , x = 0,1, . . . .

Obtenha:

a) o valor de x.

b) a probabilidade de X ser um número par.

58 / 135

Page 68: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

3. Seja X uma variável aleatória discreta com função de distribuição dada por

F(x) =

0, se x < 0,1/2, se 0≤ x < 1,3/5, se 1≤ x < 2,4/5, se 2≤ x < 3,9/10, se 3≤ x < 4,1, se x≥ 4.

Calcule:

a) a função de probabilidade de X .

b) P(X = 0|X é par).

4. Uma urna contém cinco bolas numeradas de 1 a 5. Duas bolas são retiradas simultaneamente.Obtenha a função de probabilidade das seguintes variáveis aleatórias:

a) o maior número sorteado;

b) a soma dos números retirados.

5. Verifique que as seguintes funções são densidades:

a)

f (x) =

1/8, se 0≤ x≤ 2,3/4, se 4≤ x≤ 5,0, caso contrário.

b) f (x) = 3(1− x)2,0≤ x≤ 1.

c) f (x) = 4xe−2x, x≥ 0.

6. Seja X uma variável aleatória contínua com densidade dada por

f (x) =cx3 , x≥ 1.

Calcule:

a) o valor de c;

b) a probabilidade de X ser maior do que 2;

c) a função de distribuição de X .

7. Encontre a densidade de Y = e−2X , onde X é uma variável aleatória contínua com densidade dadapor f (x) = e−x, x > 0.

8. Encontre a densidade de |X |, se X é uma variável aleatória contínua com densidade dada por

f (x) =1√2π

e−x2/2, x ∈ R.

9. Seja X uma variável aleatória com densidade dada por

f (x) =

1/2, se −1 < x < 0,e−x/2, se x≥ 0,0, caso contrário.

Obtenha a densidade de Y = X2.

59 / 135

Page 69: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

RESPOSTAS

1. a) 1/21 b) 3/7

2. a) 3/4 b) 4/5

3. a) P(X = 0) = 1/2,P(X = 1) = P(X = 3) = P(X = 4) = 1/10,P(X = 2) = 1/5. b)5/8

4. a) p(2) = 1/10, p(3) = 1/5, p(4) = 3/10, p(5) = 2/5. b) p(x) = 1/10 se x ∈3,4,8,9 e p(x) = 1/5 se x ∈ 5,6,7.

6. a) 2 b) 1/4 c) F(x) =

1− x2, se x≥ 1,0, se x < 1.

7. fY (y) = 12√

y , 0 < y < 1.

8. fY (y) = (2/π)1/2 exp−y2/2, y > 0.

9.

fY (y) =

1

4√

y

(1+ e−

√y), se 0≤ y < 1,

14√

ye−√

y, se y≥ 1,

0, caso contrário.

Feedback sobre o capítuloVocê pode contribuir para melhoria dos nossos livros. Encontrou algum erro? Gostaria desubmeter uma sugestão ou crítica?Para compreender melhor como feedbacks funcionam consulte o guia do curso.

60 / 135

Page 70: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Capítulo 5

Esperança de uma Variável Aleatória

OBJETIVOS DO CAPÍTULO

Ao final deste capítulo você deverá ser capaz de:

• Entender o que é a esperança de variáveis aleatórias

• Conhecer as propriedades da esperança

• Saber calcular a esperança

• Entender o que é a variância de variáveis aleatórias

• Conhecer as propriedades da variância

• Saber calcular a variância

Vamos começar introduzindo uma notação que será útil ao estudar o conceito de esperança matemá-tica: variáveis aleatórias independentes.

5.1 Variáveis aleatórias independentes

Relembre a definição de eventos independentes: sejam Ω um espaço amostral, A e B eventos de Ω.Então, dizemos que os eventos A e B são independentes se P(A∩B) = P(A)P(B).

Esta definição motiva a definição de independência entre variáveis aleatórias:

Definição: Variáveis Aleatórias IndependentesSejam X : Ω→ R e Y : Ω→ R duas variáveis aleatórias. Dizemos que X e Y são independentesse para todos os eventos A,B ∈ R, vale a fórmula:

P(X ∈ A e Y ∈ B) = P(X ∈ A)P(Y ∈ B).

NotaSejam X e Y são duas variáveis aleatórias discretas. Suponha que X toma valores no con-junto a1,a2,a3, . . . e que Y toma valores no conjunto b1,b2,b3, . . .. Então, é possívelmostrar que X e Y são independentes se, e somente se, para cada ai e b j, temos

P(X = ai,Y = b j) = P(X = ai)P(Y = b j).

61 / 135

Page 71: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

5.2 Esperança matemática

Vamos começar motivando a definição de esperança. A esperança pode ser pensada como uma ge-neralização da média. De fato, suponha que temos 10 pesos. O primeiro possui 1 quilo, o segundo2 quilos, . . . , o décimo 10 quilos. Suponha que uma pessoa escolhe um peso aleatoriamente, ondetodos os pesos possuem a mesma probabilidade de serem escolhidos. Qual o peso médio?

Temos 1 quilo com probabilidade 1/10, 2 quilos com probabilidade 1/10, . . . , 10 quilos com probabi-lidade 1/10. Assim, o peso médio é m = 1/10+2/10+ · · ·+10/10 = 5,5.

Mais geralmente temos a

Definição: Esperança de Variáveis Aleatórias DiscretasSeja X uma variável aleatória discreta tomando valores no conjunto a1,a2,a3, . . .. Sejap(ai) = P(X = ai) sua função de probabilidade. Então, definimos a esperança, ou valor es-perado, de X como:

E(X) =∞

∑i=1

ai p(ai),

se a série ∑∞i=1 |ai|p(ai) convergir, ou seja, se a série ∑

∞i=1 ai p(ai) convergir absolutamente.

Caso a série em questão não convirja absolutamente, dizemos que a esperança de X não existe.

É claro que se X toma apenas uma quantidade finita de valores, digamos a1, . . . ,an, então a esperançade X é dada por

E(X) =n

∑i=1

ai p(ai).

NotaObserve que como a soma p(a1)+ · · ·+ p(an) = 1, podemos pensar nesta esperança comouma média ponderada, entre os valores a1, . . . ,an, com os pesos p(a1), . . . , p(an). Noteainda que se todos os valores forem igualmente possíveis, ou seja, se para cada i, p(ai) =1/n, então a esperança será dada simplesmente pela média aritmética entre os valorespossíveis:

E(X) =1n

n

∑i=1

ai.

Exemplo 5.1 Exemplo de esperança de variável aleatória discretaSeja X uma variável aleatória que toma valor 1 com probabilidade p, e valor 0 com probabilidade1− p. Temos então que

E(X) = 0p(0)+1p(1) = p(1) = P(X = 1) = p.

Vamos agora definir esperança para variáveis aleatórias contínuas.

Definição: Esperança de Variáveis Aleatórias ContínuasSeja X uma variável aleatória contínua com função de densidade f . Definimos a esperança deX como

E(X) =∫

−∞

f (x)dx,

62 / 135

Page 72: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

se ∫∞

−∞

|x| f (x)dx < ∞.

No caso da integral imprópria acima divergir, dizemos que a esperança de X não existe.

Exemplo 5.2 Exemplo de esperança de variável aleatória contínuaSeja X uma variável aleatória contínua com função de densidade dada por

f (x) =

1

b−a , a < x < b,0, caso contrário.

Portanto,

E(X) =∫ b

a

xb−a

dx =1

b−a· x

2

2

∣∣∣ba

= b2−a2

2(b−a) =(b+a)(b−a)

2(b−a)= a+b

2 .

5.3 Esperança de uma Função de Variável Aleatória

Definição: Esperança de função de variável aleatóriaSeja X uma variável aleatória e seja Y = H(X), para uma função real H. Temos então doiscasos:

• Se X for uma variável aleatória discreta tomando valores em a1,a2, . . ., e se p é a funçãode probabilidade de X , temos que

E(Y ) = E(H(X)) =∞

∑i=1

H(ai)P(X = ai) =∞

∑i=1

H(ai)p(ai).

• Se X for uma variável aleatória contínua com função de densidade f , então temos que

E(Y ) = E(H(X)) =∫

−∞

H(x) f (x)dx.

Exemplo 5.3 Exemplo de esperança de função de uma variável aleatória discretaVamos relembrar um exemplo estudando quando introduzimos funções de variáveis aleatórias: sejaX uma variável aleatória discreta tomando valores no conjunto 1,2,3, . . .. Suponha que P(X = n) =(1/2)n. Defina a função g : 1,2,3, . . . → R dada por f (2k) = 1, k = 1,2,3, . . ., e f (2k− 1) = −1,para k = 1,2,3, . . .. Ou seja, g(x) é igual a 1 se x é par, e é igual a -1 se x é ímpar. Desta forma,

63 / 135

Page 73: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

definindo Y = g(X), temos que

E(Y ) = E(g(X)) =∞

∑i=1

g(i)P(X = i)

=∞

∑i=1

g(2i)P(X = 2i)+∞

∑i=1

g(2i−1)P(X = 2i−1)

=∞

∑i=1

P(X = 2i)+∞

∑i=1

(−1)P(X = 2i−1)

=∞

∑i=1

(1/2)2i−∞

∑i=1

(1/2)2i−1

=∞

∑i=1

(1/2)2i−∞

∑i=1

2 · (1/2)2i

=∞

∑i=1

(1/2)2i−2∞

∑i=1

(1/2)2i

= −∞

∑i=1

(1/2)2i

= −∞

∑i=1

(1/4)i

= − 1/41−1/4

= −1/3.

Portanto, E(Y ) =−1/3.Note que, quando apresentamos o exemplo no Capítulo 4, vimos que Y só assume os valores −1 e 1.Além disso, calculamos sua função de probabilidade:

P(Y =−1) = 2/3 e P(Y = 1) = 1/3.

Desta forma, usando diretamente a definição de esperança de variáveis aleatórias discretas, temos:

E(Y ) = (−1) ·2/3+1 ·1/3 =−2/3+1/3 =−1/3.

Logo, vemos que não há contradição entre as definições, e as esperanças sempre vão coincidir.

ImportanteComo vimos no exemplo anterior, na hora de calcular a esperança de funções de variáveisaleatórias discretas, temos duas opções:

• Calcular diretamente, usando a função de probabilidade de X , através da fórmula

E(Y ) = E(H(X)) =∞

∑i=1

H(ai)P(X = ai);

• Obter a função de probabilidade de Y e depois calcular a esperança de Y diretamente:

E(Y ) =∞

∑j=1

b jP(Y = b j),

onde Y toma valores em b1,b2, . . ..

64 / 135

Page 74: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Exemplo 5.4 Exemplo de esperança de função de uma variável aleatória contínuaSuponha que X é uma variável aleatória contínua com função de densidade

f (x) =

ex

2 , x≤ 0,e−x

2 , x > 0.

Tome Y = |X |, então E(Y ) é dada por

E(Y ) = E(|X |) =∫

−∞

|x| f (x)dx

=∫ 0

−∞

−xex

2dx+

∫∞

0x

e−x

2dx.

Observe que integrando por partes, obtemos que F(x) = −xex + ex é uma primitiva para −xex e queG(x) =−xe−x− e−x é uma primitiva para xe−x. Daí,∫ 0

−∞

−xex

2dx =

12(−xex + ex)

∣∣∣0−∞

=12

e∫

0x

e−x

2dx =

12(−xe−x− e−x)

∣∣∣∞0=

12.

Finalmente, juntando todas as informações, obtemos

E(Y ) =∫ 0

−∞

−xex

2dx+

∫∞

0x

e−x

2dx =

12+

12= 1.

Assim como no caso de variáveis discretas, podemos calcular a esperança de Y diretamente. Paraisto, vamos obter a função de densidade de Y . Observe que como X é variável aleatória contínua,P(X = y) = 0 para todo y real. Assim, como Y ≥ 0, segue que para todo y≥ 0:

FY (y) = P(Y ≤ y) = P(|X | ≤ y) = P(−y≤ X ≤ y) = P(−y < X ≤ y) = FX(y)−FX(−y).

Desta forma, por derivação, obtemos que a função de densidade de Y , fY (y) é dada por

fY (y) = f (y)+ f (−y) =e−y

2+

e−y

2= e−y,

e f (y) = 0, se y < 0.Portanto,

E(Y ) =∫

−∞

y fY (y)dy =∫

0ye−ydy = (ye−y− ey)

∣∣∣∞0= 1,

donde usamos que H(y) = ye−y− ey é primitiva de ye−y.Assim como no caso de funções de variáveis aleatórias discretas, as duas formas de calcular a espe-rança fornecem o mesmo resultado.

ImportanteComo vimos no exemplo anterior, e no caso de funções de variáveis aleatórias discretas,na hora de calcular a esperança de funções de variáveis aleatórias contínuas, temos duasopções:

• Calcular diretamente, usando a função de densidade de X , através da fórmula

E(Y ) = E(H(X)) =∫

−∞

H(x) f (x)dx;

• Obter a função de densidade de Y , fY (y), e depois calcular a esperança de Y diretamente:

E(Y ) =∫

−∞

y fY (y)dy.

65 / 135

Page 75: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

5.4 Propriedades da Esperança

Nessa seção vamos apresentar várias propriedades da esperança matemática e demonstrar algumasdelas.

Propriedades da esperança

• (Esperança da constante): Seja c ∈ R um número real, e seja X a variável aleatória constanteigual a c, ou seja, P(X = c) = 1. Então E(X) = c..

• (Sinal da esperança): Se X ≥ 0, então E(X)≥ 0, e se X ≤ 0, então E(X)≤ 0.

• (Multiplicação por constante): Seja c ∈ R um número real, e seja X uma variável aleatória.Então E(cX) = cE(X).

• (Soma de variáveis aleatórias): Sejam X e Y variáveis aleatórias quaisquer, então E(X +Y ) =E(X)+E(Y ).

• (Combinação linear de variáveis aleatórias): Sejam X1,X2, . . . ,Xn variáveis aleatórias, ec1,c2, . . . ,cn números reais. Então

E( n

∑i=1

ciXi

)=

n

∑i=1

ciE(Xi).

• (Produto de variáveis aleatórias independentes): Sejam X e Y variáveis aleatórias indepen-dentes, então

E(XY ) = E(X)E(Y ).

Demonstração

• (Esperança da constante): Note que X é uma variável aleatória discreta que toma apenas ovalor c, e portanto

E(X) = cP(X = c) = c.

• (Sinal da esperança): Vamos demonstrar o caso X ≥ 0 para variáveis aleatórias discretas epara variáveis aleatórias contínuas. Os casos de variáveis aleatórias mistas e X ≤ 0 ficamcomo exercícios para o leitor.

Seja X variável aleatória discreta, X ≥ 0, tomando valores no conjunto a1,a2, . . .. ComoX ≥ 0, segue que para todo i, temos ai ≥ 0. Além disso, P(X = ai)≥ 0. Logo,

E(X) =n

∑i=1

aiP(X = ai)≥ 0.

Seja, agora, X variável aleatória contínua, X ≥ 0, com função de densidade f (x). Então, comoX ≥ 0, vale f (x) = 0 se x < 0. Daí

E(X) =∫

−∞

x f (x)dx =∫

0x f (x)dx≥ 0.

• (Multiplicação por contante): Vamos demonstrar para variáveis aleatórias discretas e paravariáveis aleatórias contínuas. O caso de variáveis aleatórias mistas fica como exercício parao leitor.

66 / 135

Page 76: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Seja, então, X variável aleatória discreta, e suponha que X toma valores no conjuntoa1,a2, . . .. Então, cX é função da variável aleatória discreta, daí

E(cX) =∞

∑i=1

caiP(X = ai) = c∞

∑i=1

aiP(X = ai) = cE(X).

Suponha agora que X é variável aleatória contínua com função de densidade f (x). Então, cX éfunção de uma variável aleatória contínua, e segue que

E(X) =∫

−∞

cx f (x)dx = c∫

−∞

f (x)dx = cE(X).

• (Soma de variáveis aleatórias): A demonstração foge do escopo do livro.

• (Combinação linear de variáveis aleatórias): Usando a propriedade da soma de variáveisaleatórias n vezes, temos que

E( n

∑i=1

ciXi

)=

n

∑i=1

E(ciXi).

Usando a propriedade da multiplicação por constante, obtemos o resultado desejado:

E( n

∑i=1

ciXi

)=

n

∑i=1

E(ciXi) =n

∑i=1

ciE(Xi).

• (Produto de variáveis aleatórias independentes): Foge do escopo do livro.

5.5 Variância de uma variável aleatória

Vamos agora utilizar a esperança para definir uma noção de variabilidade da variável aleatória: avariância.

A variância de uma variável aleatória mede o quanto a variável aleatória flutua em torno da esperança.Ou seja, mede quanto os valores da variável aleatória X podem se afastar da esperança.

Vale observar também que se a variância de X for igual a zero, então X não varia nada, com relação àesperança, e portanto a variável aleatória X é constante igual à esperança de X .

Definição: Variância de uma variável aleatóriaSeja X uma variável aleatória. Definimos a variância de X como

Var(X) = E[(X−E(X))2].

NotaObserve que como (X −E(X))2 ≥ 0, temos pela propriedade do sinal da esperança queE[(X−E(X))2]≥ 0, e portanto Var(X)≥ 0.

Uma noção muito útil em estatística é dada pela raiz quadrada da variância (pois a variância é maiorou igual a zero). Mais precisamente, seja X uma variável aleatória, então o número

√Var(X) é

chamado de desvio padrão de X , e é denotado por σX .

O seguinte resultado fornece uma simplificação do cálculo da variância:

67 / 135

Page 77: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

ProposiçãoSeja X uma variável aleatória, então Var(X) = E(X2)− (E(X))2.

DemonstraçãoTemos que como E(X) é um número real constante, podemos utilizar as propriedades: espe-rança da multiplicação por constante; esperança da constante; e esperança da soma, para obter:

Var(X) = E[(X−E(X))2

]= E

[X2−2XE(X)+E(X)2

]= E(X2)−2E(XE(X))+E(X)2

= E(X2)−2E(X)2 +E(X)2

= E(X2)− (E(X))2.

ImportanteÉ possível mostrar que se Var(X) = 0, então P(X = E(X)) = 1. Ou seja, X é uma variá-vel aleatória constante. Quanto maior o valor da variância, mais a variável aleatória podese afastar da esperança, ou seja, maior a oscilação da variável aleatória em torno da espe-rança.

Exemplo 5.5 Exemplo de variância de uma variável aleatória discretaSeja X a variável aleatória discreta que toma valor 1 com probabilidade p e toma valor 0 com proba-bilidade 1− p.Então, temos que E(X) = 0 · (1− p)+1 · p = p. Daí,

Var(X) = E(X2)−E(X)2 = E(X2)− p2 = 02 · (1− p)+1 · p− p2 = p(1− p).

Exemplo 5.6 Exemplo de variância de uma variável aleatória contínuaSeja X variável aleatória contínua com função de densidade

f (x) =

1+ x, −1≤ x≤ 0,1− x, 0≤ x≤ 1,0, caso contrário.

Comece notando que

E(X) =∫ 0

−1x(1+ x)dx+

∫ 1

0x(1− x)dx

=∫ 0

−1x+ x2dx+

∫ 1

0x− x2dx

=(

x2

2 + x3

3

)∣∣∣0−1

+(

x2

2 −x3

3

)∣∣∣10

= −1/2+1/3+1/2−1/3= 0.

68 / 135

Page 78: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Além disso,

E(X2) =∫ 0

−1x2(1+ x)dx+

∫ 1

0x2(1− x)dx

=∫ 0

−1x2 + x3dx+

∫ 1

0x2− x3dx

=(

x3

3 + x4

4

)∣∣∣0−1

+(

x3

3 −x4

4

)∣∣∣10

= 1/3−1/4+1/3−1/4= 1/6.

Logo, Var(X) = E(X2) = 1/6.

5.6 Propriedades da variância

Nesta seção vamos apresentar algumas propriedades da variância e provar algumas delas.

Propriedades da variância

• (Variância da constante): Seja c ∈ R um número real, e seja X a variável aleatória constanteigual a c, ou seja, P(X = c) = 1. Então, Var(X) = 0.

• (Soma por constante): Seja X uma variável aleatória e seja c ∈ R uma constante. Então,Var(X + c) =Var(X).

• (Variância da soma de variáveis independentes): Sejam X e Y variáveis aleatórias indepen-dentes. Então, Var(X +Y ) =Var(X)+Var(Y ).

• (Variância da multiplicação por constante): Seja X variável aleatória, e seja c ∈ R uma cons-tante. Então, Var(cX) = c2Var(x).

• (Variância de uma função afim de X): Sejam a,b ∈ R, e seja X variável aleatória. Então,Var(aX +b) = a2Var(X).

Demonstração

• (Variância da constante): Observe que se X é constante igual a c, temos pela propriedade daesperança que E(X) = c. Daí

Var(X) = E[(X−E(X))2

]= E[(c− c)2] = 0.

• (Soma por constante): Usando as propriedades da esperança, temos diretamente que

Var(X +c) =E[(X +c−E(X +c))2

]=E

[(X +c−E(X)−c)2

]=E

[(X−E(X))2

]=Var(X).

• (Variância da soma de variáveis independentes): Foge do escopo do livro.

• (Variância da multiplicação por constante): Usando as propriedades da esperança, temos que

Var(cX) = E[(cX−E(cX))2

]= E

[(cX− cE(X))2

]= E

[c2(X−E(X))2

]= c2E

[(X−E(X))2

]= c2Var(X).

69 / 135

Page 79: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

• (Variância de uma função afim de X): Usando a variância da soma por constante, temosque Var(aX + b) = Var(aX), e usando a variância da multiplicação por constante obtemosVar(aX) = a2Var(X). Combinando as duas igualdades obtemos Var(aX +b) = a2Var(X).

ExercícioSeja X uma variável aleatória contínua com função de densidade

f (x) =

1

b−a , a < x < b,0, caso contrário.

Encontre Var(X).

SoluçãoJá vimos no exemplo de esperança de variável aleatória contínua que E(X) = a+b

2 . Temos agoraque

E(X2) =∫ b

ax2 1

b−adx =

1b−a

∣∣∣ba

=1

b−a

(b3

3− a3

3

)=

b3−a3

3(b−a).

Mas observe agora que temos o produto notável:

(b−a)(a2 +ab+b2) = a2b+ab2 +b3−a3−a2b−ab2 = b3−a3.

Portanto, segue que

E(X2) =b3−a3

3(b−a)=

(b−a)(a2 +ab+b2)

3(b−a)=

a2 +ab+b2

3.

Finalmente, temos

Var(X) = E(X2)− (E(X))2 =a2 +ab+b2

3− (a+b)2

4=

a2−2ab+b2

12=

(b−a)2

12.

Resumindo, Var(X) = (b−a)2/12.

5.7 Atividades

1. Duas bolas são escolhidas aleatoriamente de uma urna contendo 4 bolas azuis, 3 vermelhas e 2laranjas. Suponha que ganhamos 10 reais para cada bola azul selecionada, ganhamos 1 real para cadabola laranja, porém perdemos 8 reais para cada bola vermelha. Seja X o nosso lucro.

a. Determine a função de probabilidade de X ;

b. Calcule a esperança e variância de X .

2. Exatamente uma entre 6 chaves parecidas abre uma determinada porta. Tenta-se uma chave após aoutra. Qual o número médio de tentativas necessárias para se conseguir abrir a porta?

3. Cinquenta pessoas lançam uma moeda honesta dez vezes. Obtenha a média e a variância do númerode pessoas que obtêm exatamente 5 caras.

70 / 135

Page 80: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

4. Seja X uma variável aleatória contínua com densidade

f (x) =1x2 , x≥ 1.

a. Mostre que f é, de fato, uma densidade;

b. A esperança de X existe? Se sim, quanto vale?

5. Seja X uma variável aleatória com distribuição de Laplace (também conhecida como exponencialdupla), ou seja, X tem densidade

f (x) =12

e|x|, x ∈ R.

Obtenha:

a. E(X);

b. E(|X |);

c. Var(X);

RESPOSTAS

1. a) p(−16) = 1/12, p(−7) = 1/6, p(2) = 13/36, p(11) = 2/9, p(20) = 1/6. b)E(X) = 4,Var(X) = 108,5.

2. 7/2. 3. média = 12,3; variância = 9,3. 4. b) E(X) = ∞

5. a) E(X) = 0; b) E(|X |) = 1. c) Var(X) = 2.

Feedback sobre o capítuloVocê pode contribuir para melhoria dos nossos livros. Encontrou algum erro? Gostaria desubmeter uma sugestão ou crítica?Para compreender melhor como feedbacks funcionam consulte o guia do curso.

71 / 135

Page 81: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Capítulo 6

Principais Distribuições Discretas

OBJETIVOS DO CAPÍTULO

Ao final deste capítulo você deverá ser capaz de:

• Conhecer as principais distribuições discretas

• Saber a diferença entre a distribuição binomial e hipergeométrica

• Saber a diferença entre a distribuição geométrica e binomial negativa

• Entender a definição da distribuição Poisson e como utilizar a distribuição Poisson paraaproximar a distribuição binomial

Aqui apresentaremos as principais distribuições de variáveis aleatórias discretas, ou seja, apresenta-remos a função de probabilidade de algumas variáveis aleatórias importantes.

Além disso, apresentaremos algumas propriedades dessas variáveis aleatóriais, tais como esperança evariância.

O objetivo dessa seção é que o estudante saiba reconhecer qual distribuição utilizar em cada situação.

6.1 A Distribuição Bernoulli

A primeira e mais simples distribuição é a distribuição Bernoulli. É a distribuição de uma variávelaleatória que só pode assumir dois valores: 0 e 1.

Esta distribuição é bastante útil, pois normalmente usa-se a interpretação do resultado 1 como sucessoe 0 como fracasso. Mais precisamente, temos a

Definição: Variável Aleatória Seguindo Distribuição BernoulliSeja X uma variável aleatória discreta tomando os valores 0,1. Seja p, a probabilidade de Xassumir o valor 1, isto é, seja P(X = 1) = p. Então, pela probabilidade do complementar, segueque P(X = 0) = 1− p. Podemos escrever de forma compacta a função de probabilidade de Xcomo

P(X = i) = pi(1− p)1−i, i = 0,1.

Se X satisfaz a definição acima dizemos que X segue distribuição de Bernoulli com parâmetrop, e denotamos X ∼ Ber(p).

72 / 135

Page 82: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

EsperançaSeja X ∼ Ber(p), então

E(X) = 0 ·P(X = 0)+1 ·P(X = 1) = p.

DicaObserve que como X só assume valor 0 ou 1, temos que X = X2, e portanto, E(X) =E(X2).

VariânciaSeja X ∼ Ber(p), então

Var(X) = E(X2)− (E(X))2 = E(X)− (E(X))2 = p− p2 = p(1− p).

Exemplo 6.1 Onde surge o uso da distribuição BernoulliA distribuição Bernoulli aparece naturalmente em várias situações. Alguns exemplos incluem:

• Lançamento de moedas;

• Encontrar produtos perfeitos ou defeituosos;

• Ganhar ou perder um sorteio.

6.2 A Distribuição Binomial

A melhor maneira de ilustrar a distribuição binomial é com o seguinte exemplo:

Exemplo 6.2 Exemplo de distribuição binomialSuponha que temos uma urna com um certo número de bolas, donde com probabilidade p retiramosbolas azuis e com probabilidade 1− p retiramos bolas vermelhas, se a retirada for ao acaso. Suponhaque então que n bolas são retiradas com reposição (ou seja, a probabilidade de tirar uma bola azul,não muda após as retiradas). Se X é a variável aleatória dada pelo número de bolas azuis que foramretiradas entre as n bolas, dizemos que X segue distribuição binomial com parâmetros n e p.

ImportanteOlhando para o exemplo anterior é possível observar que podemos pensar numa distribuiçãobinomial como uma distribuição que surge de n distribuições de Bernoulli. De fato, se Xi éa variável aleatória que é igual a 1 se a i-ésima bola retirada foi azul, e zero caso contrário,temos que Xi ∼ Ber(p). Observe que como as retiradas das bolas são independentes, asvariáveis aleatórias Xi são independentes.

Desta forma, é fácil ver que o valor de X é dado pela soman

∑i=1

Xi. Pois teremos retirado k

bolas azuis se, e somente se, tiver k variáveis aleatórias Xi sendo iguais a 1.Desta forma, podemos (e devemos) interpretar uma variável aleatória seguindo distribui-ção binomial como soma de n variáveis aleatórias independentes seguindo distribuição Ber-noulli.

73 / 135

Page 83: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Vamos agora calcular a probabilidade em questão.

Note que para termos k bolas azuis entre n bolas retiradas, devemos ter exatamente n− k bolas ver-melhas. Como as retiradas de bolas são independentes, e a probabilidade de se obter uma bola azul ép, segue que a probabilidade de termos k bolas azuis e n− k bolas vermelhas é pk(1− p)n−k.

Para concluirmos o cálculo da probabilidade, devemos calcular de quantas formas podemos retirar kbolas azuis e n− k bolas vermelhas, se retiramos um total de n bolas.

Esta quantidade é dada pelo número de subconjuntos de k elementos em um conjunto com n elemen-tos. Para entender esta conta, podemos pensar que temos um conjunto com n bolas brancas. Tomandoum subconjunto com k elementos, é a mesma coisa que retirar k bolas. Então pintamos essas k bolasretiradas de azul, e as bolas restantes pintamos de vermelho. Desta forma, temos uma maneira deretirar k bolas azuis entre um total de n bolas retiradas. Assim, vemos que quando olhamos para todosos subconjunto de k elementos, estamos olhando para todas as formas de retirarmos k bolas azuisentre n bolas disponíveis.

Finalmente, o número de subconjuntos de k elementos de um conjunto com n elementos é dado por(nk

). Portanto, temos que se X é a variável aleatória dada pelo número de bolas azuis retiradas após

retirarmos n bolas, temos que

P(X = k) =(

nk

)pk(1− p)n−k, k = 0, . . . ,n.

Esta é a função de probabilidade de uma distribuição binomial. Portanto, podemos fornecer a seguinte

Definição: Variável Aleatória Seguindo Distribuição BinomialSeja X uma variável aleatória dada pelo número de sucessos em n ensaios de Bernoulli, ou seja,o número de sucessos obtidos em n variáveis aleatórias de Bernoulli independentes. Então,dizemos que X segue distribuição binomial, denotamos por X ∼ Bin(n, p), e sua função deprobabilidade é dada por

P(X = k) =(

nk

)pk(1− p)n−k, k = 0, . . . ,n.

É importante verificar que a nossa conta está correta, e que, de fato, a função de probabilidade dadaacima tem soma total igual a 1. Isto segue diretamente do binômio de Newton:

n

∑k=0

P(X = k) =n

∑k=0

(nk

)pk(1− p)n−k = (p+1− p)n = 1.

Esperança

E(X) =n

∑k=0

k(

nk

)pk(1− p)n−k

=n

∑k=1

kn!

k!(n− k)!pk(1− p)n−k

=n

∑k=1

n!(k−1)!(n− k)!

pk(1− p)n−k.

74 / 135

Page 84: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Faça agora a mudança de variável m = k−1. Isto implica k = m+1, e portanto, continuando,

E(X) =n

∑k=1

n!(k−1)!(n− k)!

pk(1− p)n−k

=n−1

∑m=0

n!m!(n−m−1)!

pm+1(1− p)n−m−1

=n−1

∑m=0

n · (n−1)!m!((n−1)−m)!

p · pm(1− p)(n−1)−m

= npn−1

∑m=0

(n−1)!m!(n−1−m)!

pm(1− p)(n−1)−m

= np(p+1− p)n−1

= np.

Assim, E(X) = np.

ImportanteTemos outra forma de calcular a esperança usando ensaios de Bernoulli.Como mencionamos, se Xi ∼ Ber(p) são independentes para i = 1, . . . ,n, então,

n

∑i=1

Xi ∼ Bin(n, p). Fazendo X =n

∑i=1

Xi, temos que X ∼ Bin(n, p), e usando a pro-

priedade de soma de esperança, segue que

E(X) = E( n

∑i=1

Xi

)=

n

∑i=1

E(Xi) =n

∑i=1

p = np,

pois, como vimos na distribuição Bernoulli, E(Xi) = p.

VariânciaVamos começar calculando E(X2):

E(X2) =n

∑k=0

k2(

nk

)pk(1− p)n−k

=n

∑k=1

k(k−1+1)(

nk

)pk(1− p)n−k

=n

∑k=2

k(k−1)(

nk

)pk(1− p)n−k +

n

∑k=1

k(

nk

)pk(1− p)n−k

=n

∑k=2

k(k−1)(

nk

)pk(1− p)n−k +E(X)

=n

∑k=2

k(k−1)(

nk

)pk(1− p)n−k +np.

Vamos então calcular o último somatório do lado direito:

n

∑k=2

k(k−1)(

nk

)pk(1− p)n−k =

n

∑k=2

k(k−1)n!

k!(n− k)!pk(1− p)n−k

=n

∑k=2

n!(k−2)!(n− k)!

pk(1− p)n−k.

75 / 135

Page 85: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Façamos agora a mudança de variável m = k−2, daí k = m+2. Portanto,

n

∑k=2

k(k−1)(

nk

)pk(1− p)n−k =

n−2

∑m=0

n!m!(n−2−m)!

pm+2(1− p)n−2−m

=n−2

∑m=0

n(n−1)(n−2)!

m!(n−2−m)!p2 · pm(1− p)n−2−m

= n(n−1)p2n−2

∑m=0

(n−2)!m!(n−2−m)!

pm(1− p)n−2−m

= n(n−1)p2(p+1− p)n−2

= n(n−1)p2.

Assim, juntando as contas, temos que

E(X2) = n(n−1)p2 +np = (np)2 +np−np2 = (np)2 +np(1− p).

Finalmente, obtemos

Var(X) = E(X2)− (E(X))2 = (np)2 +np(1− p)− (np)2

= np(1− p).

ExercícioUm servidor de um jogo online possui 20 slots disponíveis, ou seja, aceita até 20 jogadoressimultaneamente. A probabilidade, em qualquer hora do dia, de que um desses slots estejadisponível é de 40%, e que a disponibilidade dos slots são independentes. Qual a probabilidadede um par de amigos encontrarem dois slots disponíveis?

SoluçãoSeja X o número de slots disponíveis no jogo. Sabemos, pela definição do problema que X ∼Bin(20,0.4). Queremos calcular P(X ≥ 2).

Note que P(X ≥ 2) = 1−P(X = 1)−P(X = 0). Daí,

P(X = 0) =(

200

)(0.4)0(0.6)20 = (0.6)20;

e

P(X = 1) =(

201

)0.4(0.6)19 = 20 ·0.4(0.6)19 = 8 · (0.6)19.

Desta forma,P(X ≥ 2) = 1− (0.6)20−8(0.6)19.

NotaObserve que a hipótese de independência no exemplo acima não é realista, porém é neces-sária para ser possível trabalhar matematicamente. Caso contrário seria muito complicado.Suposições desta natureza para facilitar a resolução prática de problemas são muito co-muns.

76 / 135

Page 86: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

6.3 A Distribuição Geométrica

Suponha que uma pessoa tem uma moeda que pode ser desonesta, ou seja, assume cara com probabi-lidade p, e coroa com probabilidade 1− p. Vamos agora considerar o experimento aleatório: lançaresta moeda sucessivamente até obter cara.

Qual a probabilidade da cara ser obtida no lançamento número k? Ou colocando numa forma maismatemática, se X é a variável aleatória dada pelo número do lançamento no qual a cara foi obtida,qual é a probabilidade P(X = k)?

A resposta é simples. Para obtermos cara no lançamento número k, esta pessoa terá que ter obtidocoroa em todos os k−1 lançamentos anteriores e ter obtido cara exatamente no k-ésimo lançamento.Como os lançamentos das moedas são independentes, temos que esta probabilidade é

P(X = k) = p(1− p)k−1, k = 1,2, . . . .

Essa variável aleatória X é uma variável aleatória que segue distribuição geométrica. Mais precisa-mente,

Definição: Variável Aleatória Seguindo Distribuição GeométricaSejam X1,X2,X3, . . . variáveis aleatórias independentes seguindo distribuição Bernoulli com pa-râmetro p. Seja X a variável aleatória dada pela ocorrência do primeiro sucesso, ou seja, omenor índice i, tal que Xi teve sucesso. Então, dizemos que X segue distribuição geométricacom parâmetro p, e denotamos X ∼ G(p). A função de probabilidade de X é dada por

P(X = k) = p(1− p)k−1, k = 1,2, . . . .

Primeiro vamos observar que a nossa conta está correta e, de fato, a função descrita acima é umafunção de probabilidade. Temos claramente que p(1− p)k−1 ≥ 0, e pela soma dos termos de umaprogressão geométrica, temos

∑k=1

p(1− p)k−1 = p∞

∑k=1

(1− p)k−1 = p1

1− (1− p)=

pp= 1.

Antes de calcularmos a esperança e variância da distribuição geométrica utilizaremos os seguintesresultados sobre séries geométricas e suas derivadas:

• Definindo a função f (r) = ∑∞k=0 rk, temos que ela converge para 0≤ r < 1, e vale a igualdade

f (r) =∞

∑k=0

rk =1

1− r;

• Temos que para todo 0 ≤ r < 1, f é infinitamente diferenciável, e sua derivada, para 0 ≤ r < 1 édada por

f ′(r) =∞

∑k=1

krk−1 =1

(1− r)2 ;

• Para 0≤ r < 1 a segunda derivada de f é dada por

77 / 135

Page 87: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

f ′′(r) =∞

∑k=2

k(k−1)rk−2 =2

(1− r)3 .

EsperançaTemos que

E(X) =∞

∑k=1

kp(1− p)k−1

= p∞

∑k=1

k(1− p)k−1

= p1

(1− (1− p))2

= p1p2

=1p.

VariânciaPara encontrar E(X2) vamos calcular primeiro E[X(X −1)], usando a fórmula da segunda de-rivada da série geométrica:

E[X(X−1)] =∞

∑k=2

k(k−1)p(1− p)k−1

= p(1− p)∞

∑k=2

k(k−1)(1− p)k−2

= p(1− p)2

(1− (1− p))3

= p(1− p)2p3

=2(1− p)

p2 .

Assim, segue que:

E[X(X−1)] = E(X2−X) = E(X2)−E(X) = E(X2)− 1p.

Ou seja,

E(X2) = E(X2)+1p=

2(1− p)p2 +

1p=

2−2pp2 +

pp2 =

2− pp2 .

Finalmente,

Var(X) = E(X2)− (E(X))2 =2− p

p2 −1p2 =

1− pp2 .

6.3.1 Perda de Memória

Exemplo 6.3 Ilustração da perda de memória da distribuição geométricaSuponha que João está lançando moedas até o resultado sair cara. Suponha que esta João já lançoua moeda 12 vezes, e ainda não saiu cara, isto significa que a probabilidade do resultado sair cara nopróximo lançamento será maior do que era 12 jogadas atrás?

78 / 135

Page 88: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

A resposta é não. Não importa o quanto tempo João tenha esperado, a probabilidade do próximolançamento sempre será 1/2. Esta propriedade da distribuição geométrica é chamada de perda dememória.

Mais precisamente, seja X uma variável aleatória seguindo distribuição Geométrica com parâmetrop. Então, temos que para todo par de inteiros positivos, m,n, vale

P(X > m+n|X > m) = P(X > n).

De fato, temos que

P(X > m+n|X > m) =P(X > m+n,X > m)

P(X > m)=

P(X > m+n)P(X > m)

,

no entanto, usando a fórmula da soma dos termos de uma progressão geométrica infinita, temos

P(X > m+n) =∞

∑k=m+n+1

p(1− p)k−1 =p(1− p)m+n

1− (1− p)= (1− p)m+n.

Analogamente, P(X > m) = (1− p)m. Logo,

P(X > m+n|X > m) =P(X > m+n)

P(X > m)=

(1− p)m+n

(1− p)m = (1− p)n = P(X > n).

Isto prova a perda de memória. Observe que aqui, na realidade, mostra mais do que falamos. Não sódiz que a próxima probabilidade não muda, mas essencialmente diz o seguinte: se João já esperou umcerto tempo m para sair cara, e a cara ainda não saiu, as probabilidades de sair cara dali para frentesão as mesmas de como se ele tivesse começado a lançar naquele momento. Ou seja, a distribuiçãgeométrica “esquece” todo o passado que já foi executado.

6.4 A Distribuição Pascal (ou Binomial Negativa)

6.4.1 Generalização do Binômio de Newton

Antes de definirmos esta distribuição, vamos rever rapidamente um pouco de teoria matemática pre-sente em cursos de cálculo.

Existe uma classe de funções reais, tais que a seguinte fórmula, conhecida como expansão em sériede Taylor, é verdade

f (x) = f (a)+ f ′(a)(x−a)+f ′′(a)

2(x−a)2 + · · ·=

∑k=0

f (k)(a)k!

(x−a)k,

onde f (k)(a) denota a k-ésima derivada de f no ponto a, e f : I → R, onde I ⊂ R é um intervaloaberto.

As funções tais que essa expansão é válida são conhecidas como funções analíticas.

ImportanteConhecemos várias funções analíticas: a função exponencial; seno; co-seno; logaritmo;poliônimos e frações de polinômios.

79 / 135

Page 89: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Um caso particular importante é dado pelas funções do tipo f (x) = (1− x)−r−1 = 1(1−x)r+1 , onde r é

um número natural. Como f é fração de polinômios, temos que f é analítica. Assim, considerando oponto a = 0, temos

f (x) = (1−x)−r−1; f ′(x) =−(−r−1)(1−x)−r−2; f ′′(x) =−(−r−2)(−r−1)(1−x)−r−3, . . . ,

e em geral, temos

f (k)(x) =−(−r− k)(−r− (k−1)) · · ·(−r−1)(1− x)−r−k−1.

Definindo o coeficiente binomial generalizado como(−rk

)=

(−r)(−r−1) . . .(−r− k+1)k!

, k = 0,1,2, . . . ,

podemos escrever

f (k)(x) = (−1)kk!(−r−1

k

)(1− x)−r−k−1.

Aplicando no ponto a = 0, temos

f (k)(0) = (−1)kk!(−r−1

k

),

por sua vez, usando na série de Taylor, obtemos,

(1− x)−r−1 = f (x) =∞

∑k=0

f (k)(0)k!

xk =∞

∑k=0

(−1)k(−r−1

k

)xk =

∑k=0

(−r−1

k

)(−x)k.

Assim, temos o binômio de Newton generalizado:

(1− x)−r−1 =∞

∑k=0

(−r−1

k

)(−x)k.

Observe que vale também a igualdade:(r+ k

k

)=

(r+ k)(r+ k−1) · · ·(r+1)rk!

= (−1)k (−r− k)(−r− (k−1)) · · ·(−r−1)(−r)k!

= (−1)k(−r−1

k

).

Daí, vale também a fórmula do binômio de Newton generalizado:

(1− x)−r−1 =∞

∑k=0

(r+ k

k

)xk.

6.4.2 Distribuição Pascal

A distribuição de Pascal (ou Binomial Negativa) é uma generalização natural da distribuição geomé-trica. Para entendermos melhor esta distribuição, voltemos ao exemplo do lançamento de moedas.

80 / 135

Page 90: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Se uma pessoa tem uma moeda que pode ser desonesta, ou seja, assume cara com probabilidade p,e coroa com probabilidade 1− p. Suponha que temos o seguinte experimento aleatório: lançar umamoeda sucessivamente até obter r caras.

Qual a probabilidade da r-ésima cara ser obtida no lançamento k? Ou, escrevendo de uma maneiramatematicamente mais precisa, se X denota a variável aleatória dada pelo número do lançamento peloqual a r-ésima cara foi obtida, qual é a probabilidade P(X = k)?

Vamos calcular essa probabilidade por partes. Comece notando que X = k, se e somente se, no k-ésimo lançamento o resultado foi cara e nos k− 1 lançamentos anteriores, obtemos r− 1 caras. Onúmero de formas de isso acontecer é simples: escolher r− 1 resultados para sair cara, entre k− 1resultados possíveis, ou seja, temos

(k−1r−1

)possibilidades.

Finalmente, como em um total de k lançamentos, saíram r caras e k− r coroas, e temos(k−1

r−1

)possi-

bilidades, a probabilidade é dada por

P(X = k) =(

k−1r−1

)pr(1− p)k−r, k = r,r+1, . . . ,

onde k ≥ r, pois para obter r caras, temos que no mínimo ter k lançamentos.

ImportanteObserve que se r = 1, temos que X segue uma distribuição geométrica com parâmetro p.

Mais precisamente,

Definição: Variável Aleatória Seguindo Distribuição PascalSejam X1,X2, . . . variáveis aleatórias independentes seguindo distribuição Bernoulli com parâ-metro p. Seja X a variável aleatória dada pela ocorrência do r-ésimo sucesso, ou seja, o índicei, tal que Xi é o r-ésimo sucesso. Então, dizemos que X segue distribuição Pascal (ou binomialnegativa) com parâmetros r e p, e denotamos X ∼ Pas(r, p). A função de probabilidade de X é

P(X = k) =(

k−1r−1

)pr(1− p)k−r, k = r,r+1, . . . ,

Vamos começar mostrando que a função acima é, de fato, uma função de probabilidade. Claramente,(k−1r−1

)pr(1− p)k−r ≥ 0, e, temos ainda que usando a mudança de variável j = k− r,

∑k=r

(k−1r−1

)pr(1− p)k−r =

∑j=0

(j+ r−1

r−1

)pr(1− p) j

= pr∞

∑j=0

(j+ r−1

j

)(1− p) j

= pr 1(1− (1− p))r

= pr 1pr

= 1,

onde usamos o binômio de Newton generalizado e usamos que(j+ r−1

r−1

)=

( j+ r−1)!(r−1)! j!

=

(j+ r−1

j

).

81 / 135

Page 91: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

NotaA distribuição de Pascal, ou Binomial Negativa, recebe o nome de binomial negativa, por utili-zar o binômio de Newton generalizado (com expoente negativo) para calcular sua esperançae variância, assim como para mostrar que a soma das probabilidades é igual a 1.

ImportanteExiste uma caracterização da distribuição Pascal em termos de soma de variáveis aleatóriasseguindo distribuição geométrica: sejam X1,X2, . . . ,Xr variáveis aleatórias independentesseguindo distribuição Geométrica com parâmetro p. Assim, definindo X = ∑

rk=1 Xk, temos

que X segue distribuição Pascal com parâmetros r e p.A intuição é que para termos a “posição” do r-ésimo sucesso, contabilizamos a posiçãodo primeiro sucesso com a variável X1, adicionamos a variável X2 para obter a posição dosegundo sucesso, . . . ,, adicionamos a variável Xr para obter a posição do r-ésimo sucesso.Ou seja, cada variável geométrica Xi representa o tempo que temos que esperar entre ossucessos, até a obtenção de um sucesso.

EsperançaTemos que, fazendo a mudança j = k− r,

E(X) =∞

∑k=r

k(

k−1r−1

)pr(1− p)k−r

=∞

∑j=0

( j+ r)(

j+ r−1r−1

)pr(1− p) j

= pr∞

∑j=0

( j+ r)( j+ r−1)!(r−1)! j!

(1− p) j

= pr∞

∑j=0

( j+ r)!(r−1)! j!

(1− p) j

= pr∞

∑j=0

r( j+ r)!

r! j!(1− p) j

= pr∞

∑j=0

r(

j+ rj

)(1− p) j

= rpr∞

∑j=0

(j+ r

j

)(1− p) j

= rpr 1(1− (1− p))r+1

=rp.

82 / 135

Page 92: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

ImportanteVale a pena notar que utilizando a caracterização de X como soma de variáveis alea-tórias independentes seguindo distribuição geométrica, temos que

X =r

∑i=1

Xi,

onde Xi ∼ G(p). Daí,

E(X) = E( r

∑i=1

Xi

)=

r

∑i=1

E(Xi) =r

∑i=1

1p=

rp.

VariânciaVamos começar calculando E[X(X +1)]:

E[X(X +1)] =∞

∑k=r

k(k+1)(

k−1r−1

)pr(1− p)k−r

=∞

∑j=0

( j+ r+1)( j+ r)(

j+ r−1r−1

)pr(1− p) j

= pr∞

∑j=0

( j+ r+1)( j+ r)( j+ r−1)!(r−1)! j!

(1− p) j

= pr∞

∑j=0

( j+ r+1)!(r−1)! j!

(1− p) j

= pr∞

∑j=0

r(r+1)( j+ r+1)!(r+1)! j!

(1− p) j

= pr∞

∑j=0

r(r+1)(

j+ r+1j

)(1− p) j

= r(r+1)pr∞

∑j=0

(j+ r+1

j

)(1− p) j

= r(r+1)pr 1(1− (1− p))r+2

=r(r+1)

p2 .

Portanto, temos que E[X(X +1)] = E(X2+X) = E(X2)+E(X). Como E(X) = r/p e E[X(X +1)] = r(r+1)/p2, temos que

E(X2) =r(r+1)

p2 − rp=

r2 + r− rpp2 .

Finalmente, a variância é dada por

Var(X) = E(X2)− (E(X))2 =r2 + r− rp

p2 − r2

p2 =r− rp

p2 =r(1− p)

p2 .

6.5 Distribuição Hipergeométrica

Assim como na distribuição binomial, vamos ilustrar a distribuição hipergeométrica com um exemplo:

83 / 135

Page 93: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Exemplo 6.4 Exemplo de distribuição hipergeométricaSuponha que temos uma urna com N bolas, das quais n bolas são azuis, e N−n bolas são vermelhas.Suponha que m bolas foram retiradas aleatoriamente da urna sem reposição. Se X é a variávelaleatória dada pelo número de bolas azuis que foram retiradas entre as m bolas, dizemos que X seguedistribuição hipergeométrica com parâmetros N,n,m.

Vamos agora calcular a probabilidade em questão.

Queremos calcular a probabilidade de termos k bolas azuis. Note que temos m retiradas de bolas,entre as quais queremos k bolas azuis e m−k bolas vermelhas. O total de bolas azuis é n, então temos(n

k

)formas de selecionar estas bolas azuis e como temos N−n bolas vermelhas, temos

(N−nm−k

)formas

de selecionar as bolas vermelhas. Como temos N bolas no total, e queremos selecionar m bolas, temos(Nm

)formas de selecionar m bolas. Portanto, a probabilidade é dada por

P(X = k) =

(nk

)(N−nm−k

)(Nm

) .

Temos então a

Definição: Variável Aleatória Seguindo Distribuição HipergeométricaSuponha que temos N objetos para selecionarmos. Suponha que temos n formas de obter umaseleção “boa”, e N−n formas de obter uma seleção “ruim”. Suponha que tomemos uma amos-tra de tamanho m, sem reposição, e seja Xi a variável aleatória que assume valor 1, se a i-ésimaseleção foi boa e assume valor 0, se a i-ésima seleção foi ruim. Então se X denota o número deseleções boas, ou seja, se

X =m

∑i=1

Xi,

dizemos que X segue distribuição hipergeométrica com parâmetros N,n,m, denotamos por X ∼HG(N,n,m), e sua função de probabilidade é dada por

P(X = k) =

(nk

)(N−nm−k

)(Nm

) , k = 0, . . . ,m.

Vamos mostrar que a função acima é uma função de probabilidade. Claramente, (nk)(

N−mm−k)

(Nm)

≥ 0. Para

mostrar que a soma sobre todos os valores de k é igual a 1, vamos obter uma identidade de coeficientesbinomiais.

Considere o coeficiente de xm na expansão de (1+ x)N em binômio de Newton. Este coeficiente édado por

(Nm

).

Por outro lado, sabemos que (1+ x)N = (1+ x)n(1+ x)N−n. Vamos olhar então o coeficiente de xm

na expansão de (1+ x)n(1+ x)N−n, que é igual a(N

m

).

Mas, observe que

(1+ x)n(1+ x)N−n =( n

∑i=0

(ni

)xi)(N−n

∑j=0

(N−n

j

)x j)

=N

∑i=0

( i

∑j=0

(nj

)(N−ni− j

))xi.

84 / 135

Page 94: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Assim, o coeficiente de xm na expansão de (1+ x)n(1+ x)N−n é dado por

m

∑k=0

(nk

)(N−nm− k

).

Portanto, notando que o coeficiente de xm na expansão de (1+ x)n(1+ x)N−n é igual ao coeficientede xm na expansão de (1+ x)N , pois (1+ x)N = (1+ x)n(1+ x)N−n, chegamos à identidade de Chu-Vandermonte: (

Nm

)=

m

∑k=0

(nk

)(N−nm− k

).

Dividindo ambos os lados por(N

m

), temos

m

∑k=0

(nk

)(N−nm−k

)(Nm

) = 1.

Isto é o que queríamos provar, pois P(X = k) = (nk)(

N−nm−k)

(Nm)

.

EsperançaTemos que

E(X) =m

∑k=0

k

(nk

)(N−nm−k

)(Nm

)=

m

∑k=1

k

(nk

)(N−nm−k

)(Nm

)=

m

∑k=1

k(

nk

)(N−nm−k

)(Nm

)=

m

∑k=1

kn!

k!(n− k)!

(N−nm−k

)(Nm

)=

m

∑k=1

n!(k−1)!(n− k)!

(N−nm−k

)(Nm

)=

m

∑k=1

n(n−1)!

(k−1)!(n− k)!

(N−nm−k

)(Nm

)= n

m

∑k=1

(n−1k−1

)(N−nm−k

)(Nm

)= n

m

∑k=1

(n−1k−1

)(N−nm−k

)(Nm

)= n

m

∑k=1

(n−1k−1

)(N−nm−k

)N/m

(N−1m−1

)=

nmN

m

∑k=1

(n−1k−1

)(N−nm−k

)(N−1m−1

)=

nmN

,

onde na última igualdade utilizamos a identidade de Chu-Vandermonte com a terna (N−1,n−1,m−1).

85 / 135

Page 95: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

NotaPodemos também utilizar a caracterização de X como a soma

X =m

∑i=1

Xi,

onde Xi denota a variável aleatória que assume valor 1 se a i-ésima seleção foi boa, eassume valor 0 se a i-ésima seleção foi ruim.Observe que temos n seleções boas, entre um total de N possibilidades, ou seja, paracada i, as variáveis Xi possuem a mesma função de probabilidade:

P(Xi = 1) =nN,

daí, E(Xi) = n/N, e portanto,

E(X) = E( m

∑i=1

Xi

)=

m

∑i=1

E(Xi) =m

∑i=1

nN

=nmN

.

VariânciaUtilizando a mesma técnica da esperança é possível mostrar que

Var(X) =mn(N−n)(N−m)

N2(N−1).

6.6 Distribuição Poisson

Vamos começar motivando a definição da distribuição de Poisson por meio da aproximação conhecidacomo lei dos eventos raros. Também é conhecida como aproximação da distribuição binomial peladistribuição Poisson.

Para tanto, considere o seguinte exemplo:

Exemplo 6.5 Motivação para a distribuição de PoissonSuponha que uma empresa tem uma linha telefônica dedicada exclusivamente a reclamações. Numperíodo fixado de 4 horas (por exemplo 08:00 às 12:00) essa linha recebe em média 500 ligações.Entretanto, essas ligações ocorrem aleatoriamente ao longo dessas 4 horas. Assim, sabemos que aolongo dos dias, teremos uma quantidade média de 500 ligações ao final das 4 horas, mas não sabemosem que momentos essas ligações são recebidas, nem o número exato de ligações recebidas em cadadia.A pergunta que surge é: Qual a probabilidade de termos k ligações no período de 4 horas no dia dehoje?Responder a pergunta acima não é uma tarefa trivial, e essa resposta envolve o uso da distribuição dePoisson.Para resolver este problema, divida o intervalo de 4 horas em n subintervalos, de mesmo tamanho,dado por 4/n horas, onde n > 500. Como 500 é o número médio de ligações recebidas durante todoo período, é esperado que tenhamos no máximo uma ligação em cada intervalo (observe que se n émuito grande, o intervalo fica muito pequeno, e a probabilidade de termos duas ligações no mesmointervalo é próxima de zero, assim essa aproximação faz sentido).

86 / 135

Page 96: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Assim, temos aproximadamente uma probabilidade 500/n de termos uma ligação em cada intervalo.Como temos n intervalos, a probabilidade de termos k ligações no total é dada pela probabilidadede escolhermos k intervalos entre os n intervalos disponíveis: temos

(nk

)formas de escolher esses k

intervalos, e cada escolha dessas tem probabilidade(

500n

)k(1− 500

n

)n−k. Resumindo, se X denota

a variável aleatória cujo valor é o número de ligações recebidas hoje durante as 4 horas, temos queP(X = k), ou seja, a probabilidade de termos k ligações é aproximadamente

P(X = k)≈(

nk

)(500n

)k(1− 500

n

)n−k.

Em outras palavras, X segue aproximadamente distribuição binomial (n,500/n). Observe que o valoresperado dessa aproximação binomial é dado por 500, o que mostra que a aproximação está consis-tente com o problema em questão.Finalmente, para sabermos a probabilidade exata, temos que calcular o limite do lado direito quandon tende a infinito. Faremos isso na próxima subseção.

NotaVale a pena observar que calcular a probabilidade do exemplo anterior usando a aproxima-ção acima sem calcular o limite é uma tarefa computacionalmente complicada, pois envolvecálculo de fatoriais de números muito grandes.Por este motivo também, é muito comum usar uma aproximação inversa: se temos umavariável aleatória X seguindo distribuição binomial com parâmetros n e p, onde n é muitogrande, é mais fácil calcular uma aproximação desta probabilidade usando a distribuiçãoPoisson.

6.6.1 Aproximação da distribuição binomial pela Poisson

Baseado no exemplo da seção anterior, suponha que temos uma taxa média λ > 0, e considere asequência de variáveis aleatórias X1,X2, . . . , onde cada Xn segue distribuição Bin(n,λ/n). Observeque precisamos que n seja grande para que λ/n < 1 e portanto seja uma probabilidade.

Nosso objetivo nesta seção é calcular o limite

limn→∞

P(Xn = k) = limn→∞

(nk

)(λ

n

)k(1− λ

n

)n−k.

87 / 135

Page 97: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

NotaPara calcular o limite em questão, precisaremos relembrar alguns fatos básicos de cálculoem uma variável. Relembre que o número de Euler, e, é definido como

e = limn→∞

(1+

1n

)n.

Utilizando a regra de L’Hopital, podemos mostrar que para todo x ∈ R

ex = limn→∞

(1+

xn

)n.

Desta forma, se tomarmos x =−λ na expressão acima, obtemos,

e−λ = limn→∞

(1− λ

n

)n.

Finalmente, para cada k natural fixado (constante, não muda com n), temos que limn→∞

(1−

λ

n

)k= 1, e portanto

limn→∞

(1− λ

n

)n−k= lim

n→∞

(1− λ

n

)n

(1− λ

n

)k = e−λ .

Para começarmos a calcular o limite, observe que para cada k, temos(nk

)=

n!k!(n− k)!

=n(n−1) · · ·(n− k+1)

k!.

Desta forma, temos

P(Xn = k) =

(nk

)(λ

n

)k(1− λ

n

)n−k

=n(n−1) · · ·(n− k+1)

k!

n

)k(1− λ

n

)n−k

=1k!

n(n−1) · · ·(n− k+1)λ k

nk

(1− λ

n

)n−k

=λ k

k!n(n−1) · · ·(n− k+1)

nk

(1− λ

n

)n−k

=λ k

k!nn

n−1n· · · n− k+1

n

(1− λ

n

)n−k

=λ k

k!

(1− 1

n

)· · ·(

1− (k−1)n

)(1− λ

n

)n−k.

Temos que valem os seguintes limites:

limn→∞

(1− 1

n

)· · ·(

1− (k−1)n

)= 1, e lim

n→∞

(1− λ

n

)n−k= e−λ .

Portanto, obtemos

limn→∞

P(Xn = k) = limn→∞

λ k

k!

(1− 1

n

)· · ·(

1− (k−1)n

)(1− λ

n

)n−k

=λ k

k!e−λ .

88 / 135

Page 98: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Este é o valor do limite procurado no final do exemplo, e assim, voltando ao exemplo: .Motivaçãopara a definição da distribuição Poisson

Relembremos que se X denota a variável aleatória cujo valor é o número de ligações recebidas hojedurante as 4 horas, temos que P(X = k), ou seja, a probabilidade de termos k ligações é aproximada-mente

P(X = k)≈(

nk

)(500n

)k(1− 500

n

)n−k.

Em outras palavras, X segue aproximadamente distribuição binomial (n,500/n).

O valor exato da probabilidade é então dado por

P(X = k) = limn→∞

(nk

)(500n

)k(1− 500

n

)n−k=

500k

k!e−500.

ImportanteEste resultado de aproximação também pode ser usado para calcular aproximações de pro-babilidades de distribuições binomiais quando n é muito grande.Mais precisamente, se temos uma variável aleatória X seguindo distribuição binomial comparâmetros n e p, e n é muito grande, podemos aproximar esta probabilidade por

P(X = k)≈ (np)k

k!e−np.

6.6.2 Distribuição Poisson

Definição: Variável Aleatória Seguindo Distribuição PoissonSuponha que temos ocorrências de eventos em um intervalo (de tempo ou espaço) I. Suponhaque temos um número médio de ocorrências em I é dado por λ > 0, e que a ocorrência de cadaevento subsequente é independente da ocorrência dos eventos anteriores. Então se X denota onúmero de ocorrências do evento no intervalo I, dizemos que X segue distribuição Poisson comparâmetro λ , denotamos por X ∼ P(λ ), e sua função de probabilidade é dada por

P(X = k) =λ k

k!e−λ , k = 0,1, . . . .

Para verificar que a função definida acima é realmente uma função de probabilidade, como temos,claramente, que λ k/k!e−λ > 0, basta verificar que a soma sobre todos os valores de k é igual a 1.

Para tanto, relembre a definição de função analítica. É um fato conhecido que a função exponencialf (x) = ex é analítica. Como temos que

f (x) = ex, f ′(x) = ex, f ′′(x) = ex, f ′′′(x) = ex,

e, em geral, valef (k)(x) = ex.

Portanto, aplicando em a = 0, temos que f (k)(0) = 1. Assim, obtemos a série de Taylor da funçãoexponencial,

ex = f (x) =∞

∑k=0

f (k)(0)k!

xk =∞

∑k=0

1k!

xk.

89 / 135

Page 99: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Em particular, obtemos

eλ =∞

∑k=0

1k!

λk.

Vamos então mostrar que as probabilidades da Poisson formam, de fato, uma função de probabilidade:∞

∑k=0

P(X = k) =∞

∑k=0

λ k

k!e−λ

= e−λ∑

∞k=0

λ k

k!= e−λ eλ

= 1.

EsperançaTemos que

E(X) = ∑∞k=0 kP(X = k)

= ∑∞k=0 k λ k

k! e−λ

= ∑∞k=1 k λ k

k! e−λ

= ∑∞k=1 λ

λ k−1

(k−1)!e−λ

= λ ∑∞k=1

λ k−1

(k−1)!e−λ .

Fazendo j = k−1, temos que

E(X) = λ

∑k=1

λ k−1

(k−1)!e−λ

= λ

∑j=0

λ j

j!e−λ

= λeλ e−λ

= λ .

VariânciaVamos começar calculando E[X(X−1)]. Daí,

E[X(X−1)] =∞

∑k=0

k(k−1)P(X = k)

=∞

∑k=0

k(k−1)λ k

k!e−λ

=∞

∑k=2

k(k−1)λ k

k!e−λ

=∞

∑k=2

λ k

(k−2)!e−λ

=∞

∑k=2

λ2 λ k−2

(k−2)!e−λ .

Fazendo a mudança de variável j = k−2, temos que

E[X(X−1)] =∞

∑k=2

λ2 λ k−2

(k−2)!e−λ

= λ2

∑j=0

λ j

j!e−λ

= λ 2eλ e−λ

= λ 2.

90 / 135

Page 100: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Porém, como temos que E[X(X − 1)] = E(X2)−E(X), e portanto E(X2) = E[X(X − 1)] +E(X) = λ 2 +λ . Portanto, temos que

Var(X) = E(X2)− (EX)2 = λ2 +λ −λ

2 = λ .

Desta forma, uma variável aleatória com distribuição Poisson com parâmetro λ possui espe-rança e variância iguais a λ .

6.7 Atividades

1. Quinze pessoas portadoras de determinada doença são selecionadas para se submeter a um trata-mento. Sabe-se que este tratamento é eficaz na cura da doença em 80% dos casos. Suponha que osindivíduos submetidos ao tratamento curam-se (ou não) independentemente uns dos outros. Seja X onúmero de pessoas curadas dentre os 15 pacientes submetidos ao tratamento.

a) Qual a distribuição de X?

b) Qual a probabilidade de que os 15 pacientes sejam curados?

c) Qual a probabilidade de que pelo menos dois não sejam curados?

2. Um aluno estuda 12 exercícios, dos quais o professor vai escolher 6 aleatoriamente para uma prova.O estudante sabe resolver 9 dos 12 problemas. Seja X o número de exercícios resolvidos por ele naprova.

a) Qual a distribuição de X?

b) Qual a probabilidade do aluno resolver pelo menos 5 exercícios da prova.

3. Um estudante preenche ao acaso um exame de múltipla escolha com 5 respostas possíveis (umadas quais é a correta) para cada uma de 10 questões.

a) Qual a distribuição do número de respostas certas?

b) Qual a probabilidade de que o estudante obtenha 9 ou mais respostas certas?

c) Qual a probabilidade de que acerte pelo menos duas questões?

4. Em uma pizzaria com entrega a domicílio, 30% dos pedidos por telefone são de mais de uma pizza.Certo dia, o dono decide mandar um brinde ao cliente que fizer o primeiro pedido com mais de umapizza. Seja X o número de pedidos recebidos até o ganhador ganhar o brinde.

a) Qual a distribuição de X?

b) Determine o menor número de pedidos necessários para garantir que o brinde saia com probabili-dade maior do que 0,9.

5. Um vendedor que vai de porta em porta, consegue concretizar uma venda em 40% das visitas quefaz. Este vendedor pretende efetuar no mínimo duas vendas por dia. Seja X o número de visitas feitasaté que a segunda venda seja efetivada.

a) Qual a distribuição de X?

b) Calcule a probabilidade de que o vendedor faça no máximo seis visitas para concluir as duasvendas.

6. O número X de acidentes de trabalho que ocorrem em uma fábrica por semana segue distribui-ção Poisson. Sabendo que a porcentagem de semanas em que ocorre um acidente é um terço daporcentagem de semanas em que não acontece nenhum, calcule:

91 / 135

Page 101: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

a) o parâmetro da distribuição;

b) a probabilidade de que ocorra um acidente em uma semana e também um na semana seguinte,sabendo que acidentes em semanas diferentes são independentes;

7. Se uma variável aleatória tem distribuição Poisson e P(X = 0) = 1/2, quanto vale a variância deX?

8. Suponha que 1% das lâmpadas de enfeite de natal de certa marca apresentem defeito. Estime aprobabilidade de que uma caixa com 30 lâmpadas contenha no máximo uma lâmpada com defeito.(Dica: Aproxime essa probabilidade pela distribuição Poisson)

9. Sabe-se que 0,6% dos parafusos produzidos em uma fábrica são defeituosos. Usando a aproxima-ção da Binomial pela Poisson, estime a probabilidade de que, em um pacote com 1000 parafusos:

a) tenhamos exatamente 4 parafusos defeituosos;

b) não tenhamos mais do que 4 parafusos defeituosos;

c) encontrem-se pelo menos 3 parafusos defeituosos.

RESPOSTAS

1. a) Binomial com n = 15, p = 0,8 b) 0,035 c) 0,83

2. a) Hipergeométrica com parâmetros 6, 9 e 12 b) 1/2

3. a) Binomial com n = 10 e p = 1/5 b) 4,2 ·10−6 c) 0,62

4. a) Geométrica com p = 0,3 b) 7

5. a) Binomial negativa n = 2 e p = 2/5 b) 0,7667

6. a) 1/3 b) 0,057

7. log(2) 8. 0,9631 9. a) 0,1339 b) 0,2851 c) 0,9380

Feedback sobre o capítuloVocê pode contribuir para melhoria dos nossos livros. Encontrou algum erro? Gostaria desubmeter uma sugestão ou crítica?Para compreender melhor como feedbacks funcionam consulte o guia do curso.

92 / 135

Page 102: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Capítulo 7

Principais Distribuições Contínuas

OBJETIVOS DO CAPÍTULO

Ao final deste capítulo você deverá ser capaz de:

• Conhecer as principais distribuições contínuas

• Saber utilizar a tabela da distribuição normal

• Conhecer a distribuição Exponencial e Gama

• Saber utilizar a distribuição normal para aproximar a distribuição binomial

Aqui apresentaremos algumas das principais distribuições contínuas. Para tanto, apresentaremos suasfunções de densidade.

Além disso, apresentaremos algumas propriedades destas distribuições, tais como esperança e vari-ância.

7.1 Distribuição Uniforme

Definição: Variável Aleatória Seguindo Distribuição UniformeSuponha que X seja uma variável aleatória contínua que assuma valores no intervalo [a,b], noqual a e b sejam ambos finitos. Se a função de densidade de X for dada por

f (x) =

1

b−a , a≤ x≤ b,0, caso contrário,

dizemos que X é uniformemente distribuída sobre o intervalo [a,b], e denotamos X ∼U [a,b].

Uma variável aleatória uniformemente distribuída representa o análogo contínuo dos resultados equi-prováveis no seguinte sentido: Para qualquer subintervalo [c,d], onde a≤ c < d ≤ b, P(c≤ X ≤ d) éa mesma para todos os subintervalos que tenham o mesmo comprimento. Ou seja,

P(c≤ X ≤ d) =∫ d

cf (x)dx =

d− cb−a

,

e, por isso, depende unicamente do comprimento do intervalo.

93 / 135

Page 103: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

EsperançaTemos que

E(X) =∫ b

ax

b−ad

x =x2

2(b−a)

∣∣∣ba=

b2−a2

2(b−a)=

a+b2

.

VariânciaTemos que

E(X2) =∫ b

a

x2

b−adx =

x3

3(b−a)

∣∣∣ba=

b3−a3

3(b−a)=

a2 +ab+b2

3.

Portanto, obtemos que

Var(X) = E(X2)− (E(X))2 =a2 +ab+b2

3− (a+b)2

4=

(b−a)2

12.

Exemplo 7.1 Exemplo de aplicação da distribuição uniformeUm ponto é escolhido ao acaso no segmento de reta [0,2]. Qual será a probabilidade de que o pontoescolhido esteja entre 1 e 3/2?Seja X a variável aleatória que representa a coordenada do ponto escolhido. Temos que X ∼U [0,2],daí

f (x) =

1/2, 0≤ x≤ 2,0, caso contrário,

e

P(1≤ X ≤ 3/2) =∫ 3/2

1

12

dx =12

(32−1)=

14.

7.2 A Distribuição Normal

Definição: Variável Aleatória Seguindo Distribuição NormalA variável aleatória X , que assume valores na reta,−∞ < x < ∞, tem distribuição normal se suafunção de densidade é da forma

f (x) =1√

2πσe−

(x−µ)2

2σ2 , −∞ < x < ∞,

onde −∞ < µ < ∞ e σ > 0, e denotamos X ∼ N(µ,σ2).

Na figura abaixo apresentamos gráficos das funções de densidade da distribuição normal para algunsvalores de µ e σ2:

94 / 135

Page 104: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

−4 −2 0 2 4

0.0

0.2

0.4

0.6

0.8

x

f(x)

(0;0.2)

(0;1)

(0;5)

(−2;0.5)

Figura 7.1: Exemplo de funções de densidade da distribuição normal para valores de µ e σ2 descritosno par ordenado (µ;σ2)

Esperança e VariânciaTemos que se X ∼ N(µ,σ2), então

E(X) = µ e Var(X) = σ2.

7.2.1 Padronização e Tabulação da Distribuição Normal

Temos que se X ∼ N(µ,σ2), então a variável padronizada

Z =X−µ

σ

terá distribuição normal padrão, ou seja, Z ∼ N(0,1), e sua função de densidade é dada por

f (z) =1√2π

e−z22 , −∞ < z < ∞.

Logo, temos que

P(a≤ Z ≤ b) =∫ b

a

1√2π

e−z22 dz.

Desta forma, dada uma variável aleatória X ∼ N(µ,σ2), podemos padronizá-la na variável Z, e obteras probabilidades a partir da tabela de valores da função de distribuição da normal padrão

Φ(z) = P(Z ≤ z) =∫ z

−∞

1√2π

e−z22 dz.

NotaObserve que na padronização dividimos por σ , que é o desvio padrão da variável aleatórianormal. Não dividimos pela variância.

95 / 135

Page 105: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

A distribuição normal padrão satisfaz a seguinte propriedade se simetria:

Φ(−x) = 1−Φ(x).

ImportanteA identidade de simetria acima nos diz que podermos calcular as probabilidades P(Z ≤−x) a partir das probabilidades P(Z ≤ x). Assim, como a tabela da normal apresentadano apêndice não contém valores negativos de x, para calcularmos estas probabilidades,utilizamos a fórmula acima.

Exemplo 7.2 Exemplo de cálculo de probabilidades utilizando a tabela da normalSeja Z ∼ N(0,1). Vamos calcular as probabilidades P(0≤ Z ≤ 1),P(Z ≥ 1,93),P(−2,55≤ Z ≤ 1,2)e P(Z ≤ 1,93).Observe inicialmente que

P(0≤ Z ≤ 1) = Φ(1)−Φ(0).

Olhando para a tabela da normal (que pode ser encontrada no Apêndice deste livro), obtemos queΦ(1) = 0,8413 e Φ(0) = 0,5. Portanto

P(0≤ Z ≤ 1) = Φ(1)−Φ(0) = 0,8413−0,5 = 0,3413.

Para a próxima probabilidade, temos que P(Z ≥ 1,93) = 1−P(Z ≤ 1,93) = 1−Φ(1,93). Olhandopara a tabela no apêndice, obtemos P(Z ≥ 1,93) = 1−Φ(1,93) = 1−0,9732 = 0,0268.A próxima probabilidade deve ser observada com cuidado, pois temos um valor negativo, e se olhar-mos na tabela, não há valores negativos, e portanto, teremos que usar a simetria da distribuição normal.Assim,

P(−2,55≤ Z ≤ 1,2) = Φ(1,2)−Φ(−2,55) = Φ(1,2)− (1−Φ(2,55))= Φ(1,2)+Φ(2,55)−1 = 0,8849+0,9946−1= 0,8795.

Finalmente, P(Z ≤ 1,93) = Φ(1,93) = 0,0268.

Veremos agora mais alguns exemplos de aplicações da distribuição normal.

Exemplo 7.3 Exemplo de aplicação da distribuição normalSuponha que as alturas dos alunos de ciências da computação da UFPB seguem distribuição normalcom média 1,60m e desvio padrão 0,30m. Seja X a variável aleatória que indica a altura de umaluno de ciências da computação da UFPB escolhido ao acaso. Encontre a probabilidade de um alunomedir:a) Entre 1,50m e 1,80m;Queremos calcular P(1,50≤ X ≤ 1,80). Observe que

Z =X−1,60

0,30∼ N(0,1).

Temos então que:

P(1,50≤ X ≤ 1,80) = P(1,50−1,60≤ X−1,60≤ 1,80−1,60) = P(−0,1≤ X−1,60≤ 0,2)= P(−0,1/0,3≤ (X−1,60)/0,30≤ 0,2/0,3) = P(−1/3≤ Z ≤ 2/3)= Φ(0,67)−Φ(−0,33)= Φ(0,67)− (1−Φ(0,33))= Φ(0,67)+Φ(0,33)−1= 0,7486+0,6293−1= 0,3779.

96 / 135

Page 106: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

b) Mais de 1,75m;Queremos calcular P(X ≥ 1,75).Temos então que:

P(X ≥ 1,75) = P(X−1,60≥ 1,75−1,60) = P(X−1,60≥ 0,15)= P((X−1,60)/0,30≥ 0,15/0,3) = P(Z ≥ 1/2)= 1−P(Z ≤ 1/2)= 1−Φ(0,5)= 1−0,6915= 0,3085.

c) Menos de 1,48m;Queremos calcular P(X ≤ 1,48).Temos então que:

P(X ≤ 1,48) = P(X−1,60≤ 1,48−1,60) = P(X−1,60≤−0,12)= P((X−1,60)/0,30≤−0,12/0,3) = P(Z ≤−4/10)= Φ(−0,4)= 1−Φ(0,4)= 0,3446.

d) Qual deve ser a altura mínima para escolhermos 10% dos alunos mais altos?Queremos encontrar um valor c, tal que P(X > c) = 0,10.Assim, temos que

P(X > c) = P(X−1,60 > c−1,60)= P((X−1,60)/0,30 > (c−1,60)/0,3) = P(Z > (c−1,60)/0,3)= 1−Φ((c−1,60)/0,3).

Assim, queremos encontrar c, tal que 0,1= 1−Φ((c−1,60)/0,3), ou seja, Φ((c−1,60)/0,3) = 0,9.Seja z = (c−1,60)/0,3, temos que Φ(z) = 0,9. Olhando para a tabela, vemos que z = 1,28.Logo, (c−1,60)/0,3 = 1,28, o que implica que c = 1,6+0,384 = 1,984. Desta forma, a altura emquestão é 1,98m.

7.2.2 Aproximação da Distribuição Binomial pela Normal

Vimos no capítulo de variáveis aleatórias discretas que podemos aproximar a distribuição binomialpela distribuição Poisson.

A aproximação da distribuição binomial pela Poisson é boa quando o parâmetro p da distribuiçãobinomial é pequeno. Se este valor for grande, a aproximação pela distribuição Poisson é pobre. Nestecaso, devemos aproximar pela distribuição normal.

Proposição: Aproximação da distribuição binomial pela normalSuponha que Xn é uma sequência de variáveis aleatórias tais que Xn ∼ Bin(n, p). Então, vale oseguinte resultado:

limn→∞

P( Xn−np√

np(1− p)≤ z)= Φ(z),

onde Φ(z) é a função de distribuição da normal padrão.

Desta forma, vale a aproximação para n grande:

P(Xn ≤ x)≈Φ

( x−np√np(1− p)

).

97 / 135

Page 107: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Exemplo 7.4 Exemplo de aplicação da aproximação da binomial pela normalSuponha que lançamos uma moeda honesta 200 vezes. Obtenha a probabilidade do número de carasestar entre 45% e 55% dos lançamentos (incluindo os extremos). Ou seja, se Xn denota o número decaras obtidas após os 200 lançamentos, temos que Xn ∼ Bin(200,1/2), e queremos calcular

P(90≤ Xn ≤ 110) = P(Xn ≤ 110)−P(Xn ≤ 89).

Como o parâmetro p da binomial não é pequeno, ou seja, não está próximo de zero, a aproximaçãoideal é dada pela normal.Assim, como

√np(1− p) = 7,07 e np = 100, pela proposição anterior, temos que

P(90≤ Xn ≤ 110) ≈ Φ

(110−100

7,07

)−Φ

(90−100

7,07

)= Φ(1,41)−Φ(−1,27)= Φ(1,41)− (1−Φ(1,27))= Φ(1,41)+Φ(1,27)−1= 0,9207+0,8980−1= 0,8187.

Logo, a probabilidade é de aproximadamente 0,8187.

NotaNo exemplo anterior:

• A probabilidade exata é dada por 0,8626.

• A probabilidade obtida pela aproximação de Poisson é dada por 0,7065. Vemos que aaproximação é, de fato, muito pobre neste caso.

O motivo da aproximação ser ruim é que a aproximação da binomial pela Poisson supõe quea probabilidade p da binomial tende a zero quando n tende a infinito, o que não acontece noexemplo anterior.

7.3 A Distribuição Exponencial

A distribuição exponencial é uma distribuição muito utilizada na prática para modelar tempo de falhade objetos. Por exemplo, pode ser usada para modelar o tempo que demora até uma lâmpada falhar.Ela possui um parâmetro, λ , que pode ser interpretado da seguinte forma: 1/λ é o tempo de vidamédio do objeto.

Mais precisamente, temos a

Definição: Variável Aleatória Seguindo Distribuição ExponencialUma variável aleatória contínua X assumindo valores não-negativos é dita seguir distribuiçãoexponencial com parâmetro λ > 0, se sua função de densidade é dada por

f (x) =

λe−λx, x≥ 0,0, x < 0.

Denotamos X ∼ Exp(λ ).

98 / 135

Page 108: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Observe que f (x) é, de fato, uma função de densidade, pois f (x)≥ 0 para todo x, e, além disso,∫∞

−∞

f (x)dx =∫

0λe−λxdx

= λe−λx

−λ

∣∣∣∞0= λ

= 1.

Na figura abaixo apresentamos gráficos das funções de densidade da distribuição exponencial paraalguns valores de λ :

0 1 2 3 4 5

0.0

0.5

1.0

1.5

x

f(x)

(1.5)

(0.5)

Figura 7.2: Exemplo de funções de densidade da distribuição exponencial para valores de λ descritosno parêntese (λ )

Podemos também calcular a função de distribuição de uma variável aleatória seguindo distribuiçãoexponencial explicitamente:

F(x) = P(X ≤ x) =∫ x

0 λe−λxdx = λe−λx

−λ

∣∣∣x0

= λ

[−e−λx

λ− 1

λ

]= 1− e−λx,

para x≥ 0, e F(x) = 0, se x < 0.

Em particular, obtemos P(X > x) = e−λx.

EsperançaTemos que

E(X) =∫

0xλe−λxdx.

Integrando por partes com dv = λe−λxdx e u = x, temos que v =−e−λx e du = dx, e portanto,

E(X) = −xe−λx∣∣∣∞0−∫

0−e−λxdx

= 0+ e−λx

−λ

∣∣∣∞0

= 1λ.

99 / 135

Page 109: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

VariânciaIntegrando por partes duas vezes, obtemos que

E(X2) =2

λ 2 .

Portanto,

Var(X) = E(X2)− (E(X))2 =2

λ 2 −1

λ 2 =1

λ 2 .

Exemplo 7.5 Exemplo de cálculo envolvendo a distribuição exponencialSuponha que X ∼ Exp(λ ). Vamos encontrar a probabilidade de que X seja maior que seu valoresperado. De fato, como E(X) = 1/λ , queremos calcular:

P(X > 1/λ ) = 1−F(1/λ ) = 1− (1− e−λ ·1/λ ) = e−1 ≈ 0,37.

ExercícioO tempo médio de falha das lâmpadas produzidas em uma certa fábrica é de 17500 horas.Sabendo que o tempo de falha destas lâmpadas segue distribuição exponencial, qual é a proba-bilidade de uma lâmpada falhar no primeiro ano de uso?

SoluçãoPrimeiro, observe que como o tempo médio de falha é de 17500 horas, o parâmetro da expo-nencial é dado por

λ

=

117500

.

Como um ano tem 365 dias (em geral não considera-se anos bissextos), temos 24 ·365 = 8760horas em um ano. Assim, queremos calcular

P(X ≤ 8760) = 1− e−1

17500 ·8760 ≈ 1− e−0,5 ≈ 0,39.

Assim, temos uma probabilidade de aproximadamente 39% de que a lâmpada venha a falhar noprimeiro ano de uso.

7.3.1 Perda de Memória

Assim como a distribuição Geométrica é a única distribuição discreta que possui perda de memória,a distribuição exponencial é a única distribuição contínua que possui perda de memória.

Mais precisamente, considere o seguinte exemplo:

Exemplo 7.6 Ilustração da perda de memória da distribuição exponencialSuponha que Pedro é funcionário da fábrica de lâmpadas e sua função é esperar até que uma lâmpadafalhe. Suponha que Pedro já esperou 6 meses e a lâmpada ainda não falhou, isto significa que aprobabilidade da lâmpada falhar nos próximos 30 dias será maior do que a probabilidade de falharnos primeiros 30 dias de uso da lâmpada?A resposta é não. Não importa o quanto tempo Pedro tenha esperado, a probabilidade de falha nospróximos 30 dias sempre será a mesma. Assim como para a distribuição geométrica, esta propriedadeda distribuição exponencial é chamada de perda de memória.

100 / 135

Page 110: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Mais precisamente, seja X uma variável aleatória seguindo distribuição exponencial com parâmetroλ . Então, temos que para todo par de números reais positivos, t,s, vale

P(X > t + s|X > t) = P(X > s).

De fato, temos que

P(X > t + s|X > t) =P(X > t + s,X > t)

P(X > t)=

P(X > t + s)P(X > t)

,

no entanto, já vimos que, para todo x > 0, P(X > x) = e−λx. Daí,

P(X > t + s|X > t) =P(X > t + s)

P(X > t)=

e−λ (t+s)

e−λ t= e−λ s = P(X > s).

Isto prova a perda de memória. Observe que aqui, assim como na geométrica, na realidade, mostramais do que falamos. Não só diz que a próxima probabilidade não muda, mas essencialmente dizo seguinte: se Pedro já esperou um certo tempo t para a lâmpada falhar, e ela ainda não falhou, asprobabilidades de falhas dali para frente são as mesmas de como se ele tivesse começado a esperarnaquele momento. Ou seja, a distribuiçã exponencial “esquece” todo o passado que já foi esperado.

7.4 A Distribuição Gama

7.4.1 A Função Gama

Definição: Função GamaA função gama, denotada por Γ(·), é dada por

Γ(p) =∫

0xp−1e−xdx, p > 0.

Realizando a integral por partes na função gama, fazendo u = xp−1 e dv = e−xdx, temos que

Γ(p) = −e−xxp−1∣∣∣∞0−∫

0

(− e−x(p−1)xp−2)dx

= 0+(p−1)∫

0e−xxp−2dx

= (p−1)Γ(p−1).

Se p = n um número natural, então teremos que

Γ(n) = (n−1)Γ(n−1) = · · ·= (n−1)(n−2) · · ·1 ·Γ(1).

Porém, temos que

Γ(1) =∫

0e−xdx = 1.

Assim, temos que se n é um número natural, Γ(n) = (n−1)!, e portanto a função gama generaliza ofatorial, e pode ser pensada como o fatorial de números reais positivos.

101 / 135

Page 111: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

7.4.2 Distribuição Gama

Definição: Variável Aleatória Seguindo Distribuição GamaSeja X uma variável aleatória contínua tomando valores não-negativos. Dizemos que X seguedistribuição gama com parâmetros r > 0 e α > 0, se sua função de densidade for dada por

f (x) =α

Γ(r)(αx)r−1e−αx, x≥ 0.

Denotamos X ∼ Gama(r,α).

A distribuição gama é mais flexível que a distribuição exponencial, isto é, as densidades podemassumir as mesmas formas das densidades da distribuição exponencial, mas também podem assumirformas diferentes. Isso se deve à inclusão do segundo parâmetro.

Na figura abaixo apresentamos gráficos das funções de densidade da distribuição gama para algunsvalores de r e α:

0 5 10 15 20

0.0

0.1

0.2

0.3

0.4

0.5

x

f(x)

(1;0,5)

(2;0,5) (9;2)

(3;0,5)

Figura 7.3: Exemplo de funções de densidade da distribuição gama para valores de r e α descritos nopar ordenado (r,α)

NotaObserve que se X ∼ Gama(1,α), então na realidade X ∼ Exp(α). Assim, a distribuiçãoexponencial é caso particular da distribuição gama.Além disso, por este fato, o parâmetro α da distribuição gama é chamado de taxa, e oparâmetro r é chamado de parâmetro de forma.

Esperança e VariânciaÉ possível mostrar que se X ∼ Gama(r,α), então

E(X) =rα

e Var(X) =r

α2 .

102 / 135

Page 112: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

ExercícioSuponha que o tempo de vida útil, em anos, de uma máquina de lavar é uma variável aleatóriaX com função de densidade dada por

f (x) =xe−x/2

4, x≥ 0.

Determine a distribuição de X .

Além disso, se o fabricante fornece seis meses de garantia para o produto, qual a proporção deaparelhos que devemos esperar que usem essa garantia?

SoluçãoOlhando a função de densidade, observamos que não se trata de uma distribuição exponencial,mas que se parece com uma distribuição gama.

Comparando a densidade acima com a densidade geral da distribuição gama, vemos que Xsegue distribuição gama com parâmetros r = 2 e α = 1/2.

Como o tempo de vida está sendo dado em anos, queremos calcular a probabilidade

P(X ≤ 1/2) =∫ 1/2

0

xe−x/2

4dx =

14

∫ 1/2

0xe−x/2dx.

Para calcular a probabilidade acima, vamos integrar por partes. Fazendo u = x e dv = e−x/2dx,obtemos que du = dx e v =−2e−x/2. Desta forma,

P(X ≤ 1/2) = −12xe−x/2

∣∣∣1/2

0− 1

4∫ 1/2

0 (−2e−x/2)dx

= −e−1/4

2 + 12∫ 1/2

0 e−x/2dx

= −e−1/4

2 − e−x/2∣∣∣1/2

0= −e−1/4

2 − (e−1/4−1)≈ 0,0265.

Desta forma, é esperado que aproximadamente 2,65% das máquinas de lavar utilizarão o serviçode garantia.

7.5 Atividades

1. Se Y tem distribuição uniforme em (0,5), qual é a probabilidade de que as raízes da equação4x2 +4xY +Y +2 = 0 sejam ambas reais?

2. Numa população, o nível sérico de colesterol em adultos (medido em mg/dl) é uma variávelaleatória com distribuição normal com parâmetros µ = 225 e σ = 75. Calcule:

a) a proporção de pessoas com nível de colesterol entre 200 e 350.

b) o valor acima do qual se encontra o colesterol da parcela de 10% da população que tem os níveismais elevados.

3. Seja X ∼ N(5,16). Obtenha:

a) P(X ≤ 13);

b) P(X ≥ 1);

103 / 135

Page 113: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

c) P(4≤ X ≤ 9);

d) o valor de a tal que P(X ≤ a) = 0,04;

e) o valor de b tal que P(X ≥ b) = 0,01;

f) o intervalo que contém 95% dos valores centrais (intervalo simétrico em torno de µ) de X .

4. Em uma fábrica de refrigerante, uma máquina é usada para encher garrafas de 600ml. O conteúdolíquido (em ml) por garrafa varia segundo a distribuição normal com parâmetros µ = 600 e σ = 4.Calcule:

a) a porcentagem de garrafas produzidas com conteúdo inferior a 592ml ou superior a 612ml;

b) o conteúdo mínimo encontrado em 96% das garrafas fabricadas.

5. O peso em gramas de recém-nascidos em uma maternidade tem distribuição normal com parâmetroµ = 3000g. Sabe-se que 98% dos bebês nascem com um peso compreendido entre 2,5kg e 3,5kg.Determine:

a) o parâmetro σ ;

b) o peso abaixo do qual nascem 0,4% dos bebês dessa maternidade.

6. Se 55% da população de uma cidade é a favor de um projeto proposto pelo prefeito, estime (usandoa aproximação da binomial pela normal) de que, em uma amostra aleatória de 176 pessoas, no máximo93 sejam favoráveis ao projeto.

7. Seja U uma variável aleatória uniforme no intervalo (a,b). Calcule, para todo n≥ 1, E(Un).

8. Seja X uma variável aleatória seguindo distribuição Exponencial com parâmetro λ . Calcule E(Xn).

9. Obtenha a esperança da área de um triângulo retângulo isósceles cuja hipotenusa tem comprimentouniformemente distribuído no intervalo (2,8).

10. Um computador foi usado para gerar sete números aleatórios independentes uniformemente dis-tribuídos no intervalo (0,1). Calcule a probabilidade de que:

a) exatamente de três números estejam entre 1/2 e 1;

b) menos do que três sejam maiores que 3/4.

11. (Distribuição Log-Normal): Seja Y = eX , onde X ∼ N(0,1). Encontre a densidade de Y .

12. Seja X ∼N(0,1). Seja Y = X2. Obtenha a densidade de Y , mostre que Y segue distribuição Gamae determine os parâmetros. (Dica: Use que Γ(1/2) =

√π .)

RESPOSTAS

1. 3/5 2. a) 58,2% b) 321 3. a) 0,9772 b) 0,8413 c) 0,44 d) -2 e) 14,32 f)[−2,84,12,84] 4. a) 2,41% b) 593ml 5. a) 214,6 b) 2431g 6. 0,281 7. bn+1−an+1

(n+1)(b−a)8. n!/λ n 9. 7 10. a) 35/128 b) 12393/16384

11. fY (y) = y−1(2π)−1/2 exp−(log(y))2/2, y > 0

12. Y segue distribuição Gama (1/2,1/2)

Feedback sobre o capítuloVocê pode contribuir para melhoria dos nossos livros. Encontrou algum erro? Gostaria desubmeter uma sugestão ou crítica?Para compreender melhor como feedbacks funcionam consulte o guia do curso.

104 / 135

Page 114: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Capítulo 8

Introdução à Inferência Estatística

OBJETIVOS DO CAPÍTULO

Ao final deste capítulo você deverá ser capaz de:

• Conhecer os principais tipos de amostragem

• Saber o que são estimadores e a diferença entre estimador e estimativa

• Conhecer a distribuição amostral da média, proporção, diferença de médias e diferençade proporções

• Saber construir diversos intervalos de confiança

• Saber realizar uma regressão linear de Y em X e calcular seu coeficiente de determina-ção

8.1 Definições Básicas

Vamos começar relembrando dois conceitos básicos importantes de estatística, a saber, população eamostra.

De uma maneira mais precisa, temos a seguinte definição:

Definição: PopulaçãoO conjunto de todos os elementos, ou resultados, sob investigação é chamado de população.

Quando estamos lidando com uma população é interessante observar:

• Características mensuráveis (expressas por variáveis numéricas);

• Características qualitativas (expressas por variáveis nominais ou categóricas).

Definição: Parâmetros PopulacionaisDamos o nome de parâmetros da população ou parâmetros populacionais aos valores numéricosque caracterizam globalmente uma população.

Relacionadas à população temos as seguintes definições:

105 / 135

Page 115: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Definição: Amostra e Tamanho AmostralUm subconjunto da população é chamado de amostra. Chamamos o número de elementos daamostra de de tamanho amostral.

ImportanteO objetivo da inferência estatística é produzir afirmações sobre dada característica da popu-lação na qual estamos interessados, a partir de informações colhidas de uma parte dessapopulação. Esta característica na população pode ser representada por uma variável aleató-ria.

A relação entre inferência e amostragem é ilustrada na figura abaixo:

Figura 8.1: Amostragem e Inferência

Nota

• Se tivermos informações completas sobre a distribuição, não haverá necessidade de obteramostras.

• Podemos supor que as variáveis vêm de uma família de distribuições de probabilidade,mas não podemos supor qual o valor do parâmetro. Por exemplo, podemos supor que osdados seguem distribuição normal, mas não podemos informar os valores das médias evariâncias.

• Existem casos onde a amostragem é necessária. Por exemplo, se quisermos saber onúmero de glóbulos brancos.

• É importante que a amostra seja representativa da população, ou seja, que o comporta-mento da amostra seja próximo do comportamento da população. Para garantir isso, épreciso saber escolher bem o tamanho amostral, e que a amostra seja obtida aleatoria-mente.

8.2 Amostragem

8.2.1 Tipos de Amostragem

Temos dois grandes grupos de amostragem:

106 / 135

Page 116: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

• Amostragem Probabilística: O mecanismo de escolha dos elementos da amostra é tal que existeuma probabilidade conhecida de cada elemento da população vir a participar da amostra.

• Amostragem Não-Probabilística: Não existe nenhum mecanismo probabilístico na seleção daamostra.

Tipos de Amostragem Probabilística

• Amostragem Aleatória Simples (AAS):

a. Supomos que a população é homogênea, ou seja, a característica que estamos procurandopode aparecer em qualquer elemento da população com a mesma probabilidade;

b. Procedimento: Rotular os elementos da população e sortear os indivíduos que farão parte daamostra.

• Amostragem Sistemática:

a. Supomos que a população é homogênea;

b. Procedimento: Os elementos da população são ordenados, a retirada do primeiro elementoé aleatória, e a partir do segundo elemento a retirada é feita periodicamente (com períododeterminístico). Por exemplo, o primeiro elemento é retirado aleatoriamente, e em seguida,retiramos o décimo elemento depois do primeiro retirado, depois o décimo elemento após osegundo retirado, e assim por diante.

• Amostragem Estratificada:

a. Supomos que a população é heterogênea, ou seja, a característica que estamos procurandopode variar dependendo de onde os dados são retirados. Entretanto, supomos que podemosdividir a população em grupos (estratos) homogêneos;

b. Procedimento: A seleção dos elementos de cada estrato é realizada de forma aleatória, ou seja,realizamos uma amostragem aleatória simples em cada estrato.

• Amostragem por Conglomerado:

a. Supomos que a população pode ser dividida em subgrupos (conglomerados) heterogêneos;

b. Procedimento: A amostragem é realizada sobre os conglomerados, e não mais sobre os indiví-duos da população, ou seja, realiza-se uma amostragem aleatória simples, onde os elementosescolhidos são os conglomerados a serem utilizados, ao invés de já se sortear os elementos daamostra.

107 / 135

Page 117: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

8.2.2 Distribuição Amostral

InteresseUma medida que descreva certa característica da população. Normalmente temos interesse emum parâmetro desconhecido da população, seja média, variância, ou outro parâmetro.

SoluçãoA partir da amostra, podemos construir uma função, utilizando apenas os valores obtidos nestaamostra, para descrever tal característica. Esta função é chamada de estatística.

NotaComo os valores da amostra são aleatórios, qualquer quantidade calculada em função doselementos da amostra também será uma variável aleatória. Assim, as estatísticas, sendovariáveis aleatórias, terão alguma distribuição de probabilidade.

Formalização do Problema

Seja X1, . . . ,Xn uma amostra aleatória simples (AAS) de uma população de tamanho n. Para realizar-mos uma afirmação sobre algum parâmetro θ da população (média, variância, etc.), utilizaremos umaestatística T que, como sabemos, é uma função da amostra, isto é, T = f (X1, . . . ,Xn), para algumafunção f .

NotaQuando conhecemos melhor o comportamento da estatística T , ou seja, se conhecemossua distribuição amostral, que nada mais é que a distribuição de probabilidade da variávelaleatória T , poderemos realizar afirmações sobre o parâmetro θ .A distribuição amostral relata o comportamento da estatística T , caso retirássemos todas aspossíveis amostras de tamanho n.

8.2.2.1 Distribuição Amostral da Média

Consideremos uma população identificada pela variável aleatória X , cujos parâmetros média popula-cional µ = E(X) e variância populacional σ2 = Var(X) são supostos conhecidos. Vamos tirar todasas possíveis amostras de tamanho n dessa população e, para ccada uma, calcular a média amostral Xdada por

X =1n

n

∑i=1

Xi,

e em seguida vamos obter algumas propriedades de X .

Considere a população 1,3,5,7. Sabemos que a média populacional é µ = 4,2 e a variância popu-lacional é σ2 = 4,16. Se retiramos uma amostra de tamanho n = 2, segundo amostragem aleatóriasimples (então todos os elementos possuem a mesma probabilidade de serem retirados), a distribuiçãoamostral de

X =X1 +X2

2será dada por

108 / 135

Page 118: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

x 1 2 3 4 5 6 7 TotalP(X = x) 1/25 2/25 5/25 6/25 6/25 4/25 1/25 1

Assim,

E(X) =7

∑i=1

xiP(X = xi) = 4,2,

eVar(X) = 2,08.

Temos então a seguinte proposição:

ProposiçãoSeja X uma variável aleatória com média µ e variância σ2, e seja (X1, . . . ,Xn) uma AAS de X .Então,

E(X) = µ e Var(X) =σ2

n.

DemonstraçãoTemos que

E(X) = E(1

n

n

∑i=1

Xi

)=

n

∑i=1

E(Xi)

n

=1n

n

∑i=1

µ

=nµ

n= µ.

e, usando que a variância de soma de variáveis independentes é dada pela soma das variâncias,e as propriedades da variância, temos:

Var(X) = Var(1

n

n

∑i=1

Xi

)=

n

∑i=1

Var(Xi

n

)=

1n2

n

∑i=1

σ2

=nσ2

n2

=σ2

n.

8.2.2.2 Teorema Central do Limite

Vamos agora enunciar um dos principais resultados da probabilidade moderna: o teorema central dolimite. A demonstração deste teorema pode ser encontrada em livros mais avançados de probabili-dade.

109 / 135

Page 119: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Teorema Central do LimiteSejam X1, . . . ,Xn uma AAS da variável aleatória X , com distribuição comum satisfazendoE(Xi) = µ e Var(Xi) = σ2. Como a amostragem foi AAS, temos que as variáveis são inde-pendentes. Assim, se n é grande, temos que,

P(X ≤ x)≈Φµ,σ2/n(x),

onde Φµ,σ2 é a função de distribuição de uma variável aleatória N ∼ N(µ,σ2/n).

Assim, dizemos que X segue aproximadamente distribuição normal com média µ e variânciaσ2/n.

Podemos fazer a mudança de variáveis:

Z =X−µ

σ/√

n.

Desta forma, o teorema central do limite nos diz que se n é suficientemente grande, temos que Z segueaproximadamente distribuição normal com média 0 e variância 1.

NotaNo caso em que a distribuição de X é normal, a distribuição de X será normal, mesmo paravalores pequenos de n.

8.2.2.3 Distribuição Amostral da Proporção

Seja X uma variável aleatória com distribuição Bernoulli com parâmetro p, isto é, P(X = 1) = p eP(X = 0) = 1− p. Temos que E(X) = p e Var(X) = p(1− p). Considere uma AAS de tamanho ndessa população. Seja

Sn =n

∑i=1

Xi,

o número de indivíduos com a característica de interesse da amostra. Sabemos que Sn ∼ Bin(n, p).

Pelo teorema central do limite temos que X tem distribuição aproximadamente normal, para n sufici-entemente grande. Seja p = X , a proporção amostral. Então, temos que

paprox.∼ N

(p,

p(1− p)n

),

ou equivalentemente,

Z =p− p√

p(1− p)/naprox.∼ N(0,1),

pois, temos que

E(p) = E(Sn

n

)=

1n

E(Sn) = npn= p,

e

Var(p) =Var(Sn

n

)=

1n2Var(Sn) =

np(1− p)n2 =

p(1− p)n

.

É possível mostrar, na realidade, que vale o seguinte resultado:

p− p√p(1− p)/n

aprox.∼ N(0,1),

ou seja, se trocarmos p(1− p)/n por p(1− p)/n, o resultado ainda vale. Este resultado será útil naconstrução de intervalos de confiança.

110 / 135

Page 120: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

8.2.2.4 Distribuição Amostral da Diferença entre Médias

Em vários problemas práticos, deseja-se comparar duas populações de interesse. Por exemplo, pode-mos estar interessados em avaliar a diferença de desempenho entre duas linhas de produção.

Suponha que duas populações de interesse, X1 e X2, com médias µ1 e µ2, e variâncias σ21 e σ2

2 ,respectivamente.

Considere duas AAS independentes de tamanhos n1 e n2 das duas populações. Pelo teorema centraldo limite, a distribuição amostral da diferença (X1−X2), para n1 e n2 suficientemente grandes, serádada por

(X1−X2)aprox.∼ N

(µ1−µ2,

σ21

n1+

σ22

n2

),

ou equivalentemente,

Z =(X1−X2)− (µ1−µ2)√

σ21/n1 +σ2

2/n2

aprox.∼ N(0,1),

pois,E(X1−X2) = E(X1)−E(X2) = µ1−µ2,

e

Var(X1−X2) =Var(X1)+Var(X2) =σ2

1n1

+σ2

2n2

.

8.2.2.5 Distribuição Amostral da Diferença entre Proporções

Neste caso, supomos que as duas populações de interesse apresentam distribuição binomial com pro-porções p1 e p2. Considere que são feitas duas AAS independentes de tamanhos n1 e n2. A distri-buição amostral da diferença entre proporções (p1− p2), para n1 e n2 suficientemente grandes, peloteorema central do limite temos

(p1− p2)aprox.∼ N

(p1− p2,

p1(1− p1)

n1+

p2(1− p2)

n2

),

ou equivalentemente,

Z =(p1− p2)− (p1− p2)√

p1(1− p1)/n1 + p2(1− p2)/n2

aprox.∼ N(0,1).

8.3 Inferência Estatística

Suponha que alguma característica da população possa ser representada por uma variável aleatóriaX , com função de distribuição FX(x;θ). Suponha que os valores x1, . . . ,xn de uma AAS X1, . . . ,Xnde FX(x;θ) possam ser observados. Com base nos valores amostrais, desejamos estimar o parâmetrodesconhecido θ , ou alguma função deste parâmetro. Neste caso, a estimação poderá ser feita de duasmaneiras:

• Estimação Pontual: Estimamos o parâmetro θ por meio de uma estatística T = t(X1, . . . ,Xn),chamada de estimador.

• Estimação Intervalar: É definida por duas estatísticas T1 = t1(X1, . . . ,Xn) e T2 = t2(X1, . . . ,Xn),tais que T1 < T2, onde o intervalo [T1,T2] terá uma probabilidade conhecida de conter o parâmetrodesconhecido θ .

111 / 135

Page 121: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

8.3.1 Estimação Pontual

Vamos começar entendendo a diferença entre estimador e estimativa.

Definição: EstimadorUm estimador é uma estatística, isto é, é uma função da amostra, que é usada para representarum valor plausível para o parâmetro desconhecido de interesse.

Definição: EstimativaÉ valor numérico particular assumido por um estimador. Ou seja, é o valor do estimador apli-cado em uma realização da amostra.

8.3.2 Propriedades dos Estimadores

ImportanteÉ importante frisar que podem existir vários estimadores para um mesmo parâmetro popula-cional. Logo, a escolha do melhor estimador será feita com base em alguns critérios.

• Não-Tendencioso (Também chamados de não-viesados ou não-viciados): Dizemos que um estima-dor T é não-viesado para o parâmetro θ se o seu valor esperado for igual ao próprio parâmetro, istoé, se

E(T ) = θ .

• Consistência: Dizemos que um estimador T para o parâmetro θ é consistente se, além de sernão-viesado, sua variância tende a zero quando o tamanho amostral tende a infinito:

limn→∞

Var(T ) = 0.

• Eficiência: Sejam T1 e T2 dois estimadores não-viesados para o parâmetro θ , com

Var(T1)<Var(T2),

então, dizemos que T1 é mais eficiente que T2.

112 / 135

Page 122: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Exemplo 8.1 Exemplo de estimador viesadoSeja X1, . . . ,Xn uma AAS da seguindo distribuição uniforme no intervalo [0,θ ]. Um estimador naturalpara θ é dado pelo maior valor encontrado na amostra, já que sabemos que a distribuição uniformenão fornece valores maiores do que θ .Assim, seja M = max(X1, . . . ,Xn), ou seja, o maior valor da amostra. Vamos mostrar que M é umestimador viesado para θ .Seja X ∼U(0,θ), então a função de densidade de X é dada por

fX(x) =1θ, 0 < x < θ ,

e fX(x) = 0 caso contrário. Assim, se FM é a função de distribuição de M, então, como as variáveisX1, . . . ,Xn são independentes, temos que

FM(m) = P(M ≤ m) = P(max(X1, . . . ,Xn)≤ m)= P(X1 ≤ m, . . . ,Xn ≤ m) = P(X1 ≤ m) · · ·P(Xn ≤ m)= [P(X ≤ m)]n = [FX(m)]n,

e portanto,fM(m) = F ′M(m) = n[FX(m)]n−1 fX(m).

Além disso, temos que

FX(x) =∫ x

0

dt =xθ, 0 < x < θ .

Logo, temos que

fM(m) = n[m

θ

]n−1 1θ=

nmn−1

θ n , 0 < m < θ .

E(M) =∫

θ

0m

nmn−1

θ n dm =n

θ n

∫θ

0mndm

=n

θ n

(mn+1

n+1

)∣∣∣θ0

=n

θ nθ n+1

n+1=

nn+1

θ .

Assim, temos que M é um estimador viesado. Podemos obter um outro estimador, a partir de M, queseja não-viesado, dado por

M =n+1

nM.

8.3.3 Alguns Estimadores Pontuais Importantes

8.3.3.1 Estimador para a Média

O estimador mais utilizado para a média populacional µ é a média amostral:

µ = X =1n

n

∑i=1

Xi.

113 / 135

Page 123: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

8.3.3.2 Estimador para a Variância

Quando a média populacional µ é conhecida, um estimador para a variância populacional é dado por

σ2 =

1n

n

∑i=1

(Xi−µ)2.

Caso a média populacional µ seja desconhecida, que é a situação mais comum na prática, a variânciapopulacional pode ser estimada por

S2 =1

n−1

n

∑i=1

(Xi−X)2.

8.3.3.3 Estimador para a Proporção

Um estimador para a proporção populacional é dado pela proporção amostral:

p =Sn

n,

onde Sn é o número de elementos que apresentam uma determinada característica de interesse entreos n elementos da amostra.

8.3.4 Estimação Intervalar

Suponha que temos um estimador para um certo parâmetro θ dado por θ . Além disso, suponha quetemos a seguinte aproximação:

θ −θ

σ

aprox.∼ N(0,1).

Queremos então utilizar θ e a aproximação acima para construir um intervalo de confiança para θ , ouseja, queremos utilizar θ para construir um intervalo aleatório, do tipo [T1,T2], onde T1 e T2 dependemde θ tal que

P(T1 < θ ≤ T2))≈ 1−α,

onde α é um nível de significância determinado previamente. Normalmente costuma-se escolherα = 0,01,α = 0,05 ou α = 0,10, isto é, estamos afirmando que em apenas em 1%, ou 5%, ou 10%,das amostras possíveis (de mesmo tamanho) da população, o intervalo de confiança não contém oparâmetro θ . Nestes casos, dizemos que estamos construindo intervalos de confiança de níveis deconfiança de 99%, 95% ou 90%, respectivamente.

Observe que a aproximação acima obtida para θ nos fornece:

P(−C < θ−θ

σ≤C

)= P

(θ−θ

σ≤C

)−P(

θ−θ

σ≤−C

)≈ Φ(C)−Φ(−C)= Φ(C)−1+Φ(C)= 2Φ(C)−1.

Por outro lado,

P(−C < θ−θ

σ≤C

)= P

(−Cσ < θ −θ ≤Cσ

)= P

(−Cσ − θ <−θ ≤Cσ − θ

)= P

(−Cσ + θ ≤ θ <Cσ + θ

).

114 / 135

Page 124: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Juntando as duas equações, obtemos que:

P(−Cσ + θ ≤ θ <Cσ + θ

)≈ 2Φ(C)−1.

Se quisermos um nível 1−α , temos que resolver 2Φ(C)−1 = 1−α o que fornece

C = Φ−1(

1− α

2

),

onde Φ−1(1−α/2) é o valor encontrado na tabela da normal, tal que a probabilidade de ser menorou igual a este valor é de 1−α/2.

Finalmente, obtemos que um intervalo de confiança de nível α para θ é dado por[−Cσ + θ ;Cσ + θ

],

onde C é dado por C = Φ−1(

1− α

2

).

8.3.5 Intervalo de Confiança para a Média

Seja X1, . . . ,Xn uma AAS de uma variável aleatória comum X satisfazendo E(Xi) = µ e Var(Xi) = σ2.Então, seja X a média dessa AAS:

X =1n

n

∑i=1

Xi.

Vimos que a distribuição amostral da média é, pelo Teorema Central do Limite, aproximadamente:

X−µ

σ/√

n≈ N(0,1).

Pelo que vimos na subseção anterior, isto nos diz que um intervalo de confiança de nível 1−α para amédia é dado por [

−Cσ√

n+X ;C

σ√n+X

],

onde C é dado por C = Φ−1(

1− α

2

).

Exemplo 8.2 Exemplo de cálculo de intervalo de confiança para a médiaSuponha que as alturas dos alunos da UFPB tenham distribuição normal com σ = 15cm. Foi retiradauma amostra aleatória de 100 alunos obtendo-se X = 175cm. Vamos construir um intervalo de 95\%de confiança para a verdadeira altura média dos alunos.Primeiramente, note que estamos querendo 1−α = 0,95, o que nos fornece α = 0,05 e desta forma,1−α/2 = 0,975.Olhando para a tabela da normal, vemos que C = Φ−1(1−α/2) é dado por 1,96.Desta forma, o intervalo de confiança é dado por[

−1,96 · 15√100

+175;1,96 · 15√100

+175].

Realizando a conta, obtemos que o intervalo, ao nível de 95% de confiança para o verdadeiro valor daaltura média dos alunos da UFPB é [

−1,72;1,78].

115 / 135

Page 125: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

8.3.6 Intervalo de Confiança para a Proporção

Seja X1, . . . ,Xn uma AAS de uma variável aleatória Bernoulli X com parâmetro p, isto é, as variáveisXi assumem o valor 1 com probabilidade p, e 0 com probabilidade 1− p. Seja p a proporção daamostra que assume valor 1 (ou em exemplos práticos a proporção da amostra que satisfaz umadeterminada condição), então, temos que p é dado por

p = X =1n

n

∑i=1

Xi.

Vimos que a distribuição amostral da proporção satisfaz

p− p√p(1− p)/n

aprox.∼ N(0,1).

Desta forma, utilizando o que vimos na construção de intervalos de confiança, um intervalo de confi-ança de nível 1−α para a proporção é dado por[

−C

√p(1− p)√

n+ p;C

√p(1− p)√

n+ p],

onde C é dado por C = Φ−1(

1− α

2

).

Exemplo 8.3 Exemplo de cálculo de intervalo de confiança para a proporçãoUma amostra de 300 habitantes de uma cidade mostrou que 180 desejavam a água fluorada. Vamosencontrar o intervalo de confiança de 95% para a população favorável a fluoração.Primeiramente, note que estamos querendo 1−α = 0,95, o que nos fornece α = 0,05 e desta forma,1−α/2 = 0,975.Olhando para a tabela da normal, vemos que C = Φ−1(1−α/2) é dado por 1,96.Por outro lado, como a proporção estimada dos habitantes favoráveis a fluoração é

p =180300

= 0,6.

Desta forma, o intervalo de confiança é dado por[−1,96 ·

√0,6 ·0,4√

300+0,6;1,96 ·

√0,6 ·0,4√

300+0,6

].

Realizando a conta, obtemos que o intervalo, ao nível de 95% de confiança para o verdadeiro valor daproporção da população favorável a fluoração é[

0,54;0,65].

8.3.7 Intervalo de Confiança para a Diferença de Médias

Considere duas AAS independentes de tamanhos n1 e n2 das duas populações. Vimos que a distribui-ção amostral da diferença (X1−X2), para n1 e n2 suficientemente grandes, satisfaz

(X1−X2)− (µ1−µ2)√σ2

1/n1 +σ22/n2

aprox.∼ N(0,1).

116 / 135

Page 126: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Desta forma, utilizando o que vimos na construção de intervalos de confiança, um intervalo de confi-ança de nível 1−α para a diferença de médias é dado por[

−C√

σ21/n1 +σ2

2/n2 +X1−X2;C√

σ21/n1 +σ2

2/n2 +X1−X2

],

onde C é dado por C = Φ−1(

1− α

2

).

Exemplo 8.4 Exemplo de cálculo de intervalo de confiança para a diferença de médiasUm teste psicológico destinado a medir a precisão com que uma pessoa julga outras pessoas, foirealizado. As notas possíveis do teste variam de 0 a 41. Durante sua elaboração o teste foi aplicado avários grupos com diferentes de pessoas. De acordo com os resultados observados, vamos construirum intervalo de confiança para a diferença entre as médias dos grupos de homens e de mulheres, com$95\%$ de confiança.Homens: n = 133, X = 25,34 e σ = 5,05.Mulheres: n = 162, X = 24,94 e σ = 5,44.Primeiramente, note que estamos querendo 1−α = 0,95, o que nos fornece α = 0,05 e desta forma,1−α/2 = 0,975.Olhando para a tabela da normal, vemos que C = Φ−1(1−α/2) é dado por 1,96.Pelos dados do problema, temos que o intervalo de confiança é dado por[−1,96 ·

√(5,05)2

133+

(5,44)2

162+25,34−24,94;1,96 ·

√(5,05)2

133+

(5,44)2

162+25,34−24,94

].

Realizando a conta, obtemos que o intervalo, ao nível de 95% de confiança para o verdadeiro valor dadiferença entre as médias dos grupos de homens e de mulheres é[

−0,80;1,60].

8.4 Regressão e Correlação

8.4.1 Correlação

Relação Funcional e Relação Estatística Como sabemos, o perímetro e o lado de um quadrado estãorelacionados. A relação que os liga é perfeitamente definida e pode ser expressa matematicamentepor

perímetro = 4l,

onde l é o lado do quadrado. Atribuindo-se, então, um valor qualquer a l, é possível determinarexatamente o valor do perímetro.

Consideremos agora a relação entre o peso e a altura de um grupo de pessoas. É evidente que estarelação não é do mesmo tipo da anterior. Assim, podemos ter duas pessoas com a mesma alturae pesos diferentes, assim como pessoas com mesmo peso e alturas diferentes. Porém, existe umatendência clara de que, quanto maior a altura, maior o peso.

As relações do tipo perímetro-lado são chamadas de relações funcionais e as relações do tipo peso-altura são chamadas de relações estatística.

Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe correlação entreelas.

117 / 135

Page 127: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

8.4.1.1 Diagrama de Dispersão

O diagrama de dispersão apresenta os pares ordenados (xi,yi) de uma amostra aleatória bidimensionalem um plano cartesiano. Esse diagrama nos fornece uma ideia grosseira, porém útil, da correlaçãoexistente.

−2 −1 0 1 2

−2

−1

01

2

x

y

Figura 8.2: Exemplo de diagrama de dispersão

Correlação Linear

• Se os pontos do diagrama apresentam uma tendência linear ascendente, temos correlação linearpositiva:

0 5 10 15 20 25 30

05

10

20

30

x

y

Figura 8.3: Exemplo de diagrama de dispersão com correlação linear positiva

118 / 135

Page 128: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

• Se os pontos apresentam uma tendência linear descendente, temos correlação linear negativa

0 5 10 15 20 25 30

−3

0−

20

−1

00

x

y

Figura 8.4: Exemplo de diagrama de dispersão com correlação linear negativa

• Se os pontos apresentam uma tendência curvilínea, temos correlação não-linear

0 5 10 15 20 25 30

0.0

0.4

0.8

1.2

x

y

Figura 8.5: Exemplo de diagrama de dispersão com correlação não-linear

• Se os pontos apresentam-se dispersos, não oferecendo uma tendência definida, concluímos que nãohá correlação entre as variáveis em estudo

119 / 135

Page 129: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

−2 −1 0 1 2

−2

−1

01

x

y

Figura 8.6: Exemplo de diagrama de dispersão sem correlação

8.4.1.2 Coeficiente de Correlação de Pearson

É usado para indicar o grau de intensidade da correlação linear entre duas variáveis e, ainda, o sentidodessa correlação: se positivo ou negativo. O coeficiente de correlação de Pearson entre duas amostras(x1, . . . ,xn) e (y1, . . . ,yn) é dado por

r =n∑

ni=1 xiyi−

(∑

ni=1 xi

)(∑

ni=1 yi

)√[n∑

ni=1 x2

i −(

∑ni=1 xi

)2][

n∑ni=1 y2

i −(

∑ni=1 yi

)2] ,

onde n é o número de observações. Observe que r ∈ [−1,1].

Temos que

• Se r = 1, há uma correlação perfeita e positiva entre as variáveis.

• Se r =−1 há uma correlação perfeita e negativa entre as variáveis.

• Se r = 0 não há correlação entre as variáveis.

Exemplo 8.5 Exemplo de cálculo do coeficiente de correlação de PearsonConsidere uma amostra aleatória das variáveis (X ,Y ), dada por (xi,yi) na tabela abaixo:

xi yi xiyi x2i y2

i4 12 48 16 1446 10 60 36 1008 8 64 64 6410 12 120 100 14412 14 168 144 196

120 / 135

Page 130: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

∑xi ∑yi ∑xiyi ∑x2i ∑y2

i40 56 460 360 648

Assim, temos n = 5, e portanto

r =5×460−40×56√

(5×360− (40)2)(5×648− (56)2)= 0,4160.

Logo, a correlação linear entre as variáveis X e Y é positiva, porém fraca.

8.4.2 Regressão

Podemos dizer que a análise de regressão tem como objetivo descrever, através de um modelo mate-mático, a relação entre duas variáveis.

A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável dependente e aoutra variável recebe o nome de variável independente.

Assim, supondo que X é a variável independente e Y é a variável dependente, procuramos determinaratravés de ajuste de uma reta a relação entre essas variáveis, ou seja, vamos obter a função definidapor

Y = a+bX ,

onde a e b são os parâmetros da regressão. Entretanto, sabemos que essa fórmula não é exata, assim,existe a presença de um erro aleatório:

Yi = a+bXi + ei, i = 1, . . . ,n,

onde ei é um erro aleatório que possui valor esperado igual a zero.

A maneira que vamos utilizar para determinar valores adequados para a e b é a de minimizar a somade quadrado dos erros. Ou seja, queremos escolher os valores a e b de tal forma que o nosso modelo“erre” pouco.

Este método é chamado de método de mínimos quadrados. Assim, dadas as observações (Xi,Yi), i =1, . . . ,n, desejamos minimizar

n

∑i=1

e2i =

n

∑i=1

(Yi−a−bXi)2.

Desta forma, para encontrarmos o ponto de mínimo, precisamos calcular as derivadas parciais:

∂ ∑ni=1 e2

i∂a

=−2n

∑i=1

(Yi−a−bXi),

e∂ ∑

ni=1 e2

i∂b

=−2n

∑i=1

(Yi−a−bXi)Xi.

Assim, como os nossos estimadores a e b são os valores que minimizam a soma de quadrados doserros, temos que a e b são tais que as derivadas parciais calculadas acima se anulam.

Logo, temos que:

−2n

∑i=1

(Yi− a− bXi) = 0⇒n

∑i=1

Yi−na− bn

∑i=1

Xi = 0⇒ 1n

n

∑i=1

Yi = a+ b1n

n

∑i=1

Xi,

121 / 135

Page 131: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

e portantoa = Y − bX .

Por outro lado, temos também que

−2n

∑i=1

(Yi− a− bXi)Xi = 0⇒n

∑i=1

YiXi− an

∑i=1

Xi− bn

∑i=1

X2i = 0,

daí,n

∑i=1

YiXi = an

∑i=1

Xi + bn

∑i=1

X2i .

Substituindo o valor de a na equação acima, obtemos

n

∑i=1

YiXi = (Y − bX)n

∑i=1

Xi + bn

∑i=1

X2i .

Isolando b, obtemos

b( n

∑i=1

X2i −

(∑

ni=1 Xi

)2

n

)=

n

∑i=1

YiXi−(

∑ni=1Yi

)(∑

ni=1 Xi

)n

.

Isto nos fornece

b =∑

ni=1YiXi−

(∑

ni=1Yi

)(∑

ni=1 Xi

)/n

∑ni=1 X2

i −(

∑ni=1 Xi

)2/n

Costuma-se usar as seguintes notações para o numerador e denominador da expressão que define b:

SY X =n

∑i=1

YiXi−(

∑ni=1Yi

)(∑

ni=1 Xi

)n

,

e

SXX =n

∑i=1

X2i −

(∑

ni=1 Xi

)2

n.

Assim, temos as fórmulas para b e a em notação simplificada:

b =SY X

SXXe a = Y − bX .

ImportanteComo estamos fazendo uso de uma amostra para obtermos os valores dos parâmetros, oresultado, na realidade, é um estimador para a verdadeira equação de regressão, e portanto,temos

Yi = a+ bXi,

onde Yi é um estimador para Yi.

Exemplo 8.6 Exemplo de cálculo das estimativas dos parâmetros em um modelo de regressãoAbaixo apresentamos os valores de uma amostra de 10 observações de duas variáveis aleatórias X eY :

122 / 135

Page 132: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

yi xi yixi x2i

6 5 30 259 8 72 648 7 56 4910 10 100 1005 6 30 367 7 49 498 9 72 814 3 12 96 8 48 642 2 4 4

∑xi ∑yi ∑xiyi ∑x2i

65 65 473 481

Daí,

SY X = 473− 652

10= 473−422,5 = 50,5,

e

SXX = 481− 652

10= 481−422,5 = 58,5,

assimb =

50,558,5

= 0,86 e a =6510−0,86 · 65

10= 0,91.

Logo, temos a equaçãoYi = 0,91+0,86Xi.

Na figura abaixo apresentamos o diagrama de dispersão juntamente com a reta de regressão estimadano exemplo anterior:

2 4 6 8 10

24

68

10

x

y

Figura 8.7: Exemplo de ajuste de regressão

123 / 135

Page 133: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

8.4.2.1 O Poder Explicativo do Modelo

Existe uma medida utilizada para avaliar a “qualidade” do ajuste. Esta medida é conhecida comocoeficiente de determinação ou poder explicativo da regressão. Seu valor fornece a proporção davariação total da variável Y explicada pela variável X através da função ajustada.

O coeficiente de determinação é denotado por R2 e pode ser expresso por

R2 =b2SXX

SYYou R2 =

bSY X

SYY,

onde

SXX =n

∑i=1

X2i −

(∑

ni=1 Xi

)2

n,

SYY =n

∑i=1

Y 2i −

(∑

ni=1Yi

)2

n,

e

SY X =n

∑i=1

YiXi−(

∑ni=1Yi

)(∑

ni=1 Xi

)n

.

O coeficiente de determinação pode assumir valores no intervalo [0,1], isto é, 0≤ R2 ≤ 1.

Quando R2 = 0, a variação explicada de Y é zero, ou seja, a reta ajustada é paralela ao eixo da variávelX . Se R2 = 1, a reta ajustada explicará toda a variação de Y . Assim, quanto mais próximo de 1 estivero valor de R2, melhor será a “qualidade” do ajuste da regressão aos pontos do diagrama de dispersãoe quanto mais próximo de zero, pior será a “qualidade” do ajuste.

Se o poder explicativo for, por exemplo, 98%, isto significa que 98% das variações de Y são explicadaspor X através da função escolhida para relacionar as duas variáveis e 2% são atribuídas a causasaleatórias.

Na figura abaixo vemos um exemplo no qual R2 = 1:

−1 0 1 2

−1

01

2

x

y

Figura 8.8: Exemplo contendo diagrama de dispersão e reta de regressão ajustada para R2 = 1

124 / 135

Page 134: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Nesta figura vemos um exemplo no qual R2 < 1, mas é próximo de 1, R2 = 0,93:

−1 0 1 2

−1

01

2

x

y

Figura 8.9: Exemplo contendo diagrama de dispersão e reta de regressão ajustada para R2 = 0,93

Nesta figura vemos um exemplo no qual 0 < R2, mas é próximo de 0, R2 = 0,32:

−2 −1 0 1 2

−1

01

2

x

y

Figura 8.10: Exemplo contendo diagrama de dispersão e reta de regressão ajustada para R2 = 0,32

Na figura abaixo vemos um exemplo com R2 = 0:

125 / 135

Page 135: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

−2 −1 0 1 2

−1

01

2

x

y

Figura 8.11: Exemplo contendo diagrama de dispersão e reta de regressão ajustada para R2 = 0

Exemplo 8.7 Exemplo de cálculo do R2

Vamos calcular o coeficiente de determinação, R2, para o exemplo considerado na última seção. Asaber, temos os valores de uma amostra de 10 observações de duas variáveis aleatórias X e Y :

yi xi yixi x2i y2

i6 5 30 25 369 8 72 64 818 7 56 49 6410 10 100 100 1005 6 30 36 257 7 49 49 498 9 72 81 644 3 12 9 166 8 48 64 362 2 4 4 4

∑xi ∑yi ∑xiyi ∑x2i ∑y2

i65 65 473 481 475

Daí,

SYY = 475− 652

10= 475−422,5 = 52,5,

e

SXX = 481− 652

10= 481−422,5 = 58,5.

Como calculado anteriormente, temos que b = 0,86 e, portanto,

R2 = (0,86)2 58,552,5

≈ 0,83.

126 / 135

Page 136: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Logo, 83% da variação total está sendo explicada pela regressão.

8.5 Atividades

1. Suponha que as alturas dos alunos da UFPB tenham distribuição normal com σ = 15cm. Foiretirada uma amostra aleatória de 100 alunos obtendo-se X = 175cm. Construa um intervalo de 90%de confiança para a verdadeira altura média dos alunos, e outro de nível 99%.

2. Foram retiradas 25 peças da produção diária de uma máquina, encontrando-se para uma medidauma média de 5,2mm. Sabendo-se que as medidas têm distribuição normal com desvio-padrão po-pulacional de 1,2mm, construa intervalos de confiança para a média com confianças de 90%, 95% e99%.

3. Suponha uma população com σ2 = 9 e considere uma amostra aleatória de tamanho n = 36 dessapopulação, com X = 110. Determine os intervalos de confiança para µ , com confiança de 90% e 95%.

4. Uma amostra de 300 habitantes de uma cidade mostrou que 180 desejavam a água fluorada. En-contre os intervalos de confiança de 90% e 99% para a população favorável a fluoração.

5. Em 50 lances de uma moeda foram obtidas 30 caras. A partir de um intervalo de confiança de 96%,pode-se dizer que a moeda é honesta?

6. Numa amostra de 400 casas, 100 dessas casas são alugadas. Construa um intervalo de confiançapara a proporção de casas alugadas, com uma confiança de 96% e, supondo a mesma confiança,construa também um intervalo de confiança para o número de casas alugadas na cidade, uma vez quea cidade possui 20.000 casas.

7. Um teste psicológico destinado a medir a precisão com que uma pessoa julga outras pessoas, foirealizado. As notas possíveis do teste variam de 0 a 41. Durante sua elaboração o teste foi aplicadoa vários grupos com diferentes de pessoas. De acordo com os resultados observados, construa umintervalo de confiança para a diferença entre as médias dos grupos de homens e de mulheres, com90% de confiança.

Homens: n = 133, X = 25,34 e σ = 5,05.

Mulheres: n = 162, X = 24,94 e σ = 5,44.

8. Suponha duas populações normalmente distribuídas de forma que a população I corresponde avariável aleatória X ∼ N(µ1,25) e a população II corresponde a variável aleatória Y ∼ N(µ2,40).Com base nas amostras obtidas abaixo construa um intervalo de confiança para µ1−µ2 com 95% deconfiança.

Amostra da População I - 12, 14, 15, 14, 13, 17, 14, 13.

Amostra da População II - 13, 17, 14, 13, 16, 17, 18, 16.

9. Uma pesquisa revelou que das 500 donas de casa consultadas, 300 preferiram o detergente A. Umfuncionário da companhia afirmou que 50% das donas de casa preferem o detergente A. A companhia,tem evidência, ao nível de 95% para confiar no funcionário?

10. Sabe-se por experiência que 5% da produção de um determinado artigo é defeituosa. Um novoempregado é contratado. Ele produz 600 peças do artigo com 82 defeituosas. Podemos afirmar, aonível de 90% de confiança, que o novo empregado produz peças com maior índice de defeitos que oexistente?

127 / 135

Page 137: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

11. A partir da tabela:Xi 2 4 6 8 10 12 14Yi 30 25 22 18 15 11 10

a) Calcule o coeficiente de correlação;

b) Determine a reta ajustada;

c) Estime o valor de Y para X = 0.

12. Certa empresa, estudando a variação da demanda de seu produto em relação à variação de preçode venda, obteve a tabela:

Preço (Xi) 38 42 50 56 59 63 70 80 95 110Demanda (Yi) 350 325 297 270 256 246 238 223 215 208

a) Estabeleça a equação da reta ajustada;

b) Estime o valor de Y para X = 60 e X = 120.

c) Calcule o coeficiente de determinação da regressão.

13. Pretendendo-se estudar a relação entre as variáveis consumo de energia elétrica (Xi) e vo-lume de produção nas empresas industriais (Yi), fez-se uma amostragem que inclui vinte empresas,computando-se os seguintes valores:

∑Xi = 11.34, ∑Yi = 20.72, ∑X2i = 12.16, ∑Y 2

i = 84.96, e ∑XiYi = 22.13

Determine:

a) A equação de regressão de Y para X ;

b) O coeficiente de determinação da regressão acima;

c) A equação de regressão de X para Y ;

d) O coeficiente de determinação da regressão acima.

RESPOSTAS

1. Intervalo de 90% [1,73;1,77]. Intervalo de 99% [1,71;1,79].

2. Intervalo de 90% [4,80;5,59]. Intervalo de 95% [4,73;5,67]. Intervalo de 99%[4,58;5,82].

3. Intervalo de 90% [109,18;110,82]. Intervalo de 95% [109,02;110,98].

4. Intervalo de 90% [0,55;0,65]. Intervalo de 99% [0,53;0,67].

5. Intervalo de 96% [0,46;0,74]. Como o valor p = 0,5 pertence ao intervalo de confi-ança de 96%, podemos afirmar, com 96% de confiança que, sim, a moeda é honesta.

6. Intervalo de 96% [0,20;0,29]. Baseado no intervalo de confiança, temos que se Xi éuma variável aleatória indicando que a i-ésima casa é alugada, então, Xi segue distribuiçãoBernoulli com o parâmetro p pertencente a este intervalo. O número de casas alugadasentão é dado por

N =20.000

∑i=1

Xi.

Portanto, N ∼ Bin(n, p), onde p pertence a este intervalo. Como o número esperado decasas alugadas é dado por

E(N) = 20.000p.

128 / 135

Page 138: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Temos que o número esperado de casas alugadas pertence ao intervalo

[4000,5800].

7. Intervalo de 90% [−0,61;1,41].

8. Intervalo de 95% [−7,09;4,09].

9. Intervalo de 95% [0,56;0,64]. Como 0,5 = 50% não pertence ao intervalo, e o intervalocontém, com 95% de confiança, a média verdadeira. Temos que com 95% de confiançaa média verdadeira, isto é, a proporção de donas de casa que preferem o detergente A, émaior do que 50%. Desta forma, a companhia tem evidência suficiente para NÃO confiarno funcionário.

10. Intervalo de 90% [0,11;0,16]. Como 0,05 = 5% não pertence ao intervalo, e ointervalo contém, com 90% de confiança, a média verdadeira. Temos que com 90% deconfiança a média verdadeira, isto é, o percentual de artigos defeituosos produzidos pelonovo empregado, é maior do que 5%. Desta forma, podemos sim afirmar que o novoempregado produz peças com índice de defeitos maior do que o existente.

11. a) -0,9921 b) Y = 32,28−1,7X c) Temos que para X = 0, Y = 32,28.

12. a) Y = 386,84− 1,87X b) Temos que para X = 60, Y = 274,64. Para X = 120,temos Y = 162,44 c) R2 ≈ 0,79.

13. a) Y = 1,81X b) R2 ≈ 0,30 c) X = 0,4+0,16X d) R2 ≈ 0,30.

Feedback sobre o capítuloVocê pode contribuir para melhoria dos nossos livros. Encontrou algum erro? Gostaria desubmeter uma sugestão ou crítica?Para compreender melhor como feedbacks funcionam consulte o guia do curso.

129 / 135

Page 139: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Apêndice A

Apêndice - Tabela da Distribuição Normal

P(X ≤ x) = Φ(x) =∫ x

−∞

1√2π

e−y2/2 dy

Φ(−x) = 1−Φ(x).

FUNÇÃO DE DISTRIBUIÇÃO DA NORMAL N(0,1)x 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.53590.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.57530.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.61410.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.65170.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.68790.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.72240.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.75490.7 0.7580 0.7611 0.7642 0.7673 0.7703 0.7734 0.7764 0.7794 0.7823 0.78520.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.81330.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.83891.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.86211.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.88301.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.90151.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.91771.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.93191.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.94411.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.95451.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.96331.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.97061.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767

130 / 135

Page 140: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

FUNÇÃO DE DISTRIBUIÇÃO DA NORMAL N(0,1)x 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.98172.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.98572.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.98902.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.99162.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.99362.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.99522.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.99642.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.99742.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.99812.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.99863.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.99903.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.99933.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.99953.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.99973.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.99983.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.99983.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.99993.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.99993.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.99993.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

131 / 135

Page 141: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Capítulo 9

Índice Remissivo

AAAS, 108Absoluta

Acumulada, 6Acumulada, 6Aditividade

Contável, 36Finita, 36

Aleatória Simples, 107Amostra, 1, 105

Tamanho, 105Amostragem, 106

Aleatória Simples, 107Estratificada, 107Não-Probabilística, 106por Conglomerado, 107Probabilística, 106Sistemática, 107

Amostral, 18, 35Amplitude, 17Amplitude Total, 4Analítica, 79Aproximação da Binomial, 87Arranjos, 29

BBayes, 42Bernoulli, 72Binômio de Newton, 30

Generalizado, 80Binomial, 73Binomial Negativa, 79

CCenso, 1Central do Limite, 109Certo, 35Coeficiente

de Determinação, 124Coeficiente Binomial Generalizado, 80Coeficiente de Variação, 21Coeficientes Binomiais, 30Combinações, 29Complementar, 26, 37Condicional, 39Conjunto, 23

Complementar, 26Diferença, 26Elemento, 24Igualdade, 24Interseção, 25Subconjunto, 24União, 24Vazio, 24

Consistência, 112Consistente, 112Contável, 36Contínua, 2, 50Contagem

Regra da adição, 28Regra da multiplicação, 27

Correlação, 117de Pearson, 120

Correlação LinearNegativa, 118Positiva, 118

Correlação Não-Linear, 118Cronológica, 3

Dde Colunas, 9de Determinação, 124de Dispersão, 16de Linhas, 8de Pearson, 120de Setores, 11

132 / 135

Page 142: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

de Tendência Central, 11Densidade

Parte contínua, 55densidade, 50Dependente, 121Desvio

Médio, 17Padrão, 19

Desvio padrão, 67Diferença, 26Discreta, 2Discretas, 49Distribuição, 52, 72

Bernoulli, 72Binomial, 73Binomial Negativa, 79Exponencial, 98

Perda de Memória, 100Gama, 101Geométrica, 77

Perda de memória, 78Hipergeométrica, 84Normal, 94

Padronização, 95Tabulação, 95

Parte contínua, 55Parte discreta, 55Pascal, 79Poisson, 86

Aproximação da Binomial, 87Uniforme, 93

Distribuição acumulada, 52Distribuição Amostral, 108Distribuição de Frequência, 4

EEficiência, 112Eficiente, 112Elemento, 24Elemento Mediano, 14em Barras, 10Equiprováveis, 38Espaço

Amostral, 35Espaço Amostral

Partição, 36Reduzido, 40

Específica, 4Esperança

Variável Aleatória, 62

Função de, 63Variável Aleatória Contínua, 62Variável Aleatória Discreta, 62

Estatística, 108, 117Estimação

Intervalar, 111Pontual, 111

Estimador, 111Consistente, 112Eficiente, 112Não-tendencioso, 112Não-viciado, 112Não-viesado, 112

Estimativa, 112Estratificada, 107Evento, 35

Certo, 35Complementar, 37Impossível, 35

EventosIndependentes, 43Mutuamente excludentes, 35

Experimento Aleatório, 34Exponencial, 98

Perda de Memória, 100

FFórmula da Mediana, 15Fórmula de Czuber, 13Finita, 36Frequência

AbsolutaAcumulada, 6

Relativa, 6Acumulada, 6

Frequência Absoluta, 5Função, 56

Analítica, 79Densidade

Parte contínua, 55densidade, 50Distribuição, 52

Parte contínua, 55Parte discreta, 55

Distribuição acumulada, 52Gama, 101Probabilidade

Parte discreta, 55Função de, 49, 63Funcional, 117

133 / 135

Page 143: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

GGama, 101Generalizado, 80Geográfica, 3Geométrica, 77

Perda de memória, 78Gráfico

de Colunas, 9de Linhas, 8de Setores, 11em Barras, 10Pizza, 11

HHipergeométrica, 84Histograma, 7

IIdentidade de Chu-Vandermonte, 85Igualdade, 24Imagem inversa, 48Impossível, 35Inclusão e Exclusão, 37Independente, 121Independentes, 43, 61Induzida por uma variável aleatória, 48Interseção, 25Intervalar, 111Intervalo de Confiança, 114

para a Diferença de Médias, 116para a Média, 115para a Proporção, 116

LLei dos eventos raros, 86

MMédia, 11Média Amostral, 108Média Aritmética, 11

Ponderada, 12Médio, 17Método

Mínimos Quadrados, 121Mínimos Quadrados, 121Mediana, 11, 14Medida

Probabilidade, 36Medidas

de Dispersão, 16de Tendência Central, 11

Mista, 55Moda, 11, 13Modelos Matemáticos, 34Multiplicação, 40Mutuamente excludentes, 35

NNão-Probabilística, 106Não-tendencioso, 112Não-viciado, 112Não-viesado, 112Negativa, 118Nominal, 2Normal, 94

Padronização, 95Tabulação, 95

OOrdinal, 2

PPadrão, 19Padronização, 95Parâmetros Populacionais, 105para a Diferença de Médias, 116para a Média, 115para a Proporção, 116Parte contínua, 55Parte discreta, 55Partição, 36Pascal, 79Perda de Memória, 100Perda de memória, 78Permutação, 28Pizza, 11Poisson, 86

Aproximação da Binomial, 87Polígono de Frequência, 7Ponderada, 12Pontual, 111População, 1, 105Populacional, 18por Conglomerado, 107Positiva, 118Princípio

Inclusão e Exclusão, 37Probabilística, 106Probabilidade, 36

Condicional, 39Função de, 49Induzida por uma variável aleatória, 48

134 / 135

Page 144: Probabilidade e Estatística - producao.virtual.ufpb.brproducao.virtual.ufpb.br/books/ufpb-computacao/estatistica-livro/... · 6.2 A Distribuição Binomial ... um experimento pode

Probabilidade e Estatística

Parte discreta, 55Probabilidade total, 41

QQualitativa

Nominal, 2Ordinal, 2

QuantitativaContínua, 2Discreta, 2

RReduzido, 40Regra da adição, 28Regra da multiplicação, 27Relação

Estatística, 117Funcional, 117

Relativa, 6Acumulada, 6

ResultadosEquiprováveis, 38

Rol de dados, 4

SSérie

Cronológica, 3Específica, 4Geográfica, 3Temporal, 3

Série de Taylor, 79Sistemática, 107Subconjunto, 24

TTabelas, 3Tabulação, 95Tamanho, 105Tamanho Amostral, 5Temporal, 3Teorema

Bayes, 42Central do Limite, 109Multiplicação, 40Probabilidade total, 41

UUnião, 24Uniforme, 93

VVariáveis Aleatórias

Independentes, 61Variável, 1

Dependente, 121Independente, 121Qualitativa

Nominal, 2Ordinal, 2

QuantitativaContínua, 2Discreta, 2

Variável Aleatória, 47, 62, 67Contínua, 50Desvio padrão, 67Discretas, 49Função, 56Função de, 63Imagem inversa, 48Mista, 55Variância, 67

Variável Aleatória Contínua, 62Variável Aleatória Discreta, 62Variância, 67

Amostral, 18Populacional, 18Variável Aleatória, 67

Vazio, 24

135 / 135