275
Probabilidades e Estat´ ıstica dr. Rachid Muleia, Msc in Statistics Instituto Superior de Transportes e Comunica¸c˜oes [email protected] 28 de Outubro de 2016 dr. Rachid Muleia, Msc in Statistics ISUTC/ 1 Ano 28 de Outubro de 2016 1 / 294

dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Probabilidades e Estatıstica

dr. Rachid Muleia, Msc in Statistics

Instituto Superior de Transportes e Comunicacoes

[email protected]

28 de Outubro de 2016

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 1 / 294

Page 2: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Conteudo

1 IntroducaoInformacoes historicasConceitos basicosAs etapas do metodo estatıstico

2 Estatısticas DescritivasFormas de representacao tabular e graficaMedidas de LocalizacaoMedidas de separatiz

3 Toeria de probabilidadesVariaveis aleatoriasFuncao de probabilidadeFuncao de distribuicaoEsperanca de uma variavel aleatoriaDistribuicoes de probabilidades

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 2 / 294

Page 3: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Bibliografia recomendada

Reis, E. (2008). Estatıstica Descritiva. 7ªEdicao.Edicoes Silabo

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 3 / 294

Page 4: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Bibliografia recomendada

Carreira, A. Pinto, Goncalo. (2002). Calculo da probabilidade.INSTITUTO PIAGET

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 4 / 294

Page 5: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao

Introducao

Definicao

Pode-se definir Estatıstica como sendo o ramo da matematica aplicadaque fornece metodos para a recolha, organizacao, descricao, analise einterpretacao de dados para melhor se tirar decisoes sobre um dadofenomeno ou acontecimento.

A estatıstica e de uma larga importancia uma vez que e necessariapara a compreensao de fenomenos que ocorrem em diversas areas doconhecimento (Ex: Biologia, Agricultura, Ciencias Sociais,Engenharia, etc.

No estudo da Estatıstica, o termo ”estatıstica”e utilizado para referirdois conceitos diferentes, conforme se utiliza no singular ou no plural.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 5 / 294

Page 6: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao Informacoes historicas

IntroducaoInformacoes historicas

A origem da palavra Estatıstica esta associada a palavra latinaSTATUS (Estado).

Ha indıcios de que 3000 anos A.C. ja se faziam censos na Babilonia,China e Egito e ate mesmo o 4ºlivro do Velho Testamento.

”Fazei o recenseamento de toda a comunidade dos filhos de Israel, deacordo com suas casas patriarcais: todos aqueles que tem de vinte anospara cima, aptos para o servir no exercito de Israel”:Numeros 26:2

Na epoca do Imperador Cesar Augusto, saiu um edito para que sefizesse o censo em todo o Imperio Romano. Por isso Maria e Joseteriam viajado para Belem.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 6 / 294

Page 7: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao Informacoes historicas

IntroducaoConceitos basicos

A Estatıstica esta dividida em duas partes, nomeadamente: Estatıstica Des-critiva e Estatıstica Inferencial.

1 Estatıstica Descritiva: Consiste na recolha de dados numericosatraves da criacao de instrumentos adequados: tabelas, graficos eindicadores numericos.

Univariada: resumir ou descrever o conjunto de dados referentes a umaunica variavel.Bivariada ou multivariada: relacao entre duas ou mais variaveis

2 Estatıstica Inferencial: consiste de procedimentos para fazergeneralizacoes sobre as caracterısticas de uma populacao a partir dainformacao contida na amostra.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 7 / 294

Page 8: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao Conceitos basicos

IntroducaoConceitos basicos

Os metodos de Inferencia Estatıstica permitem:

1 estimar as caracterısticas desconhecidas de uma populacao (porexemplo, a proporcao de consumidores que preferem uma dada marcade detergentes)

2 testar se determinadas hipoteses sobre essas caracterısticasdesconhecidas sao plausıveis (Ex, se a afirmacao de um vendedor deque os resultados de imagem da marca que vende sao superiores aosde outras marcas concorrentes).

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 8 / 294

Page 9: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao Conceitos basicos

IntroducaoPopulacao, Amostra e Unidade Estatıstica

1 Populacao: conjunto de unidades individuais, que podem serpessoas, animais ou objectos com uma ou mais caracterısticas emcumum na qual o pesquisador tem interesse em analisar.

2 Amostra: o subconjunto retirado da populacao, que se supoe serrepresentativo de todas as caracterısticas da mesma, sobre o qual serafeito o estudo, com o objectivo de serem tiradas conclusoes validassobre a populacao.

3 Unidade estatıstica: cada elemento da populacao sobre a qualincide o experimento/estudo.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 9 / 294

Page 10: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao Conceitos basicos

IntroducaoPopulacao, Amostra e Unidade Estatıstica

Na estatıstica, na maioria das vezes usa-se a amostra e nao a populacaopara se estudar um determinada fenomeno. Mas porque estudar a amostrae nao a populacao no seu todo?

custo alto para obter informacao da populacao toda

tempo muito longo para obter informacao da populacao toda

algumas vezes impossıvel, por exemplo, estudo de poluicaoatmosferica

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 10 / 294

Page 11: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao Conceitos basicos

IntroducaoExemplos que nos levam a estudar a amostra

Quando se cozinha um certo molho nao e necessario provar todomolho para saber se o molho esta bom ou nao.

Assim como, quando se vai ao hospital para se fazer um exame desangue, o tecnico de laboratorio nao precisa tirar todo sangue parasaber se o paciente esta enfermo ou nao.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 11 / 294

Page 12: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao Conceitos basicos

IntroducaoConceitos basicos:Variavel, Dados, Parametro e Estimativa

1 Variavel: toda caracterıstica que e observada em uma unidadeexperimental.

2 Dados: Informacoes obtidas em uma unidade experimental (numericaou nao).

3 Parametro: Valor que resume informacao relativa a uma variavel napopulacao.

4 Estimativa: e uma estatıstica que e utilizada para inferir um valor deum parametro desconhecido em um modelo estatıstico.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 12 / 294

Page 13: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao Conceitos basicos

IntroducaoExemplo 1: populacao, amostra, unidade estatıstica

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 13 / 294

Page 14: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao Conceitos basicos

IntroducaoConceitos basicos: variaveis e classificacao

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 14 / 294

Page 15: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao Conceitos basicos

IntroducaoConceitos basicos: variaveis e classificacao

1 Variaveis qualitativas – quando os valores de uma determinadacaracterıstica em estudo sao expressos por atributos, qualidades ouainda por categorias.

As variaveis qualitativas nominais- sao caracterizadas por dados que seapresentam apenas sob aspecto qualitativo.As variaveis qualitativas ordinais - sao caracterizadas por categoriasque apresentam uma ordenacao natural.

2 Variavel quantitativa – quando seus valores sao expressos emnumeros, os quais podem ser obtidos atraves de uma contagem oumensuracao

Variaveis quantitativas Discretas-quando so pode assumir valorespertencentes a um conjunto enumeravel.Variaveis quantitativas Continuas -quando pode assumir, teoricamenteum valor qualquer dentro de um intervalo.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 15 / 294

Page 16: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao Conceitos basicos

IntroducaoExemplo 2: variaveis e classificacao

Variaveis qualitativas nominais: sexo, raca e resultado de um teste

Variaveis qualitativas ordinais: Nıvel escolaridade e conceito dequalidade.

Variaveis quantitativas Discretas: idade dos alunos de uma escola,numeros de filhos de um determinado casal, numero de parafusosdefeituosos numa linha de producao.

Variaveis quantitativas Continuas: altura, peso, comprimento,salario de operarios de uma determinada empresa

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 16 / 294

Page 17: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao Conceitos basicos

IntroducaoConceitos basicos: Observacao

Observacao

O facto de uma variavel ser expressa por numeros nao significa que elaseja necessariamente quantitativa, por que a classificacao da variaveldepende do modo como foi medida, e nao do modo como se manifesta.Por exemplo, para a variavel peso de um lutador de boxe, se for anotado opeso marcado na balanca, a variavel e quantitativa continua; por outrolado, se esse peso for classificado segundo as categorias do boxe, a variavele quantitativa ordinal

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 17 / 294

Page 18: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao As etapas do metodo estatıstico

As etapas do metodo estatıstico

Identi-ficacao doproblema

Recolhade Dados

Crıticados

Dados Apre-sentacao

dosDados

Analise einterpre-

tacao dosDados

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 18 / 294

Page 19: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao As etapas do metodo estatıstico

Etapas do metodo estatısticoIdentificacao do problema

A aplicacao do metodo estatıstico depende da identificacao clara doproblema, isto e, do que se pretende resolver.

E preciso que se tenha em mente o metdo que sera usado para aresolucao do problema

Visto que a escolha do metodo depende do tipo de informacao quesera recolhida.

A identificacao clara do problema tambem possibilita saber que tipode informacao se deve recolher.

Uma identificacao incorreta do problema torna todas etapas seguintesinuteis.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 19 / 294

Page 20: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao As etapas do metodo estatıstico

Etapas do metodo estatısticoRecolha de Dados

Apos a identificacao do problema a fase a seguir consiste na recolha dedados. O processo de recolha de dados deve garantir o seguinte:

Nao perca tempo recolhendo algo que nao vai usar, isto e recolhaapenas informacao necessaria.

Recolha informacao que lhe ajudara a resolver o seu problema.

Ademais, recolha dados tao completos quanto possıveis

No processo de recolha de dados, temos duas dois tipos de dados:

1 Dados primarios: sao aqueles que sao especificamente recolhidospara o estudo em questao.

2 Dados secundarios: aqueles que ja foram recolhidos, tabulados,ordenados e, muitas vezes, ate analisados, com propositos outros aode atender as necessidades da pesquisa em andamento, e que estaocatalogados a disposicao dos interessados.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 20 / 294

Page 21: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao As etapas do metodo estatıstico

Etapas do metodo estatısticoRecolha de Dados

Todos os dados de inqueritos feitos directamente a uma populacaosao dados primarios

Podemos ainda considerar como dados primarios todos os dadosdisponıveis nas estatısticas publicadas pelo INE( Instituto Nacional deEstatıstica)

Numero de nascimentos, casamentos e obitos de dada regiao no ano de1991.O numero de desempregados em um determinado sector de actividadeeconomica.

Dados Secundarios sera por exemplo uma estimativa da esperanca devida a nascenca da populacao mocambicana no ano 2016 com basenos valores observados nos ultimos 10 anos ou a taxa de inflacao parao ano 2018.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 21 / 294

Page 22: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao As etapas do metodo estatıstico

Etapas do metodo estatisticoCrıtica dos dados

Um dos primeiros e mais importantes passos em qualquer tarefa de proces-samento de dados e verificar se os seus valores de dados estao correctosou, no mınimo, estao de acordo com alguns um conjunto de regras. Porexemplo:

A variavel genero espera-se que tome dois valores apenas;

A altura em centımetros espera-se que esteja dentro de limitesrazoaveis.

Nao basta so recolher os dados, quer sejam dados primarios ou secundariose preciso fazer uma limpeza antes da analise. Esta etapa consiste em:

Identificar dados incompletos ou incorrectos;

Eliminar erros capazes de produzir decisoes erroneas.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 22 / 294

Page 23: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao As etapas do metodo estatıstico

Etapas do metodo estatısticoApresentacao dos dados

Apos a recolha e crıtica dos dados, convem organizar os dados de maneirapratica e racional, para um melhor entendimento do fenomeno que se pre-tende estudar.

Aqui comeca o principal objectivo da Estatıstica Descritiva.

Criar instrumentos necessarios para classificar e apresentar conjuntode dados numericos de tal forma que a informacao neles contida sejaapreendida facilmente.

Existem varios instrumentos para a apresentacao de dados: Tabelas,graficos, medidas de tendencia central, etc

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 23 / 294

Page 24: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Introducao As etapas do metodo estatıstico

Etapas do metodo estatsticoAnalsie e interpretacao dos resultados

Apos a apresentacao dos dados e preciso interpretar os dados

A interpretacao estara mais tanto facilitada quando se estiveremescolhido, em etapas anteriores, instrumentos mais apropriados eanalise do tipo de dados recolhido.

Nesta etapa por vezes chega-se a conclusoes enviesadas, que podemser de forma propositada ou nao.

O enviesamento propositado tem a vista a satisfazer alguns fins, taiscomo polıticos. Daı que podemos ter duas informacoes diferentes paraum mesmo problema reportados pois duas organizacoes diferentes.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 24 / 294

Page 25: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 25 / 294

Page 26: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados: Tabelas e GraficosTabelas

O sucesso na utilizacao de dados estatısticos depende em grandeparte do modo como os dados sao apresentados.

Quando nos deparamos com grandes massas de dados naoclassificados torna-se difıcil classifica-los

E preciso proceder um trabalho previo de ordenacao

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 26 / 294

Page 27: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados: Tabelas e GraficosTabelas

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 27 / 294

Page 28: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados: Tabelas e GraficosTabelas

Definicao

Tabela: e um quadro que resume um conjunto de observacoes.

As tabelas assim como os como graficos devem apresentar tres partes :ocabecalho, o corpo e o rodape.

o cabecalho deve dar-nos a informacao sobre os dados, em queconsiste e a que ser referem(lugar e epoca).

o corpo e apresentado por colunas e sobcolunas dentro das quais seapresentam os dados.

No rodape para alem da identificacao da fonte dos dados, poderaoainda incluir-se quaisquer fontes pertinentes.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 28 / 294

Page 29: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados: Tabelas e GraficosExemplo: Apresentacao de dados em Tabelas

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 29 / 294

Page 30: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados: Tabelas e GraficosGraficos

Uma imagem vale mais que mil palavras. Confucio

A representacao grafica tem por finalidade dar uma ideia, a maisrepresentacao grafica possıvel dos resultados obtidos permitindo chegar aconclusoes rapidas sobre a evolucao do estudo ou sobre relacao entrediferentes valores apresentados.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 30 / 294

Page 31: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados: Tabelas e GraficosGrafico de Linhas

Grafico de linha

Um grafico de linhas exibe uma serie como um conjunto de pontosconectado por uma unica linha. As linhas de grafico sao usadas pararepresentar grandes quantidades de dados que ocorrem em um perıodo detempo contınuo.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 31 / 294

Page 32: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados: Tabelas e GraficosGrafico de Linhas

O grafico de linhas geralmente e usado para representar variasquantitativas que se observam ao longo do tempo.

Graficos de linhas sao ideais para exibir tendencias ao longo do tempo.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 32 / 294

Page 33: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados: Tabelas e GraficosGrafico de barras

Um grafico de barras e uma forma de resumir um conjunto de dados ca-tegoricos (variavel qualitativa).

Mostra os dados utilizando um numero de barras com mesma largura.

Cada uma das barras representa uma categoria particular

A altura de cada barra e proporcional a uma agregacao especıfica.

O grafico de barras constroi-se colocando os valores da variavel em ob-servacao no eixo horizontal e as respectivas frequencias (absolutas ou rela-tivas) no eixo vertical.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 33 / 294

Page 34: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados: Tabelas e GraficosGrafico de barras

Os graficos de barras tambem nos permitem fazer comparacoes multiplasde duas ou mais variaveis

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 34 / 294

Page 35: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados: Tabelas e GraficosGrafico de barras

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 35 / 294

Page 36: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados: Tabelas e GraficosExercıcio: Grafico de barras

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 36 / 294

Page 37: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados: Tabelas e GraficosGrafico de sectores ou diagrama circular

O grafico de sectores consiste na representacao grafica de um circulo,divido em sectores.

E utilizando quando se pretende comparar cada parte com o total.

Para se construir divide-se o circulo em sectores, cujas areas saoproporcionais aos valores das partes.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 37 / 294

Page 38: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados: Tabelas e GraficosGrafico de sectores ou diagrama circular

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 38 / 294

Page 39: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Apresentacao dos dados: Tabelas e GraficosExercıcio: Grafico de sectores

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 39 / 294

Page 40: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Distribuicao de frequencias

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 40 / 294

Page 41: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Distribuicao de frequencias

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 41 / 294

Page 42: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Frequencia absoluta simples: numero de vezes que cadamodalidade/ou observacao da variavel se repete na amostra ou napopulacao.

Frequencia relativa(fri) de um valor da variavel e dada porfin

, isto e

o numero de vezes que esse valor ocorre relativamente ao total.

As frequencias acumuladas sao a soma do numero(frequenciasabsolutas acumuladas) ou proporcoes (frequencias acumuladasrelativas) de ocorrencias para valores inferiores ou iguais ao valordado.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 42 / 294

Page 43: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Distribuicao de frequenciasExemplo : distribuicao de frequencias para variavel quantitativa discreta

A distribuicao de frequencias do numero de erros cometidos por umadatilografa apresenta-se da seguinte maneira.

Tabela 1: Distribuicao de frequencias do numero de erros

Xi fi fri Fi Fri

0 10 0.10 10 0.101 15 0.15 25 0.252 25 0.25 50 0.503 40 0.40 90 0.904 10 0.10 100 1.00Total 100 1.00

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 43 / 294

Page 44: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Distribuicao de frequenciasExemplo : distribuicao de frequencias para variavel quantitativa discreta

A tabela mostra que 10 paginas nao tinham nenhum erro;

40 paginas foram encontradas com 3 erros;

As frequencias acumuladas nos mostram que 50% do total daspaginas datilografadas tinham no maximo 2 erros.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 44 / 294

Page 45: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Distribuicao de frequenciasDistribuicao de frequencias para variaveis quantitativas

As variaveis continuas por poderem tomar um numero infinito denao-numeravel de valores,

Figura 1: Pedaco extraıdo de Reis(2008)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 45 / 294

Page 46: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas

Distribuicao de frequenciasDistribuicao de frequencias para variaveis quantitativas

Embora nao exista uma formula cientifica exacta para o calculo de numerode classes, o processo de construcao de classes deve obedecer algumas re-gras:

Em geral o numero de classes devera estar compreendido entre 4 e 14.

Nenhuma classe devera ter frequencia nula.

As classes deverao ter, sempre que possıvel, amplitudes iguais;

Os pontos medios da classe deverao ser de calculo facil.

As classes abertas deverao sempre ser evitadas, embora nem sempre epossıvel.

Os limites da classe sao definidos de modo a que cada valor e incluidonuma so classe.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 46 / 294

Page 47: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Formas de representacao tabular e grafica

Tabelas de Distribuicao e Frequencias

1 Elementos de uma tabela de distribuicao de frequencias:

frequencias simples/absolutas (fi)Frequencia absoluta acumulada (Fi)

frequencia relativa absoluta fri =fin

Frequencia relativa acumulada Fri =Fi

n2 Procedimentos para construcao de uma tabela de distribuicao de

frequencias

Determinar Amplitude Total (At): At = Xmax −Xmin

Determinar o numero de classes (k): k = d√ne ou Sturges:

k = d1 + 3.322log(n)e, se n 6 25 k = 5

Determinar Amplitude do Intervalo de Classe (h): h =

⌈At

k

⌉Definicao das classes e suas respectivas frequencias (veja o exemplo)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 47 / 294

Page 48: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Formas de representacao tabular e grafica

Exemplo 8: Tabelas de Distribuicao de Frequencias

Tabela 2: Dados brutos: Precipitacao media mensal de 2012, Moc.

9.2 41 56.3 63.4 67 78.8 116.1 122.9 243.423.9 41 56.3 63.4 67 78.8 116.1 122.9 243.423.9 44.6 56.3 63.4 67 78.8 116.1 122.9 243.423.9 44.6 56.3 65.3 67 80.9 116.1 130.5 243.423.9 45.3 56.3 65.3 67 84.1 116.1 135.1 243.423.9 45.4 56.3 65.3 67 84.2 116.1 135.1 243.423.9 47.3 56.3 65.3 67 84.2 116.1 135.1 243.424.9 48.6 56.3 65.3 72.1 94.4 116.4 135.1 26524.9 49.7 56.6 65.3 72.1 94.4 116.4 135.1 26524.9 52.7 56.6 65.3 77 94.4 116.4 135.125.2 52.7 60.4 65.3 77 94.4 116.4 135.135.3 52.7 60.4 65.3 77 94.4 116.4 135.135.3 52.7 60.4 67 77 94.4 116.4 135.140.2 52.7 60.4 67 77 98.9 116.4 135.140.2 55.8 60.4 67 78.4 107.8 118.4 135.140.2 55.8 63.1 67 78.4 109.6 121.9 243.4

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 48 / 294

Page 49: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Formas de representacao tabular e grafica

Exemplo 8: Tabelas de Distribuicao de Frequencias

1 At = Xmax −Xmin = 265− 9.2 = 255.8

2 k = d√

137e = d11.70e = 12

3 h =

⌈AT

k

⌉=

⌈255.8

12

⌉= 22

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 49 / 294

Page 50: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Formas de representacao tabular e grafica

Exemplo 8: Tabelas de Distribuicao de Frequencias

i Classes fi Fi fri Fri1 9.2 ` (9.2+ 22)=31.2 11 11 0.080292 0.0802922 31.2 ` (31.2+ 22)=53.2 21 32 0.153285 0.2335773 53.2 ` 75.2 41 73 0.29927 0.5328474 75.2 ` 97.2 20 93 0.145985 0.6788325 97.2 ` 119.2 18 111 0.131387 0.8102196 119.2 ` 141.2 16 127 0.116788 0.9270077 141.2 ` 163.2 0 127 0 0.9270078 163.2 ` 185.2 0 127 0 0.9270079 185.2 ` 207.2 0 127 0 0.927007

10 207.2 ` 229.2 0 127 0 0.92700711 229.2 ` 251.2 8 135 0.058394 0.98540112 251.2 ` 273.2 2 137 0.014599 1

total 137

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 50 / 294

Page 51: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Representacao grafica das distribuicoes de frequenciasVariavel quantitativa discreta

Para presentar a distribuicao de frequencias relativas para umavariavel discreta utiliza-se o grafico de barras ou o diagramadiferencial.

Figura 2: Distribuicao de frequencias para numero de erros

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 51 / 294

Page 52: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua

A representacao grafica adequada para este tipo de variaveis e ohistograma.

O histograma e um grafico, formado por uma sucessao de rectangulosadjacentes, tendo cada um por base um intervalo de classe e umaarea igual (ou proporcional) a frequencia relativa (ou absoluta) dessaclasse.

Ao contrario do grafico de barras,em que estas estao separadas e emque a altura de cada barra e o mais relevante, no histograma as barras(rectangulos) estao juntas e o que e importante e a area de cada uma.

Considerando, entao, para areas das barras as frequencias relativas,vemos que a area total ocupada pelo histograma e igual a 1 ou 100%

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 52 / 294

Page 53: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma

Tabela 3: Distribuicao de frequencias

Classes fi fr h = fr/c

[130, 135[ 7 0.14 0.028[135, 140[ 9 0.18 0.036[140, 145[ 11 0.22 0.044[145, 150[ 14 0.28 0.056[150, 155[ 5 0.1 0.020[155, 160[ 4 0.08 0.016

Total 50 1

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 53 / 294

Page 54: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma

No histograma ao lado, a area dorectangulo mais a esquerda e igual a5×0,028=0,14; a area do rectanguloseguinte e 5×0,036=0,18 e assimsucessivamente, donde a area totaldo histograma e igual a 1 (soma dasfrequencias relativas).

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 54 / 294

Page 55: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma

No histograma ao lado, a area dorectangulo mais a esquerda e iguala 5×0,14; a area do rectangulo se-guinte e 5×0,18 e assim sucessiva-mente, donde a area total do histo-grama e igual a 5 (=5× 1 onde 1 ea soma das frequencias relativas).

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 55 / 294

Page 56: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma

No histograma ao lado, a area dorectangulo mais a esquerda e igual a5×7; a area do rectangulo seguinte e5×9 e assim sucessivamente, dondea area total do histograma e igual a250 (=5×50, onde 50 e a soma dasfrequencias absolutas).

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 56 / 294

Page 57: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma

A imagem transmitida tem sempre o mesmo aspecto.

As areas dos rectangulos ou sao iguais as frequencias relativas, ou saoproporcionais, com a mesma constante de proporcionalidade,que eigual a amplitude de classe no caso do segundo histograma ou aamplitude de classe vezes o numero de dados, no caso do terceirohistograma

O eixo vertical so serve como auxılio para a construcao dosrectangulos, nao transmitindo, no caso do histograma, qualquerinformacao relevante:

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 57 / 294

Page 58: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma

Observacao

Nao devemos perder de vista que o histograma representa os dadosatraves das areas das barras e nao das alturas, o que constitui umagrande diferenca relativamente ao grafico de barras.

Outra grande diferenca e que no histograma as barras estao juntas,para transmitir a ideia de continuidade da variavel em estudo,enquanto no grafico de barras estas sao separadas.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 58 / 294

Page 59: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma

Caso as amplitudes das classes seja diferente e preciso normalizar aaltura do histograma de mod que esta seja proporcional a area domesmo.

Tabela 4: Distribuicao de frequencias da duracao das chamadas telefonicas

Classes fI fr

[0, 2[ 28 0.28[2, 5[ 37 0.37[5, 10[ 23 0.23[10, 20[ 9 0.09[20, 30[ 3 0.03

100

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 59 / 294

Page 60: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma

Se usarmos as frequencias relativas directamente, teremos umarepresentacao errada do histograma

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 60 / 294

Page 61: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma

Considerando as alturas correctas, temos o seguinte histograma:

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 61 / 294

Page 62: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma

Uma forma alternativa de apresentar dados quantitativos contınuos eusando o polıgono de frequencias, que se obtem unindo os pontosmedios dos topos dos rectangulos com segmentos de rectas.

A area sobre o histograma deve ser igual a area sobre o polıgono defrequencias.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 62 / 294

Page 63: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma

Figura 3: Histograma e polıgono de frequenciasdr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 63 / 294

Page 64: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Medidas de tendencia central: Media

O objectivo das medidas de tendencia central e descrever ou sumariar oconjunto de dados atraves de um valor apenas.

Media

E a medida de tendencia central mais usada para descrever resumidamenteuma distribuicao de frequencias. Todavia, ha varios tipos de medias quesao usados de acordo com cada objectivo.

1 Media Aritimetica

2 Media Geometrica

3 Media Harmonica

4 Media Quadratica

O valor a escolher depende da caracterıstica dos dados

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 64 / 294

Page 65: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Media Aritmetica

A media aritmetica simples:

x =x1 + x2 + · · ·+ xn

n=

∑ni=1 xin

(1)

A media aritmetica ponderada:Dados nao agrupados

x =w1x1 + w2x2 + · · ·+ wnxn

n=

∑ni=1wixi∑ni=1wi

(2)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 65 / 294

Page 66: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Media aritimeticaExemplo 3: Dados nao agrupados

Tabela 5: Preco das T-shirts em Euros

Modelo Preco

Simples 4.9Madona 9.9Julio Iglesias 7.6Springsteen 7.6David Bowie 8.4Maradona 7.8

X =4.9 + 9.9 + 7.6 + 7.6 + 8.4 + 7.8

6= 7.70

Este valor e referente ao preco medio das T-shirts, mas se o quantidade deT-shirts vendida o valor do prec medio sera diferente.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 66 / 294

Page 67: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Media aritimeticaExemplo 4: Dados agrupados

Tabela 6: Media dos precos das T-shirts vendidas

ModeloPreco do

modelo Xi

Quantidadevendida fi

Preco × QuantidadeXi · fi

Simples 4.90 15 73.50Madona 9.90 5 49.50Julio Iglesias 7.60 10 76.00Springsteen 7.60 8 60.80David Bowie 8.40 6 50.40Maradona 7.80 6 46.80

Total∑

=50∑

= 357.00

X =

∑ni=1Xi · fi∑n

i=1 fi=

357.00

50= 7.14

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 67 / 294

Page 68: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Media Aritmetica

Para dados agrupados em classe a media aritimetica pode ser calculada combase na seguinte formula:

x = x0 + c

∑ni=1 d

′fin

(3)

Onde,

d′ =x0 − xi

cx0 sera igual ao ponto medio da classe de maior frequencia, se onumero de classes for par, ou o ponto medio da classe intermediaria,se o numero de classes for ımpar.

c sera igual a amplitude do intervalo de classe.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 68 / 294

Page 69: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Exemplo

Aplicando a formula, a media sera igual a: x = x0 + c

∑ni=1 d

′fin

= 79.5

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 69 / 294

Page 70: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Media aritimetiaExemplo 6:metodo alternativo para dados agrupados em classe

Tabela 7: Calculo da media usando o ponto medio

Classes fi Fi Ponto medio Xi

[5–25[ 4 4 15=5 + 25

2[25–45[ 6 10 35[45–65[ 14 24 55[65–85[ 26 50 75[85–105[ 14 64 95[105–125[ 8 72 115[125–145[ 6 78 135[145–165[ 2 80 155

X =

∑8i=1Xi · fi∑8

i=1 fi=

6360

80= 79.5

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 70 / 294

Page 71: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Algumas propriedades da media aritimetica

A soma algebrica dos desvios tomados em relacao a media e nula:∑ni=1(xi − x)

Somando-se (ou subtraindo-se) uma constante (c) de todos os valoresde uma variavel, a media do conjunto fica aumentada (ou diminuıda)dessa constante: yi = xi + c⇒ Y = X + c

Multiplicando-se (ou dividindo-se) todos os valores de uma variavelpor uma constante (c), a media do conjunto fica multiplicada (oudividida) por essa constante: yi = xi × c⇒ Y = X × c

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 71 / 294

Page 72: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Media Geometrica

Media geometrica

A media geometrica de n valores e definida, genericamente, como a raizn-esima do produto de todos eles.

1 Media geometrica simples

n√x1 · x2 · x3 · · ·xn (4)

2 Media geometrica Ponderada

n

√xf11 · x

f22 · x

f33 · · ·x

fnn (5)

A media geometrica se aplica apenas a numeros positivos a fim de evitar ocalculo do produto de um numero negativo que poderia resultar em numerosimaginarios.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 72 / 294

Page 73: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Aplicacoes da media geometrica

Aplicacao

A media geometrica e mais apropriada que a media aritmetica paradescrever crescimentos proporcionais, tanto crescimento exponencial(proporcao constante de crescimento) e crescimento variado.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 73 / 294

Page 74: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Exemplo

Vamos considerar um aumento sucessivo de salarios de 15% noprimeiro mes, 12% no segundo mes e 21% no terceiro mes.

Vamos determinar a media geometrica dos dos aumentos.

Primeiro devemos determinar as taxas percentuais.15%12%21%

=

1.151.121.21

(6)

3√

1.15 · 1.12 · 1.21 = 1.1594

O valor 1.1594 corresponde a taxa media de 15.94%

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 74 / 294

Page 75: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Media harmonica

Media harmonica

Em situacoes onde a proporcionalidade inversa esteja presente eaconselhavel o calculo da media harmonica. Por exemplo, quandoestudamos fenomenos como a velocidade media, o custo medio debens comprados com uma quantia fixa.

A media harmonica e o inverso da media aritimetica dos inversos dosvalores observados.

O calculo da media harmonica e com base na seguinte formula (Dadossimples):

xM =n

1x1

+ 1x2

+ · · ·+ 1xn

(7)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 75 / 294

Page 76: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Media harmonica

A media harmonica para dados agrupados e calculada com base na seguinteformula:

xM =n

f11x1

+ f21x2

+ · · ·+ fn1xn

=

∑ni=1 fi∑n

i=i fi1xi

(8)

onde n e fi representam as o numero total de observacoes e frequencias aabsolutas simples, respectivamente.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 76 / 294

Page 77: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Exemplo: Media harmonica

Um aviao voa tres distancias iguais a uma velocidade de 300, 400, e300 milhas/hora.

Calcule a velocidade media com que o aviao percorreu a distanciatotal.

Neste caso acoselha-se a utilizacao da media harmonica por se tratarde uma distancia fixa percorrida em velocidades diferentes

xM =3

1300 + 1

400 + 1300

= 327.27milhas/hora

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 77 / 294

Page 78: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Mediana

Mediana

E definido como o valor da variavel que ocupa a posicao central nasucessao das observacoes ou na distribuicao de frequencias.

O numero de observacoes para valores que lhe sao inferiores e igualao numero de observacoes para valores que lhe sao superior.

Antes de achar a mediana e preciso ordenar os dados em ordemcrescente ou decrescente).

1 Caso N seja ımpar a mediana sera o elemento central(de ordemN + 1

22 Se o N for par, sera a media entre os elementos centrais (de ordemN

2eN + 2

2)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 78 / 294

Page 79: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Exemplo: MedianaCalculo da mediana para valores discretos

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 79 / 294

Page 80: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Exemplo: MedianaCalculo da mediana para valores discretos

Como N = 42 e par, a mediana sera a media entre os valores

correspondentes aos elementos de ordemN

2eN + 2

2, ou seja 21 e

22dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 80 / 294

Page 81: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

MedianaCalculo da mediana para dados agrupados em classe

Quando os dados estiverem agrupados em classe, o calculo usando a formula:

Md = Li(Md) +N2 − Fant

fMdc (9)

Li(Md)- limite inferior da classe mediana.

c- amplitude da classe mediana.

Fant-frequencia acumulada ate a classe anterior a classe mediana.

fMd-frequencia simples da classe mediana

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 81 / 294

Page 82: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Exemplo: MedianaCalculo da mediana para dados agrupados em classe

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 82 / 294

Page 83: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Exemplo: MedianaCalculo da mediana para dados agrupados em classe

Calcula-seN

2= 29.

Identificar a classe mediana [55, 65[

Calcula-se a mediana utilizando a formula:

55 +29− 17

18× 10 = 61.67

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 83 / 294

Page 84: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

MedianaCaracterısticas importantes da mediana

1 A mediana e facil de calcular e de compreender.

2 Nao e afectada por valores extremos.

3 E uma medida muito utilizada, sobretudo para distribuicoesfortemente assimetricas.

4 Para fins de inferencia a estatıstica, a mediana nao satisfazpropriedades de um bom estimador.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 84 / 294

Page 85: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Moda

A moda e o valor que ocorre com maior frequencia em uma serie devalores.

O calculo da mediana e facil quando os dados estiverem ordenados.

Podes entretanto, encontrar uma serie de dados sem moda. Este tipode distribuicao de dados chama-se amodal.

Moda para dados nao agrupados.

Quando se lida com valores nao agrupados, a moda e facilmente reconhe-cida: basta, de acordo com a definicao, procurar o valor que mais se repete.

A serie de dados: 7, 8, 9, 10, 10, 10, 11, 12, 13, 15; tem moda igual a 10

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 85 / 294

Page 86: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

ModaCaculo da moda para dados agrupados em classe

Existem varios metodos de determinacao da moda. Mas para o nosso es-tudo, iremos determinar a moda usando o metodo de King.

Mo = l + cfpost

fant + fpost(10)

onde,

l- limite inferior da classe modal.

c -amplitude do intervalo de classe modal.

fant-frequencia simples da classe adjacente anterior a classe modal.

fpost-frequencia simples da classe posterior a classe modal

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 86 / 294

Page 87: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

ModaDeterminacao grafica da moda

A moda podera ser determinada graficamente, para tal e necessario construiro histograma da distribuicao, identificar a classe modal e fazer a seguinteconstrucao.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 87 / 294

Page 88: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Outras medidas de tendencia central: Media aparada

A media aparada e calculado pela ”descartar”uma certa percentagemde valores maiores e menores de um conjunto de dados.

Por exemplo, a media aparada de 10% encontra-se, eliminando a 10%das observacoes menores e 10% das observacoes maiores, e depoiscalcula-se a media dos restantes valores.

Por exemplo, considere o seguinte conjunto de dados.

5, 4, 6, 7, 8, 10, 11, 0, 7, 18

a media aparada de 10% sera

X =4 + 5 + 6 + 7 + 7 + 0 + 10 + 11

8= 7.25

a media aparada de 20% sera

X =5 + 6 + 7 + 7 + 0 + 10

6= 7.1667

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 88 / 294

Page 89: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de Localizacao

Media aparadaCaracterısticas

Diferentemente da media aritmetica,a media aparada e menos sensıvela valores extremos.

Embora a media aparada seja menos sensıvel, ela nao se assemelha amediana que e praticamente insensıvel a valores extremos.

A media aparada tem vantagem sobre a media, pois, para alem de sermenos insensıvel a valores extremos, ela usa mais observacoes do quea mediana.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 89 / 294

Page 90: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de separatiz:Quartis, Decis e PercentisQuartis

Os quartis sao os valores da variavel que dividem a distribuicao defrequencias em quatro partes iguais.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 90 / 294

Page 91: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de separatiz:Quartis, Decis e PercentisQuartis

O primeiro quartil Q1, sera um valor da variavel tal que o numero deobservacoes para valores inferiores sera 25%, e superiores,75%.

O segundo quartil Q2 e igual a mediana. Este divide a distribuicao emduas partes iguais.

O terceiro quartil Q3 sera um valor da variavel tal que a sua esquerdaconcentram-se 75% das observacoes e a sua direita as restantes 25%.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 91 / 294

Page 92: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de separatiz:Quartis, Decis e PercentisQuartis

O calculo dos quartis e similar ao calculo da mediana.

Ordene os dados em ordem crescente.

Calcule o ındice i, a posicao do p-esimo quartil sera:

i =(p

4

)n

Se i nao e inteiro arredonde por excesso. O p-esimo quartil sera ovalor na posicao i

Caso i seja inteiro, o p-esimo quartil sera a media aritmetica dosvalores na posicao i e i+ 1.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 92 / 294

Page 93: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de separatiz:Quartis, Decis e PercentisExemplo: Quartis

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 93 / 294

Page 94: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de separatiz:Quartis, Decis e PercentisDecis e Percentis

Os decis sao valores da variavel que dividem a distribuicao em dezpartes iguais enquanto que os percentis dividem em 100 partes iguais.

O numero de decis e de percentis sera 9 e 99, respectivamente.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 94 / 294

Page 95: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de separatiz:Quartis, Decis e PercentisDados agrupados em classe

Caso os dados estejam agrupados em classe, o calculo de Quartis,Decis e Percentis e feito usando as seguintes formulas:

Qp = l + cnp4 − Fant

fQp(11)

Dp = l + cnp10 − Fant

fDp(12)

Cp = l + cnp100 − Fant

fCp(13)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 95 / 294

Page 96: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de separatiz:Quartis, Decis e PercentisExercıcio

a) Calcule o primeiro quartil e o percentil 25.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 96 / 294

Page 97: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao absoluta

Podemos definir a estatıstica como uma ciencia que lida comvariabilidade.

Sem variabilidade nao faz sentido a existencia da estatıstica

Por exemplo, se numa turma todos tivessem a mesma idade, naohaveria necessidade de calcular a media .

Se numa empresa todos tivessem o mesmo salario, nao se perderiatempo em procurar uma medida que possa condensar a informacao nadistribuicao de dados

As medidas de dispersao servem para verificar a representatividadedas medidas de localizacao

Ademais, podemos ter dois conjuntos de dados com mesma media,desta forma nao sendo suficiente a media para descrever o conjuntode dados.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 97 / 294

Page 98: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao absoluta

Ambas distribuicoes tem mesma media µx = µy = 20

Porem, os valores de X nao apresentam nenhuma variacao em tornoda media.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 98 / 294

Page 99: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao absolutaAmplitude Total

A primeira medida de dispersao e a amplitude total

E a diferenca entre o valor maximo e mınimo da variavel.

At = Xmax −Xmin

Se os dados estiverem agrupados em classe, podemos calcular aamplitude da seguinte maneira:

At =Ponto medio da ultima classe – ponto medio da primeira classe.At =Limite superior da ultima classe – limite inferior da primeira classe

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 99 / 294

Page 100: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao absolutaAmplitude Total

O uso da amplitude total tem como desvantagem o facto de ter emconta apenas os dois valores extremos que a variavel toma.

A parte isso, a amplitude total h insensıvel a valores intermedios.

Exemplo: Considere a amostra 4, 6, 1, 2, 3, 3

At = 1− 6 = 4

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 100 / 294

Page 101: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao absolutaAmplitude Interquartil

Uma outra medida de dispersao e a amplitude do intervalointerquartis ou simplesmente amplitude interquartil.

Esta e definida como a diferenca entre o terceiro e o primeiro quartil

Corresponde ao intervalo que engloba 50% das observacoes.

IQ = Q3 −Q1

Tem a desvantagem de nao ser influenciado por metade dos valoresobservados.

Esta medida deve ser utilizada para distribuicoes assimetricas uma vezque nao e afectada por valores extremos.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 101 / 294

Page 102: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao absolutaExemplo: Amplitude Interquartil

IQ = 219− 146 = 73euros

50% das observacoes centrais apresentam uma variacao de preco de73 euros

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 102 / 294

Page 103: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao absolutaVariancia

A variancia e a mediada de variabilidade que utiliza todos os dados. Avariancia e baseada na diferenca entre o valor de cada observacao(xi) e a media. A diferenca entre cada valor de xi e a media, echamada de desvio em relacao a media.

Dados nao agrupados Dados agrupados

Populacao σ2 =

∑ni=1(xi − µ)2

Nσ2 =

∑ni=1(xi − µ)2fi

N

Amostra s2 =

∑ni=1(xi − x)2

n− 1s2 =

∑ni=1(xi − x)2fi

n− 1

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 103 / 294

Page 104: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao absolutaVariancia

No caculo da variancia podemos dividir a soma dos desvios por n− 1ou n, isto e

s2 =

∑ni=1(xi − x)2

n− 1(14)

ou

s2 =

∑ni=1(xi − x)2

n(15)

A formula 15 produz valores viciados para amostras pequenas.

Para amostras grandes as duas formulas produzem valoresaproximadamente iguais.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 104 / 294

Page 105: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao absolutaVariancia

A partir do grafico podemos ver que a medida que o tamanho daamostra aumenta as diferencas entre as formulas 14 e 15 saominusculas.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 105 / 294

Page 106: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao absolutaDesvio-padrao

Uma vez que a variancia e expressa em unidades ao quadrado o quetorna difıcil a sua interpretacao, recorre-se ao desvio padrao que edefinido como sendo a raiz quadrada positiva da variancia:

desvio-padrao amostral s = +√s2

desvio-padrao amostral σ = +√σ2

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 106 / 294

Page 107: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao absolutaExemplo: Desvio-padrao

Considere a seguinte amostra: 1, 3, 2, 2, 4

Temos que∑ni=1 xi = 1 + 3 + 2 + 2 + 4 = 12,

∑ni=1 x

2i = 12 + 32 + 22 + 22 + 42 = 34

Daı que

s2 =

∑ni=1(xi − x)2

n− 1=

34− 122/5

4= 1.3

s =√

1.3 = 1.1042

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 107 / 294

Page 108: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao absolutaDesvio-padrao

E a medida de dispersao mais utilizada. As suas propriedadesmatematicas tornam-no particularmente apropriado em situacoes deinferencia estatıstica.

O desvio-padrao e uma medida de dispersao afectada por todosvalores, portanto, qualquer alteracao nestes provoca uma alteracao noprimeiro.

O seu valor pode ser fortemente influenciado por valores extremos.Por essa razao,a sua utilizacao e menos aconselhada em distribuicoesaltamente assimetricas.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 108 / 294

Page 109: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao relativaCoeficiente de dispersao e variacao

Todas medidas de dispersao apresentadas ate agora, sao medidas dedispersao absoluta.

Portanto, nao sao validas para comparacao da dispersao de duasdistribuicoes, sobre tudo quando estas estao em unidades de medidasdiferentes.

o coeficiente de variacao e uma medida relativa de dispersao quemede o grau de concentracao de valores em torno da media, em valorpercentual.

CV =s

x× 100

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 109 / 294

Page 110: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao relativaCoeficiente de dispersao e variacao

Eis algumas regras empıricas para a interpretacao do coeficiente de variacao:

Rule of thumb ou ”regra do polegar”

Se CV < 15% tem-se baixa dispersao.

Se 15% 6 CV < 30% tem-se media dispersao.

Se CV > 30%tem-se elevada dispersao.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 110 / 294

Page 111: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de dispersao relativaExemplo

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 111 / 294

Page 112: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de Assimetria

A forma mais simples de medir o grau de assimetria de umadistribuicao consiste na comparacao de tres medidas de tendenciacentral.

Numa distribuicao simetrica temos que x = Mo = Me

Quando a media > mediana> moda, temos uma distribuicaoassimetrica positiva.

No caso inverso- media 6 mediana6 moda, temos uma distribuicaoassimetrica negativa

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 112 / 294

Page 113: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de Assimetria

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 113 / 294

Page 114: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de Assimetria

Existem varias formulas para o calculo do coeficiente de assimetria, dentreelas sao uteis:

1ºCoeficiente de assimetria de PearsonAS =x−Mo

s

2ºCoeficiente de assimetria de PearsonAS =Q1 +Q3 − 2Me

Q3 −Q1

Rule of thumb

Se AS = 0 diz-se que a distribuicao e simetrica.

Se AS > 0 diz-se que a distribuicao e assimetrica positiva.

AS < 0, diz-se que a distribuicao e assimetrica negativa.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 114 / 294

Page 115: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de achatamento ou kurtosis

Entende-se por kurtosis o grau de achatamento de uma distribuicao.

Estas medidas dao uma indicacao da intensidade das frequencias navizinhanca dos valores centrais.

Como referencia ao grau de achatamento podemos ter: distribuicaoleptocurtica, mesocurtica e platicurtica.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 115 / 294

Page 116: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de achatamento ou kurtosis

Para medir o grau de kurtosis pode ser utilizada a seguinte medida:

K =Q3 −Q1

2(P90 − P10

Rule of thumb

K = 0.263 a distribuicao de frequencia e mesocurtica.

K > 0.263 a distribuicao de frequencia e platicurtica

K < 0.263 a distribuicao de frequencia e leptocurtica

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 116 / 294

Page 117: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Medidas de achatamento ou kurtosis

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 117 / 294

Page 118: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Box-plot ou caixa de bigodesConstrucao

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 118 / 294

Page 119: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Box-plot ou caixa de bigodes

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 119 / 294

Page 120: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Estatısticas Descritivas Medidas de separatiz

Toeria de probabilidades

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 120 / 294

Page 121: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Toeria de probabilidadesIntroducao

No nosso quotidiano, lidamos sempre com situacoes em que estapresente a incerteza do resultado.

Por exemplo: o sexo de um embriao pode ser masculino ou feminino,mas so saberemos o resultado exacto quando bebe nascer.

Se estamos interessados na face voltada para cima quando jogamosum dado, os resultados possıveis sao 1, 2, 3, 4, 5, 6, mas sosaberemos o resultado quando o experimento se completar, ou seja,quando o dado atingir a superfıcie sobre a qual foi lancado.

Entao e conveniente dispor de uma medida que expresse a incerteza.Tal media chama-se probabilidade.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 121 / 294

Page 122: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Experimento aleatorio, Espaco amostral e EventoExperimento aleatorio

Experimento aleatorio- e um processo que acusa variabilidade emseus resultados, isto e, repetindo-se o experimento sob as mesmascondicoes, os resultados serao diferentes.

Alem dos experimentos aleatorios, temos osexperimentosdeterminısticos

experimentos determinısticos- sao experimentos que, repetidos sobas mesmas condicoes, conduzem a resultados identicos.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 122 / 294

Page 123: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Experimento aleatorioExemplo

O lancamento de uma moeda e um experimento aleatorio.

O lancamento de um dado tambem e um experimento aleatorio

Todo experimento que gera dados/informacao pode ser consideradocom um experimento aleatorio

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 123 / 294

Page 124: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Espaco amostral

Espaco amostral

Espaco amostral de um experimento aleatorio e o conjunto de todosresultados possıveis desse experimentos.

Vamos denotar o espaco amostral pela letra grega omega maiuscula,Ω

O espaco amostral pode ser considerado discreto , quando este efinitoou infinito numeravel, ou contınuo caso contrario.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 124 / 294

Page 125: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Espaco amostralExemplo

1 Lancamento de um dado

O espaco amostral e dado por Ω = 1, 2, 3, 4, 5, 6, que por sua vezpode ser considerado como sendo discreto

2 Lancamento de duas moedas

O espaco amostral e Ω = KK,KC,CK,CC

Se por exemplo estivermos interessado no numero de caras, o espacoamostral sera: Ω = 0, 1, 2

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 125 / 294

Page 126: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Evento aleatorios

Os subconjuntos de Ω sao chamados de eventos aleatorios.

Os elementos de Ω sao designados por eventos elementares

Os eventos aleatorios serao representados por letras maiusculas donosso alfabeto e os eventos elementares por letras minusculas.

Exemplo Para o lancamento de um dado podemos considerar alguns even-

tos:

face par= 2, 4, 6face ımpar= 1, 3, 5

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 126 / 294

Page 127: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Operacoes com eventos aleatoriosInterseccao

O evento interseccao de A e B e o evento que equivale a ocorrenciasimultanea de A e B.

Em notacao de teoria de conjunto temos A ∩B

Note que x ∈ A ∩B ⇔ x ∈ A ∧ x ∈ B

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 127 / 294

Page 128: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Operacoes com eventos aleatoriosExemplo: Interseccao

Considere o experimento lancamento de dois dados e os eventos A =”Asoma das faces e um numero par”e B =”A soma das faces e um numeromaior do que 9. Calcule A ∩B

SolucaoO espaco amostral tem 36 elementos

Ω = (1, 1), (1, 2), ..., (1, 6), (2, 1), ..., (2, 6), ..., (6, 6)

A ∩B = (4, 6), (5, 5), (6, 4), (6, 6)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 128 / 294

Page 129: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Operacoes com eventos aleatoriosExclusao

Exclusao

Dois eventos A e B sao mutuamente exclusivos quando eles naopodem ocorrer simultaneamente, isto e, quando a ocorrencia de umimpossibilita a ocorrencia do outro.

Isto significa dizer que os eventos A e B nao tem elementos emcomum

Dois eventos A e B sao mutuamente exclusivos quando a suainterseccao e o conjunto vazio, isto, e A ∩B = ∅

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 129 / 294

Page 130: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Operacoes com eventos aleatoriosUniao

A uniao de dois eventos A e B (A ∪B) e o evento que corresponde aocorrencia de pelo menos um deles.

Isso significa que pode ocorrer apenas A, ou apenas B ou A e Bsimultaneamente.

x ∈ A ∪B ⇔ x ∈ A ∨ x ∈ B

Exemplo

SejaA = a, b, c e B = b, c, d, e

EntaoA ∪B = a, b, c, d, e

.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 130 / 294

Page 131: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Operacoes com eventos aleatoriosComplementacao

O complementar de um evento e denotado por A ou Ac, e e anegacao de A.

O complementar de A e formado por todos elementos que naopertencem a A.

Note que x ∈ Ac ⇔ x /∈ AAc ∪A = Ω

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 131 / 294

Page 132: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Operacoes com eventos aleatoriosDiferenca

Diferenca

A diferenca entre dois eventos A e B, representada por A \B, e oevento formado pelos elementos do espaco amostral que pertencem aA mas nao pertencem a B

Note que ∈ A \B ⇔ x ∈ A ∧ x /∈ B ⇔ x ∈ A ∩BAdemais, observe que A \B 6= B \A

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 132 / 294

Page 133: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Operacoes com eventos aleatoriosPropriedade das operacoes

Identidade:A ∩ ∅ = ∅A ∪ Ω = Ω

A ∪ ∅ = A

A ∩ Ω = A

Complementar:Ω = ∅∅ = Ω

A ∩A = ∅A ∪A = Ω

.dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 133 / 294

Page 134: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Operacoes com eventos aleatoriosPropriedade das operacoes

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 134 / 294

Page 135: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Analise combinatoriaPrincipio fundamental da adicao

Principio fundamental da adicao

Consideremos uma coleccao de eventos mutuamente exclusivos dois a dois,tais que n(Ai) = ni, i = 1, · · · k. O princpio fundamental da adicaoestabelece que :

Ai ∩Aj = ∅ ∀ i 6= j ⇒ n( k⋃

i=1

Ai

)=

k∑i=1

n(Ai) = n1 + n2 + · · ·+ nk

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 135 / 294

Page 136: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Analise combinatoriaPrincipio fundamental da multiplicacao

Suponha que temos k conjuntos . Conjunto 1 tem n1 elementos,conjunto 2 tem n2 elementos,· · · ,conjunto k tem nk elementos

Podemos formar uma amostra de k elementos, tomando um elementoem cada conjunto.

O numero de amostras diferentes que podem ser formadas e igual

n1n2n3 · · ·nk

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 136 / 294

Page 137: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Analise combinatoriaExemplo 1: Principio fundamental da multiplicacao

Quantos numeros naturais de tres algarismos distintos existem?

Para o primeiro algarismo (milhar), existem novepossibilidades(excluımos o zero)

Para a segunda posicao, escolhida a primeira, sobram novealgarismos(agora incluımos o zero)

Para a terceira, escolhidos os dois primeiros, sobram oito algarismos.

Entao temos 9× 9× 8 = 648 numeros.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 137 / 294

Page 138: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Analise combinatoriaExemplo 2: Principio fundamental da multiplicacao

Quantos numeros pares de tres algarismos distintos podemos formar comos algarismos 1, 2, 3, 4, 5, 6

Para que o numero seja par ele deve terminar com 2,4 ou 6.

Seja P o evento de interesse. Vamos denotar por A2, A4 e A6 oevento ”numero que termina com 2, 4, e 6”, respectivamente.

n(A2) = 5× 4× 1, n(A4) = 5× 4× 1, n(A6) = 5× 4× 1

Pelo princıpio fundamental da adicao temos.

n(P ) = n(A2) + n(A4) + n(A6) = 60

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 138 / 294

Page 139: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Analise combinatoriaPermutacoes

Considere quatro objectos distintos a1, a2, a3, a4. De quantasmaneiras podemos ordena-los?

Cada uma dessas ordenacoes e chamada uma permutacao simples.

Considere n objectos distintos, a1, a2, a3, · · · an. Para a primeiraposicao temos n possibilidades. Para a segunda temos n− 1possibilidades. Continuando para a ultima posicao, escolhidas a n− 1anteriores, resta apenas um objecto.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 139 / 294

Page 140: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Pelo principio da multiplicacao, o numero total de permutacoes,denotado por Pn sera igual a

n× (n− 1)× (n− 2)× (n− 3)× · · · × 1

Permutacao

Dados n objetos distintos, o numero de permutacoes simples de taisobjetos e dado por

Pn = n× (n− 1)× (n− 2)× · · · × 1 = n!

Exemplo

Quantas filas diferentes podemos formar com 5 criancas ?

5! = 5× 4××3× 2× 1 = 120

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 140 / 294

Page 141: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Analise combinatoriaPermutacoes circulares

Considere a situacao em que coloca n objectos distintos em n lugares equi-espacados em torno de um cırculo.

O ponto relevante e considerar equivalentes posicoes que coincidempor rotacao

Para o calculo de permutacoes circulares usamos a seguinte formula:

Pn = (n− 1)!

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 141 / 294

Page 142: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Analise combinatoriaExemplo Permutacoes

Considere o anagrama TEORIA

1) Quantos anagramas podemos formar?

6! = 6× 5× 4× 3× 2× 1 = 720

2) Quantos anagramas comecam com a letra T? Fixamos a letra T naprimeira posicao as outras cinco podem ser organizadas de

5! = 120 maneiras diferentes.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 142 / 294

Page 143: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Analise combinatoriaParticoes

Suponha que tem se um unico conjunto N com elementos diferentes

E queira-se dividir este conjunto em k subconjuntos, com n1

elementos no conjunto 1, n2 elementos no conjunto 2,· · · e nk noconjunto k.

O numero de particoes diferentes e dado por

P =N !

n1!n2! · · ·nkonde n1 + n2 + · · ·nk = N

Exemplo: Suponha que tem 12 analistas de sistema e pretende atribuir atres analista a tarefa 1, a quatro a tarefa 2 e a cinco deles a tarefa 3. Dequantas formas pode atribuir as tarefas?

P =12!

3!4!5!= 27720

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 143 / 294

Page 144: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Analise combinatoriaCombinacoes

Combinacao

Chama-se combinacao de n elementos tomados p a p aos agrupamentosdistintos que podem formar-se de modo que em cada um dessesagrupamentos entrem p dos n elementos, considerando como distintos dosagrupamentos que difiram somente pela natureza (especie) de pelo menosum elemento.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 144 / 294

Page 145: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Analise combinatoriaCombinacoes

Combinacoes sem repeticao: Cada elemento entra uma unica veznum agrupamento dado

Cnp =

n!

p!(n− p)!Combinacoes com repeticao: Representam a quantidade de modosde escolher k objectos distintos ou nao entre n objectos distintosdados.

Cn+p−1p =

(n+ p− 1)!

p!(n− 1)!

Exemplo: Suponha que queira empregar 5 pessoas dentre 100 candidatos.De quantas formas estas pessoas podem ser seleccionadas.

C1005 =

100!

5!(100− 5)!= 75287520

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 145 / 294

Page 146: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Analise combinatoriaArranjos

Arranjos

Chama-se arranjos de n elementos p a p aos agrupamentos distintos quepodem formar-se de modo que em cada um dos agrupamentos entrem os pdos n elementos, considerando como distinto os dois agrupamentos quedifiram pela natureza (especie) ou pela ordem dos seus elementos.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 146 / 294

Page 147: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Analise combinatoriaArranjos

Se num conjunto de n elementos seleccionarmos p elementos, earranjarmos esses elementos em p posicoesEntao o numero total de arranjos sem repeticao e dado por

Anp =

n!

(n− p)!E o numero de arranjos com repeticao e dado por

Anp = np

Exemplo: quantos numeros de quatro algarismos diferentes sao possıvelformar com os quatro elementos do conjunto 1, 2, 3, 5, 6?

A54 =

5!

(5− 4)!= 120

Podıamos tambem aplicar o princıpio fundamental da multiplicacao 5× 4×3× 3× 2 = 120dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 147 / 294

Page 148: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeDefinicao classica e frequentista

Existem dois procedimentos que por meio dos quais pode se estimar a pro-babilidade de um evento:

1 Abordagem classica

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 148 / 294

Page 149: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeExemplo: definicao classica

No lancamento de um dado, qual e a probabilidade de obter face maior doque 4?

Neste caso estamos perante um espaco amostral finito.

Alm disso, considerando que o dado e honesto, estamos diante deeventos equipraveis.

O evento de de interesse e A = 5, 6, e sabendo que n(Ω) = 6,entao temos

P(A) =2

6=

1

3

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 149 / 294

Page 150: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeExemplo: definicao classica

Um numero e escolhido entre os 20 primeiros inteiros, 1 a 20. Qual e aprobabilidade de que o numero escolhido seja (i) par? (ii) primo? (iii)quadrado perfeito?

Numeros pares

P = 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 ⇒ P (P ) =10

20=

1

2

Numeros primos

R = 2, 3, 5, 7, 11, 13, 17, 19 ⇒ P (R) =8

20=

2

5

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 150 / 294

Page 151: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadedefinicao frequentista

1 Abordagem frequentista

Se apos n repeticoes de um experimento, onde n e um numero grande,e observado que um evento ocorre em h destas repeticoes, entao aprobabilidade do evento e h/n. Esta e a chamada probabilidadeempırica do evento

P (A) = limn→∞

n(A)

n

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 151 / 294

Page 152: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeExemplo: definicao frequentista

Se lancarmos uma moeda 1000 vezes e aparecer cara 532 vezes, estimaremosa probabilidade de ocorrer cara por 532/1000 = 0.532

Observacao

Ambas as abordagens tem serias restricoes, a primeira porque a palavra”igualmente provaveis”sao vagas e segunda porque o ”numerogrande”envolvido tambem e vago.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 152 / 294

Page 153: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Caculo da probabilidadeDefinicoes axiomaticas e regras de probabilidade

1 Axioma 1: 0 6 P (A) 6 1

2 Axioma 2 : P (Ω) = 1

3 Axioma 3: A ∩B = ∅ ⇒ P (A ∪B) = P (A) + P (B)

Propriedades

1 P (∅) = 0

2 P (A) = 1− P (A)

3 P (A \B) = P (A ∩B) = P (A)− P (A ∩B)

4 P (A ∪B) = P (A) + P (B)− P (A ∩B)

5 P (A \B) = P (A ∩B) = P (A)− P (A ∩B)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 153 / 294

Page 154: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeDefinicoes axiomaticas e regras de probabilidade

Regras de probabilidades

6 A ⊂ B ⇒ P (A) 6 P (B)

7

8 P (A1 ∪A2 ∪A3 ∪ · · · ∪An) 6∑n

i=1 P (Ai)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 154 / 294

Page 155: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeExemplo

Considere o lancamento de dois dados, onde o evento A =”soma das facespar”, B =”soma das faces maior do que 9”e C = ”soma das faces ımparmenor do que 9”. Cacule a probabilidade de cada evento.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 155 / 294

Page 156: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Podemos ver que:

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 156 / 294

Page 157: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 157 / 294

Page 158: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeExemplo:Bolas de uma urna

Em uma urna ha 4 bolas brancas e 3 bolas verdes. Duas bolas sao retiradasdessa urna, sequencialmente e sem reposicao. Qual e a probabilidade deobtermos:

1 2 bolas brancas?

2 2 bolas verdes?

3 2 bolas de cores diferentes?

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 158 / 294

Page 159: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Logo P (B) =6

42=

1

7ou P (B) =

A32

A27

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 159 / 294

Page 160: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

O evento C =”bolas de cores diferentes”e complementar do eventoD =”bolascom cores iguais. Que por sua vez e uniao dos eventos A e B, entao temos

P (A ∪B) = P (A) + P (B)− P (A ∩B) =2

7+

1

7=

3

7

P (C) = 1− P (D) = 1− 3

7=

4

7

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 160 / 294

Page 161: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeProbabilidade condicional

Definicao

Seja B um evento arbitrario em um espaco amostral Ω, com P (B) > 0. Aprobabilidade de um evento A ocorrer, uma vez que B tenha ocorrido ou,em outras palavras, a probabilidade condicional de A dado B, escritaP (A \B), e definida como:

P (A \ E) =P (A ∩B)

P (B)

Note que, nessa definicao, temos que supor que o evento B e umevento possıvel, visto que ele ja ocorreu, isto e (P (B) > 0)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 161 / 294

Page 162: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeProbabilidade condicional

Se Ω e um espaco finito equi-provavel e n(A) representa o numero deelementos em um evento A, entao

P (A ∩B) =n(A ∩B)

n(Ω)P (B) =

n(B)

n(Ω)entao deduz-se que:

P (A \B) =(A ∩B)

P (B)=n(A ∩B)

n(B)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 162 / 294

Page 163: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Caculo da probabilidadeProbabilidade condicional

Teorema

Seja Ω um espaco finito com eventos A e B, entao

P(A \B) =numero de elementos em A ∩B

numero de elementos

ou

P(A \B) =numero de maneiras nas quais A e B podem occorrer

numero de maneiras nas quais B pode ocorrer

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 163 / 294

Page 164: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeExemplo1: probabilidade condicional

Um grupo de 100 alunos foi classificado quanto ao sexo e a atividadede lazer preferida, obtendo-se a distribuicao dada na tabela abaixo.

1. Qual e a probabilidade uma pessoa escolhida ao acaso neste grupo serdo sexo masculino?

2. Se a pessoa escolhida prefere praia como actividade de lazer, qual e aprobabilidade de que seja homem?

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 164 / 294

Page 165: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeExemplo 1: probabilidade condicional

Vamos definir os seguintes eventosM =”masculino, F =”feminino, C =”Cinema”,P =”praia”, D =”Desporto”

Como o sorteio e aleatorio, e estamos diante de um espaco amostral finitoe equi-provavel, podemos usar a definicao classica.

1. visto que temos 20 homens dentre 100, entao tem-se

P (M) =20

100=

1

5

2. P (M \ P ) =P (M ∩ P )

P (P )=

1210053100

=12

53

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 165 / 294

Page 166: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeExemplo2: probabilidade condicional

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 166 / 294

Page 167: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeExemplo 2: probabilidade condicional

Seja E o evento ”empregado tem o plano aposentadoria complementar da”eP o evento ”empregado possui plano pessoal de aposentadoria complementaempresa”

P (P ) =200

500=

2

5P (E) =

400

500=

4

5P (P ∩ E) =

200

500=

2

5

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 167 / 294

Page 168: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 168 / 294

Page 169: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeRegra geral da multiplicacao

Esse resultado nos permite calcular a probabilidade da intersecao dedois eventos

E muito util para modelar experimentos que tem caracter sequencial.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 169 / 294

Page 170: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeExemplo: Regra geral da multiplicacao

Considere que duas cartas de um baralho (13 cartas de cada um dos naipescopas, paus, ouro, espada) sejam extraıdas sem reposicao, uma depois daoutra. Qual e a probabilidade de nenhuma das duas ser de copas?

Seja C1 = copas na primeira extracao

Seja C2 = copas na segunda extracao

Pretende-se calcular P (C1 ∩ C2), pela regra da multiplicacao

P (C1 ∩ C2) = P (C1)P (C2 \ C1) =39

52× 38

51

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 170 / 294

Page 171: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeExemplo: Regra geral da multiplicacao, diagrama de arvore

Cada no na arvore corresponde a ocorrencia de um evento condicionada aocorrencia de todos os eventos representados pelos nos anteriores no cami-nho correspondente.dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 171 / 294

Page 172: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeRegra geral da multiplicacao

Regra geral da multiplicacao

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 172 / 294

Page 173: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Calculo da probabilidadeEventos independentes

Independencia

Um evento B e dito independente de um evento A, se a probabilidade de Bocorrer nao e influenciada pelo facto de A ter ocorrido ou nao. Em outraspalavras, se a probabilidade de B e igual a probabilidade condicional de Bdado A.

P (B \A) = P (B) , P (A \B) = P (A)

P (A \B) = P (A)]⇒ P (A ∩B)

P (B)= P (A)

⇒ P (A ∩B) = P (A)P (B)

Exemplo: prove se os eventos do exemplo no slide 167 sao ou nao indepen-dentes

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 173 / 294

Page 174: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Caculo da probabilidadeTeorema da probabilidade total e Teorema de Bayes

Particao de um espaco amostral

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 174 / 294

Page 175: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Caculo da probabilidadeTeorema da probabilidade total e Teorema de Bayes

Teorema da probabilidade total

Seja, A1, A2...An uma particao do espaco amostral Ω e seja E um eventodo espaco amostral,

P (E) =

n∑i=1

P (E \A)P (Ai)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 175 / 294

Page 176: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Caculo da probabilidadeTeorema da probabilidade total e Teorema de Bayes

Teorema de de Bayes

Seja, A1, A2...An uma particao do espaco amostral Ω e seja E um eventodo espaco amostral,com P (E) > 0 , tem-se que ∀i = 1, 2, · · ·n

P (Ai \ E) =P (Ai ∩ E)

P (E)=

P (E \Ai)P (Ai)∑ni=1 P (E \Ai)P (Ai)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 176 / 294

Page 177: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Caculo da probabilidadeExemplo: Teorema da probabilidade total e Teorema de Bayes

Em uma empresa, 4 pessoas sao responsaveis pela compra. pessoa A faz40% das contas, a pessoa B 30%, a pessoa C 20% e pessoa D 10%.

Em 1% das contas de A ha um erro. Para B, o erro e de 2%, 5% paraC e D tem de 10% de erros.

Qual e a probabilidade de que haja um erro numa das contasseleccionadas aleatoriamente?

Qual e a probabilidade de que este erro seja feito pela pessoa A?

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 177 / 294

Page 178: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades

Caculo da probabilidadeExemplo: Teorema da probabilidade total e Teorema de Bayes

Para a primeira questao usamos o teorema da probabilidade total

Para a segunda questao usamos o teorema de Bayes

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 178 / 294

Page 179: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Variaveis aleatorias

Calculo da probabilidadeVariaveis aleatorias

Considere o seguinte experimento aleatorio:

Sorteio de uma amostra de 20 funcionarios de uma empresa com 500funcionarios.

O espaco amostral e formado por todas amostras possıveis.

O numero total de amostras e n(Ω) = C50020

Cada elemento do espaco amostral e formado por uma relacao de 20funcionarios sorteados.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 179 / 294

Page 180: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Variaveis aleatorias

Calculo da probabilidadeVariaveis aleatorias

Geralmente nao estamos interessados no funcionario como tal, massim em alguma caracterıstica do funcionario(Ex: altura, numero dedependentes).

Tendo-se uma amostra podemos calcular por exemplo uma mediapara a altua.

E dessa forma temos um valor associado a cada elemento/ amostrado espaco amostral.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 180 / 294

Page 181: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Variaveis aleatorias

Calculo da probabilidadeVariaveis aleatorias

Variavel aleatoria

Uma variavel aleatoria e uma funcao real (isto e, que assume valores emR) definida no espaco amostral Ω de um experimento aleatorio. Dito deoutra forma, uma variavel aleatoria e uma funcao que associa um numeroreal a cada evento de Ω.

Por convencao vamos usar letras maiusculas do alfabeto pararepresentar uma variavel aleatoria, X, Y, etc.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 181 / 294

Page 182: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Variaveis aleatorias

Calculo da probabilidadeVariaveis aleatorias

Considere novamente o exemplo referente a amostra de 20 funcionarios

Pode-se, entao, definir as seguintes variaveis.

X =”altura media em centımetros”.Y = ”numero maximo de pendentes”.

Estas variaveis tem naturezas diferentes.

Variaveis aleatorias discretas e contınuas

Uma variavel aleatoria e discreta se sua imagem (ou conjunto de valoresque ela assume) for um conjunto finito ou enumeravel. Se a imagem forum conjunto nao enumeravel, dizemos que a variavel aleatoria e contınua.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 182 / 294

Page 183: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Variaveis aleatorias

Calculo da probabilidadeVariaveis aleatorias

A questao que se coloca e: como atribuir probabilidade aos valores, ouintervalo de valores, de uma variavel aleatoria?

Considere o lancamento de dois dados:

O espaco amostral e formado pelos pares ordenados (i, j) i, j =1, 2,3, 4, 5, 6

O espaco amostral deste experimento nao e formado por numeros.

Suponhamos que nosso interesse esteja no maximo das faces dos doisdados.

Seja X o maximo numero das duas faces?

X e uma variavel discreta que pode assumir valores 1,2, 3, 4, 5, 6

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 183 / 294

Page 184: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Variaveis aleatorias

X = 2 corresponde ao evento A = (1, 2), (2, 2), (2, 1)X = 1 corresponde ao evento B = (1, 1)

Por conseguinte :

P (X = 2) =3

36e P (X = 1) =

1

36

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 184 / 294

Page 185: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Variaveis aleatorias

Calculo da probabilidadeExemplo: Variaveis aleatorias

Considere a altura media de uma amostra de funcionarios.

Retiram-se varias amostras e se regista a altura media.

o Histograma e construıdo de tal forma que a soma das areas de cadarectangulo seja igual a 1.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 185 / 294

Page 186: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Variaveis aleatorias

A frequencia relativa e uma aproximacao da probabilidade de umelemento pertencer a uma determinada classe.

Entao pode-se estimar a probabilidade de altura media estar entredois valores quaisquer com a area dos retangulos envolvidos.

A area sombreada corresponde a frequencia (probabilidade) de alturasentre os valores 168 e 178 cm

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 186 / 294

Page 187: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Funcao de probabilidade

Calculo da probabilidadeFuncao de probabilidade:variavel aleatoria discreta

Funcao de probabilidade

Seja X uma variavel aleatoria discreta. A funcao de probabilidades deX e a funcao fX(x) que associa, a cada valor possıvel x de X, suarespectiva probabilidade, calculada da seguinte forma: fX(x) e aprobabilidade do evento X = x que consiste em todos os resultados doespaco amostral que dao origem ao valor x.

fX(x) = P (X = x) =∑

ω∈Ω:X(ω)=x

P (ω)

Pela definicao de probabilidade,tem-se:

fX(x) > 0∑x fX(x) = 1

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 187 / 294

Page 188: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Funcao de probabilidade

Calculo da probabilidadeCalculo da funcao de probabilidade

Da definicao de funcao de probabilidade, resulta que o seu calculo se da emtres etapas:

primeiro, temos que identificar todos os possıveis valores x da v.a. X.

segundo, temos que identificar os resultados que dao origem a cadavalor x e suas respectivas probabilidades.

finalmente, temos que somar todas essas probabilidades para obterfX(x) = P (X = x).

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 188 / 294

Page 189: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Funcao de probabilidade

Calculo da probabilidadeExemplo: Calculo da funcao de probabilidade

Considere o lancamento de dois dados: maximo das faces

Agora considere a variavel aleatotira X =”soma das duas faces”.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 189 / 294

Page 190: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Funcao de probabilidade

Calculo da probabilidadeExemplo: Calculo da funcao de probabilidade

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 190 / 294

Page 191: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Funcao de distribuicao

Calculo da probabilidadeFuncao de distribuicao acumulada

Funcao de distribuicao

Dada uma variavel aleatoria X, a funcao de distribuicao acumulada deX, ou simplesmente funcao de distribuicao, e definida por

FX(x) = P (X 6 x) ∀x ∈ R

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 191 / 294

Page 192: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Funcao de distribuicao

Calculo da probabilidadeExemplo: Funcao de distribuicao acumulada

Considere o exemplo do numero maximo das faces:

Observe que FX(x) = 0 ∀x < 1

Para X = 1 tem-se FX(1) = P (X 6 1) = P (X < 1) + P (X = 1)

Para ∀x tal que 1 < x < 2, temos fX(x) = 0

Deste modo tem-se FX(x) = FX(1) =1

2∀x ∈ 1 6 x < 2

Para x ∈ (2, 3) FX(x) = P (X 6 2) + P (2 < X < x) = FX(2) + 0 =FX(2) ∀x : 2 < x < 3

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 192 / 294

Page 193: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Funcao de distribuicao

Calculo da probabilidadeExemplo: Funcao de distribuicao acumulada

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 193 / 294

Page 194: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Funcao de distribuicao

Calculo da probabilidadeExemplo: Funcao de distribuicao acumulada

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 194 / 294

Page 195: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Funcao de distribuicao

Calculo da probabilidadeFuncoes de Variaveis Aleatorias

Funcoes de Variaveis Aleatorias

Dada uma v.a. X; podemos obter outras variaveis aleatorias atraves defuncoes de X e, da mesma forma que calculamos a funcao de probabilidadede X; podemos calcular a funcao de probabilidade dessas novas variaveis.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 195 / 294

Page 196: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Funcao de distribuicao

Calculo da probabilidadeExemplo: Funcoes de Variaveis Aleatorias

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 196 / 294

Page 197: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Funcao de distribuicao

Calculo da probabilidadeExemplo: Funcoes de Variaveis Aleatorias

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 197 / 294

Page 198: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Funcao de distribuicao

Funcoes de Variaveis Aleatorias

Seja X uma variavel aleatoria discreta com funcao de probabilidade fX(x): Se definimos uma nova v.a. Y = g(X), onde g e uma funcao realqualquer, entao a funcao de probabilidade de Y e calculada como

fY (y) =∑

x|g(x)=y

fX(x)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 198 / 294

Page 199: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Esperanca de uma variavel aleatoria

Calculo da probabilidadeEsperanca de uma variavel aleatoria discreta

Definicao

Seja X uma variavel aleatoria discreta que assume os valores x1, x2,. . .com probabilidades p1; p2... respectivamente. A esperanca ou media de Xe definida como

E(X) =∑i

pixi =∑i

xiP (X = xi)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 199 / 294

Page 200: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Esperanca de uma variavel aleatoria

Caculo da probabilidadeExemplo: Esperanca matematica

Considere que o numero de produtos vendidos em um dia por umfuncionario e uma variavel aleatoria P com seguinte distribuicao deprobabilidade.

Numero de produtos 0 1 2 3 4 5 6

Probabilidade de Venda 0.1 0.4 0.2 0.1 0.1 0.05 0.05

se ele vende se ele vende ate dois produtos em um dia, ele ganha umacomissao de 10, 00$ por produto vendido

a partir da terceira venda, a comissao passa para 50, 00$ por produto.

Qual e o numero medio de produtos vendidos por cada vendedor equal a comissao media de cada um deles?

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 200 / 294

Page 201: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Esperanca de uma variavel aleatoria

Caculo da probabilidadeExemplo: Esperanca matematica

O numero medio de vendas por funcionario e

E(P ) = 0× 0.1 + 1× 0.4 + 2× 0.2+

3× 0.1 + 4× 0.1 + 5× 0.05+

6× 0.05 = 2.05

(16)

com relacao a comissao temos a seguinte funcao de probabilidade

Numero de produtos 0 1 2 3 4 5 6

Probabilidade de Venda 0.1 0.4 0.2 0.1 0.1 0.05 0.05Comissao C 0 10 20 70 120 170 220

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 201 / 294

Page 202: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Esperanca de uma variavel aleatoria

Calculo da probabilidadeEsperanca de Funcoes de uma Variavel Aleatoria

Definicao

Seja X uma variavel aleatoria discreta com funcao de distribuicao deprobabilidade fX(x). Se definimos uma nova v.a. Y = g(X), entao

E(Y ) = E(g(X)) =∑x

g(x)fX(x) =

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 202 / 294

Page 203: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Esperanca de uma variavel aleatoria

Calculo da probabilidadeExemplo: Esperanca de Funcoes de uma Variavel Aleatoria

Considere o experimento maximo das faces de um dado. Calcule E(X2)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 203 / 294

Page 204: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Esperanca de uma variavel aleatoria

Calculo da probabilidadePropriedades da esperanca matematica

Seja X e uma variavel aleatoria discreta com funcao de probabilidade fX(x)e a, b 6= 0 sao constantes reais quaisquer.

E(a) = a

E(X + a) = E(X) + a

E(bX) = bE(X)

xmin 6 E(X) 6 xmax

xmin e xmax sao os valores mınimo e maximo da variavel X

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 204 / 294

Page 205: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Esperanca de uma variavel aleatoria

Caculo da probabilidadeVariancia de uma variavel aleatoria

Definicao

A variancia de uma variavel aleatoria X e definida como

Var(X) = E(X − E(X))2

O termo X − E(X) representa o desvio em torno da media.

Sendo assim, a variancia e a media dos desvios quadraticos em tornode E(X).

vejamos como se calcula a variancia. Seja g(X) = (X − E(X))2,entao Var(X) = E(g(X)) =

∑x(X − E(X))2fX(x)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 205 / 294

Page 206: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Esperanca de uma variavel aleatoria

Caculo da probabilidadeVariancia de uma variavel aleatoria

Desenvolvendo o quadrado e usando as propriedades do somatorio eda esperanca, tem-se

Var(X) =∑x

x2 − 2xE(X) + [E(X)]2

fX(x) =

=∑x

x2fX(x)− 2E(X)∑x

xfX(x) + [E(X)]2∑x

fx(X) =

=∑x

x2fX(x)− 2E(X)E(X) + [E(X)]2 × 1 =

=∑x

x2fX(x)− 2[E(X)]2 + [E(X)]2 =

=∑x

x2fX(x)− [E(X)]2

(17)dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 206 / 294

Page 207: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Esperanca de uma variavel aleatoria

Caculo da probabilidadeVariancia de uma variavel aleatoria

Mas, se definimos h(X) = X2, entao E[h(X)] =∑

x x2fX(x). Logo,

podemos escreverVar(X) = E(X2)− [E(X)]2

Desvio-padrao de uma variavel aleatoria

O desvio-padrao de uma variavel aleatoria X e definido como a raizquadrada de sua variancia

DP(X) =√

Var(X)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 207 / 294

Page 208: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Esperanca de uma variavel aleatoria

Caculo da probabilidadePropriedades da variancia e do desvio-padrao

V ar(X) 6 0

DP (X) 6 0

V ar(a) = 0; DP (a) = 0

V ar(X + b) = V ar(X)

DP (X + b) = DP (X)

V ar(bX) = b2V ar(X)

DP (X) = |b|DP (X)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 208 / 294

Page 209: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeDistribuicao uniforme discreta

Suponha que seu professor de Estatıstica decida dar de presente a umdos alunos um livro de sua autoria.

Decide sortear aleatoriamente o ganhador, dentre os 45 alunos daturma

Para isso, ele enumera os nomes dos alunos que constam do diario declasse de 1 a 45.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 209 / 294

Page 210: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeDistribuicao uniforme discreta

Definicao

A variavel aleatoria discreta X, que assume os valores x1, x2,..., xn, temdistribuicao uniforme se

fX(xi) = P (X = xi) =1

n∀i = 1, 2, ..., n

valor esperado/ media/ esperanca matematica

E(X) =1

nx1 +

1

nx2 + ...+

1

nxn

VarianciaVar(X) = E(X − E(X))2 =1

n(x1 − x)2 +

1

n(x2 − x)2 + ...+

1

n(xn − x)2 = σX

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 210 / 294

Page 211: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeExemplo:Distribuicao uniforme discreta

Os defeitos em determinada maquina ocorrem aproximadamente na mesmafrequencia. Dependendo do tipo de defeito, o tecnico leva 1, 2, 3, 4 ou 5horas para consertar a maquina

(a) Descreva o modelo probabilıstico apropriado para representar aduracao do tempo de reparo da maquina.

(b) Qual e o tempo medio de reparo desta maquina? E o desvio-padraodeste tempo de reparo?

(c) Sao 15 horas e acaba de ser entregue uma maquina para reparo. Ajornada normal de trabalho do tecnico termina as 17 horas. Qual e aprobabilidade de que o tecnico nao precise fazer hora extra paraterminar o conserto desta maquina?

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 211 / 294

Page 212: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Solucao

Seja T = “tempo de reparo, em horas”.

(a) Como os defeitos ocorrem na mesma frequencia, o modeloprobabilıstico apropriado e uma distribuicao uniforme:

t 1 2 3 4 5

fT (t) 15

15

15

15

15

(b) E(T ) =1 + 2 + 3 + 4 + 5

5= 3 horas

(c) Var(T ) =12 + 22 + 32 + 42 + 52

5− 9 = 2⇒ DP(T ) = 1, 41 horas

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 212 / 294

Page 213: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeDistribuicao de Bernoulli

Considere o lancamento de uma moeda. A caracterıstica de talexperimento aleatorio e que ele possui apenas dois resultadospossıveis

Uma situacao analoga surge quando da extracao da carta de umbaralho, em que o interesse esta apenas na cor (preta ou vermelha)da carta sorteada.

Experimento de Bernoulli

Um experimento de Bernoulli e um experimento aleatorio com apenasdois resultados possıveis; por convencao, um deles e chamado ”sucesso”eo outro, ”fracasso”.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 213 / 294

Page 214: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeDistribuicao de Bernoulli

Variavel aleatoria de Bernoulli

A v.a. de Bernoulli e a v.a. X associada a um experimento deBernoulli,em que se define

X =

1 se sucesso ocorre

0 se fracasso ocorre

Chamando de p a probabilidade de sucesso (0 < p < 1), a distribuicao deBernoulli e

x 0 1

fX(x) 1− p p

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 214 / 294

Page 215: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

A funcao de distribuicao acumulada e dada por:

FX(x) =

0 se x < 0

1− p se 0 6 x < 1

1 se x > 1

Valor esperadoE(X) = 0× (1− p) + 1× p = p

VarianciaVar(X) = E(X2)− [E(X)]2 = p− p2 = p(1− p)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 215 / 294

Page 216: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeDistribuicao Binomial

Motivacao

Um dado e lancado 3 vezes de forma independente. Qual aprobabilidade de obter a face 5 duas vezes?

Denotando Ω como sendo sucesso (obter face 5 num lancamento)e Fcomo sendo fracasso, o espaco amostral pode ser representado porΩ =(SSS), (SSF ), (SFS), (FSS), (SFF ), (FSF ), (FFS), (FFF ).Vamos considerar a variavel aleatoria X: numero de sucessos nos treslancamentos, sendo p = P (S) e q = 1− p = P (F ) em cadalancamento.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 216 / 294

Page 217: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 217 / 294

Page 218: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Portanto, a funcao de probabilidade da variavel aleatoria X: numerode sucessos nos tres lancamentos fica dada por

x 0 1 2 3

fX(x) q3 3pq2 3p2q p3

Assim, a funcao de probabilidade de X pode ser expressa na forma(3

x

)px(1− p)(3−x)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 218 / 294

Page 219: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeDistribuicao Binomial

Variavel aleatoria binomial

Para um experimento binomial consistindo em n repeticoes independentesde um experimento de Bernoulli com parametro p, defina a variavelaleatoria

X = ”numero de sucessos”

Entao, X tem distribuicao binomial com parametros n e p, cuja funcao dedistribuicao de probabilidade e dada por

fX(x) = P (X = x) =

(n

x

)px(1− p)(n−x) x = 0, 1, 2...n

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 219 / 294

Page 220: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeDistribuicao Binomial: Esperanca e Variancia

Pode-se mostrar que

X ∼ bin(n, p)⇒

E(X) = np

Var(X) = np(1− p)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 220 / 294

Page 221: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeExemplo: Distribuicao Binomial

Um atirador acerta, na mosca do alvo, 20% dos tiros. Se ele da 10 tiros,qual a probabilidade de ele acertar na mosca no maximo uma vez?

Podemos pensar os tiros como experimentos de Bernoulli independentes, emque o sucesso e acertar no alvo e a probabilidade de sucesso e 0.20. Entao,o problema pede P (X ≤ 1), em que X =numero de acertos em 10 tiros.Logo, X ∼ bin(10; 0.20) e

P (X ≤ 1) = P (X = 0) + P (X = 1)

=

(10

0

)(0.20)0(0.80)10 +

(10

1

)(0.2)1(0.8)9 = 0, 37581

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 221 / 294

Page 222: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Caculo da probabilidadeDistribuicao Geometrica

Definicao

Suponha que X representa o numero de ensaios independentes ate aocorrencia do primeiro sucesso que ocorre com probabilidade p. A funcaode probabilidade de X fica dada por

P (X = x) = p(1− p)(x−1)

em que x = 1, 2, ... Denotamos X ∼ G(p). E um exemplo de variavelaleatoria discreta com um numero enumeravel de valores.

Valor esperado

E(X) =1

pVariancia

V ar(X) =1− pp2

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 222 / 294

Page 223: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Caculo da probabilidadeExemplo: Distribuicao Geometrica

Joga-se um dado equilibrado. Qual e a probabilidade de serem necessarios10 lancamentos ate a primeira ocorrencia de um seis?

Solucao

Nesse caso, sucesso e a ocorrencia de face seis. Logo, Pr(sucesso)=p =1

6

e Pr(fracasso)=1− p =5

6

Seja X = numero de lancamentos ate primeiro seis. Entao X ∼ G(1

6)

P (X = 10) =(5

6

)9(1

6

)= 0.03230

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 223 / 294

Page 224: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Caculo da probabilidadeDistribuicao binomial negativa

A distribuicao binomial negativa e uma generalizacao da distribuicao geometrica.Onde X = numero de repeticoes necessarias ate a obtencao do r-esimo su-cesso. r ≥ 1-esimo

Dito de outra forma, a distribuicao binomial negativa numero de repeticoesnecessarias ate a obtencao do r-esimo sucesso.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 224 / 294

Page 225: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Caculo da probabilidadeDistribuicao binomial negativa

Um experimento que apresenta uma distribuicao binomial negativa satisfazas seguintes condicoes :

O experimento consiste de uma sequencia de tentativasindependentes;

Cada tentativa apresenta apenas dois resultados: sucesso ou fracasso;

A probabilidade de sucesso permanece constante em todas astentativas;

O experimento continua ate que um total de ”r”sucessos sejamobservados, onde ”r”e um valor inteiro maior do que um, fixado deantemao.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 225 / 294

Page 226: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeDistribuicao binomial negativa

Definicao

Em um processo de Bernoulli, a variavel e denominada binomial negativa,quando X refere-se ao numero de repeticoes independentes necessariaspara que um certo numero de ”sucessos”ocorram. A funcao deprobabilidades e dada por :

P (X = x) =

(x− 1

r − 1

)pr(1− p)k−1 x > k

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 226 / 294

Page 227: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeDistribuicao binomial negativa

A funcao acumulada de probabilidades e dada por:

FX(x) =

0 se x < r

∑xk=r

(k−1r−1

)pr(1− p)k−r se x ≥ r

Valor esperado

E(X) =r

p

Variancia

Var(X) =r(1− p)p2

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 227 / 294

Page 228: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeExemplo: Distribuicao binomial negativa

Joga-se um dado equilibrado. Qual e a probabilidade de serem necessarios10 lancamentos ate a terceira ocorrencia de um seis?

SolucaoNeste caso, sucesso e a ocorrencia da face seis. Logo Pr(sucesso)=1

6 ePr(fracasso)=1− p = 5

6

SejaX = numero de lancamentos ate terceiro seis. Entao X ∼ BinNega(3, 16)

P (X = 10) =

(9

2

)(5

6

)7(1

6

)3= 0, 046514.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 228 / 294

Page 229: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeExemplo: Distribuicao binomial negativa

Considere-se um conjunto de N elementos, r dos quais tem uma determi-nada caracterıstica (r ≤ N) e N − r nao tenham esta caracterıstica.

Extraı-se n elementos (n ≤ N) sem reposicao. Seja X a variavel aleatoriaigual ao numero de elementos que possuem a caracterıstica entre os n reti-rados.

X e denominada de variavel aleatoria hipergeometrica.

As probabilidades de uma variavel aleatoria hipergeometrica podem ser ava-liadas por:

P (X = x) =

(rx

)(N−rn−x

)(Nn

)dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 229 / 294

Page 230: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeDistribuicao hipergeometrica: Esperanca e Variancia

Valor esperado

E(X) = nr

NVariancia

V ar(X) = nr

N

N − rN

N − nN − 1

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 230 / 294

Page 231: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeDistribuicao hipergeometrica: Esperanca e Variancia

Entre os 16 programadores de uma empresa, 12 sao do sexo masculino.A empresa decide sortear 5 programadores para fazer um curso avancadode programacao. Qual e a probabilidade dos 5 sorteados serem do sexomasculino?

solucao

Sucesso = sexo masculino. Se X = numero de homens sorteados, entaoX ∼ hiper(16; 12; 5) e o problema pede:

P (X = 5) =

(125

)(165

) = 0.181319

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 231 / 294

Page 232: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Calculo da probabilidadeDistribuicao de Poisson

Distribuicao discreta de probabilidade aplicavel a ocorrencias de um eventoem um intervalo especificado.

Exemplo

clientes chegando ao caixa de um supermercado.

acidentes com automoveis em uma determinada estrada

Numero de carros que chegam a um posto de gasolina

Numero de avioes sequestrados em um dia.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 232 / 294

Page 233: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Relacao entre variaveis

1 Conceitos

2 Exemplos

3 Tipos de relacao4 Medidas de associacao

Variaveis QuantitativasVariaveis Qualitativas

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 233 / 294

Page 234: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Relacao entre variaveisConceitos

Medidas de associacao

As medidas de associacao referem-se a uma ampla variedade decoeficiente que medem o grau de associacao da relacao entrevariaveis.

Estas medidas de associacao podem ser descritas de varias maneirasdependendo do tipo de analise.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 234 / 294

Page 235: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Relacao entre variaveisExemplos

Podemos estar interessado em analisar a relacao entre o numero demortes devido ao cancro do pulmao e a condicao de fumante (se oindivıduo fuma ou nao).

Podemos estar interessado na relacao entre a pressao arterial dopaciente e a quantidade de medicamento que o paciente toma por dia.

Existe uma relacao entre a temperatura, medida em graus Fahrenheit,e as vendas de sorvete?

Por exemplo, pode ser importante analisar a relacao entre a idade emanos e a altura em metros.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 235 / 294

Page 236: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Relacao entre variaveisTipos de relacao

Unilateral:y depende de x (ou x depende de y).

Figura 4: Relacao unilateral

ex.:o preco de venda dum producto (y) depende da distancia entre olocal de producao e o local de venda (x).

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 236 / 294

Page 237: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Relacao entre variaveisTipos de relacao

Bilateral ou interdependencia:y depende de x e x depende de y.

Figura 5: Relacao bilateral

ex.: relacao entre peso e altura dum indivıduo.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 237 / 294

Page 238: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Relacao entre variaveisTipos de relacao

Dependencia indirecta ou associacao espuria:y e x saoinfluenciados por outra(s) variavel(is).

Figura 6: Relacao espuria

ex.: relacao entre o numero anual de insolacao e producao anual detrigo. Causa comum: temperatura.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 238 / 294

Page 239: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Relacao entre variaveisMedidas de associacao: Variaveis quantitativas

Covariancia e correlacao

Propriedades de correlacao

Exemplo

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 239 / 294

Page 240: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Medidas de associacao: Variaveis quantitativasCovariancia e correlacao

Seja (x1, y1), . . . , (xn, yn): conjunto de dados bivariados.

Grafico de dispersao (Scatter plot): representacao grafica dos pares(xı, yı), ı = 1, . . . , n.

Figura 7: Exemplo Scatter plot

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 240 / 294

Page 241: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Medidas de associacao: Variaveis quantitativasCovariancia e correlacao

1 Covariancia entre x e y:medida de variacao conjunta (ousimultanea) de x e y em relacao as suas medias.

cov(x, y) =1

n− 1

n∑ı=1

(xı − x)(yı − y), −∞ < cov(x, y) < +∞

Obs:cov(x, y) = cov(y, x) e cov(x, x) = var(x).

2 Coeficiente de correlacao linear de Person (r)

corr(x, y) = r =cov(x, y)

sxsy=

1n−1

∑nı=1(xı − x)(yı − y)

sxsy

sendo que sx e sy denotam o desvio-padrao de x e y respectivamente.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 241 / 294

Page 242: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Medidas de associacao: Variaveis quantitativasPropriedades

1 O coeficiente de correlacao de pearson (r) mede somente o grau deassociacao linear entre variaveis quantitativas;

2 −1 ≤ r ≤ 1

3 r = −1 se e somente se a relacao entre x e y for negativa linearperfeita;

4 r = 1 se e somente se a relacao entre x e y for positiva linear perfeita;

5 Corr(X,Y ) = Corr(Y,X)

6 O coeficiente de correlacao nao depende da escala de medida. Mesmoadicionando, subtraindo, multiplicando ou, o valor de r se mantem.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 242 / 294

Page 243: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Medidas de associacao: Variaveis quantitativasCovariancia e correlacao

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 243 / 294

Page 244: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Medidas de associacao: Variaveis quantitativasCoeficiente de correlacao: Classificacao

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 244 / 294

Page 245: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Medidas de associacao: Variaveis quantitativasCoeficiente de correlacao: Classificacao

Regra de ouro

Antes de calcular e tentar interpretar o coeficiente de correlacao entreduas variaveis, construa um diagrama de dispersao. Nao esqueca que ocoeficiente de correlacao so mede a intensidade com que duas variaveis seassociam linearmente, pelo que se a representacao grafica nao sugere aexistencia de associacao linear, nao faz sentido proceder com o seu calculo.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 245 / 294

Page 246: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Medidas de associacao: Variaveis quantitativasCoeficiente de correlacao: Classificacao

Obs: r = 0 nao significa ausencia de associacao.

Figura 8: Simetria em x e y

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 246 / 294

Page 247: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Medidas de associacao: Variaveis quantitativasCoeficiente de correlacao: Exemplo 12

Considere os seguintes dados

Figura 9: Tabela de observacoesdr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 247 / 294

Page 248: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Coeficiente de correlacacao usando SPSS

Example (Comandos SPSS para grafico de dispersao)

GRAPH

/SCATTERPLOT(BIVAR)=x WITH y

/MISSING=LISTWISE.

Example (Comandos SPSS para coeficiente de correlacao e covariancia)

CORRELATIONS

/VARIABLES=x y

/PRINT=TWOTAIL NOSIG

/STATISTICS XPROD

/MISSING=PAIRWISE.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 248 / 294

Page 249: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Medidas de associacao: Variaveis quantitativasCoeficiente de correlacao: Exemplo

Figura 10: Scatter plot

O grafico sugere a existencia duma relacao linear entre x e y.dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 249 / 294

Page 250: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Medidas de associacao: Variaveis quantitativasCoeficiente de correlacao: Exemplo 12

Estatısticas descritivasn = 11x = 9.0y = 7.5sx = 3.32sy = 2.03

cov(x, y) =

∑nı=1(xı − 9)(yı − 7.5)

11− 1= 5.501

corr(x, y) =cov(x, y)

sxsy=

5.501

3.32× 2.03= 0.816

correlacao linear positiva forte entre x e y, i.e., y tende a aumentarcom aumento em x.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 250 / 294

Page 251: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Analise de Regressao

1 Analise de Regressao: Uma metodologia estatıstica que utiliza arelacao estatıstica entre duas ou mais variaveis quantitativas de formaque uma variavel (variavel resposta) possa ser estimada ou previstaatraves de outras variaveis (variaveis explicativas)

2 E uma tecnica largamente usada em economia, ciencias sociais,ciencias biomedicas entre outras.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 251 / 294

Page 252: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Analise de Regressao

Exemplo de aplicacao incluem:

1 As vendas de um produto podem ser previstas utilizando a relacaoentre as vendas e o volume de gastos com publicidades

2 Rendimento de cultura pode ser prevista utilizando a profundidademedia sazonal de lencol freatico.

3 Caudal anual pode ser prevista utilizando a precipitacao anual.

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 252 / 294

Page 253: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Relacao funcional vs. Relacao estatıstica

Relacao funcional

Relacao funcional entre duas (ou mais) variaveis e expressa por umaformula matematica:

Y = f(X)

onde f(.) e uma funcao conhecida. Exemplos: Y = 2X ou Y = X2 dadoX,Y e determinado (conhecido) completamente

Relacao estatıstica

Numa relacao estatıstica, as variaveis sao de natureza aleatoria, i.e,variaveis que tem associado uma distribuicao de probabilidade.

Y = f(X) + ε

onde ε representa o erro cometido ao se usar f(X) para aproximar Y .Notacao: X e a variavel independente (predictora); Y e a variaveldependente (resposta).dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 253 / 294

Page 254: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Exemplo 14: Relacao funcional vs. Relacao estatıstica

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 254 / 294

Page 255: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Modelo de Regressao Linear Simples

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 255 / 294

Page 256: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Pressupostos do Modelo de Regressao Linear

Um experimento aleatorio e repetido n vezes em condicoes identicas. Emcada ensaio i = 1, 2, ..., n o valor de Xi

’e determinado (conhecido) e o valor de Yi observado. Usamos um modelode regressao linear simples da forma:

Yi = β0 + β1Xi + εi (18)

1 Os valores de Xi sao fixos ou conhecido a prior

2 Yi e uma variavel contınua e aleatoria3 β0 e β1 sao parametros do modelo, o que significa que sao

DesconhecidosConstantes, nao aleatoriosIndependentes do numero do ensaio i

4 Sobre o termo de erro (ε)Nao e observavelMedia igual a zeroPossue variancia constante (ou homoscedasticidade)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 256 / 294

Page 257: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Pressupostos do Modelo de Regressao Linear

1 Pressupostos adicionais sobre o termo de erro (ε)

εi ∼ N(0, σ2) para todo iPara dois ensaios diferentes i e j, εi e εj sao indepedndentes →cov(εi, εj) = 0, cov=covariancia

De (1) e (2), resulta a equacao de regressao linear simples estimada:

Y = β0 + β1X (19)

onde Y e o valor estimado (ou previsto) para a observacao i; β0 e β1

sao estimadores nao enviesados de β0 e β1

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 257 / 294

Page 258: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Metodo dos Mınimos Quadrados para Estimacao dosParametros do Modelo

1 Idea: encontrar β0 e β1 que minimizem a soma do quadrado doserros (SQR)

2 Para cada par (Xi, Yi), o termo de erro e dado por:

εi = Yi − Yi = Yi − (β0 + β1Xi)

ε2i = [Yi − Yi]2 = [Yi − (β0 + β1Xi)]2

3 Somando para todas as observacoes

Q(β0, β1) =

n∑i=1

[Yi − (β0 + β1Xi)]2 (20)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 258 / 294

Page 259: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Metodo dos Mınimos Quadrados para Estimacao dosParametros do Modelo

1 Resolvendo a equacao (20), temos:

β1 =

∑ni=1(Xi − X)(Yi − Y )∑n

i=1(Xi − X)2=SXY

SXX(21)

ou β1 =

∑ni=1XY − nXY∑ni=1X

2 − nX2

β0 = Y − β1X, Y =1

n

n∑i=1

Yi, X =1

n

n∑i=1

Xi (22)

onde SXY e chamado de soma de quadrados de produtos cruzados eSXX e a soma de quadrados de X

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 259 / 294

Page 260: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Exemplo 15

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 260 / 294

Page 261: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Exemplo 15Year Runoff(Y) Precipitation(X) XY X2 Y 2

1928 125 110 13750 12100 156251929 67 73 4891 5329 44891930 68 74 5032 5476 46241931 71 91 6461 8281 50411932 118 108 12744 11664 139241933 144 130 18720 16900 20736

......

......

......

1941 58 84 4872 7056 33641942 79 85 6715 7225 62411943 124 115 14260 13225 153761944 62 70 4340 4900 38441945 87 91 7917 8281 7569∑

1799 1801 192042 189291 197373

Media 99.94444 100.0555556

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 261 / 294

Page 262: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Exemplo 15

1 Para estes dados:∑ni=1XY = 192042; nXY = 18× 99.94× 100.06 = 179999.94;∑ni=1X

2 = 189291; nX2 = 18× 100.062 = 180216.06

2 β1 =

∑ni=1XY − nXY∑ni=1X

2 − nX2=

192042− 18× 99.94× 100.06

189291− 18× 100.062= 1.325

3 β0 = Y − β1X = 99.94− 1.325× 100.6 = −32.64

4 Conhecidos β0 e β1, podemos escrever a equacao de regressaoestimada:

Yi = −32.591 + 1.325Xi

5 Podemos pensar em Yi como a media estimada da variavel respostapara Xi = x

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 262 / 294

Page 263: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Exemplo 15

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 263 / 294

Page 264: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Estimcao da Variancia

1 O valor de Q(β0, β1) denota-se por Soma de Quadrados dos Erros(SQE). Ou seja SQE representa a soma de quadrados dos desviosentre Y e Y

2 O SQE indica-nos quao bem bem a linha de regressao se ajusta aosdados

SQE = Q(β0, β1) =

n∑i=1

(Yi − Yi)2 =

n∑i=1

e2i (23)

onde ei e designado por resıduo

3 Notacao: ei = (Y − Yi) e a diferenca entre o valor observado eestimado (previsto). Podemos pensar em ei como um estimador dotermo de erro εi

4 como σ2 e a variancia comum dos ε1, ε2, ..., εn e porque e1, e2, ..., enestima os εi entao SQE deve providenciar alguma informacao sobreσ2

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 264 / 294

Page 265: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Estimcao da Variancia

De facto, SQE tem associado n − 2 graus de liberdade. Dois graus deliberdade usados para estimar β0 e β1 na determinacao da media estimadaYi. Desta forma, a media de SQE tambem chamada de quadrado medio edado pela formula:

s2 = QM =SQE

n− 2(24)

que e estimador nao enviesado de σ2, onde QM significa quadrado medio

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 265 / 294

Page 266: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Inferencia dos Parametros do Modelo

1 Inferencia baseada na distribuicao normal:

f(Y, µ, σ2) =1√2πσ

exp

[−1

2

(Y − µσ

)2]

2 εi ∼ iid N(0, σ2), i.e, termo de erro e identica e independentementedistribuido de acordo com uma distribuicao normal com media 0 evariancia constante σ2

3 Inferencia baseada no Teorema do Limite Central

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 266 / 294

Page 267: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Inferencia para β1

1 Na maioria dos problemas nos estamos interessados em β1. Porque?β1 = 0→ Nao ha associacao linear entre X e Y .

2 Avaliacao por meio de duas tecnicas relacionadas

Testes de hipotesesIntervalos de confianca

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 267 / 294

Page 268: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Teste de Hipotese para β1

Procedimentos

1 Definicao de hipoteses e nıvel de significanciaH0 : β1 = c vs. H1 : β1 6= c

2 Encontrar valores crıticos do teste usando distribuicao tn−2

3 Calcular a estatıstica do teste

T =β1 − β1

s(β1)∼ tn−2 (25)

4 Comparar os valores T com os valores crıticos:

Se |T | 6 t1−αn ,n−2 → Nao rejeite a hipotese nulaSe |T | > t1−αn ,n−2 → Rejeite a hipotese nula

5 Comparar o valor de p-value e nıvel de significancia, α

p-value = P (T > |t|)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 268 / 294

Page 269: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Intervalo de Confianca para β1

O intervalo com 100(1− α)% de confianca para β1 e dado por

β1 ± t1−αn,n−2s(β1) (26)

β ± t1−αn,n−2

√( MSE∑(Xi − X2)

)β1 − t1−α

n,n−2s(β1) ≤ β1 ≤ β1 + t1−α

n,n−2s(β1)

onde s(β1)e erro padrao de β1

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 269 / 294

Page 270: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Teste de Hipotese para β0

Procedimentos

1 Definicao de hipoteses e nıvel de significanciaH0 : β0 = c vs. H1 : β0 6= c

2 Encontrar valores crıticos do teste usando distribuicao tn−2

3 Calcular a estatıstica do teste

T =β0 − β0

s(β0)∼ tn−2 (27)

4 Comparar os valores T com os valores crıticos:

Se |T | 6 t1−αn ,n−2 → Nao rejeite a hipotese nulaSe |T | > t1−αn ,n−2 → Rejeite a hipotese nula

5 Comparar o valor de p-value e nıvel de significancia, α

p-value = P (T > |t|)

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 270 / 294

Page 271: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Intervalo de Confianca para β0

O intervalo com 100(1− α)% de confianca para β0 e dado por

β0 ± t1−αn,n−2s(β0) (28)

β0 − t1−αn,n−2s(β0) ≤ β0 ≤ β0 + t1−α

n,n−2s(β0)

onde s(β0) e erro padrao de β0

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 271 / 294

Page 272: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Coeficiente de Correlacao e Determinacao, R2

1 Medida que descrever o grau de associacao linear entre X e Y2 SQT mede a variabilidade quando estimamos a media de Y e X nao

consta do modelo → Da mesma forma que SQE mede a variacao emY quando o modelo de regressao utiliza a variavel explicativa X

3 Qual o efeito de X na variabilidade em Y ?

R2 =SQT − SQE

SQT=SQR

SQT= 1− SQE

SQT(29)

4 R2 e chamado de coeficiente de determinacao e mede a proporcao davariacao total em Y que e explicada pela recta de regressao linearcom X como variavel explicativa

5 Porque 0 ≤ SQE ≤ SQT entao 0 ≤ R2 ≤ 1. No caso de um perfeitoajuste da recta de regressao, SQE = 0 e R2 = 1 (β1 6= 0)

6 Em pratica 0 < R2 < 0 e quando mais proximo estiver de 1, maior e ograu de associacao linear entre X e Y

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 272 / 294

Page 273: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Coeficiente de Correlacao e Determinacao, R2

1 O coeficiente de determinacao e o quadrado do coeficiente decorrelacao linear, r, que mede o grau de associacao linear entre X e Y

r = ±√R2

onde o sinal de r depedende do sinal de β1

2 β1 e r estao relacionados da seguinte maneira:

r =s(X)

s(Y )β1

onde s(X) e s(Y ) desvio-padrao de X e Y , respectivamente

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 273 / 294

Page 274: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

Exempo 17 Coeficiente de Correlacao e Determinacao

1 Para o caso do exemplo anterior, onde X: Precipitacao (rainfall) e YCaudal:SQR = 15951.16 e SQT = 17572.94

R2 =SQR

SQT=

15951.16

17572.94= 0.908

2 Desta forma, cerca de 90.8% da variacao total do vulome de aguaque escorre a partir da superficie e explicada pela equacao deregressao estimada tendo precipitacao como variavel explicativa

3 O coeficiente de correlacao linear: r = ±√R2 = +

√0.908 = 0.953

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 274 / 294

Page 275: dr. Rachid Muleia, Msc in Statistics · 2020. 7. 21. · E preciso que se tenha em mente o m etdo que ser a usado para a resolu˘c~ao do problema Visto que a escolha do m etodo depende

Toeria de probabilidades Distribuicoes de probabilidades

The End

dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 275 / 294