Upload
others
View
9
Download
0
Embed Size (px)
Citation preview
Probabilidades e Estatıstica
dr. Rachid Muleia, Msc in Statistics
Instituto Superior de Transportes e Comunicacoes
28 de Outubro de 2016
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 1 / 294
Conteudo
1 IntroducaoInformacoes historicasConceitos basicosAs etapas do metodo estatıstico
2 Estatısticas DescritivasFormas de representacao tabular e graficaMedidas de LocalizacaoMedidas de separatiz
3 Toeria de probabilidadesVariaveis aleatoriasFuncao de probabilidadeFuncao de distribuicaoEsperanca de uma variavel aleatoriaDistribuicoes de probabilidades
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 2 / 294
Bibliografia recomendada
Reis, E. (2008). Estatıstica Descritiva. 7ªEdicao.Edicoes Silabo
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 3 / 294
Bibliografia recomendada
Carreira, A. Pinto, Goncalo. (2002). Calculo da probabilidade.INSTITUTO PIAGET
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 4 / 294
Introducao
Introducao
Definicao
Pode-se definir Estatıstica como sendo o ramo da matematica aplicadaque fornece metodos para a recolha, organizacao, descricao, analise einterpretacao de dados para melhor se tirar decisoes sobre um dadofenomeno ou acontecimento.
A estatıstica e de uma larga importancia uma vez que e necessariapara a compreensao de fenomenos que ocorrem em diversas areas doconhecimento (Ex: Biologia, Agricultura, Ciencias Sociais,Engenharia, etc.
No estudo da Estatıstica, o termo ”estatıstica”e utilizado para referirdois conceitos diferentes, conforme se utiliza no singular ou no plural.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 5 / 294
Introducao Informacoes historicas
IntroducaoInformacoes historicas
A origem da palavra Estatıstica esta associada a palavra latinaSTATUS (Estado).
Ha indıcios de que 3000 anos A.C. ja se faziam censos na Babilonia,China e Egito e ate mesmo o 4ºlivro do Velho Testamento.
”Fazei o recenseamento de toda a comunidade dos filhos de Israel, deacordo com suas casas patriarcais: todos aqueles que tem de vinte anospara cima, aptos para o servir no exercito de Israel”:Numeros 26:2
Na epoca do Imperador Cesar Augusto, saiu um edito para que sefizesse o censo em todo o Imperio Romano. Por isso Maria e Joseteriam viajado para Belem.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 6 / 294
Introducao Informacoes historicas
IntroducaoConceitos basicos
A Estatıstica esta dividida em duas partes, nomeadamente: Estatıstica Des-critiva e Estatıstica Inferencial.
1 Estatıstica Descritiva: Consiste na recolha de dados numericosatraves da criacao de instrumentos adequados: tabelas, graficos eindicadores numericos.
Univariada: resumir ou descrever o conjunto de dados referentes a umaunica variavel.Bivariada ou multivariada: relacao entre duas ou mais variaveis
2 Estatıstica Inferencial: consiste de procedimentos para fazergeneralizacoes sobre as caracterısticas de uma populacao a partir dainformacao contida na amostra.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 7 / 294
Introducao Conceitos basicos
IntroducaoConceitos basicos
Os metodos de Inferencia Estatıstica permitem:
1 estimar as caracterısticas desconhecidas de uma populacao (porexemplo, a proporcao de consumidores que preferem uma dada marcade detergentes)
2 testar se determinadas hipoteses sobre essas caracterısticasdesconhecidas sao plausıveis (Ex, se a afirmacao de um vendedor deque os resultados de imagem da marca que vende sao superiores aosde outras marcas concorrentes).
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 8 / 294
Introducao Conceitos basicos
IntroducaoPopulacao, Amostra e Unidade Estatıstica
1 Populacao: conjunto de unidades individuais, que podem serpessoas, animais ou objectos com uma ou mais caracterısticas emcumum na qual o pesquisador tem interesse em analisar.
2 Amostra: o subconjunto retirado da populacao, que se supoe serrepresentativo de todas as caracterısticas da mesma, sobre o qual serafeito o estudo, com o objectivo de serem tiradas conclusoes validassobre a populacao.
3 Unidade estatıstica: cada elemento da populacao sobre a qualincide o experimento/estudo.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 9 / 294
Introducao Conceitos basicos
IntroducaoPopulacao, Amostra e Unidade Estatıstica
Na estatıstica, na maioria das vezes usa-se a amostra e nao a populacaopara se estudar um determinada fenomeno. Mas porque estudar a amostrae nao a populacao no seu todo?
custo alto para obter informacao da populacao toda
tempo muito longo para obter informacao da populacao toda
algumas vezes impossıvel, por exemplo, estudo de poluicaoatmosferica
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 10 / 294
Introducao Conceitos basicos
IntroducaoExemplos que nos levam a estudar a amostra
Quando se cozinha um certo molho nao e necessario provar todomolho para saber se o molho esta bom ou nao.
Assim como, quando se vai ao hospital para se fazer um exame desangue, o tecnico de laboratorio nao precisa tirar todo sangue parasaber se o paciente esta enfermo ou nao.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 11 / 294
Introducao Conceitos basicos
IntroducaoConceitos basicos:Variavel, Dados, Parametro e Estimativa
1 Variavel: toda caracterıstica que e observada em uma unidadeexperimental.
2 Dados: Informacoes obtidas em uma unidade experimental (numericaou nao).
3 Parametro: Valor que resume informacao relativa a uma variavel napopulacao.
4 Estimativa: e uma estatıstica que e utilizada para inferir um valor deum parametro desconhecido em um modelo estatıstico.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 12 / 294
Introducao Conceitos basicos
IntroducaoExemplo 1: populacao, amostra, unidade estatıstica
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 13 / 294
Introducao Conceitos basicos
IntroducaoConceitos basicos: variaveis e classificacao
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 14 / 294
Introducao Conceitos basicos
IntroducaoConceitos basicos: variaveis e classificacao
1 Variaveis qualitativas – quando os valores de uma determinadacaracterıstica em estudo sao expressos por atributos, qualidades ouainda por categorias.
As variaveis qualitativas nominais- sao caracterizadas por dados que seapresentam apenas sob aspecto qualitativo.As variaveis qualitativas ordinais - sao caracterizadas por categoriasque apresentam uma ordenacao natural.
2 Variavel quantitativa – quando seus valores sao expressos emnumeros, os quais podem ser obtidos atraves de uma contagem oumensuracao
Variaveis quantitativas Discretas-quando so pode assumir valorespertencentes a um conjunto enumeravel.Variaveis quantitativas Continuas -quando pode assumir, teoricamenteum valor qualquer dentro de um intervalo.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 15 / 294
Introducao Conceitos basicos
IntroducaoExemplo 2: variaveis e classificacao
Variaveis qualitativas nominais: sexo, raca e resultado de um teste
Variaveis qualitativas ordinais: Nıvel escolaridade e conceito dequalidade.
Variaveis quantitativas Discretas: idade dos alunos de uma escola,numeros de filhos de um determinado casal, numero de parafusosdefeituosos numa linha de producao.
Variaveis quantitativas Continuas: altura, peso, comprimento,salario de operarios de uma determinada empresa
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 16 / 294
Introducao Conceitos basicos
IntroducaoConceitos basicos: Observacao
Observacao
O facto de uma variavel ser expressa por numeros nao significa que elaseja necessariamente quantitativa, por que a classificacao da variaveldepende do modo como foi medida, e nao do modo como se manifesta.Por exemplo, para a variavel peso de um lutador de boxe, se for anotado opeso marcado na balanca, a variavel e quantitativa continua; por outrolado, se esse peso for classificado segundo as categorias do boxe, a variavele quantitativa ordinal
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 17 / 294
Introducao As etapas do metodo estatıstico
As etapas do metodo estatıstico
Identi-ficacao doproblema
Recolhade Dados
Crıticados
Dados Apre-sentacao
dosDados
Analise einterpre-
tacao dosDados
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 18 / 294
Introducao As etapas do metodo estatıstico
Etapas do metodo estatısticoIdentificacao do problema
A aplicacao do metodo estatıstico depende da identificacao clara doproblema, isto e, do que se pretende resolver.
E preciso que se tenha em mente o metdo que sera usado para aresolucao do problema
Visto que a escolha do metodo depende do tipo de informacao quesera recolhida.
A identificacao clara do problema tambem possibilita saber que tipode informacao se deve recolher.
Uma identificacao incorreta do problema torna todas etapas seguintesinuteis.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 19 / 294
Introducao As etapas do metodo estatıstico
Etapas do metodo estatısticoRecolha de Dados
Apos a identificacao do problema a fase a seguir consiste na recolha dedados. O processo de recolha de dados deve garantir o seguinte:
Nao perca tempo recolhendo algo que nao vai usar, isto e recolhaapenas informacao necessaria.
Recolha informacao que lhe ajudara a resolver o seu problema.
Ademais, recolha dados tao completos quanto possıveis
No processo de recolha de dados, temos duas dois tipos de dados:
1 Dados primarios: sao aqueles que sao especificamente recolhidospara o estudo em questao.
2 Dados secundarios: aqueles que ja foram recolhidos, tabulados,ordenados e, muitas vezes, ate analisados, com propositos outros aode atender as necessidades da pesquisa em andamento, e que estaocatalogados a disposicao dos interessados.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 20 / 294
Introducao As etapas do metodo estatıstico
Etapas do metodo estatısticoRecolha de Dados
Todos os dados de inqueritos feitos directamente a uma populacaosao dados primarios
Podemos ainda considerar como dados primarios todos os dadosdisponıveis nas estatısticas publicadas pelo INE( Instituto Nacional deEstatıstica)
Numero de nascimentos, casamentos e obitos de dada regiao no ano de1991.O numero de desempregados em um determinado sector de actividadeeconomica.
Dados Secundarios sera por exemplo uma estimativa da esperanca devida a nascenca da populacao mocambicana no ano 2016 com basenos valores observados nos ultimos 10 anos ou a taxa de inflacao parao ano 2018.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 21 / 294
Introducao As etapas do metodo estatıstico
Etapas do metodo estatisticoCrıtica dos dados
Um dos primeiros e mais importantes passos em qualquer tarefa de proces-samento de dados e verificar se os seus valores de dados estao correctosou, no mınimo, estao de acordo com alguns um conjunto de regras. Porexemplo:
A variavel genero espera-se que tome dois valores apenas;
A altura em centımetros espera-se que esteja dentro de limitesrazoaveis.
Nao basta so recolher os dados, quer sejam dados primarios ou secundariose preciso fazer uma limpeza antes da analise. Esta etapa consiste em:
Identificar dados incompletos ou incorrectos;
Eliminar erros capazes de produzir decisoes erroneas.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 22 / 294
Introducao As etapas do metodo estatıstico
Etapas do metodo estatısticoApresentacao dos dados
Apos a recolha e crıtica dos dados, convem organizar os dados de maneirapratica e racional, para um melhor entendimento do fenomeno que se pre-tende estudar.
Aqui comeca o principal objectivo da Estatıstica Descritiva.
Criar instrumentos necessarios para classificar e apresentar conjuntode dados numericos de tal forma que a informacao neles contida sejaapreendida facilmente.
Existem varios instrumentos para a apresentacao de dados: Tabelas,graficos, medidas de tendencia central, etc
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 23 / 294
Introducao As etapas do metodo estatıstico
Etapas do metodo estatsticoAnalsie e interpretacao dos resultados
Apos a apresentacao dos dados e preciso interpretar os dados
A interpretacao estara mais tanto facilitada quando se estiveremescolhido, em etapas anteriores, instrumentos mais apropriados eanalise do tipo de dados recolhido.
Nesta etapa por vezes chega-se a conclusoes enviesadas, que podemser de forma propositada ou nao.
O enviesamento propositado tem a vista a satisfazer alguns fins, taiscomo polıticos. Daı que podemos ter duas informacoes diferentes paraum mesmo problema reportados pois duas organizacoes diferentes.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 24 / 294
Estatısticas Descritivas
Apresentacao dos dados
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 25 / 294
Estatısticas Descritivas
Apresentacao dos dados: Tabelas e GraficosTabelas
O sucesso na utilizacao de dados estatısticos depende em grandeparte do modo como os dados sao apresentados.
Quando nos deparamos com grandes massas de dados naoclassificados torna-se difıcil classifica-los
E preciso proceder um trabalho previo de ordenacao
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 26 / 294
Estatısticas Descritivas
Apresentacao dos dados: Tabelas e GraficosTabelas
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 27 / 294
Estatısticas Descritivas
Apresentacao dos dados: Tabelas e GraficosTabelas
Definicao
Tabela: e um quadro que resume um conjunto de observacoes.
As tabelas assim como os como graficos devem apresentar tres partes :ocabecalho, o corpo e o rodape.
o cabecalho deve dar-nos a informacao sobre os dados, em queconsiste e a que ser referem(lugar e epoca).
o corpo e apresentado por colunas e sobcolunas dentro das quais seapresentam os dados.
No rodape para alem da identificacao da fonte dos dados, poderaoainda incluir-se quaisquer fontes pertinentes.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 28 / 294
Estatısticas Descritivas
Apresentacao dos dados: Tabelas e GraficosExemplo: Apresentacao de dados em Tabelas
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 29 / 294
Estatısticas Descritivas
Apresentacao dos dados: Tabelas e GraficosGraficos
Uma imagem vale mais que mil palavras. Confucio
A representacao grafica tem por finalidade dar uma ideia, a maisrepresentacao grafica possıvel dos resultados obtidos permitindo chegar aconclusoes rapidas sobre a evolucao do estudo ou sobre relacao entrediferentes valores apresentados.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 30 / 294
Estatısticas Descritivas
Apresentacao dos dados: Tabelas e GraficosGrafico de Linhas
Grafico de linha
Um grafico de linhas exibe uma serie como um conjunto de pontosconectado por uma unica linha. As linhas de grafico sao usadas pararepresentar grandes quantidades de dados que ocorrem em um perıodo detempo contınuo.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 31 / 294
Estatısticas Descritivas
Apresentacao dos dados: Tabelas e GraficosGrafico de Linhas
O grafico de linhas geralmente e usado para representar variasquantitativas que se observam ao longo do tempo.
Graficos de linhas sao ideais para exibir tendencias ao longo do tempo.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 32 / 294
Estatısticas Descritivas
Apresentacao dos dados: Tabelas e GraficosGrafico de barras
Um grafico de barras e uma forma de resumir um conjunto de dados ca-tegoricos (variavel qualitativa).
Mostra os dados utilizando um numero de barras com mesma largura.
Cada uma das barras representa uma categoria particular
A altura de cada barra e proporcional a uma agregacao especıfica.
O grafico de barras constroi-se colocando os valores da variavel em ob-servacao no eixo horizontal e as respectivas frequencias (absolutas ou rela-tivas) no eixo vertical.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 33 / 294
Estatısticas Descritivas
Apresentacao dos dados: Tabelas e GraficosGrafico de barras
Os graficos de barras tambem nos permitem fazer comparacoes multiplasde duas ou mais variaveis
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 34 / 294
Estatısticas Descritivas
Apresentacao dos dados: Tabelas e GraficosGrafico de barras
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 35 / 294
Estatısticas Descritivas
Apresentacao dos dados: Tabelas e GraficosExercıcio: Grafico de barras
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 36 / 294
Estatısticas Descritivas
Apresentacao dos dados: Tabelas e GraficosGrafico de sectores ou diagrama circular
O grafico de sectores consiste na representacao grafica de um circulo,divido em sectores.
E utilizando quando se pretende comparar cada parte com o total.
Para se construir divide-se o circulo em sectores, cujas areas saoproporcionais aos valores das partes.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 37 / 294
Estatısticas Descritivas
Apresentacao dos dados: Tabelas e GraficosGrafico de sectores ou diagrama circular
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 38 / 294
Estatısticas Descritivas
Apresentacao dos dados: Tabelas e GraficosExercıcio: Grafico de sectores
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 39 / 294
Estatısticas Descritivas
Distribuicao de frequencias
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 40 / 294
Estatısticas Descritivas
Distribuicao de frequencias
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 41 / 294
Estatısticas Descritivas
Frequencia absoluta simples: numero de vezes que cadamodalidade/ou observacao da variavel se repete na amostra ou napopulacao.
Frequencia relativa(fri) de um valor da variavel e dada porfin
, isto e
o numero de vezes que esse valor ocorre relativamente ao total.
As frequencias acumuladas sao a soma do numero(frequenciasabsolutas acumuladas) ou proporcoes (frequencias acumuladasrelativas) de ocorrencias para valores inferiores ou iguais ao valordado.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 42 / 294
Estatısticas Descritivas
Distribuicao de frequenciasExemplo : distribuicao de frequencias para variavel quantitativa discreta
A distribuicao de frequencias do numero de erros cometidos por umadatilografa apresenta-se da seguinte maneira.
Tabela 1: Distribuicao de frequencias do numero de erros
Xi fi fri Fi Fri
0 10 0.10 10 0.101 15 0.15 25 0.252 25 0.25 50 0.503 40 0.40 90 0.904 10 0.10 100 1.00Total 100 1.00
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 43 / 294
Estatısticas Descritivas
Distribuicao de frequenciasExemplo : distribuicao de frequencias para variavel quantitativa discreta
A tabela mostra que 10 paginas nao tinham nenhum erro;
40 paginas foram encontradas com 3 erros;
As frequencias acumuladas nos mostram que 50% do total daspaginas datilografadas tinham no maximo 2 erros.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 44 / 294
Estatısticas Descritivas
Distribuicao de frequenciasDistribuicao de frequencias para variaveis quantitativas
As variaveis continuas por poderem tomar um numero infinito denao-numeravel de valores,
Figura 1: Pedaco extraıdo de Reis(2008)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 45 / 294
Estatısticas Descritivas
Distribuicao de frequenciasDistribuicao de frequencias para variaveis quantitativas
Embora nao exista uma formula cientifica exacta para o calculo de numerode classes, o processo de construcao de classes deve obedecer algumas re-gras:
Em geral o numero de classes devera estar compreendido entre 4 e 14.
Nenhuma classe devera ter frequencia nula.
As classes deverao ter, sempre que possıvel, amplitudes iguais;
Os pontos medios da classe deverao ser de calculo facil.
As classes abertas deverao sempre ser evitadas, embora nem sempre epossıvel.
Os limites da classe sao definidos de modo a que cada valor e incluidonuma so classe.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 46 / 294
Estatısticas Descritivas Formas de representacao tabular e grafica
Tabelas de Distribuicao e Frequencias
1 Elementos de uma tabela de distribuicao de frequencias:
frequencias simples/absolutas (fi)Frequencia absoluta acumulada (Fi)
frequencia relativa absoluta fri =fin
Frequencia relativa acumulada Fri =Fi
n2 Procedimentos para construcao de uma tabela de distribuicao de
frequencias
Determinar Amplitude Total (At): At = Xmax −Xmin
Determinar o numero de classes (k): k = d√ne ou Sturges:
k = d1 + 3.322log(n)e, se n 6 25 k = 5
Determinar Amplitude do Intervalo de Classe (h): h =
⌈At
k
⌉Definicao das classes e suas respectivas frequencias (veja o exemplo)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 47 / 294
Estatısticas Descritivas Formas de representacao tabular e grafica
Exemplo 8: Tabelas de Distribuicao de Frequencias
Tabela 2: Dados brutos: Precipitacao media mensal de 2012, Moc.
9.2 41 56.3 63.4 67 78.8 116.1 122.9 243.423.9 41 56.3 63.4 67 78.8 116.1 122.9 243.423.9 44.6 56.3 63.4 67 78.8 116.1 122.9 243.423.9 44.6 56.3 65.3 67 80.9 116.1 130.5 243.423.9 45.3 56.3 65.3 67 84.1 116.1 135.1 243.423.9 45.4 56.3 65.3 67 84.2 116.1 135.1 243.423.9 47.3 56.3 65.3 67 84.2 116.1 135.1 243.424.9 48.6 56.3 65.3 72.1 94.4 116.4 135.1 26524.9 49.7 56.6 65.3 72.1 94.4 116.4 135.1 26524.9 52.7 56.6 65.3 77 94.4 116.4 135.125.2 52.7 60.4 65.3 77 94.4 116.4 135.135.3 52.7 60.4 65.3 77 94.4 116.4 135.135.3 52.7 60.4 67 77 94.4 116.4 135.140.2 52.7 60.4 67 77 98.9 116.4 135.140.2 55.8 60.4 67 78.4 107.8 118.4 135.140.2 55.8 63.1 67 78.4 109.6 121.9 243.4
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 48 / 294
Estatısticas Descritivas Formas de representacao tabular e grafica
Exemplo 8: Tabelas de Distribuicao de Frequencias
1 At = Xmax −Xmin = 265− 9.2 = 255.8
2 k = d√
137e = d11.70e = 12
3 h =
⌈AT
k
⌉=
⌈255.8
12
⌉= 22
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 49 / 294
Estatısticas Descritivas Formas de representacao tabular e grafica
Exemplo 8: Tabelas de Distribuicao de Frequencias
i Classes fi Fi fri Fri1 9.2 ` (9.2+ 22)=31.2 11 11 0.080292 0.0802922 31.2 ` (31.2+ 22)=53.2 21 32 0.153285 0.2335773 53.2 ` 75.2 41 73 0.29927 0.5328474 75.2 ` 97.2 20 93 0.145985 0.6788325 97.2 ` 119.2 18 111 0.131387 0.8102196 119.2 ` 141.2 16 127 0.116788 0.9270077 141.2 ` 163.2 0 127 0 0.9270078 163.2 ` 185.2 0 127 0 0.9270079 185.2 ` 207.2 0 127 0 0.927007
10 207.2 ` 229.2 0 127 0 0.92700711 229.2 ` 251.2 8 135 0.058394 0.98540112 251.2 ` 273.2 2 137 0.014599 1
total 137
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 50 / 294
Estatısticas Descritivas Medidas de Localizacao
Representacao grafica das distribuicoes de frequenciasVariavel quantitativa discreta
Para presentar a distribuicao de frequencias relativas para umavariavel discreta utiliza-se o grafico de barras ou o diagramadiferencial.
Figura 2: Distribuicao de frequencias para numero de erros
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 51 / 294
Estatısticas Descritivas Medidas de Localizacao
Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua
A representacao grafica adequada para este tipo de variaveis e ohistograma.
O histograma e um grafico, formado por uma sucessao de rectangulosadjacentes, tendo cada um por base um intervalo de classe e umaarea igual (ou proporcional) a frequencia relativa (ou absoluta) dessaclasse.
Ao contrario do grafico de barras,em que estas estao separadas e emque a altura de cada barra e o mais relevante, no histograma as barras(rectangulos) estao juntas e o que e importante e a area de cada uma.
Considerando, entao, para areas das barras as frequencias relativas,vemos que a area total ocupada pelo histograma e igual a 1 ou 100%
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 52 / 294
Estatısticas Descritivas Medidas de Localizacao
Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma
Tabela 3: Distribuicao de frequencias
Classes fi fr h = fr/c
[130, 135[ 7 0.14 0.028[135, 140[ 9 0.18 0.036[140, 145[ 11 0.22 0.044[145, 150[ 14 0.28 0.056[150, 155[ 5 0.1 0.020[155, 160[ 4 0.08 0.016
Total 50 1
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 53 / 294
Estatısticas Descritivas Medidas de Localizacao
Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma
No histograma ao lado, a area dorectangulo mais a esquerda e igual a5×0,028=0,14; a area do rectanguloseguinte e 5×0,036=0,18 e assimsucessivamente, donde a area totaldo histograma e igual a 1 (soma dasfrequencias relativas).
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 54 / 294
Estatısticas Descritivas Medidas de Localizacao
Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma
No histograma ao lado, a area dorectangulo mais a esquerda e iguala 5×0,14; a area do rectangulo se-guinte e 5×0,18 e assim sucessiva-mente, donde a area total do histo-grama e igual a 5 (=5× 1 onde 1 ea soma das frequencias relativas).
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 55 / 294
Estatısticas Descritivas Medidas de Localizacao
Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma
No histograma ao lado, a area dorectangulo mais a esquerda e igual a5×7; a area do rectangulo seguinte e5×9 e assim sucessivamente, dondea area total do histograma e igual a250 (=5×50, onde 50 e a soma dasfrequencias absolutas).
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 56 / 294
Estatısticas Descritivas Medidas de Localizacao
Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma
A imagem transmitida tem sempre o mesmo aspecto.
As areas dos rectangulos ou sao iguais as frequencias relativas, ou saoproporcionais, com a mesma constante de proporcionalidade,que eigual a amplitude de classe no caso do segundo histograma ou aamplitude de classe vezes o numero de dados, no caso do terceirohistograma
O eixo vertical so serve como auxılio para a construcao dosrectangulos, nao transmitindo, no caso do histograma, qualquerinformacao relevante:
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 57 / 294
Estatısticas Descritivas Medidas de Localizacao
Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma
Observacao
Nao devemos perder de vista que o histograma representa os dadosatraves das areas das barras e nao das alturas, o que constitui umagrande diferenca relativamente ao grafico de barras.
Outra grande diferenca e que no histograma as barras estao juntas,para transmitir a ideia de continuidade da variavel em estudo,enquanto no grafico de barras estas sao separadas.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 58 / 294
Estatısticas Descritivas Medidas de Localizacao
Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma
Caso as amplitudes das classes seja diferente e preciso normalizar aaltura do histograma de mod que esta seja proporcional a area domesmo.
Tabela 4: Distribuicao de frequencias da duracao das chamadas telefonicas
Classes fI fr
[0, 2[ 28 0.28[2, 5[ 37 0.37[5, 10[ 23 0.23[10, 20[ 9 0.09[20, 30[ 3 0.03
100
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 59 / 294
Estatısticas Descritivas Medidas de Localizacao
Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma
Se usarmos as frequencias relativas directamente, teremos umarepresentacao errada do histograma
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 60 / 294
Estatısticas Descritivas Medidas de Localizacao
Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma
Considerando as alturas correctas, temos o seguinte histograma:
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 61 / 294
Estatısticas Descritivas Medidas de Localizacao
Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma
Uma forma alternativa de apresentar dados quantitativos contınuos eusando o polıgono de frequencias, que se obtem unindo os pontosmedios dos topos dos rectangulos com segmentos de rectas.
A area sobre o histograma deve ser igual a area sobre o polıgono defrequencias.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 62 / 294
Estatısticas Descritivas Medidas de Localizacao
Representacao grafica das distribuicoes de frequenciasVariavel quantitativa contınua: histograma
Figura 3: Histograma e polıgono de frequenciasdr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 63 / 294
Estatısticas Descritivas Medidas de Localizacao
Medidas de tendencia central: Media
O objectivo das medidas de tendencia central e descrever ou sumariar oconjunto de dados atraves de um valor apenas.
Media
E a medida de tendencia central mais usada para descrever resumidamenteuma distribuicao de frequencias. Todavia, ha varios tipos de medias quesao usados de acordo com cada objectivo.
1 Media Aritimetica
2 Media Geometrica
3 Media Harmonica
4 Media Quadratica
O valor a escolher depende da caracterıstica dos dados
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 64 / 294
Estatısticas Descritivas Medidas de Localizacao
Media Aritmetica
A media aritmetica simples:
x =x1 + x2 + · · ·+ xn
n=
∑ni=1 xin
(1)
A media aritmetica ponderada:Dados nao agrupados
x =w1x1 + w2x2 + · · ·+ wnxn
n=
∑ni=1wixi∑ni=1wi
(2)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 65 / 294
Estatısticas Descritivas Medidas de Localizacao
Media aritimeticaExemplo 3: Dados nao agrupados
Tabela 5: Preco das T-shirts em Euros
Modelo Preco
Simples 4.9Madona 9.9Julio Iglesias 7.6Springsteen 7.6David Bowie 8.4Maradona 7.8
X =4.9 + 9.9 + 7.6 + 7.6 + 8.4 + 7.8
6= 7.70
Este valor e referente ao preco medio das T-shirts, mas se o quantidade deT-shirts vendida o valor do prec medio sera diferente.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 66 / 294
Estatısticas Descritivas Medidas de Localizacao
Media aritimeticaExemplo 4: Dados agrupados
Tabela 6: Media dos precos das T-shirts vendidas
ModeloPreco do
modelo Xi
Quantidadevendida fi
Preco × QuantidadeXi · fi
Simples 4.90 15 73.50Madona 9.90 5 49.50Julio Iglesias 7.60 10 76.00Springsteen 7.60 8 60.80David Bowie 8.40 6 50.40Maradona 7.80 6 46.80
Total∑
=50∑
= 357.00
X =
∑ni=1Xi · fi∑n
i=1 fi=
357.00
50= 7.14
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 67 / 294
Estatısticas Descritivas Medidas de Localizacao
Media Aritmetica
Para dados agrupados em classe a media aritimetica pode ser calculada combase na seguinte formula:
x = x0 + c
∑ni=1 d
′fin
(3)
Onde,
d′ =x0 − xi
cx0 sera igual ao ponto medio da classe de maior frequencia, se onumero de classes for par, ou o ponto medio da classe intermediaria,se o numero de classes for ımpar.
c sera igual a amplitude do intervalo de classe.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 68 / 294
Estatısticas Descritivas Medidas de Localizacao
Exemplo
Aplicando a formula, a media sera igual a: x = x0 + c
∑ni=1 d
′fin
= 79.5
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 69 / 294
Estatısticas Descritivas Medidas de Localizacao
Media aritimetiaExemplo 6:metodo alternativo para dados agrupados em classe
Tabela 7: Calculo da media usando o ponto medio
Classes fi Fi Ponto medio Xi
[5–25[ 4 4 15=5 + 25
2[25–45[ 6 10 35[45–65[ 14 24 55[65–85[ 26 50 75[85–105[ 14 64 95[105–125[ 8 72 115[125–145[ 6 78 135[145–165[ 2 80 155
X =
∑8i=1Xi · fi∑8
i=1 fi=
6360
80= 79.5
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 70 / 294
Estatısticas Descritivas Medidas de Localizacao
Algumas propriedades da media aritimetica
A soma algebrica dos desvios tomados em relacao a media e nula:∑ni=1(xi − x)
Somando-se (ou subtraindo-se) uma constante (c) de todos os valoresde uma variavel, a media do conjunto fica aumentada (ou diminuıda)dessa constante: yi = xi + c⇒ Y = X + c
Multiplicando-se (ou dividindo-se) todos os valores de uma variavelpor uma constante (c), a media do conjunto fica multiplicada (oudividida) por essa constante: yi = xi × c⇒ Y = X × c
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 71 / 294
Estatısticas Descritivas Medidas de Localizacao
Media Geometrica
Media geometrica
A media geometrica de n valores e definida, genericamente, como a raizn-esima do produto de todos eles.
1 Media geometrica simples
n√x1 · x2 · x3 · · ·xn (4)
2 Media geometrica Ponderada
n
√xf11 · x
f22 · x
f33 · · ·x
fnn (5)
A media geometrica se aplica apenas a numeros positivos a fim de evitar ocalculo do produto de um numero negativo que poderia resultar em numerosimaginarios.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 72 / 294
Estatısticas Descritivas Medidas de Localizacao
Aplicacoes da media geometrica
Aplicacao
A media geometrica e mais apropriada que a media aritmetica paradescrever crescimentos proporcionais, tanto crescimento exponencial(proporcao constante de crescimento) e crescimento variado.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 73 / 294
Estatısticas Descritivas Medidas de Localizacao
Exemplo
Vamos considerar um aumento sucessivo de salarios de 15% noprimeiro mes, 12% no segundo mes e 21% no terceiro mes.
Vamos determinar a media geometrica dos dos aumentos.
Primeiro devemos determinar as taxas percentuais.15%12%21%
=
1.151.121.21
(6)
3√
1.15 · 1.12 · 1.21 = 1.1594
O valor 1.1594 corresponde a taxa media de 15.94%
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 74 / 294
Estatısticas Descritivas Medidas de Localizacao
Media harmonica
Media harmonica
Em situacoes onde a proporcionalidade inversa esteja presente eaconselhavel o calculo da media harmonica. Por exemplo, quandoestudamos fenomenos como a velocidade media, o custo medio debens comprados com uma quantia fixa.
A media harmonica e o inverso da media aritimetica dos inversos dosvalores observados.
O calculo da media harmonica e com base na seguinte formula (Dadossimples):
xM =n
1x1
+ 1x2
+ · · ·+ 1xn
(7)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 75 / 294
Estatısticas Descritivas Medidas de Localizacao
Media harmonica
A media harmonica para dados agrupados e calculada com base na seguinteformula:
xM =n
f11x1
+ f21x2
+ · · ·+ fn1xn
=
∑ni=1 fi∑n
i=i fi1xi
(8)
onde n e fi representam as o numero total de observacoes e frequencias aabsolutas simples, respectivamente.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 76 / 294
Estatısticas Descritivas Medidas de Localizacao
Exemplo: Media harmonica
Um aviao voa tres distancias iguais a uma velocidade de 300, 400, e300 milhas/hora.
Calcule a velocidade media com que o aviao percorreu a distanciatotal.
Neste caso acoselha-se a utilizacao da media harmonica por se tratarde uma distancia fixa percorrida em velocidades diferentes
xM =3
1300 + 1
400 + 1300
= 327.27milhas/hora
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 77 / 294
Estatısticas Descritivas Medidas de Localizacao
Mediana
Mediana
E definido como o valor da variavel que ocupa a posicao central nasucessao das observacoes ou na distribuicao de frequencias.
O numero de observacoes para valores que lhe sao inferiores e igualao numero de observacoes para valores que lhe sao superior.
Antes de achar a mediana e preciso ordenar os dados em ordemcrescente ou decrescente).
1 Caso N seja ımpar a mediana sera o elemento central(de ordemN + 1
22 Se o N for par, sera a media entre os elementos centrais (de ordemN
2eN + 2
2)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 78 / 294
Estatısticas Descritivas Medidas de Localizacao
Exemplo: MedianaCalculo da mediana para valores discretos
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 79 / 294
Estatısticas Descritivas Medidas de Localizacao
Exemplo: MedianaCalculo da mediana para valores discretos
Como N = 42 e par, a mediana sera a media entre os valores
correspondentes aos elementos de ordemN
2eN + 2
2, ou seja 21 e
22dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 80 / 294
Estatısticas Descritivas Medidas de Localizacao
MedianaCalculo da mediana para dados agrupados em classe
Quando os dados estiverem agrupados em classe, o calculo usando a formula:
Md = Li(Md) +N2 − Fant
fMdc (9)
Li(Md)- limite inferior da classe mediana.
c- amplitude da classe mediana.
Fant-frequencia acumulada ate a classe anterior a classe mediana.
fMd-frequencia simples da classe mediana
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 81 / 294
Estatısticas Descritivas Medidas de Localizacao
Exemplo: MedianaCalculo da mediana para dados agrupados em classe
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 82 / 294
Estatısticas Descritivas Medidas de Localizacao
Exemplo: MedianaCalculo da mediana para dados agrupados em classe
Calcula-seN
2= 29.
Identificar a classe mediana [55, 65[
Calcula-se a mediana utilizando a formula:
55 +29− 17
18× 10 = 61.67
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 83 / 294
Estatısticas Descritivas Medidas de Localizacao
MedianaCaracterısticas importantes da mediana
1 A mediana e facil de calcular e de compreender.
2 Nao e afectada por valores extremos.
3 E uma medida muito utilizada, sobretudo para distribuicoesfortemente assimetricas.
4 Para fins de inferencia a estatıstica, a mediana nao satisfazpropriedades de um bom estimador.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 84 / 294
Estatısticas Descritivas Medidas de Localizacao
Moda
A moda e o valor que ocorre com maior frequencia em uma serie devalores.
O calculo da mediana e facil quando os dados estiverem ordenados.
Podes entretanto, encontrar uma serie de dados sem moda. Este tipode distribuicao de dados chama-se amodal.
Moda para dados nao agrupados.
Quando se lida com valores nao agrupados, a moda e facilmente reconhe-cida: basta, de acordo com a definicao, procurar o valor que mais se repete.
A serie de dados: 7, 8, 9, 10, 10, 10, 11, 12, 13, 15; tem moda igual a 10
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 85 / 294
Estatısticas Descritivas Medidas de Localizacao
ModaCaculo da moda para dados agrupados em classe
Existem varios metodos de determinacao da moda. Mas para o nosso es-tudo, iremos determinar a moda usando o metodo de King.
Mo = l + cfpost
fant + fpost(10)
onde,
l- limite inferior da classe modal.
c -amplitude do intervalo de classe modal.
fant-frequencia simples da classe adjacente anterior a classe modal.
fpost-frequencia simples da classe posterior a classe modal
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 86 / 294
Estatısticas Descritivas Medidas de Localizacao
ModaDeterminacao grafica da moda
A moda podera ser determinada graficamente, para tal e necessario construiro histograma da distribuicao, identificar a classe modal e fazer a seguinteconstrucao.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 87 / 294
Estatısticas Descritivas Medidas de Localizacao
Outras medidas de tendencia central: Media aparada
A media aparada e calculado pela ”descartar”uma certa percentagemde valores maiores e menores de um conjunto de dados.
Por exemplo, a media aparada de 10% encontra-se, eliminando a 10%das observacoes menores e 10% das observacoes maiores, e depoiscalcula-se a media dos restantes valores.
Por exemplo, considere o seguinte conjunto de dados.
5, 4, 6, 7, 8, 10, 11, 0, 7, 18
a media aparada de 10% sera
X =4 + 5 + 6 + 7 + 7 + 0 + 10 + 11
8= 7.25
a media aparada de 20% sera
X =5 + 6 + 7 + 7 + 0 + 10
6= 7.1667
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 88 / 294
Estatısticas Descritivas Medidas de Localizacao
Media aparadaCaracterısticas
Diferentemente da media aritmetica,a media aparada e menos sensıvela valores extremos.
Embora a media aparada seja menos sensıvel, ela nao se assemelha amediana que e praticamente insensıvel a valores extremos.
A media aparada tem vantagem sobre a media, pois, para alem de sermenos insensıvel a valores extremos, ela usa mais observacoes do quea mediana.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 89 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de separatiz:Quartis, Decis e PercentisQuartis
Os quartis sao os valores da variavel que dividem a distribuicao defrequencias em quatro partes iguais.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 90 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de separatiz:Quartis, Decis e PercentisQuartis
O primeiro quartil Q1, sera um valor da variavel tal que o numero deobservacoes para valores inferiores sera 25%, e superiores,75%.
O segundo quartil Q2 e igual a mediana. Este divide a distribuicao emduas partes iguais.
O terceiro quartil Q3 sera um valor da variavel tal que a sua esquerdaconcentram-se 75% das observacoes e a sua direita as restantes 25%.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 91 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de separatiz:Quartis, Decis e PercentisQuartis
O calculo dos quartis e similar ao calculo da mediana.
Ordene os dados em ordem crescente.
Calcule o ındice i, a posicao do p-esimo quartil sera:
i =(p
4
)n
Se i nao e inteiro arredonde por excesso. O p-esimo quartil sera ovalor na posicao i
Caso i seja inteiro, o p-esimo quartil sera a media aritmetica dosvalores na posicao i e i+ 1.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 92 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de separatiz:Quartis, Decis e PercentisExemplo: Quartis
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 93 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de separatiz:Quartis, Decis e PercentisDecis e Percentis
Os decis sao valores da variavel que dividem a distribuicao em dezpartes iguais enquanto que os percentis dividem em 100 partes iguais.
O numero de decis e de percentis sera 9 e 99, respectivamente.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 94 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de separatiz:Quartis, Decis e PercentisDados agrupados em classe
Caso os dados estejam agrupados em classe, o calculo de Quartis,Decis e Percentis e feito usando as seguintes formulas:
Qp = l + cnp4 − Fant
fQp(11)
Dp = l + cnp10 − Fant
fDp(12)
Cp = l + cnp100 − Fant
fCp(13)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 95 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de separatiz:Quartis, Decis e PercentisExercıcio
a) Calcule o primeiro quartil e o percentil 25.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 96 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao absoluta
Podemos definir a estatıstica como uma ciencia que lida comvariabilidade.
Sem variabilidade nao faz sentido a existencia da estatıstica
Por exemplo, se numa turma todos tivessem a mesma idade, naohaveria necessidade de calcular a media .
Se numa empresa todos tivessem o mesmo salario, nao se perderiatempo em procurar uma medida que possa condensar a informacao nadistribuicao de dados
As medidas de dispersao servem para verificar a representatividadedas medidas de localizacao
Ademais, podemos ter dois conjuntos de dados com mesma media,desta forma nao sendo suficiente a media para descrever o conjuntode dados.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 97 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao absoluta
Ambas distribuicoes tem mesma media µx = µy = 20
Porem, os valores de X nao apresentam nenhuma variacao em tornoda media.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 98 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao absolutaAmplitude Total
A primeira medida de dispersao e a amplitude total
E a diferenca entre o valor maximo e mınimo da variavel.
At = Xmax −Xmin
Se os dados estiverem agrupados em classe, podemos calcular aamplitude da seguinte maneira:
At =Ponto medio da ultima classe – ponto medio da primeira classe.At =Limite superior da ultima classe – limite inferior da primeira classe
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 99 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao absolutaAmplitude Total
O uso da amplitude total tem como desvantagem o facto de ter emconta apenas os dois valores extremos que a variavel toma.
A parte isso, a amplitude total h insensıvel a valores intermedios.
Exemplo: Considere a amostra 4, 6, 1, 2, 3, 3
At = 1− 6 = 4
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 100 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao absolutaAmplitude Interquartil
Uma outra medida de dispersao e a amplitude do intervalointerquartis ou simplesmente amplitude interquartil.
Esta e definida como a diferenca entre o terceiro e o primeiro quartil
Corresponde ao intervalo que engloba 50% das observacoes.
IQ = Q3 −Q1
Tem a desvantagem de nao ser influenciado por metade dos valoresobservados.
Esta medida deve ser utilizada para distribuicoes assimetricas uma vezque nao e afectada por valores extremos.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 101 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao absolutaExemplo: Amplitude Interquartil
IQ = 219− 146 = 73euros
50% das observacoes centrais apresentam uma variacao de preco de73 euros
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 102 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao absolutaVariancia
A variancia e a mediada de variabilidade que utiliza todos os dados. Avariancia e baseada na diferenca entre o valor de cada observacao(xi) e a media. A diferenca entre cada valor de xi e a media, echamada de desvio em relacao a media.
Dados nao agrupados Dados agrupados
Populacao σ2 =
∑ni=1(xi − µ)2
Nσ2 =
∑ni=1(xi − µ)2fi
N
Amostra s2 =
∑ni=1(xi − x)2
n− 1s2 =
∑ni=1(xi − x)2fi
n− 1
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 103 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao absolutaVariancia
No caculo da variancia podemos dividir a soma dos desvios por n− 1ou n, isto e
s2 =
∑ni=1(xi − x)2
n− 1(14)
ou
s2 =
∑ni=1(xi − x)2
n(15)
A formula 15 produz valores viciados para amostras pequenas.
Para amostras grandes as duas formulas produzem valoresaproximadamente iguais.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 104 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao absolutaVariancia
A partir do grafico podemos ver que a medida que o tamanho daamostra aumenta as diferencas entre as formulas 14 e 15 saominusculas.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 105 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao absolutaDesvio-padrao
Uma vez que a variancia e expressa em unidades ao quadrado o quetorna difıcil a sua interpretacao, recorre-se ao desvio padrao que edefinido como sendo a raiz quadrada positiva da variancia:
desvio-padrao amostral s = +√s2
desvio-padrao amostral σ = +√σ2
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 106 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao absolutaExemplo: Desvio-padrao
Considere a seguinte amostra: 1, 3, 2, 2, 4
Temos que∑ni=1 xi = 1 + 3 + 2 + 2 + 4 = 12,
∑ni=1 x
2i = 12 + 32 + 22 + 22 + 42 = 34
Daı que
s2 =
∑ni=1(xi − x)2
n− 1=
34− 122/5
4= 1.3
s =√
1.3 = 1.1042
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 107 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao absolutaDesvio-padrao
E a medida de dispersao mais utilizada. As suas propriedadesmatematicas tornam-no particularmente apropriado em situacoes deinferencia estatıstica.
O desvio-padrao e uma medida de dispersao afectada por todosvalores, portanto, qualquer alteracao nestes provoca uma alteracao noprimeiro.
O seu valor pode ser fortemente influenciado por valores extremos.Por essa razao,a sua utilizacao e menos aconselhada em distribuicoesaltamente assimetricas.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 108 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao relativaCoeficiente de dispersao e variacao
Todas medidas de dispersao apresentadas ate agora, sao medidas dedispersao absoluta.
Portanto, nao sao validas para comparacao da dispersao de duasdistribuicoes, sobre tudo quando estas estao em unidades de medidasdiferentes.
o coeficiente de variacao e uma medida relativa de dispersao quemede o grau de concentracao de valores em torno da media, em valorpercentual.
CV =s
x× 100
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 109 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao relativaCoeficiente de dispersao e variacao
Eis algumas regras empıricas para a interpretacao do coeficiente de variacao:
Rule of thumb ou ”regra do polegar”
Se CV < 15% tem-se baixa dispersao.
Se 15% 6 CV < 30% tem-se media dispersao.
Se CV > 30%tem-se elevada dispersao.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 110 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de dispersao relativaExemplo
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 111 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de Assimetria
A forma mais simples de medir o grau de assimetria de umadistribuicao consiste na comparacao de tres medidas de tendenciacentral.
Numa distribuicao simetrica temos que x = Mo = Me
Quando a media > mediana> moda, temos uma distribuicaoassimetrica positiva.
No caso inverso- media 6 mediana6 moda, temos uma distribuicaoassimetrica negativa
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 112 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de Assimetria
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 113 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de Assimetria
Existem varias formulas para o calculo do coeficiente de assimetria, dentreelas sao uteis:
1ºCoeficiente de assimetria de PearsonAS =x−Mo
s
2ºCoeficiente de assimetria de PearsonAS =Q1 +Q3 − 2Me
Q3 −Q1
Rule of thumb
Se AS = 0 diz-se que a distribuicao e simetrica.
Se AS > 0 diz-se que a distribuicao e assimetrica positiva.
AS < 0, diz-se que a distribuicao e assimetrica negativa.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 114 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de achatamento ou kurtosis
Entende-se por kurtosis o grau de achatamento de uma distribuicao.
Estas medidas dao uma indicacao da intensidade das frequencias navizinhanca dos valores centrais.
Como referencia ao grau de achatamento podemos ter: distribuicaoleptocurtica, mesocurtica e platicurtica.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 115 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de achatamento ou kurtosis
Para medir o grau de kurtosis pode ser utilizada a seguinte medida:
K =Q3 −Q1
2(P90 − P10
Rule of thumb
K = 0.263 a distribuicao de frequencia e mesocurtica.
K > 0.263 a distribuicao de frequencia e platicurtica
K < 0.263 a distribuicao de frequencia e leptocurtica
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 116 / 294
Estatısticas Descritivas Medidas de separatiz
Medidas de achatamento ou kurtosis
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 117 / 294
Estatısticas Descritivas Medidas de separatiz
Box-plot ou caixa de bigodesConstrucao
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 118 / 294
Estatısticas Descritivas Medidas de separatiz
Box-plot ou caixa de bigodes
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 119 / 294
Estatısticas Descritivas Medidas de separatiz
Toeria de probabilidades
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 120 / 294
Toeria de probabilidades
Toeria de probabilidadesIntroducao
No nosso quotidiano, lidamos sempre com situacoes em que estapresente a incerteza do resultado.
Por exemplo: o sexo de um embriao pode ser masculino ou feminino,mas so saberemos o resultado exacto quando bebe nascer.
Se estamos interessados na face voltada para cima quando jogamosum dado, os resultados possıveis sao 1, 2, 3, 4, 5, 6, mas sosaberemos o resultado quando o experimento se completar, ou seja,quando o dado atingir a superfıcie sobre a qual foi lancado.
Entao e conveniente dispor de uma medida que expresse a incerteza.Tal media chama-se probabilidade.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 121 / 294
Toeria de probabilidades
Experimento aleatorio, Espaco amostral e EventoExperimento aleatorio
Experimento aleatorio- e um processo que acusa variabilidade emseus resultados, isto e, repetindo-se o experimento sob as mesmascondicoes, os resultados serao diferentes.
Alem dos experimentos aleatorios, temos osexperimentosdeterminısticos
experimentos determinısticos- sao experimentos que, repetidos sobas mesmas condicoes, conduzem a resultados identicos.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 122 / 294
Toeria de probabilidades
Experimento aleatorioExemplo
O lancamento de uma moeda e um experimento aleatorio.
O lancamento de um dado tambem e um experimento aleatorio
Todo experimento que gera dados/informacao pode ser consideradocom um experimento aleatorio
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 123 / 294
Toeria de probabilidades
Espaco amostral
Espaco amostral
Espaco amostral de um experimento aleatorio e o conjunto de todosresultados possıveis desse experimentos.
Vamos denotar o espaco amostral pela letra grega omega maiuscula,Ω
O espaco amostral pode ser considerado discreto , quando este efinitoou infinito numeravel, ou contınuo caso contrario.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 124 / 294
Toeria de probabilidades
Espaco amostralExemplo
1 Lancamento de um dado
O espaco amostral e dado por Ω = 1, 2, 3, 4, 5, 6, que por sua vezpode ser considerado como sendo discreto
2 Lancamento de duas moedas
O espaco amostral e Ω = KK,KC,CK,CC
Se por exemplo estivermos interessado no numero de caras, o espacoamostral sera: Ω = 0, 1, 2
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 125 / 294
Toeria de probabilidades
Evento aleatorios
Os subconjuntos de Ω sao chamados de eventos aleatorios.
Os elementos de Ω sao designados por eventos elementares
Os eventos aleatorios serao representados por letras maiusculas donosso alfabeto e os eventos elementares por letras minusculas.
Exemplo Para o lancamento de um dado podemos considerar alguns even-
tos:
face par= 2, 4, 6face ımpar= 1, 3, 5
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 126 / 294
Toeria de probabilidades
Operacoes com eventos aleatoriosInterseccao
O evento interseccao de A e B e o evento que equivale a ocorrenciasimultanea de A e B.
Em notacao de teoria de conjunto temos A ∩B
Note que x ∈ A ∩B ⇔ x ∈ A ∧ x ∈ B
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 127 / 294
Toeria de probabilidades
Operacoes com eventos aleatoriosExemplo: Interseccao
Considere o experimento lancamento de dois dados e os eventos A =”Asoma das faces e um numero par”e B =”A soma das faces e um numeromaior do que 9. Calcule A ∩B
SolucaoO espaco amostral tem 36 elementos
Ω = (1, 1), (1, 2), ..., (1, 6), (2, 1), ..., (2, 6), ..., (6, 6)
A ∩B = (4, 6), (5, 5), (6, 4), (6, 6)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 128 / 294
Toeria de probabilidades
Operacoes com eventos aleatoriosExclusao
Exclusao
Dois eventos A e B sao mutuamente exclusivos quando eles naopodem ocorrer simultaneamente, isto e, quando a ocorrencia de umimpossibilita a ocorrencia do outro.
Isto significa dizer que os eventos A e B nao tem elementos emcomum
Dois eventos A e B sao mutuamente exclusivos quando a suainterseccao e o conjunto vazio, isto, e A ∩B = ∅
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 129 / 294
Toeria de probabilidades
Operacoes com eventos aleatoriosUniao
A uniao de dois eventos A e B (A ∪B) e o evento que corresponde aocorrencia de pelo menos um deles.
Isso significa que pode ocorrer apenas A, ou apenas B ou A e Bsimultaneamente.
x ∈ A ∪B ⇔ x ∈ A ∨ x ∈ B
Exemplo
SejaA = a, b, c e B = b, c, d, e
EntaoA ∪B = a, b, c, d, e
.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 130 / 294
Toeria de probabilidades
Operacoes com eventos aleatoriosComplementacao
O complementar de um evento e denotado por A ou Ac, e e anegacao de A.
O complementar de A e formado por todos elementos que naopertencem a A.
Note que x ∈ Ac ⇔ x /∈ AAc ∪A = Ω
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 131 / 294
Toeria de probabilidades
Operacoes com eventos aleatoriosDiferenca
Diferenca
A diferenca entre dois eventos A e B, representada por A \B, e oevento formado pelos elementos do espaco amostral que pertencem aA mas nao pertencem a B
Note que ∈ A \B ⇔ x ∈ A ∧ x /∈ B ⇔ x ∈ A ∩BAdemais, observe que A \B 6= B \A
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 132 / 294
Toeria de probabilidades
Operacoes com eventos aleatoriosPropriedade das operacoes
Identidade:A ∩ ∅ = ∅A ∪ Ω = Ω
A ∪ ∅ = A
A ∩ Ω = A
Complementar:Ω = ∅∅ = Ω
A ∩A = ∅A ∪A = Ω
.dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 133 / 294
Toeria de probabilidades
Operacoes com eventos aleatoriosPropriedade das operacoes
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 134 / 294
Toeria de probabilidades
Analise combinatoriaPrincipio fundamental da adicao
Principio fundamental da adicao
Consideremos uma coleccao de eventos mutuamente exclusivos dois a dois,tais que n(Ai) = ni, i = 1, · · · k. O princpio fundamental da adicaoestabelece que :
Ai ∩Aj = ∅ ∀ i 6= j ⇒ n( k⋃
i=1
Ai
)=
k∑i=1
n(Ai) = n1 + n2 + · · ·+ nk
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 135 / 294
Toeria de probabilidades
Analise combinatoriaPrincipio fundamental da multiplicacao
Suponha que temos k conjuntos . Conjunto 1 tem n1 elementos,conjunto 2 tem n2 elementos,· · · ,conjunto k tem nk elementos
Podemos formar uma amostra de k elementos, tomando um elementoem cada conjunto.
O numero de amostras diferentes que podem ser formadas e igual
n1n2n3 · · ·nk
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 136 / 294
Toeria de probabilidades
Analise combinatoriaExemplo 1: Principio fundamental da multiplicacao
Quantos numeros naturais de tres algarismos distintos existem?
Para o primeiro algarismo (milhar), existem novepossibilidades(excluımos o zero)
Para a segunda posicao, escolhida a primeira, sobram novealgarismos(agora incluımos o zero)
Para a terceira, escolhidos os dois primeiros, sobram oito algarismos.
Entao temos 9× 9× 8 = 648 numeros.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 137 / 294
Toeria de probabilidades
Analise combinatoriaExemplo 2: Principio fundamental da multiplicacao
Quantos numeros pares de tres algarismos distintos podemos formar comos algarismos 1, 2, 3, 4, 5, 6
Para que o numero seja par ele deve terminar com 2,4 ou 6.
Seja P o evento de interesse. Vamos denotar por A2, A4 e A6 oevento ”numero que termina com 2, 4, e 6”, respectivamente.
n(A2) = 5× 4× 1, n(A4) = 5× 4× 1, n(A6) = 5× 4× 1
Pelo princıpio fundamental da adicao temos.
n(P ) = n(A2) + n(A4) + n(A6) = 60
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 138 / 294
Toeria de probabilidades
Analise combinatoriaPermutacoes
Considere quatro objectos distintos a1, a2, a3, a4. De quantasmaneiras podemos ordena-los?
Cada uma dessas ordenacoes e chamada uma permutacao simples.
Considere n objectos distintos, a1, a2, a3, · · · an. Para a primeiraposicao temos n possibilidades. Para a segunda temos n− 1possibilidades. Continuando para a ultima posicao, escolhidas a n− 1anteriores, resta apenas um objecto.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 139 / 294
Toeria de probabilidades
Pelo principio da multiplicacao, o numero total de permutacoes,denotado por Pn sera igual a
n× (n− 1)× (n− 2)× (n− 3)× · · · × 1
Permutacao
Dados n objetos distintos, o numero de permutacoes simples de taisobjetos e dado por
Pn = n× (n− 1)× (n− 2)× · · · × 1 = n!
Exemplo
Quantas filas diferentes podemos formar com 5 criancas ?
5! = 5× 4××3× 2× 1 = 120
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 140 / 294
Toeria de probabilidades
Analise combinatoriaPermutacoes circulares
Considere a situacao em que coloca n objectos distintos em n lugares equi-espacados em torno de um cırculo.
O ponto relevante e considerar equivalentes posicoes que coincidempor rotacao
Para o calculo de permutacoes circulares usamos a seguinte formula:
Pn = (n− 1)!
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 141 / 294
Toeria de probabilidades
Analise combinatoriaExemplo Permutacoes
Considere o anagrama TEORIA
1) Quantos anagramas podemos formar?
6! = 6× 5× 4× 3× 2× 1 = 720
2) Quantos anagramas comecam com a letra T? Fixamos a letra T naprimeira posicao as outras cinco podem ser organizadas de
5! = 120 maneiras diferentes.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 142 / 294
Toeria de probabilidades
Analise combinatoriaParticoes
Suponha que tem se um unico conjunto N com elementos diferentes
E queira-se dividir este conjunto em k subconjuntos, com n1
elementos no conjunto 1, n2 elementos no conjunto 2,· · · e nk noconjunto k.
O numero de particoes diferentes e dado por
P =N !
n1!n2! · · ·nkonde n1 + n2 + · · ·nk = N
Exemplo: Suponha que tem 12 analistas de sistema e pretende atribuir atres analista a tarefa 1, a quatro a tarefa 2 e a cinco deles a tarefa 3. Dequantas formas pode atribuir as tarefas?
P =12!
3!4!5!= 27720
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 143 / 294
Toeria de probabilidades
Analise combinatoriaCombinacoes
Combinacao
Chama-se combinacao de n elementos tomados p a p aos agrupamentosdistintos que podem formar-se de modo que em cada um dessesagrupamentos entrem p dos n elementos, considerando como distintos dosagrupamentos que difiram somente pela natureza (especie) de pelo menosum elemento.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 144 / 294
Toeria de probabilidades
Analise combinatoriaCombinacoes
Combinacoes sem repeticao: Cada elemento entra uma unica veznum agrupamento dado
Cnp =
n!
p!(n− p)!Combinacoes com repeticao: Representam a quantidade de modosde escolher k objectos distintos ou nao entre n objectos distintosdados.
Cn+p−1p =
(n+ p− 1)!
p!(n− 1)!
Exemplo: Suponha que queira empregar 5 pessoas dentre 100 candidatos.De quantas formas estas pessoas podem ser seleccionadas.
C1005 =
100!
5!(100− 5)!= 75287520
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 145 / 294
Toeria de probabilidades
Analise combinatoriaArranjos
Arranjos
Chama-se arranjos de n elementos p a p aos agrupamentos distintos quepodem formar-se de modo que em cada um dos agrupamentos entrem os pdos n elementos, considerando como distinto os dois agrupamentos quedifiram pela natureza (especie) ou pela ordem dos seus elementos.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 146 / 294
Toeria de probabilidades
Analise combinatoriaArranjos
Se num conjunto de n elementos seleccionarmos p elementos, earranjarmos esses elementos em p posicoesEntao o numero total de arranjos sem repeticao e dado por
Anp =
n!
(n− p)!E o numero de arranjos com repeticao e dado por
Anp = np
Exemplo: quantos numeros de quatro algarismos diferentes sao possıvelformar com os quatro elementos do conjunto 1, 2, 3, 5, 6?
A54 =
5!
(5− 4)!= 120
Podıamos tambem aplicar o princıpio fundamental da multiplicacao 5× 4×3× 3× 2 = 120dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 147 / 294
Toeria de probabilidades
Calculo da probabilidadeDefinicao classica e frequentista
Existem dois procedimentos que por meio dos quais pode se estimar a pro-babilidade de um evento:
1 Abordagem classica
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 148 / 294
Toeria de probabilidades
Calculo da probabilidadeExemplo: definicao classica
No lancamento de um dado, qual e a probabilidade de obter face maior doque 4?
Neste caso estamos perante um espaco amostral finito.
Alm disso, considerando que o dado e honesto, estamos diante deeventos equipraveis.
O evento de de interesse e A = 5, 6, e sabendo que n(Ω) = 6,entao temos
P(A) =2
6=
1
3
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 149 / 294
Toeria de probabilidades
Calculo da probabilidadeExemplo: definicao classica
Um numero e escolhido entre os 20 primeiros inteiros, 1 a 20. Qual e aprobabilidade de que o numero escolhido seja (i) par? (ii) primo? (iii)quadrado perfeito?
Numeros pares
P = 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 ⇒ P (P ) =10
20=
1
2
Numeros primos
R = 2, 3, 5, 7, 11, 13, 17, 19 ⇒ P (R) =8
20=
2
5
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 150 / 294
Toeria de probabilidades
Calculo da probabilidadedefinicao frequentista
1 Abordagem frequentista
Se apos n repeticoes de um experimento, onde n e um numero grande,e observado que um evento ocorre em h destas repeticoes, entao aprobabilidade do evento e h/n. Esta e a chamada probabilidadeempırica do evento
P (A) = limn→∞
n(A)
n
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 151 / 294
Toeria de probabilidades
Calculo da probabilidadeExemplo: definicao frequentista
Se lancarmos uma moeda 1000 vezes e aparecer cara 532 vezes, estimaremosa probabilidade de ocorrer cara por 532/1000 = 0.532
Observacao
Ambas as abordagens tem serias restricoes, a primeira porque a palavra”igualmente provaveis”sao vagas e segunda porque o ”numerogrande”envolvido tambem e vago.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 152 / 294
Toeria de probabilidades
Caculo da probabilidadeDefinicoes axiomaticas e regras de probabilidade
1 Axioma 1: 0 6 P (A) 6 1
2 Axioma 2 : P (Ω) = 1
3 Axioma 3: A ∩B = ∅ ⇒ P (A ∪B) = P (A) + P (B)
Propriedades
1 P (∅) = 0
2 P (A) = 1− P (A)
3 P (A \B) = P (A ∩B) = P (A)− P (A ∩B)
4 P (A ∪B) = P (A) + P (B)− P (A ∩B)
5 P (A \B) = P (A ∩B) = P (A)− P (A ∩B)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 153 / 294
Toeria de probabilidades
Calculo da probabilidadeDefinicoes axiomaticas e regras de probabilidade
Regras de probabilidades
6 A ⊂ B ⇒ P (A) 6 P (B)
7
8 P (A1 ∪A2 ∪A3 ∪ · · · ∪An) 6∑n
i=1 P (Ai)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 154 / 294
Toeria de probabilidades
Calculo da probabilidadeExemplo
Considere o lancamento de dois dados, onde o evento A =”soma das facespar”, B =”soma das faces maior do que 9”e C = ”soma das faces ımparmenor do que 9”. Cacule a probabilidade de cada evento.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 155 / 294
Toeria de probabilidades
Podemos ver que:
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 156 / 294
Toeria de probabilidades
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 157 / 294
Toeria de probabilidades
Calculo da probabilidadeExemplo:Bolas de uma urna
Em uma urna ha 4 bolas brancas e 3 bolas verdes. Duas bolas sao retiradasdessa urna, sequencialmente e sem reposicao. Qual e a probabilidade deobtermos:
1 2 bolas brancas?
2 2 bolas verdes?
3 2 bolas de cores diferentes?
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 158 / 294
Toeria de probabilidades
Logo P (B) =6
42=
1
7ou P (B) =
A32
A27
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 159 / 294
Toeria de probabilidades
O evento C =”bolas de cores diferentes”e complementar do eventoD =”bolascom cores iguais. Que por sua vez e uniao dos eventos A e B, entao temos
P (A ∪B) = P (A) + P (B)− P (A ∩B) =2
7+
1
7=
3
7
P (C) = 1− P (D) = 1− 3
7=
4
7
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 160 / 294
Toeria de probabilidades
Calculo da probabilidadeProbabilidade condicional
Definicao
Seja B um evento arbitrario em um espaco amostral Ω, com P (B) > 0. Aprobabilidade de um evento A ocorrer, uma vez que B tenha ocorrido ou,em outras palavras, a probabilidade condicional de A dado B, escritaP (A \B), e definida como:
P (A \ E) =P (A ∩B)
P (B)
Note que, nessa definicao, temos que supor que o evento B e umevento possıvel, visto que ele ja ocorreu, isto e (P (B) > 0)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 161 / 294
Toeria de probabilidades
Calculo da probabilidadeProbabilidade condicional
Se Ω e um espaco finito equi-provavel e n(A) representa o numero deelementos em um evento A, entao
P (A ∩B) =n(A ∩B)
n(Ω)P (B) =
n(B)
n(Ω)entao deduz-se que:
P (A \B) =(A ∩B)
P (B)=n(A ∩B)
n(B)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 162 / 294
Toeria de probabilidades
Caculo da probabilidadeProbabilidade condicional
Teorema
Seja Ω um espaco finito com eventos A e B, entao
P(A \B) =numero de elementos em A ∩B
numero de elementos
ou
P(A \B) =numero de maneiras nas quais A e B podem occorrer
numero de maneiras nas quais B pode ocorrer
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 163 / 294
Toeria de probabilidades
Calculo da probabilidadeExemplo1: probabilidade condicional
Um grupo de 100 alunos foi classificado quanto ao sexo e a atividadede lazer preferida, obtendo-se a distribuicao dada na tabela abaixo.
1. Qual e a probabilidade uma pessoa escolhida ao acaso neste grupo serdo sexo masculino?
2. Se a pessoa escolhida prefere praia como actividade de lazer, qual e aprobabilidade de que seja homem?
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 164 / 294
Toeria de probabilidades
Calculo da probabilidadeExemplo 1: probabilidade condicional
Vamos definir os seguintes eventosM =”masculino, F =”feminino, C =”Cinema”,P =”praia”, D =”Desporto”
Como o sorteio e aleatorio, e estamos diante de um espaco amostral finitoe equi-provavel, podemos usar a definicao classica.
1. visto que temos 20 homens dentre 100, entao tem-se
P (M) =20
100=
1
5
2. P (M \ P ) =P (M ∩ P )
P (P )=
1210053100
=12
53
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 165 / 294
Toeria de probabilidades
Calculo da probabilidadeExemplo2: probabilidade condicional
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 166 / 294
Toeria de probabilidades
Calculo da probabilidadeExemplo 2: probabilidade condicional
Seja E o evento ”empregado tem o plano aposentadoria complementar da”eP o evento ”empregado possui plano pessoal de aposentadoria complementaempresa”
P (P ) =200
500=
2
5P (E) =
400
500=
4
5P (P ∩ E) =
200
500=
2
5
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 167 / 294
Toeria de probabilidades
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 168 / 294
Toeria de probabilidades
Calculo da probabilidadeRegra geral da multiplicacao
Esse resultado nos permite calcular a probabilidade da intersecao dedois eventos
E muito util para modelar experimentos que tem caracter sequencial.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 169 / 294
Toeria de probabilidades
Calculo da probabilidadeExemplo: Regra geral da multiplicacao
Considere que duas cartas de um baralho (13 cartas de cada um dos naipescopas, paus, ouro, espada) sejam extraıdas sem reposicao, uma depois daoutra. Qual e a probabilidade de nenhuma das duas ser de copas?
Seja C1 = copas na primeira extracao
Seja C2 = copas na segunda extracao
Pretende-se calcular P (C1 ∩ C2), pela regra da multiplicacao
P (C1 ∩ C2) = P (C1)P (C2 \ C1) =39
52× 38
51
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 170 / 294
Toeria de probabilidades
Calculo da probabilidadeExemplo: Regra geral da multiplicacao, diagrama de arvore
Cada no na arvore corresponde a ocorrencia de um evento condicionada aocorrencia de todos os eventos representados pelos nos anteriores no cami-nho correspondente.dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 171 / 294
Toeria de probabilidades
Calculo da probabilidadeRegra geral da multiplicacao
Regra geral da multiplicacao
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 172 / 294
Toeria de probabilidades
Calculo da probabilidadeEventos independentes
Independencia
Um evento B e dito independente de um evento A, se a probabilidade de Bocorrer nao e influenciada pelo facto de A ter ocorrido ou nao. Em outraspalavras, se a probabilidade de B e igual a probabilidade condicional de Bdado A.
P (B \A) = P (B) , P (A \B) = P (A)
P (A \B) = P (A)]⇒ P (A ∩B)
P (B)= P (A)
⇒ P (A ∩B) = P (A)P (B)
Exemplo: prove se os eventos do exemplo no slide 167 sao ou nao indepen-dentes
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 173 / 294
Toeria de probabilidades
Caculo da probabilidadeTeorema da probabilidade total e Teorema de Bayes
Particao de um espaco amostral
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 174 / 294
Toeria de probabilidades
Caculo da probabilidadeTeorema da probabilidade total e Teorema de Bayes
Teorema da probabilidade total
Seja, A1, A2...An uma particao do espaco amostral Ω e seja E um eventodo espaco amostral,
P (E) =
n∑i=1
P (E \A)P (Ai)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 175 / 294
Toeria de probabilidades
Caculo da probabilidadeTeorema da probabilidade total e Teorema de Bayes
Teorema de de Bayes
Seja, A1, A2...An uma particao do espaco amostral Ω e seja E um eventodo espaco amostral,com P (E) > 0 , tem-se que ∀i = 1, 2, · · ·n
P (Ai \ E) =P (Ai ∩ E)
P (E)=
P (E \Ai)P (Ai)∑ni=1 P (E \Ai)P (Ai)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 176 / 294
Toeria de probabilidades
Caculo da probabilidadeExemplo: Teorema da probabilidade total e Teorema de Bayes
Em uma empresa, 4 pessoas sao responsaveis pela compra. pessoa A faz40% das contas, a pessoa B 30%, a pessoa C 20% e pessoa D 10%.
Em 1% das contas de A ha um erro. Para B, o erro e de 2%, 5% paraC e D tem de 10% de erros.
Qual e a probabilidade de que haja um erro numa das contasseleccionadas aleatoriamente?
Qual e a probabilidade de que este erro seja feito pela pessoa A?
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 177 / 294
Toeria de probabilidades
Caculo da probabilidadeExemplo: Teorema da probabilidade total e Teorema de Bayes
Para a primeira questao usamos o teorema da probabilidade total
Para a segunda questao usamos o teorema de Bayes
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 178 / 294
Toeria de probabilidades Variaveis aleatorias
Calculo da probabilidadeVariaveis aleatorias
Considere o seguinte experimento aleatorio:
Sorteio de uma amostra de 20 funcionarios de uma empresa com 500funcionarios.
O espaco amostral e formado por todas amostras possıveis.
O numero total de amostras e n(Ω) = C50020
Cada elemento do espaco amostral e formado por uma relacao de 20funcionarios sorteados.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 179 / 294
Toeria de probabilidades Variaveis aleatorias
Calculo da probabilidadeVariaveis aleatorias
Geralmente nao estamos interessados no funcionario como tal, massim em alguma caracterıstica do funcionario(Ex: altura, numero dedependentes).
Tendo-se uma amostra podemos calcular por exemplo uma mediapara a altua.
E dessa forma temos um valor associado a cada elemento/ amostrado espaco amostral.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 180 / 294
Toeria de probabilidades Variaveis aleatorias
Calculo da probabilidadeVariaveis aleatorias
Variavel aleatoria
Uma variavel aleatoria e uma funcao real (isto e, que assume valores emR) definida no espaco amostral Ω de um experimento aleatorio. Dito deoutra forma, uma variavel aleatoria e uma funcao que associa um numeroreal a cada evento de Ω.
Por convencao vamos usar letras maiusculas do alfabeto pararepresentar uma variavel aleatoria, X, Y, etc.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 181 / 294
Toeria de probabilidades Variaveis aleatorias
Calculo da probabilidadeVariaveis aleatorias
Considere novamente o exemplo referente a amostra de 20 funcionarios
Pode-se, entao, definir as seguintes variaveis.
X =”altura media em centımetros”.Y = ”numero maximo de pendentes”.
Estas variaveis tem naturezas diferentes.
Variaveis aleatorias discretas e contınuas
Uma variavel aleatoria e discreta se sua imagem (ou conjunto de valoresque ela assume) for um conjunto finito ou enumeravel. Se a imagem forum conjunto nao enumeravel, dizemos que a variavel aleatoria e contınua.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 182 / 294
Toeria de probabilidades Variaveis aleatorias
Calculo da probabilidadeVariaveis aleatorias
A questao que se coloca e: como atribuir probabilidade aos valores, ouintervalo de valores, de uma variavel aleatoria?
Considere o lancamento de dois dados:
O espaco amostral e formado pelos pares ordenados (i, j) i, j =1, 2,3, 4, 5, 6
O espaco amostral deste experimento nao e formado por numeros.
Suponhamos que nosso interesse esteja no maximo das faces dos doisdados.
Seja X o maximo numero das duas faces?
X e uma variavel discreta que pode assumir valores 1,2, 3, 4, 5, 6
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 183 / 294
Toeria de probabilidades Variaveis aleatorias
X = 2 corresponde ao evento A = (1, 2), (2, 2), (2, 1)X = 1 corresponde ao evento B = (1, 1)
Por conseguinte :
P (X = 2) =3
36e P (X = 1) =
1
36
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 184 / 294
Toeria de probabilidades Variaveis aleatorias
Calculo da probabilidadeExemplo: Variaveis aleatorias
Considere a altura media de uma amostra de funcionarios.
Retiram-se varias amostras e se regista a altura media.
o Histograma e construıdo de tal forma que a soma das areas de cadarectangulo seja igual a 1.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 185 / 294
Toeria de probabilidades Variaveis aleatorias
A frequencia relativa e uma aproximacao da probabilidade de umelemento pertencer a uma determinada classe.
Entao pode-se estimar a probabilidade de altura media estar entredois valores quaisquer com a area dos retangulos envolvidos.
A area sombreada corresponde a frequencia (probabilidade) de alturasentre os valores 168 e 178 cm
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 186 / 294
Toeria de probabilidades Funcao de probabilidade
Calculo da probabilidadeFuncao de probabilidade:variavel aleatoria discreta
Funcao de probabilidade
Seja X uma variavel aleatoria discreta. A funcao de probabilidades deX e a funcao fX(x) que associa, a cada valor possıvel x de X, suarespectiva probabilidade, calculada da seguinte forma: fX(x) e aprobabilidade do evento X = x que consiste em todos os resultados doespaco amostral que dao origem ao valor x.
fX(x) = P (X = x) =∑
ω∈Ω:X(ω)=x
P (ω)
Pela definicao de probabilidade,tem-se:
fX(x) > 0∑x fX(x) = 1
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 187 / 294
Toeria de probabilidades Funcao de probabilidade
Calculo da probabilidadeCalculo da funcao de probabilidade
Da definicao de funcao de probabilidade, resulta que o seu calculo se da emtres etapas:
primeiro, temos que identificar todos os possıveis valores x da v.a. X.
segundo, temos que identificar os resultados que dao origem a cadavalor x e suas respectivas probabilidades.
finalmente, temos que somar todas essas probabilidades para obterfX(x) = P (X = x).
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 188 / 294
Toeria de probabilidades Funcao de probabilidade
Calculo da probabilidadeExemplo: Calculo da funcao de probabilidade
Considere o lancamento de dois dados: maximo das faces
Agora considere a variavel aleatotira X =”soma das duas faces”.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 189 / 294
Toeria de probabilidades Funcao de probabilidade
Calculo da probabilidadeExemplo: Calculo da funcao de probabilidade
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 190 / 294
Toeria de probabilidades Funcao de distribuicao
Calculo da probabilidadeFuncao de distribuicao acumulada
Funcao de distribuicao
Dada uma variavel aleatoria X, a funcao de distribuicao acumulada deX, ou simplesmente funcao de distribuicao, e definida por
FX(x) = P (X 6 x) ∀x ∈ R
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 191 / 294
Toeria de probabilidades Funcao de distribuicao
Calculo da probabilidadeExemplo: Funcao de distribuicao acumulada
Considere o exemplo do numero maximo das faces:
Observe que FX(x) = 0 ∀x < 1
Para X = 1 tem-se FX(1) = P (X 6 1) = P (X < 1) + P (X = 1)
Para ∀x tal que 1 < x < 2, temos fX(x) = 0
Deste modo tem-se FX(x) = FX(1) =1
2∀x ∈ 1 6 x < 2
Para x ∈ (2, 3) FX(x) = P (X 6 2) + P (2 < X < x) = FX(2) + 0 =FX(2) ∀x : 2 < x < 3
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 192 / 294
Toeria de probabilidades Funcao de distribuicao
Calculo da probabilidadeExemplo: Funcao de distribuicao acumulada
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 193 / 294
Toeria de probabilidades Funcao de distribuicao
Calculo da probabilidadeExemplo: Funcao de distribuicao acumulada
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 194 / 294
Toeria de probabilidades Funcao de distribuicao
Calculo da probabilidadeFuncoes de Variaveis Aleatorias
Funcoes de Variaveis Aleatorias
Dada uma v.a. X; podemos obter outras variaveis aleatorias atraves defuncoes de X e, da mesma forma que calculamos a funcao de probabilidadede X; podemos calcular a funcao de probabilidade dessas novas variaveis.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 195 / 294
Toeria de probabilidades Funcao de distribuicao
Calculo da probabilidadeExemplo: Funcoes de Variaveis Aleatorias
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 196 / 294
Toeria de probabilidades Funcao de distribuicao
Calculo da probabilidadeExemplo: Funcoes de Variaveis Aleatorias
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 197 / 294
Toeria de probabilidades Funcao de distribuicao
Funcoes de Variaveis Aleatorias
Seja X uma variavel aleatoria discreta com funcao de probabilidade fX(x): Se definimos uma nova v.a. Y = g(X), onde g e uma funcao realqualquer, entao a funcao de probabilidade de Y e calculada como
fY (y) =∑
x|g(x)=y
fX(x)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 198 / 294
Toeria de probabilidades Esperanca de uma variavel aleatoria
Calculo da probabilidadeEsperanca de uma variavel aleatoria discreta
Definicao
Seja X uma variavel aleatoria discreta que assume os valores x1, x2,. . .com probabilidades p1; p2... respectivamente. A esperanca ou media de Xe definida como
E(X) =∑i
pixi =∑i
xiP (X = xi)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 199 / 294
Toeria de probabilidades Esperanca de uma variavel aleatoria
Caculo da probabilidadeExemplo: Esperanca matematica
Considere que o numero de produtos vendidos em um dia por umfuncionario e uma variavel aleatoria P com seguinte distribuicao deprobabilidade.
Numero de produtos 0 1 2 3 4 5 6
Probabilidade de Venda 0.1 0.4 0.2 0.1 0.1 0.05 0.05
se ele vende se ele vende ate dois produtos em um dia, ele ganha umacomissao de 10, 00$ por produto vendido
a partir da terceira venda, a comissao passa para 50, 00$ por produto.
Qual e o numero medio de produtos vendidos por cada vendedor equal a comissao media de cada um deles?
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 200 / 294
Toeria de probabilidades Esperanca de uma variavel aleatoria
Caculo da probabilidadeExemplo: Esperanca matematica
O numero medio de vendas por funcionario e
E(P ) = 0× 0.1 + 1× 0.4 + 2× 0.2+
3× 0.1 + 4× 0.1 + 5× 0.05+
6× 0.05 = 2.05
(16)
com relacao a comissao temos a seguinte funcao de probabilidade
Numero de produtos 0 1 2 3 4 5 6
Probabilidade de Venda 0.1 0.4 0.2 0.1 0.1 0.05 0.05Comissao C 0 10 20 70 120 170 220
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 201 / 294
Toeria de probabilidades Esperanca de uma variavel aleatoria
Calculo da probabilidadeEsperanca de Funcoes de uma Variavel Aleatoria
Definicao
Seja X uma variavel aleatoria discreta com funcao de distribuicao deprobabilidade fX(x). Se definimos uma nova v.a. Y = g(X), entao
E(Y ) = E(g(X)) =∑x
g(x)fX(x) =
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 202 / 294
Toeria de probabilidades Esperanca de uma variavel aleatoria
Calculo da probabilidadeExemplo: Esperanca de Funcoes de uma Variavel Aleatoria
Considere o experimento maximo das faces de um dado. Calcule E(X2)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 203 / 294
Toeria de probabilidades Esperanca de uma variavel aleatoria
Calculo da probabilidadePropriedades da esperanca matematica
Seja X e uma variavel aleatoria discreta com funcao de probabilidade fX(x)e a, b 6= 0 sao constantes reais quaisquer.
E(a) = a
E(X + a) = E(X) + a
E(bX) = bE(X)
xmin 6 E(X) 6 xmax
xmin e xmax sao os valores mınimo e maximo da variavel X
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 204 / 294
Toeria de probabilidades Esperanca de uma variavel aleatoria
Caculo da probabilidadeVariancia de uma variavel aleatoria
Definicao
A variancia de uma variavel aleatoria X e definida como
Var(X) = E(X − E(X))2
O termo X − E(X) representa o desvio em torno da media.
Sendo assim, a variancia e a media dos desvios quadraticos em tornode E(X).
vejamos como se calcula a variancia. Seja g(X) = (X − E(X))2,entao Var(X) = E(g(X)) =
∑x(X − E(X))2fX(x)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 205 / 294
Toeria de probabilidades Esperanca de uma variavel aleatoria
Caculo da probabilidadeVariancia de uma variavel aleatoria
Desenvolvendo o quadrado e usando as propriedades do somatorio eda esperanca, tem-se
Var(X) =∑x
x2 − 2xE(X) + [E(X)]2
fX(x) =
=∑x
x2fX(x)− 2E(X)∑x
xfX(x) + [E(X)]2∑x
fx(X) =
=∑x
x2fX(x)− 2E(X)E(X) + [E(X)]2 × 1 =
=∑x
x2fX(x)− 2[E(X)]2 + [E(X)]2 =
=∑x
x2fX(x)− [E(X)]2
(17)dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 206 / 294
Toeria de probabilidades Esperanca de uma variavel aleatoria
Caculo da probabilidadeVariancia de uma variavel aleatoria
Mas, se definimos h(X) = X2, entao E[h(X)] =∑
x x2fX(x). Logo,
podemos escreverVar(X) = E(X2)− [E(X)]2
Desvio-padrao de uma variavel aleatoria
O desvio-padrao de uma variavel aleatoria X e definido como a raizquadrada de sua variancia
DP(X) =√
Var(X)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 207 / 294
Toeria de probabilidades Esperanca de uma variavel aleatoria
Caculo da probabilidadePropriedades da variancia e do desvio-padrao
V ar(X) 6 0
DP (X) 6 0
V ar(a) = 0; DP (a) = 0
V ar(X + b) = V ar(X)
DP (X + b) = DP (X)
V ar(bX) = b2V ar(X)
DP (X) = |b|DP (X)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 208 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeDistribuicao uniforme discreta
Suponha que seu professor de Estatıstica decida dar de presente a umdos alunos um livro de sua autoria.
Decide sortear aleatoriamente o ganhador, dentre os 45 alunos daturma
Para isso, ele enumera os nomes dos alunos que constam do diario declasse de 1 a 45.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 209 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeDistribuicao uniforme discreta
Definicao
A variavel aleatoria discreta X, que assume os valores x1, x2,..., xn, temdistribuicao uniforme se
fX(xi) = P (X = xi) =1
n∀i = 1, 2, ..., n
valor esperado/ media/ esperanca matematica
E(X) =1
nx1 +
1
nx2 + ...+
1
nxn
VarianciaVar(X) = E(X − E(X))2 =1
n(x1 − x)2 +
1
n(x2 − x)2 + ...+
1
n(xn − x)2 = σX
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 210 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeExemplo:Distribuicao uniforme discreta
Os defeitos em determinada maquina ocorrem aproximadamente na mesmafrequencia. Dependendo do tipo de defeito, o tecnico leva 1, 2, 3, 4 ou 5horas para consertar a maquina
(a) Descreva o modelo probabilıstico apropriado para representar aduracao do tempo de reparo da maquina.
(b) Qual e o tempo medio de reparo desta maquina? E o desvio-padraodeste tempo de reparo?
(c) Sao 15 horas e acaba de ser entregue uma maquina para reparo. Ajornada normal de trabalho do tecnico termina as 17 horas. Qual e aprobabilidade de que o tecnico nao precise fazer hora extra paraterminar o conserto desta maquina?
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 211 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Solucao
Seja T = “tempo de reparo, em horas”.
(a) Como os defeitos ocorrem na mesma frequencia, o modeloprobabilıstico apropriado e uma distribuicao uniforme:
t 1 2 3 4 5
fT (t) 15
15
15
15
15
(b) E(T ) =1 + 2 + 3 + 4 + 5
5= 3 horas
(c) Var(T ) =12 + 22 + 32 + 42 + 52
5− 9 = 2⇒ DP(T ) = 1, 41 horas
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 212 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeDistribuicao de Bernoulli
Considere o lancamento de uma moeda. A caracterıstica de talexperimento aleatorio e que ele possui apenas dois resultadospossıveis
Uma situacao analoga surge quando da extracao da carta de umbaralho, em que o interesse esta apenas na cor (preta ou vermelha)da carta sorteada.
Experimento de Bernoulli
Um experimento de Bernoulli e um experimento aleatorio com apenasdois resultados possıveis; por convencao, um deles e chamado ”sucesso”eo outro, ”fracasso”.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 213 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeDistribuicao de Bernoulli
Variavel aleatoria de Bernoulli
A v.a. de Bernoulli e a v.a. X associada a um experimento deBernoulli,em que se define
X =
1 se sucesso ocorre
0 se fracasso ocorre
Chamando de p a probabilidade de sucesso (0 < p < 1), a distribuicao deBernoulli e
x 0 1
fX(x) 1− p p
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 214 / 294
Toeria de probabilidades Distribuicoes de probabilidades
A funcao de distribuicao acumulada e dada por:
FX(x) =
0 se x < 0
1− p se 0 6 x < 1
1 se x > 1
Valor esperadoE(X) = 0× (1− p) + 1× p = p
VarianciaVar(X) = E(X2)− [E(X)]2 = p− p2 = p(1− p)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 215 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeDistribuicao Binomial
Motivacao
Um dado e lancado 3 vezes de forma independente. Qual aprobabilidade de obter a face 5 duas vezes?
Denotando Ω como sendo sucesso (obter face 5 num lancamento)e Fcomo sendo fracasso, o espaco amostral pode ser representado porΩ =(SSS), (SSF ), (SFS), (FSS), (SFF ), (FSF ), (FFS), (FFF ).Vamos considerar a variavel aleatoria X: numero de sucessos nos treslancamentos, sendo p = P (S) e q = 1− p = P (F ) em cadalancamento.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 216 / 294
Toeria de probabilidades Distribuicoes de probabilidades
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 217 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Portanto, a funcao de probabilidade da variavel aleatoria X: numerode sucessos nos tres lancamentos fica dada por
x 0 1 2 3
fX(x) q3 3pq2 3p2q p3
Assim, a funcao de probabilidade de X pode ser expressa na forma(3
x
)px(1− p)(3−x)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 218 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeDistribuicao Binomial
Variavel aleatoria binomial
Para um experimento binomial consistindo em n repeticoes independentesde um experimento de Bernoulli com parametro p, defina a variavelaleatoria
X = ”numero de sucessos”
Entao, X tem distribuicao binomial com parametros n e p, cuja funcao dedistribuicao de probabilidade e dada por
fX(x) = P (X = x) =
(n
x
)px(1− p)(n−x) x = 0, 1, 2...n
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 219 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeDistribuicao Binomial: Esperanca e Variancia
Pode-se mostrar que
X ∼ bin(n, p)⇒
E(X) = np
Var(X) = np(1− p)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 220 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeExemplo: Distribuicao Binomial
Um atirador acerta, na mosca do alvo, 20% dos tiros. Se ele da 10 tiros,qual a probabilidade de ele acertar na mosca no maximo uma vez?
Podemos pensar os tiros como experimentos de Bernoulli independentes, emque o sucesso e acertar no alvo e a probabilidade de sucesso e 0.20. Entao,o problema pede P (X ≤ 1), em que X =numero de acertos em 10 tiros.Logo, X ∼ bin(10; 0.20) e
P (X ≤ 1) = P (X = 0) + P (X = 1)
=
(10
0
)(0.20)0(0.80)10 +
(10
1
)(0.2)1(0.8)9 = 0, 37581
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 221 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Caculo da probabilidadeDistribuicao Geometrica
Definicao
Suponha que X representa o numero de ensaios independentes ate aocorrencia do primeiro sucesso que ocorre com probabilidade p. A funcaode probabilidade de X fica dada por
P (X = x) = p(1− p)(x−1)
em que x = 1, 2, ... Denotamos X ∼ G(p). E um exemplo de variavelaleatoria discreta com um numero enumeravel de valores.
Valor esperado
E(X) =1
pVariancia
V ar(X) =1− pp2
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 222 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Caculo da probabilidadeExemplo: Distribuicao Geometrica
Joga-se um dado equilibrado. Qual e a probabilidade de serem necessarios10 lancamentos ate a primeira ocorrencia de um seis?
Solucao
Nesse caso, sucesso e a ocorrencia de face seis. Logo, Pr(sucesso)=p =1
6
e Pr(fracasso)=1− p =5
6
Seja X = numero de lancamentos ate primeiro seis. Entao X ∼ G(1
6)
P (X = 10) =(5
6
)9(1
6
)= 0.03230
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 223 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Caculo da probabilidadeDistribuicao binomial negativa
A distribuicao binomial negativa e uma generalizacao da distribuicao geometrica.Onde X = numero de repeticoes necessarias ate a obtencao do r-esimo su-cesso. r ≥ 1-esimo
Dito de outra forma, a distribuicao binomial negativa numero de repeticoesnecessarias ate a obtencao do r-esimo sucesso.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 224 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Caculo da probabilidadeDistribuicao binomial negativa
Um experimento que apresenta uma distribuicao binomial negativa satisfazas seguintes condicoes :
O experimento consiste de uma sequencia de tentativasindependentes;
Cada tentativa apresenta apenas dois resultados: sucesso ou fracasso;
A probabilidade de sucesso permanece constante em todas astentativas;
O experimento continua ate que um total de ”r”sucessos sejamobservados, onde ”r”e um valor inteiro maior do que um, fixado deantemao.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 225 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeDistribuicao binomial negativa
Definicao
Em um processo de Bernoulli, a variavel e denominada binomial negativa,quando X refere-se ao numero de repeticoes independentes necessariaspara que um certo numero de ”sucessos”ocorram. A funcao deprobabilidades e dada por :
P (X = x) =
(x− 1
r − 1
)pr(1− p)k−1 x > k
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 226 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeDistribuicao binomial negativa
A funcao acumulada de probabilidades e dada por:
FX(x) =
0 se x < r
∑xk=r
(k−1r−1
)pr(1− p)k−r se x ≥ r
Valor esperado
E(X) =r
p
Variancia
Var(X) =r(1− p)p2
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 227 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeExemplo: Distribuicao binomial negativa
Joga-se um dado equilibrado. Qual e a probabilidade de serem necessarios10 lancamentos ate a terceira ocorrencia de um seis?
SolucaoNeste caso, sucesso e a ocorrencia da face seis. Logo Pr(sucesso)=1
6 ePr(fracasso)=1− p = 5
6
SejaX = numero de lancamentos ate terceiro seis. Entao X ∼ BinNega(3, 16)
P (X = 10) =
(9
2
)(5
6
)7(1
6
)3= 0, 046514.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 228 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeExemplo: Distribuicao binomial negativa
Considere-se um conjunto de N elementos, r dos quais tem uma determi-nada caracterıstica (r ≤ N) e N − r nao tenham esta caracterıstica.
Extraı-se n elementos (n ≤ N) sem reposicao. Seja X a variavel aleatoriaigual ao numero de elementos que possuem a caracterıstica entre os n reti-rados.
X e denominada de variavel aleatoria hipergeometrica.
As probabilidades de uma variavel aleatoria hipergeometrica podem ser ava-liadas por:
P (X = x) =
(rx
)(N−rn−x
)(Nn
)dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 229 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeDistribuicao hipergeometrica: Esperanca e Variancia
Valor esperado
E(X) = nr
NVariancia
V ar(X) = nr
N
N − rN
N − nN − 1
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 230 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeDistribuicao hipergeometrica: Esperanca e Variancia
Entre os 16 programadores de uma empresa, 12 sao do sexo masculino.A empresa decide sortear 5 programadores para fazer um curso avancadode programacao. Qual e a probabilidade dos 5 sorteados serem do sexomasculino?
solucao
Sucesso = sexo masculino. Se X = numero de homens sorteados, entaoX ∼ hiper(16; 12; 5) e o problema pede:
P (X = 5) =
(125
)(165
) = 0.181319
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 231 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Calculo da probabilidadeDistribuicao de Poisson
Distribuicao discreta de probabilidade aplicavel a ocorrencias de um eventoem um intervalo especificado.
Exemplo
clientes chegando ao caixa de um supermercado.
acidentes com automoveis em uma determinada estrada
Numero de carros que chegam a um posto de gasolina
Numero de avioes sequestrados em um dia.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 232 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Relacao entre variaveis
1 Conceitos
2 Exemplos
3 Tipos de relacao4 Medidas de associacao
Variaveis QuantitativasVariaveis Qualitativas
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 233 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Relacao entre variaveisConceitos
Medidas de associacao
As medidas de associacao referem-se a uma ampla variedade decoeficiente que medem o grau de associacao da relacao entrevariaveis.
Estas medidas de associacao podem ser descritas de varias maneirasdependendo do tipo de analise.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 234 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Relacao entre variaveisExemplos
Podemos estar interessado em analisar a relacao entre o numero demortes devido ao cancro do pulmao e a condicao de fumante (se oindivıduo fuma ou nao).
Podemos estar interessado na relacao entre a pressao arterial dopaciente e a quantidade de medicamento que o paciente toma por dia.
Existe uma relacao entre a temperatura, medida em graus Fahrenheit,e as vendas de sorvete?
Por exemplo, pode ser importante analisar a relacao entre a idade emanos e a altura em metros.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 235 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Relacao entre variaveisTipos de relacao
Unilateral:y depende de x (ou x depende de y).
Figura 4: Relacao unilateral
ex.:o preco de venda dum producto (y) depende da distancia entre olocal de producao e o local de venda (x).
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 236 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Relacao entre variaveisTipos de relacao
Bilateral ou interdependencia:y depende de x e x depende de y.
Figura 5: Relacao bilateral
ex.: relacao entre peso e altura dum indivıduo.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 237 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Relacao entre variaveisTipos de relacao
Dependencia indirecta ou associacao espuria:y e x saoinfluenciados por outra(s) variavel(is).
Figura 6: Relacao espuria
ex.: relacao entre o numero anual de insolacao e producao anual detrigo. Causa comum: temperatura.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 238 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Relacao entre variaveisMedidas de associacao: Variaveis quantitativas
Covariancia e correlacao
Propriedades de correlacao
Exemplo
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 239 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Medidas de associacao: Variaveis quantitativasCovariancia e correlacao
Seja (x1, y1), . . . , (xn, yn): conjunto de dados bivariados.
Grafico de dispersao (Scatter plot): representacao grafica dos pares(xı, yı), ı = 1, . . . , n.
Figura 7: Exemplo Scatter plot
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 240 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Medidas de associacao: Variaveis quantitativasCovariancia e correlacao
1 Covariancia entre x e y:medida de variacao conjunta (ousimultanea) de x e y em relacao as suas medias.
cov(x, y) =1
n− 1
n∑ı=1
(xı − x)(yı − y), −∞ < cov(x, y) < +∞
Obs:cov(x, y) = cov(y, x) e cov(x, x) = var(x).
2 Coeficiente de correlacao linear de Person (r)
corr(x, y) = r =cov(x, y)
sxsy=
1n−1
∑nı=1(xı − x)(yı − y)
sxsy
sendo que sx e sy denotam o desvio-padrao de x e y respectivamente.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 241 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Medidas de associacao: Variaveis quantitativasPropriedades
1 O coeficiente de correlacao de pearson (r) mede somente o grau deassociacao linear entre variaveis quantitativas;
2 −1 ≤ r ≤ 1
3 r = −1 se e somente se a relacao entre x e y for negativa linearperfeita;
4 r = 1 se e somente se a relacao entre x e y for positiva linear perfeita;
5 Corr(X,Y ) = Corr(Y,X)
6 O coeficiente de correlacao nao depende da escala de medida. Mesmoadicionando, subtraindo, multiplicando ou, o valor de r se mantem.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 242 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Medidas de associacao: Variaveis quantitativasCovariancia e correlacao
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 243 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Medidas de associacao: Variaveis quantitativasCoeficiente de correlacao: Classificacao
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 244 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Medidas de associacao: Variaveis quantitativasCoeficiente de correlacao: Classificacao
Regra de ouro
Antes de calcular e tentar interpretar o coeficiente de correlacao entreduas variaveis, construa um diagrama de dispersao. Nao esqueca que ocoeficiente de correlacao so mede a intensidade com que duas variaveis seassociam linearmente, pelo que se a representacao grafica nao sugere aexistencia de associacao linear, nao faz sentido proceder com o seu calculo.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 245 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Medidas de associacao: Variaveis quantitativasCoeficiente de correlacao: Classificacao
Obs: r = 0 nao significa ausencia de associacao.
Figura 8: Simetria em x e y
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 246 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Medidas de associacao: Variaveis quantitativasCoeficiente de correlacao: Exemplo 12
Considere os seguintes dados
Figura 9: Tabela de observacoesdr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 247 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Coeficiente de correlacacao usando SPSS
Example (Comandos SPSS para grafico de dispersao)
GRAPH
/SCATTERPLOT(BIVAR)=x WITH y
/MISSING=LISTWISE.
Example (Comandos SPSS para coeficiente de correlacao e covariancia)
CORRELATIONS
/VARIABLES=x y
/PRINT=TWOTAIL NOSIG
/STATISTICS XPROD
/MISSING=PAIRWISE.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 248 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Medidas de associacao: Variaveis quantitativasCoeficiente de correlacao: Exemplo
Figura 10: Scatter plot
O grafico sugere a existencia duma relacao linear entre x e y.dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 249 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Medidas de associacao: Variaveis quantitativasCoeficiente de correlacao: Exemplo 12
Estatısticas descritivasn = 11x = 9.0y = 7.5sx = 3.32sy = 2.03
cov(x, y) =
∑nı=1(xı − 9)(yı − 7.5)
11− 1= 5.501
corr(x, y) =cov(x, y)
sxsy=
5.501
3.32× 2.03= 0.816
correlacao linear positiva forte entre x e y, i.e., y tende a aumentarcom aumento em x.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 250 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Analise de Regressao
1 Analise de Regressao: Uma metodologia estatıstica que utiliza arelacao estatıstica entre duas ou mais variaveis quantitativas de formaque uma variavel (variavel resposta) possa ser estimada ou previstaatraves de outras variaveis (variaveis explicativas)
2 E uma tecnica largamente usada em economia, ciencias sociais,ciencias biomedicas entre outras.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 251 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Analise de Regressao
Exemplo de aplicacao incluem:
1 As vendas de um produto podem ser previstas utilizando a relacaoentre as vendas e o volume de gastos com publicidades
2 Rendimento de cultura pode ser prevista utilizando a profundidademedia sazonal de lencol freatico.
3 Caudal anual pode ser prevista utilizando a precipitacao anual.
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 252 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Relacao funcional vs. Relacao estatıstica
Relacao funcional
Relacao funcional entre duas (ou mais) variaveis e expressa por umaformula matematica:
Y = f(X)
onde f(.) e uma funcao conhecida. Exemplos: Y = 2X ou Y = X2 dadoX,Y e determinado (conhecido) completamente
Relacao estatıstica
Numa relacao estatıstica, as variaveis sao de natureza aleatoria, i.e,variaveis que tem associado uma distribuicao de probabilidade.
Y = f(X) + ε
onde ε representa o erro cometido ao se usar f(X) para aproximar Y .Notacao: X e a variavel independente (predictora); Y e a variaveldependente (resposta).dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 253 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Exemplo 14: Relacao funcional vs. Relacao estatıstica
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 254 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Modelo de Regressao Linear Simples
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 255 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Pressupostos do Modelo de Regressao Linear
Um experimento aleatorio e repetido n vezes em condicoes identicas. Emcada ensaio i = 1, 2, ..., n o valor de Xi
’e determinado (conhecido) e o valor de Yi observado. Usamos um modelode regressao linear simples da forma:
Yi = β0 + β1Xi + εi (18)
1 Os valores de Xi sao fixos ou conhecido a prior
2 Yi e uma variavel contınua e aleatoria3 β0 e β1 sao parametros do modelo, o que significa que sao
DesconhecidosConstantes, nao aleatoriosIndependentes do numero do ensaio i
4 Sobre o termo de erro (ε)Nao e observavelMedia igual a zeroPossue variancia constante (ou homoscedasticidade)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 256 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Pressupostos do Modelo de Regressao Linear
1 Pressupostos adicionais sobre o termo de erro (ε)
εi ∼ N(0, σ2) para todo iPara dois ensaios diferentes i e j, εi e εj sao indepedndentes →cov(εi, εj) = 0, cov=covariancia
De (1) e (2), resulta a equacao de regressao linear simples estimada:
Y = β0 + β1X (19)
onde Y e o valor estimado (ou previsto) para a observacao i; β0 e β1
sao estimadores nao enviesados de β0 e β1
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 257 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Metodo dos Mınimos Quadrados para Estimacao dosParametros do Modelo
1 Idea: encontrar β0 e β1 que minimizem a soma do quadrado doserros (SQR)
2 Para cada par (Xi, Yi), o termo de erro e dado por:
εi = Yi − Yi = Yi − (β0 + β1Xi)
ε2i = [Yi − Yi]2 = [Yi − (β0 + β1Xi)]2
3 Somando para todas as observacoes
Q(β0, β1) =
n∑i=1
[Yi − (β0 + β1Xi)]2 (20)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 258 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Metodo dos Mınimos Quadrados para Estimacao dosParametros do Modelo
1 Resolvendo a equacao (20), temos:
β1 =
∑ni=1(Xi − X)(Yi − Y )∑n
i=1(Xi − X)2=SXY
SXX(21)
ou β1 =
∑ni=1XY − nXY∑ni=1X
2 − nX2
β0 = Y − β1X, Y =1
n
n∑i=1
Yi, X =1
n
n∑i=1
Xi (22)
onde SXY e chamado de soma de quadrados de produtos cruzados eSXX e a soma de quadrados de X
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 259 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Exemplo 15
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 260 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Exemplo 15Year Runoff(Y) Precipitation(X) XY X2 Y 2
1928 125 110 13750 12100 156251929 67 73 4891 5329 44891930 68 74 5032 5476 46241931 71 91 6461 8281 50411932 118 108 12744 11664 139241933 144 130 18720 16900 20736
......
......
......
1941 58 84 4872 7056 33641942 79 85 6715 7225 62411943 124 115 14260 13225 153761944 62 70 4340 4900 38441945 87 91 7917 8281 7569∑
1799 1801 192042 189291 197373
Media 99.94444 100.0555556
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 261 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Exemplo 15
1 Para estes dados:∑ni=1XY = 192042; nXY = 18× 99.94× 100.06 = 179999.94;∑ni=1X
2 = 189291; nX2 = 18× 100.062 = 180216.06
2 β1 =
∑ni=1XY − nXY∑ni=1X
2 − nX2=
192042− 18× 99.94× 100.06
189291− 18× 100.062= 1.325
3 β0 = Y − β1X = 99.94− 1.325× 100.6 = −32.64
4 Conhecidos β0 e β1, podemos escrever a equacao de regressaoestimada:
Yi = −32.591 + 1.325Xi
5 Podemos pensar em Yi como a media estimada da variavel respostapara Xi = x
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 262 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Exemplo 15
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 263 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Estimcao da Variancia
1 O valor de Q(β0, β1) denota-se por Soma de Quadrados dos Erros(SQE). Ou seja SQE representa a soma de quadrados dos desviosentre Y e Y
2 O SQE indica-nos quao bem bem a linha de regressao se ajusta aosdados
SQE = Q(β0, β1) =
n∑i=1
(Yi − Yi)2 =
n∑i=1
e2i (23)
onde ei e designado por resıduo
3 Notacao: ei = (Y − Yi) e a diferenca entre o valor observado eestimado (previsto). Podemos pensar em ei como um estimador dotermo de erro εi
4 como σ2 e a variancia comum dos ε1, ε2, ..., εn e porque e1, e2, ..., enestima os εi entao SQE deve providenciar alguma informacao sobreσ2
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 264 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Estimcao da Variancia
De facto, SQE tem associado n − 2 graus de liberdade. Dois graus deliberdade usados para estimar β0 e β1 na determinacao da media estimadaYi. Desta forma, a media de SQE tambem chamada de quadrado medio edado pela formula:
s2 = QM =SQE
n− 2(24)
que e estimador nao enviesado de σ2, onde QM significa quadrado medio
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 265 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Inferencia dos Parametros do Modelo
1 Inferencia baseada na distribuicao normal:
f(Y, µ, σ2) =1√2πσ
exp
[−1
2
(Y − µσ
)2]
2 εi ∼ iid N(0, σ2), i.e, termo de erro e identica e independentementedistribuido de acordo com uma distribuicao normal com media 0 evariancia constante σ2
3 Inferencia baseada no Teorema do Limite Central
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 266 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Inferencia para β1
1 Na maioria dos problemas nos estamos interessados em β1. Porque?β1 = 0→ Nao ha associacao linear entre X e Y .
2 Avaliacao por meio de duas tecnicas relacionadas
Testes de hipotesesIntervalos de confianca
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 267 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Teste de Hipotese para β1
Procedimentos
1 Definicao de hipoteses e nıvel de significanciaH0 : β1 = c vs. H1 : β1 6= c
2 Encontrar valores crıticos do teste usando distribuicao tn−2
3 Calcular a estatıstica do teste
T =β1 − β1
s(β1)∼ tn−2 (25)
4 Comparar os valores T com os valores crıticos:
Se |T | 6 t1−αn ,n−2 → Nao rejeite a hipotese nulaSe |T | > t1−αn ,n−2 → Rejeite a hipotese nula
5 Comparar o valor de p-value e nıvel de significancia, α
p-value = P (T > |t|)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 268 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Intervalo de Confianca para β1
O intervalo com 100(1− α)% de confianca para β1 e dado por
β1 ± t1−αn,n−2s(β1) (26)
β ± t1−αn,n−2
√( MSE∑(Xi − X2)
)β1 − t1−α
n,n−2s(β1) ≤ β1 ≤ β1 + t1−α
n,n−2s(β1)
onde s(β1)e erro padrao de β1
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 269 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Teste de Hipotese para β0
Procedimentos
1 Definicao de hipoteses e nıvel de significanciaH0 : β0 = c vs. H1 : β0 6= c
2 Encontrar valores crıticos do teste usando distribuicao tn−2
3 Calcular a estatıstica do teste
T =β0 − β0
s(β0)∼ tn−2 (27)
4 Comparar os valores T com os valores crıticos:
Se |T | 6 t1−αn ,n−2 → Nao rejeite a hipotese nulaSe |T | > t1−αn ,n−2 → Rejeite a hipotese nula
5 Comparar o valor de p-value e nıvel de significancia, α
p-value = P (T > |t|)
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 270 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Intervalo de Confianca para β0
O intervalo com 100(1− α)% de confianca para β0 e dado por
β0 ± t1−αn,n−2s(β0) (28)
β0 − t1−αn,n−2s(β0) ≤ β0 ≤ β0 + t1−α
n,n−2s(β0)
onde s(β0) e erro padrao de β0
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 271 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Coeficiente de Correlacao e Determinacao, R2
1 Medida que descrever o grau de associacao linear entre X e Y2 SQT mede a variabilidade quando estimamos a media de Y e X nao
consta do modelo → Da mesma forma que SQE mede a variacao emY quando o modelo de regressao utiliza a variavel explicativa X
3 Qual o efeito de X na variabilidade em Y ?
R2 =SQT − SQE
SQT=SQR
SQT= 1− SQE
SQT(29)
4 R2 e chamado de coeficiente de determinacao e mede a proporcao davariacao total em Y que e explicada pela recta de regressao linearcom X como variavel explicativa
5 Porque 0 ≤ SQE ≤ SQT entao 0 ≤ R2 ≤ 1. No caso de um perfeitoajuste da recta de regressao, SQE = 0 e R2 = 1 (β1 6= 0)
6 Em pratica 0 < R2 < 0 e quando mais proximo estiver de 1, maior e ograu de associacao linear entre X e Y
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 272 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Coeficiente de Correlacao e Determinacao, R2
1 O coeficiente de determinacao e o quadrado do coeficiente decorrelacao linear, r, que mede o grau de associacao linear entre X e Y
r = ±√R2
onde o sinal de r depedende do sinal de β1
2 β1 e r estao relacionados da seguinte maneira:
r =s(X)
s(Y )β1
onde s(X) e s(Y ) desvio-padrao de X e Y , respectivamente
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 273 / 294
Toeria de probabilidades Distribuicoes de probabilidades
Exempo 17 Coeficiente de Correlacao e Determinacao
1 Para o caso do exemplo anterior, onde X: Precipitacao (rainfall) e YCaudal:SQR = 15951.16 e SQT = 17572.94
R2 =SQR
SQT=
15951.16
17572.94= 0.908
2 Desta forma, cerca de 90.8% da variacao total do vulome de aguaque escorre a partir da superficie e explicada pela equacao deregressao estimada tendo precipitacao como variavel explicativa
3 O coeficiente de correlacao linear: r = ±√R2 = +
√0.908 = 0.953
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 274 / 294
Toeria de probabilidades Distribuicoes de probabilidades
The End
dr. Rachid Muleia, Msc in Statistics ISUTC/ 1ºAno 28 de Outubro de 2016 275 / 294