Probabilidade e Estatística (1)

Embed Size (px)

Citation preview

1 Estatstica Descritiva1.1 Denies e Conceitos em Estatsticaa)Estatstica: a cincia que se preocupa em tirar concluses de um todo com base em uma partedo todo. Por meio dela possvel coletar,apresentar, analisar e interpretar um conjunto dedados.b)Censo: um estudo estatstico que resulta da observao de todos os indivduos da populaorelativamente a diferentes atributos pr-denidos.Teoricamente, no censo, tem-se a informaoprecisa de uma varivel em estudo, enquanto na estatstica tem-se uma previso da ocorrnciada varivel.c)Diviso da Estatstica: A estatstica bsica pode ser dividida em duas reas:Estatsticadescritiva: descreve resumidamente um conjunto de dados, utilizando ta-belas, grcos, medidas de posio e de disperso.Exemplos:Velocidade de processamento de um computador; tempo de espera para seratendido em uma loja; opinio das pessoas quanto a violncia no pas; temperaturamensal de uma cidade.EstatsticaIndutivaouInfernciaEstatstica: representa o estudos dos dados deamostras comoobjetivodeentender outirar concluses sobreocomportamentodapopulao a partir das amostras.Exemplo: Suponha que se deseja calcular a voltagem necessria para que um dispositivoeltricochegueafalhar. Paraisso, submete-seumaamostradetaisdispositivosavoltagens cada vez mais elevadas, at falhar cada dispositivo da amostra. Com basenosresultados, pode-seestimaraprobabilidadedefalhanosdispositivos, acadavoltagem.d)Dadosde observao: so valores (realizaes) assumidos por uma varivel e observada pelopesquisadore)Populao: conjuntodeindivduosouobjetosquepossuempelomenosumacaractersticacomum observvel.Exemplos:Todos os eleitores do Brasil; Todos os cidados que possui TV;f )Amostra: um subconjunto nito da populao que mantm as mesmas caractersticas destapopulao.Exemplos:3000 eleitores; Cidados entrevistados pelo servio de televiso;g)Varivel: uma caracterstica que pode assumir diferentes valores de indivduo para indivduo.Variveisqualitativas: soaquelasparaasquaisumamedionumricanopos-svele, apresentamcomopossveisrealizaesumaqualidadeouatributodoindivduopesquisado.Variveisquantitativas: so aquelas para as quais possvel realizar uma contagemou mensurao.Variveis nominais: utilizadasquandonoexistenenhumaordenaonaspossveisrealizaes.1Exemplos: Sexo(Femininooumasculino), estadocivil(Solteiro, casado, divorciado,vivo), naturalidade (Uberlndia, Monte Alegre, Araguari), etc.Variveis ordinais:utilizadas quando os seus possveis resultados podem ser ordenadospor algum critrio especico.Exemplos: Grau de instruo de um indivduo (Ensino Mdio, graduao, ps-graduao),classe social (Baixa, mdia, alta), classicao de um produto (regular, bom, timo)etc.Variveis discretas: assumemvaloresespeccos, egeralmenteestorelacionadasadados de contagem e associadas com o conjunto dos nmeros inteiros.Exemplos: Nmerodelhosdeumcasal, nmerodeacidentesocorridosemumadeterminada rodovia, nmero de moradores de uma residncia, etc.Variveiscontnuas: assumem innitos valores dentro de um intervalo,e esto asso-ciadas em geral, com os nmeros reais e relacionadas a medies.Exemplos: Estatura de um indivduo, temperatura de uma cidade, produo de umacultura, etc.h)Dados Brutos: so os dados de observao sem nenhuma observao lgica.i)Dados elaborados ou rol: so os dados de observao em ordem crescente ou decrescente.j)Amplitude Total(A): a diferena entre o maior valor observado e o menor valor observado.A = X(n) X(1)= maior valor observado - menor valor observado.Apresentao dos dadosA organizao, sumarizao e descrio de dados podem ser feitas por meio dos mtodos tabularese grcos.1.2 Distribuio de Frequncias:Uma distribuio de frequncia um sumrio tabular dos dados que mostra o nmero (frequncia)de itens em cada uma das classes ou categorias no sobrepostas.Tipos de frequnciasa)Frequncia Absoluta (fi): o nmero de vezes que o indivduo aparece na amostrab)FrequnciaRelativa(fr): fr =fin , emque nonmerodeobservaes, ouseja,n =k

i=1fi, sendok o nmero de classes ou categorias.c)Frequncia Percentual (fp): fp= fr 100:d)FrequnciaAcumulada(Fi): indica o nmero de dados que possuem valores menoresou maiores, ou ento iguais ao limite superior de cada classe.Algoritmo para construo da distribuio de frequncias para variveis quantita-tivasa)Calcular a Amplitude Total(A): A = X(n) X(1);b)Calcular o nmero de classes (k): k= n sen 100; k=5logn sen>100. Em ambosos casos deve-se escolher o nmero inteiro mais prximo;2c)Calcular a amplitude da Classe (C): C=Ak1;d)Calcular o limite inferior da primeira classe (LI1a): LI1a= X(1);e)Organizar as classes e contar as frequncias;Observaes:1. Os intervalos das classes podem se classicar em: abertos(]a,b[ ou a b) de modo queos limites da classe no pertencem a ela; fechados ([a,b] ou ab) em que os limites daclasse pertencem a ela ou mistos ([a,b[ ou ab)no qual um dos limites pertence classe,e o outro, no;2. Por questes de ordem prtica e esttica, sugere-se utilizar de 5 a 20 classes;3. As frequncias simples so representadas por letras minsculas e as frequncias acumula-das por letras maisculas;4. No caso de variveis discretas, quando a amplitude total das observaes pequena, cadavaloradotadocomosendoumaclasse, enestescasos, oalgoritmoapresentadonoutilizado;5. Para determinados clculos estatsticos, todos os pontos de uma classe podem ser repre-sentadospelopontomdiodaclasse. Opontomdiodaclassei ( xi)calculadopelamdia dos limites da classe. Esse critrio conhecido como hiptese tabular bsica.Exemplos:1. Uma pesquisa foi realizada para vericar a preferncia dos consumidores em uma cidade quantoaos cinco tipos de refrigerantes:coca-cola(C), fanta(F), pepsi-cola(P), sprite(S) e Guaran(G),obtendo os seguintes dados:F C C F P P C G C FC S C F C F C S P CC P C S G P F P C CP G P C P G S C C Pa) Classicar a varivel;b) Obter a distribuio de frequncias;2. Parafacilitarumprojetodeampliaodaredeesgotodeumcertobairro, asautoridadestomaram uma amostra de tamanho 36 dos 270 quarteires que compem a regio em estudo,e foram encontrados os seguintes nmeros de casas por quarteiro:15 27 22 36 13 2923 45 15 18 16 2526 10 34 23 27 4420 30 21 32 16 3414 20 17 24 25 2617 25 36 22 42 29a) Classicar a varivel;b) Colocar os dados em rol;c) Construir a distribuio de frequncias;d) Obter as frequencias acumuladas Abaixo dee Acima de;33. Um estudo apresentou informaes sobre a tecnologia dos aparelhos domsticos e sua utilizaopor pessoas de 12 anos ou mais. Os dados a seguir referem-se ao nmero de horas de uso decomputadores pessoais durante uma semana para uma amostra de 50 pessoas:1,5 1,6 1,6 2,0 2,8 3,0 3,1 3,1 3,1 3,33,4 3,5 3,7 3,7 3,9 3,9 4,0 4,1 4,1 4,14,1 4,2 4,3 4,4 4,7 4,8 5,4 5,6 5,7 5,75,7 5,9 5,9 6,1 6,1 6,1 6,2 7,1 7,2 7,68,8 9,5 10,3 10,3 10,4 10,4 10,8 11,1 12,1 12,9a) Classicar a varivel em estudo;b) Construir a distribuio de frequncias;1.3 Representaes grcas:Variveis contnuas:a) Histogramas: um grco de colunas justapostas, no qual a varivel contnua, divididaem classes, representada no eixo horizontal. No eixo vertical, marcam-se as freqnciasrelativas ou percentuais de cada classe, construindo as colunas.b)Polgono de frequncias:so segmentos de retas que tem suas extremidades correspon-dentesaopontomdiodaclasseeacoordenadaydaextremidadeserproporcionalafrequncia da classe.c)Grcodafrequnciaacumulada(ogiva): sogrcosconstrudosapartirdadis-tribuiodefrequnciasacumuladas. Nocasodasvariveiscontinuas, utiliza-selinhascontnuas.d)Histogramascomamplitudesdeclassesdesiguais: se a distribuio de frequnciaspossuir amplitudes de classes desiguais, deve-se fazer um ajuste de frequncias antes deconstruir o histograma. Esse procedimento garante a proporcionalidade das reas entreas diferentes classes. As correes das frequncias so realizadas por meio das densidadesdefrequncias(d.f), ouseja, substituindoafrequnciadaclasseipeladfi, dadapor:dfi= fi/Ci.Exemplos:1. A distribuio de frequncias abaixo refere-se ao preo em reais das refeies por quilo de25 restaurantes prximo a UFU:Preo das refeies (R$) fifrfp1013 1 0,04 41316 4 0,16 161619 12 0,48 481922 6 0,24 242225 2 0,08 8Total 25 1,00 100Pede-se:a) Interpretar a distribuio de frequncias;b) Construir o histograma e o polgono de frequncias;c) Calcular as frequncias acumuladas e construir o grco correspondente (ogivas).42. Considereaseguiradistribuiode130empresasclassicadassegundoonmerodeempregados:Nmero de Empregados fi020 102040 304080 6080160 30Construir o histograma para esses dados;Variveis discretas:a)Grcodelinhas: para as variveis discretas a representao grca conveniente paraas frequncias simples o grco de linhas, pois s ocorre frequncias nos pontos xos,ou seja, no existe a continuidade.b)Grcodefrequnciasacumuladas: so grcos construdos a partir das frequnciasacumuladas e no caso discreto, assume um aspecto de escadas.Exemplos:1. Osetorpessoal deumaempresabrasileiraregistrouosseguintesnmerosdefaltasdefuncionrios em uma semana do ms de julho/2010:Nmero de faltas fi2 23 34 85 56 2Total 20Com base nestes dados:a) Construir o grco de linhas;b)Obterasfrequnciasacumuladaserepresentargracamenteasfrequnciasacu-muladas;Outras representaes grcas:a) Grcodesetores: comparaaspartesestudadascomotodo, sendoapresentadoemporcentagenssobreaformadesetoresemcirculoeindicadopararepresentarvariveisqualitativas.b)Ramose folhas: so os grcos construdos com os valores observados. Trata-se da dis-posioemroldosdados, combasenoisolamentodeumalgarismomaissignicativo,denominado galho (por exemplo, dezena), e de algarismos menos signicativos, denomi-nados folhas (por exemplo, unidades).c)Grco de barras:similar ao histograma, possuindo o objetivo de apresentar as frequn-cias sob a forma de barras horizontais ou verticais, separadas entre si. Os dados podemser nominais ou quantitativos (agrupados em classes ou no).d)Grcos depontos (disperso): usadoemestudosdecorrelao, permitindovi-sualizar o grau de associao entre duas variveis quantitativas medidas em um mesmoindivduo. Cadapardeobservaesrepresentadoporumponto(x,y)dosistemadecoordenadas cartesianas.5e) Grco Box-plot: um dos mais usados grcos da estatstica e fornece ideias sobre asmedidas de posio, disperso, assimetria, caudas e dados discrepantes.Exemplos:1. Uma pesquisa foi realizada com o objetivo de vericar o estado de procedncia dos alunosmatriculados na rea de exatas na UFU, obtendo os seguintes resultados:Estado fpngulo(graus)MG 62SP 17GO 14Outros 7Total 100Representar essas informaes em um grco de setores.2. Osdadosabaixoreferem-seaonmerodequartosocupadosdiariamentenumhoteldepraia durante o ms de janeiro:55 49 37 57 46 40 64 35 73 6261 43 72 48 54 69 45 78 46 5940 58 56 49 42 62 53 46 81 52Represente os dados atravs de um grco de ramos e folhas.3. Utilizando as informaes do exemplo 1, construa um grco de barras.4. Um estudo realizado em 5 cidades mineiras vericou que o nmero de lhos de 50 famliaspode ser representado pela tabela a seguir:Nmero de lhos fifrfp1 14 0,28 282 18 0,36 363 12 0,24 244 6 0,12 12Total 50 1 100Esboar o grco de barras para esses dados.5. Os dados a seguir foram obtidos num estudo sobre a relao entre a resistncia (ohms) eo tempo (min) que certos resistores sobrecarregados levam para falhar.Resistncia 33 36 30 44 34 25 40 28 40 46Tempo 39 36 34 51 36 21 45 25 45 36Verique, pormeiododiagramadedisperso, arelaoexistenteentrearesistnciaeotempo de falha.1.4 Interpolaes em tabelas de distribuio de frequncias:Exemplo: A tabela a seguir representa a distribuio de salrios em uma empresa:Salrios fa7,5010,50 1410,5013,50 1713,5016,50 1116,5019,50 8Total 50a) Qual a % de funcionrios que ganham mais de 13,50 salrios?b) Qual a % de funcionrios que ganham entre 8 e 12 salrios?61.5 Natureza da distribuio de frequncias:a)Simtrica: 50% das observaes esto abaixo do valor central e 50% acima.b)Assimtrica direita: maioria dos valores esto concentrados esquerda da distribuio.c)Assimtrica a esquerda: maioria dos valores esto concentrados a direita da distribuio.d)Multimodal: vrios picos de frequncia.1.6 Tcnicas de somatrioDada as variveisXi eYj(i = 1,2, , n), (j= 1,2, , m) e a constantek, temos:a)n

i=1Xi= x1 +x2 + +xnb)n

i=1m

j=1XiYj= x1y1 +x1y2 + +xnymc)n

i=1Xim

j=1Yj= (x1 +x2 + +xn)(y1 +y2 + +ym)d)n

i=1X2i= x21 +x22 + +x2ne) (n

i=1Xi)2= (x1 +x2 + +xn)2f )n

i=1k = k +k + +k = nkg)n

i=1kXi= kx1 +kx2 + +kxn= kn

i=1Xi1.7 Medidas de posioAs medidas de posio ou de tendncia central constituem uma forma mais sinttica de apresentaros resultados contidos nos dados observados, pois representam um valor central, em torno do qual osdados se concentram. Portanto, constitui como objetivo ao obter as medidas de posio, encontrarum nico valor, em um conjunto de valores observados, que seja representante desse conjunto. Asmedidas de posio mais empregadas so a mdia, a mediana e a moda.a)Mdiaaritmtica( x): umamedidadefcil compreenso, maiscomumesimplesdesercalculada.i)Dados no agrupados: x =n

i=1xinii)Dados agrupados: x =k

i=1 xifin, em que xi o ponto mdio da classe i;7Observao:1. Nas distribuies de frequncias,assume-se a hiptese de que todas as observaescontidas em uma classe so consideradas iguais ao ponto mdio da classe.Exemplos:1. O nmero de peas defeituosas observado em amostras retiradas diariamente da linhade produo de uma indstria, durante uma semana foi de: 10, 14, 13, 15, 16, 18 e 12peas. Calcular o nmero mdio de peas defeituosas por dia desta semana avaliada.2. Considere os nmeros de gols por partida em um determinado campeonato de futebol,agrupados e apresentados na sequncia. Calcule o nmero mdio de gols por partida.Node gols por partida fi0 71 122 163 124 95 26 2Total 603. Para a distribuio de frequncias que representa a fora de ruptura em libras porpolegada quadrada (psi) da garrafas descartveis de um litro de refrigerante, calculara mdia.Classes fi86,6147 1147208 6208269 13269330 8330390 2Total 30Propriedades da mdia aritmtica:1. A soma dos desvios (SD) de um conjunto de dados em relao a sua mdia nula.2. Asomados quadrados dos desvios deumconjuntodedados emrelaoaumaconstante k mnima se e somente se k= x.3. Somando ou subtraindo uma constanteka cada valor observado,a mdia do novoconjunto de dados car somada ou subtrada da constantek,em relao a mdiainicial.4. Multiplicandooudividindo-secadavalor observadopor umaconstante kanovamdia car multiplicada ou dividida pork.b)Outros tipos de mdia:1. Mdia Ponderada ( xp): essa mdia associa as observaes x1, x2, , xn determinadasponderaes ou pesos que dependem da importncia atribuda a cada uma das observa-es. xp=n

i=1wixin

i=1wi=w1x1 +w2x2 + +wnxnw1 +w2 + +wn,8sendowi o peso da observaoi.2. Mdia Geomtrica (G): utilizada para representar variveis assimtricas a direita, poisnestes casos, a mdia aritmtica, por ser muito inacionada pelos valores extremos, norepresenta bem a varivel.G =nx1.x2. .xnou ainda logG =1n(logx1 +logx2 + logxn)3. Mdia Harmnica (H): utilizada para variveis que apresentam periodicidade, ou seja,uma variao harmnica como porexemplo,ondas derdio,variao depreos,entresoutros.H=nn

i=11/xiExemplos:1. Suponha que uma indstria realizou ao longo dos ltimos trs meses cinco comprasde determinada matria prima:Compra Custo por quilo (R$) Quantidade Quilos1 3 12002 3,40 5003 2,80 27504 2,90 10005 3,25 800Deseja-seobterinformaessobreocustomdioporquilodamatriaprima.Qual esse custo mdio?2. Sabe-se que os multiplicadores de crescimento anual de consumo de um determinadoservio telefnico foram iguais a 1,2; 1,8; 2,7; 0,9; 1,5; 2,3 e 0,7. Calcular a mdiaaritmtica, geomtrica e harmnica.c)Mediana(Md): a realizao que ocupa a posio central de um conjunto de dados ordenados.Ou seja, abaixo da mediana devero estar 50% dos elementos analisados e acima da medianadevero estar 50% dos dados analisados.i)Dados noagrupados: Ovalor damedianadependedaquantidade ndeelementospresentes no conjunto de dados. Se o nmero de dados for mpar a mediana ser igualaovalorcentral. Nocasodenmerosdedadosparamedianaserdadapelamdiaaritmtica entre os dois valores centrais.Matematicamente, a mediana denida como:Md =_x(n+1)/2sen mparx(n2 )+x(n+22)2sen parii)Dados agrupados:Md = LI +0,5nFifMd.Cem que:LI o limite inferior da classe mediana;Fi a frequncia acumulada das classes anteriores a classe mediana;9fMd a frequncia da classe mediana;C a amplitude da classe mediana;nonmerodeobservaeseclassemedianaaclasseondeseencontraoindivduomediano.Exemplos:1. Os preos em reais para uma amostra de aparelho de ar condicionado so: 500, 840,470, 480, 420, 440 e 440. Calcular a mediana.2. Opesodemancaisproduzidosporumprocessodefundioestsendoestudado.Uma amostra de seis mancais foi medida, resultando nos seguintes pesos: 1,18; 1,21;1,19; 1,17; 1,20 e 1,21. Obter a mediana.3. Utilizandonovamenteosdadosreferenteaosnmerosdegolsporpartidaemumcampeonato de futebol, calcular a mediana desses valores:Node gols por partida fi0 71 122 163 124 95 26 2Total 604. Suponha que a renda familiar em salrios mnimos de uma amostra com 72 traba-lhadores pudesse ser representada segundo a tabela:Classe fi12 1324 2246 1868 7810 81012 4Total 72Calcular a mediana.d)Moda(Mo): ovalorqueocorrecommaiorfrequnciaentreosvaloresobservados. Emumconjunto de dados, pode existir mais de uma moda ou no ter nenhum valor modal.i) Dados no agrupados: o valor que aparece repetido mais vezes.ii)Dados agrupados:Se os dados encontram-se em uma distribuio de frequncia, procede-se das seguintes formas:utilizao de frmula:Mo = LI +11 + 2.C,em que: LI o limite inferior da classe modal;1 a diferena entre a frequncia da classe modal e a frequncia da classe imediatamenteinferior;2 a diferena entre a frequncia da classe modal e a frequncia da classe posterior;Camplitude da classe modal e classe modal a classe de maior frequncia.10utilizao do ponto mdio da classe modal:Mo =LI +LS2,em que: LI o limite inferior da classe modal e LS o limite superior da classe modalutilizao do mtodo geomtrico:Observaes:1. Quando o mtodo geomtrico utilizado, a moda tender para o limite inferior ousuperiordaclassemodala medida queovalorda frequncia da classeanteriorformaior que a d posterior ou a frequencia da classe posterior for maior que a da anterior,respectivamente. Se as classes anterior e posterior a classe modal tiverem a mesmafrequncia, ento a moda ser o ponto mdio da classe.2. As propriedades (3) e (4) da mdia aritmtica tambm so vlidas para a mediana ea moda.Exemplos:1. Durante o ms de setembro de um certo ano, o nmero de acidentes por dia em umcerto trecho da rodovia, apresentou os seguintes valores:0 0 0 0 0 1 1 1 1 11 1 1 1 1 1 2 2 2 22 2 2 2 3 3 3 4 4 6Qual a moda de acidentes por dia?2. Determine a moda para os seguintes conjuntos de dados:a) 150, 155, 157, 160, 160, 163, 165, 165, 170b) 10, 12, 14, 15, 16, 19, 213. Considereosdadosamostraisdonmerodecircuitosdefeituososemumsistemacompostopor4circuitos. Umaamostrade19sistemasfoi coletada, obtendoosseguintes dados:Nmero de circuitos defeituosos fi1 102 73 14 1Total 19Determinar a moda, ou seja, o nmero modal de circuitos defeituosos por sistema.4. O quadro a seguir representa a distribuio de frequncias do peso (kg) de pessoasde uma certa faixa etria:Peso fi4045 34550 85055 165560 126065 76570 37075 1Total 50Calcular a moda e interpretar.111.8 Relao entre, x,Md eMoa)Se x=Md=Mo: Distribuio simtricab)Se x>Md>Mo : Distribuio assimtrica direita.c)Se x 1a) Encontre o valor dek para quef(x) seja uma funo densidade de probabilidade;b) Calcular a probabilidade dex ser menor que0,5;c) Obter a distribuio acumuladaF(X).3.3 Parmetros caractersticos de uma Distribuio de Probabilidade3.3.1 Esperana MatemticaMuitasvezestem-seointeresseemestimarparmetroscaractersticosdeumadistribuiodeprobabilidade de uma varivel aleatria qualquer. Um desses parmetros a Esperana Matemtica,querepresenta uma mdia aritmtica ponderada ou umvalor esperado deuma varivel aleatria.Na prtica, a esperana pode ser entendida como um centro de distribuio de probabilidade, isto, a mdia de uma distribuio de probabilidade.A Esperana Matemtica denida da seguinte forma: SeX uma varivel aleatria discreta:x= E(X) =n

i=1xiP(X= xi) SeX uma varivel aleatria contnua:x= E(X) =_+xf(x)dx Propriedades da Esperana Matemticai) E(k) = k, sendok uma constanteii) E(kX) = kE(X)iii) E(X Y ) = E(X) E(Y )iv) E(X K) = E(X) Kv) E(XY ) =E(X)E(Y ) seXeYso variveis aleatrias independentes.3.3.2 Varincia e desvio padroAnteriormente foi apresentado que a esperana matemtica fornece a mdia de uma distribuiode probabilidade. Porm, nestas situaes no se tem a informao a respeito do grau de dispersodas probabilidades em torno da mdia. Portanto, a medida que ser utilizada para estimar o graude disperso (ou de concentrao) de probabilidade em torno da mdia ser a varincia.A varincia denida da seguinte forma:V (X) = 2x= E(X2) [E(X)]2= E(X2) 224 SeXumavarivel aleatriadiscreta, entoaesperanamatemticaE(X2)dada por :x= E(X2) =n

i=1x2iP(X= xi) SeX uma varivel aleatria contnua, ento a esperana matemticaE(X2) :x= E(X2) =_+x2f(x)dxO desvio padro obtido por meio da seguinte expresso: x=_2x. Propriedades da Varinciai) V (k) = 0, sendok uma constante;ii) V (kX) = k2V (X)iii) V (X K) = V (X)iv) V (X Y ) = V (X) V (Y ), se X e Y so variveis aleatrias independentesExemplos:1. Um estudo do nmero de carros alugados em uma operadora durante certo perodo doano foi realizado e obteve se a seguinte funo de probabilidade:X 0 1 2 3 4P(X= x) 0,05 0,25 0,36 0,21 0,13Obter a mdia e o desvio padro para esses dados.2. Dada a v.a. contnua com a seguinte funo densidade de probabilidade:f(x) =___0 parax < 0k para0 x < 1k(2 x) para1 x < 20 parax > 2a) Determinar o valor de k para que f(x) seja uma funo densidade de probabilidade;b) Esboce o grco def(x);c) Encontre a distribuio acumuladaF(X);d) Construa o grco deF(X)e) Calcular a esperana, a varincia e o desvio padro def(x).254 Variveis Aleatrias BidimensionaisEmmuitassituaes, pode-seestarinteressadoemobservarduascaractersticassimultanea-mente. Neste casos, deve-se tratar cada caracterstica como uma varivel aleatria, e, portanto, asduas variveis aleatrias conjuntamente como uma varivel bidimensional.4.1 Denio de Variveis Aleatrias BidimensionaisConsidere um experimento aleatrio e o espao amostral associado a esse experimento. Sejam Xe Yduas variveis aleatrias. Ento, (X, Y ) dene uma varivel aleatria bidimensional. Os valoresda varivel aleatria bidimensional (X, Y ) so representados pelos pares ordenados (x,y). Se tanto avarivel aleatria X quanto a varivel aleatria Yassumirem um nmero nito ou innito numervelde valores, ento dizemos que a varivel aleatria bidimensional discreta. Caso a varivel aleatriaXeavarivelaleatriaY assumirem, cadauma, umnmeroinnitonoenumerveldevalores,ento a varivel bidimensional considerada uma varivel aleatria contnua.Podeacontecerocasodeumavarivel aleatriaserdiscretaeaoutravarivel aleatriasercontnua. Noentanto, somenteoscasosemqueambasasvariveissodiscretasouambassocontnuas ser abordado neste curso.4.2 Varivel Aleatria DiscretaSeja(X, Y ) uma varivel aleatria bidimensional discreta. A cada valor possvel(x, y) associa-se um nmero real,denotado porp(x,y),representando a probabilidade de a varivel aleatriaXassumir o valor x, ao mesmo tempo em que a varivel aleatria Yassume o valor y, isto , p(x, y) =P(X= x, Y= y). O conjunto de todas as probabilidades p(x, y), para todos os valores vlidos paraas variveis aleatriasXeY , denido como a funo conjunta de probabilidades da varivelaleatria bidimensional discreta(X, Y ). Esses nmerosp(x, y),como representam probabilidades,devem satisfazer s seguintes condies:a) 0 p(x, y) 1 para todo(x, y)b)

x

yp(x, y) = 1Exemplos:1. Umafbricaproduzdeterminadotipodepea. Apeapodeserproduzidaporduaslinhas de produo distintas. A capacidade de produo da linha I de 4 peas por hora,e a capacidade de produo da linha II de 3 peas por hora. Representando o nmerodepeasrealmenteproduzidaspelasduaslinhasemumadeterminadahoraatravsdeumavarivel aleatriabidimensional (X,Y ), entoonmerodepeasproduzidaspelalinha I representar a varivelXe o nmero de peas produzidas pela linha II a varivelY . Sendo assim, tem-se a seguinte funo conjunta de probabilidades:Y \ X 0 1 2 3 4 Total0 0,01 0,01 0,05 0,08 0,11 0,261 0,01 0,02 0,06 0,09 0,06 0,242 0,01 0,03 0,06 0,07 0,08 0,253 0,01 0,02 0,05 0,09 0,08 0,25Total 0,04 0,08 0,22 0,33 0,33 1Determinar a probabilidade de a linha I produzir um nmero maior de peas do quea linha II em uma determinada hora.262. A funo de probabilidade conjunta da varivel aleatria bidimensional discreta (X, Y ) p(x, y) = c(2x +y), em que0 x 2 e0 y 3.a) Determinar o valor da constante c e obter a funo conjunta da varivel bidimen-sional(X, Y );b) Calcular aP(X 1; Y 2);4.2.1 Distribuies de Probabilidades MarginaisSemaisdeumavarivel aleatriafordenidaemumexperimentoaleatrio, serimportantedistinguir entre a distribuio de probabilidades conjuntas deXeYe a distribuio de probabili-dades de cada varivel individualmente. A distribuio individual de probabilidade de uma varivelaleatria referida como a distribuio de probabilidades marginais.Emgeral, adistribuiodeprobabilidadesmarginaisdeXpodeserdeterminadaapartirdadistribuio de probabilidades conjuntas deXe de outras variveis aleatrias.Se X e Yso variveis aleatrias discretas, com funo de probabilidade conjunta P(X,Y ), entoas funes de probabilidades marginais deXeYso:p(x) = P(X= x) =

Todo yp(x, y) e p(y) = P(Y= y) =

Todo xp(x, y) importante lembrar que,comop(x) ep(y) so funes de probabilidade,ento as condies0 p(x) 1 e

xp(x) = 1 devem ser satisfeitas, e, analogamente,0 p(y) 1 e

yp(y) = 1.Voltando ao exemplo anterior das linhas de produo,tem-se que as probabilidades marginaisdeXeYso dados, respectivamente, por:x 0 1 2 3 4p(x) 0,04 0,08 0,22 0,33 0,33 1y 0 1 2 3p(y) 0,26 0,24 0,25 0,25 1Observao:1. AE(X), E(Y ), V (X) eV (Y ) podem ser obtidas calculando as distribuies marginaisdeXeY , e em seguida, determinando as esperanas e varincias pelo mtodo usual.4.2.2 Distribuies de Probabilidades CondicionaisAprobabilidadecondicionaldevariveisaleatriasbidimensionaiscalculadadeformaseme-lhante probabilidade condicionada de eventos, vista no captulo de probabilidades. Desse modo, afuno de probabilidade condicionada deXdado queY= y, denotada porp(x|y), denida por:P(X= x|Y= y) =P(X= x; Y= y)P(Y= y)Exemplos:1. Utilizando novamente o exemplo das duas linhas de produo, calcule:a) P(X=0|Y=0)b) P(X=2|Y=1)c) P(X=4|Y=3)272. Sejam X e Yduas variveis aleatrias, representando, respectivamente, o nmero de golsmarcados pela equipe A e o nmero de gols marcados pela equipe B em um campeonato defutebol. Portanto, possvel expressar a funo de probabilidade conjunta dessa varivelaleatria bidimensional discreta por meio da seguinte tabela:Y \ X 0 1 2 3 p(y)0 0,04 0,08 0,04 0,04 0,21 0,08 0,16 0,08 0,08 0,42 0,08 0,16 0,08 0,08 0,4p(x) 0,2 0,4 0,2 0,2 1a) Qual a probabilidade do nmero de gols marcados pela equipe A, sabendo que aequipe B marcou um gol?4.2.3 Variveis Aleatrias independentesDiz-se queX eYso variveis aleatrias independentes quando o resultado deX, por exemplo,de modo algum no inuencia o resultado deY , e vice-versa, ou seja, p(x|y)=p(x) para todox ey, ou equivalentemente, sep(y|x) = p(y) para todox ey.Assim, se(X, Y ) uma varivel aleatria bidimensional discreta, diz-se queX eYso variveisindependentes se, e somente se,p(x, y) = p(x)p(y)para quaisquerx ey. Essa relao consequncia do conceito de probabilidade condicionada, poisporexemplo, comoP(X=x|Y =y)=P(X=x;Y =y)P(Y =y)e, nocasodeindependncia, p(x|y)=p(x),segue quep(x, y) = p(x)p(y).Exemplo:1. Veriqueseasvariveisbidimensionais(X, Y)doexemplodaslinhasdeproduoetambm das equipes do campeonato de futebol so independentes.4.2.4 Funes de Variveis AleatriasSeja(X, Y ) uma varivel aleatria bidimensional discreta. SejaW=H(X, Y ) uma funo davarivel aleatria bidimensional discreta(X, Y ). Ento,Wser uma varivel aleatria unidimensi-onal discreta, e neste caso, tem-se o interesse em obter a sua funo de probabilidadep(w), que obtida a partir da funoH(X, Y ) e dos valores assumidos pelas variveisXeY .Exemplos:1. Utilizando os dados do exemplo das linhas de produo considere a varivelW= X +Yque representa o nmero total de peas produzidas pelas duas linhas, em uma determinadahora.a) Determinar a funo de probabilidade da varivel aleatriaWb) Calcular aE(X),E(Y ),E(W)2. SejamXeY variveisaleatriasquerepresentamonmerodecarrosimportadoseonmero de carros nacionais, respectivamente, que uma concessionria vende ao longo deuma semana, conforme a tabela a seguir:yx 0 1 2 30 0,015 0,06 0,045 0,031 0,05 0,20 0,15 0,102 0,035 0,14 0,105 0,0728a) Calcule as distribuies marginais das variveisXeY ;b) Obtenha a distribuio da varivelZ= X.Yc) CalculeE(X),E(Y ),E(Z)4.2.5 Covarincia de duas variveis aleatriasA covarincia entre duas variveis aleatrias uma medida de relao linear entre as variveis.SeXeYso duas variveis aleatrias, a covarincia deXeY denida por:cov(X,Y ) = E[(X E(X))(Y E(Y ))].Para a varivel aleatria discreta esta frmula pode ser reescrita como:cov(X,Y ) =

x

y[Xi E(Xi)][Yi E(Yi)]P(xi, yi)ou ainda,cov(X,Y ) = E(XY ) [E(X)E(Y )].Exemplos:1. Verique se as variveis do exemplo das linhas de produo e tambm do exemplo dasvendas dos carros importados e nacionais so correlacionadas;Denio:Quandoacov(X,Y ) =0, tem-seque Xe Y sovariveisaleatriasnocorrelacionadaslinearmente.Proposio:Se X e Yso duas variveis aleatrias independentes, cov(X,Y ) = 0. No entanto, a recprocano verdadeira.Teorema:Para duas variveis aleatriasXeYtem-se que:a) V(X+Y)=V(X)+V(Y)+2cov(X,Y);b) SeXeYso independentes, ento: V(X+Y)=V(X)+V(Y)4.2.6 Coeciente de correlaoH uma outra medida da relao entre duas variveis aleatrias que frequentemente mais fcilde interpretar que a covarincia.A correlao entre as variveis aleatriasXeY , denotada por(X,Y ) :(X,Y ) =cov(X,Y )_V (X)V (Y )=X,YXYObservaes:1. Para quaisquer duas variveis aleatriasXeY , 1 (X,Y ) +1.2. Quando(X,Y ) = 1 existe uma relao linear perfeita entreXeY(direta).293. Quando(X,Y ) = 1 existe uma relao linear inversa perfeita entreXeY .4. Na equao de regresso linear (Y= ax +b), temos: Sea > 0 ento(X,Y ) positivo esea < 0 ento(X,Y ) negativo.Exemplo:1. Para os exemplos das linhas de produo e das vendas dos carros importados e nacionaiscalcule o coeciente de correlao;4.3 Varivel aleatria contnuaSeja(X,Y )umavarivel aleatriabidimensional contnua. Issosignicaquetantoavarivelaleatria X quanto a varivel aleatria Y assumem, cada uma, um nmero innito no enumervelde valores. Portanto, a varivel aleatria bidimensional contnua (X,Y ) pode assumir um nmeroinnito no enumervel de valores.A funo densidade de probabilidade conjunta da varivel aleatria bidimensional contnua(X,Y ), denotada porf(x,y) e representando a superfcie de probabilidades dos valores(x,y) que avarivel aleatria(X,Y ) assume , uma funo que deve satisfazer s seguintes condies:a) f(x,y) 0 para todo par (x,y);b)_+_+f(x,y)dxdy= 1O clculo da probabilidade dea X b ec Y d dado por:P(a X b, c Y d) =_ba_dcf(x,y)dydxExemplos:1. Suponha que a varivel aleatria bidimensional contnua (X,Y ) tenha a funo densidadede probabilidade conjunta dada por: f(x,y) = x2+xy3 ,0 x 1 e0 y 2.a) Verique sef(x, y) uma funo densidade de probabilidade conjunta.b) CalcularP(X 1/2; Y 1/2)4.3.1 Funo densidade de probabilidade marginalDe modo anlogo as variveis discretas, pode-se estar interessado na funo densidade de proba-bilidade da varivel aleatria X ou na funo de densidade de probabilidade da varivel aleatria Y ,determinadas, respectivamente, funo densidade de probabilidade marginal deXdenotadag(x), efuno densidade de probabilidade marginal deY , denotada porh(y). Essas funes so denidasda seguinte maneira:g(x) =_+f(x,y)dy eh(y) =_+f(x,y)dx. importante lembrar que, comog(x) eh(y) so funes densidade de probabilidade, g(x) 0para todox e_+g(x)dx = 1, assim comoh(y) 0 para todoy e_+h(y)dy= 1.Por meio destas funesg(x) eh(y), pode-se calcular a probabilidade de ocorrerx ou a proba-bilidade de ocorrery.30Exemplos:1. Voltando ao exemplo anterior:a) Determine a funo de densidade de probabilidade marginal da varivel Xe davarivelY .b) Qual a probabilidade dex estar entre0,2 e0,4?c) Qual a probabilidade dey estar entre0,5 e0,75?4.3.2 Distribuies de Probabilidade CondicionaisSejam X e Yvariveis aleatrias contnuas com funo densidade conjunta f(x,y) e distribuiesmarginaisg(x) eh(y).A funo densidade de probabilidade condicional deX, dado queY= y denida por:f(X|Y= y) =f(x,y)h(y), h(y) > 0,e funo densidade de probabilidade condicional deY , dado queX= x dada por:f(Y |X= x) =f(x,y)g(x), g(x) > 0,Exemplos:1. Utilizandooexemplodavarivel aleatriabidimensional contnua(X,Y ), comfunodensidade de probabilidade conjunta dada por: f(x,y) = x2+xy3 ,0 x 1 e 0 y 2,pede-se:a) Determinarf(x|y) ef(y|x);b) CalcularP(Y< 1/2|X< 1/2)2. Seja(X,Y ) uma varivel aleatria bidimensional contnua com funo densidade de pro-babilidade conjunta dada por: f(x,y) = cx(1 y),0 < x < 1 e0 < y< 1. Calcular:a) O valor da constante c.b) A funo densidade de probabilidade condicionadaf(x|y).c) A funo densidade de probabilidade condicionadaf(y|x).4.3.3 Variveis Aleatrias IndependentesDiz-sequeXeY sovariveisaleatriascontnuasindependentesquandooresultadodeX,porexemplo, demodoalgumnoinuenciaoresultadodeY , evice-versa, ouseja, XeY seroindependentes seg(x|y) = g(x), ou equivalentemente, seh(y|x) = h(y), para todox ey.Ento seja (X,Y ) uma varivel aleatria bidimensional contnua. Diz-se que X e Yso variveisaleatrias contnuas independentes se, e somente se,f(x,y) = g(x)h(y)para todo x e y, em que f(x,y) a funo densidade de probabilidade conjunta da varivel aleatriabidimensional (X,Y ), eg(x)eh(y)soasfunesdensidadedeprobabilidademarginaisdeXeY , respectivamente. Essa relao consequncia do conceito de probabilidade condicionada: comog(x|y) =f(x,y)h(y), para todo x e y, logo f(x,y) = g(x)h(y) e, no caso de independncia,g(x|y) = g(x),paratodoxe y, logof(x,y) =g(x)h(y); analogamente, comoh(y|x) =f(x,y)g(x)e, nocasos deindependncia,h(y|x) = h(y), para todox ey, logof(x,y) = g(x)h(y).31Exemplos:1. Utilizando novamente o exemplo da varivel aleatria bidimensional contnua (X,Y ), comfunodensidadedeprobabilidadeconjuntadadapor: f(x,y)=x2+xy3 , 0 x 1e0 y 2, vericar se as variveisXeYso independentes.2. O consumo de gasolina de uma marca de carro em determinada viagem representado poruma varivelaleatriaXcomfuno densidadedeprobabilidadedada por: f(x)=x2,0