48
1 Universidade Federal do Piauí Campus Universitário “Prof a . Cinobelina Elvas” – Bom Jesus, PI Profa. Gisele V - VARIÁVEIS ALEATÓRIAS 1. INTRODUÇÃO Ao descrever o espaço amostral de um experimento aleatório, o resultado individual não necessariamente é um número. Por exemplo: no lançamento de duas moedas consecutivas podemos obter: S = {cara-cara, cara-coroa, coroa-cara, coroa-coroa}. Contudo, em muitas situações experimentais, estaremos interessados na mensuração de alguma coisa e no seu registro como um número . Ou seja, desejamos atribuir um número real x a todo elemento a do espaço amostral S. Portanto, no caso do lançamento consecutivo de duas moedas, podemos transformar os resultados de S em números, atribuindo-se de acordo com a contagem do NÚMERO DE COROAS obtidas, ou seja, S ={0, 1, 2}, ou de acordo com o NÚMERO DE CARAS obtidas, ou seja, S ={2, 1, 0}. A este procedimento de obter uma função X, que associe aos elementos a pertencentes a S um número real, X (a) , é denominada VARIÁVEL ALEATÓRIA. 2. CONCEITOS DE VARIÁVEL ALEATÓRIA Definição simplificada: Uma vez que os valores da variável estão relacionados a um experimento aleatório ou probabilístico, VARIÁVEL ALEATÓRIA é toda variável cujos resultados estão associados a uma probabilidade. Experimentos aleatórios são aqueles que, repetidos em idênticas condições, podem produzir resultados diferentes. Embora não se saiba qual o resultado que irá ocorrer num experimento, em geral, consegue-se descrever o conjunto de todos os resultados possíveis que podem ocorrer. As variações de resultados, de experimento para experimento, são devidas a uma multiplicidade de causas que não podemos controlar, as quais denominam acaso acaso acaso acaso.

Apostila 5 - Variáveis aleatórias

Embed Size (px)

Citation preview

Page 1: Apostila 5 - Variáveis aleatórias

1

Universidade Federal do Piauí

Campus Universitário “Profa. Cinobelina Elvas” – Bom Jesus, PI

Profa. Gisele

V - VARIÁVEIS ALEATÓRIAS

1. INTRODUÇÃO

Ao descrever o espaço amostral de um experimento aleatório, o resultado individual

não necessariamente é um número. Por exemplo: no lançamento de duas moedas consecutivas

podemos obter: S = {cara-cara, cara-coroa, coroa-cara, coroa-coroa}. Contudo, em muitas

situações experimentais, estaremos interessados na mensuração de alguma coisa e no seu

registro como um número. Ou seja, desejamos atribuir um número real x a todo elemento a do

espaço amostral S. Portanto, no caso do lançamento consecutivo de duas moedas, podemos

transformar os resultados de S em números, atribuindo-se de acordo com a contagem do

NÚMERO DE COROAS obtidas, ou seja, S ={0, 1, 2}, ou de acordo com o NÚMERO DE

CARAS obtidas, ou seja, S ={2, 1, 0}.

A este procedimento de obter uma função X, que associe aos elementos a pertencentes

a S um número real, X(a), é denominada VARIÁVEL ALEATÓRIA.

2. CONCEITOS DE VARIÁVEL ALEATÓRIA

Definição simplificada: Uma vez que os valores da variável estão relacionados a um

experimento aleatório ou probabilístico, VARIÁVEL ALEATÓRIA é toda variável cujos

resultados estão associados a uma probabilidade.

Experimentos aleatórios são aqueles que, repetidos em idênticas condições, podem produzir resultados diferentes. Embora não se saiba qual o resultado que irá ocorrer num experimento, em geral, consegue-se descrever o conjunto de todos os resultados possíveis que podem ocorrer. As variações de resultados, de experimento para experimento, são devidas a uma multiplicidade de causas que não podemos

controlar, as quais denominam acasoacasoacasoacaso.

Page 2: Apostila 5 - Variáveis aleatórias

2

Definição estatística: Seja E um experimento aleatório e S o espaço amostral

associado a este experimento. Uma função X, que associe a cada elemento a pertencente a S

um número real, X(a), é denominada VARIÁVEL ALEATÓRIA.

Ex: Considere o experimento probabilístico ou aleatório: lançamento de duas moedas

consecutivas, logo:

S = {cara-cara; cara-coroa; coroa-cara; coroa-coroa}

Considere agora que X é a variável aleatória definida como o NÚMERO DE COROAS

obtidas, ou seja:

X = {0, 1, 2},

Portanto,

X(cara-cara) = 0 (NENHUMA COROA NO LANÇAMENTO DE DUAS MOEDAS)

X(cara-coroa) = X(coroa-cara) = 1 (UMA COROA NO LANÇAMENTO DE DUAS MOEDAS)

X(coroa-coroa) = 2 (DUAS COROA NO LANÇAMENTO DE DUAS MOEDAS)

Em que,

S = espaço amostral original correspondente a todos os possíveis resultados do experimento

(numérico ou não);

R = novo espaço amostral associado à variável aleatória X, representando todos os valores

numéricos de interesse (todos os valores possíveis e definidos de X(a) de a em S).

Cara-cara

Cara-coroa

Coroa-cara

Coroa-coroa

0

1

2

S R

a X(a)

S R

v.a.X

Page 3: Apostila 5 - Variáveis aleatórias

3

Observações:

a) Apesar da terminologia “variável aleatória”, ela é uma função cujo domínio é o

conjunto S e o contradomínio é o conjunto R;

b) O uso de variáveis aleatórias equivale a descrever os resultados de um experimento

aleatório por meio de números ao invés de palavras, o que apresenta a vantagem de

possibilitar melhor tratamento estatístico;

c) Nem toda função é uma variável aleatória, pois uma vez que ao mesmo s forem

atribuídos diferentes X(a), a relação não poderá se caracterizar uma relação funcional

ou função.

Lembrete: Uma quantidade é uma função de outra quando, para cada quantidade da variável

independente (x), corresponde a um único valor denominado f(x) (variável dependente). O

conjunto em que os valores de x podem ser tomados é chamado de domínio da função, e o

conjunto dos valores que f assume para cada x é denominado imagem da função.

As variáveis aleatórias serão sempre representadas por letras maiúsculas (X, Y, Z, W,

etc.). As realizações (ou variações) dessas variáveis em um dado elemento da população serão

sempre representadas por letras minúsculas (x, y, z, w, etc.).

Quando o resultado do experimento probabilístico for registrado como um único

número x ter-se-á uma VARIÁVEL ALEATÓRIA UNIDIMENSIONAL, que poderá ser

discreta ou contínua.

Porém, quando para um determinado experimento, cada resultado é proveniente da

avaliação simultânea de dois caracteres, como por exemplo, estudar a estatura X e o peso Y,

de alguma pessoa escolhida ao acaso, o resultado será (x,y), e ter-se-á uma VARIÁVEL

ALEATÓRIA BIDIMENSIONAL. Nota-se, nesse caso, que cada resultado é identificado por

cada um dos valores que as variáveis aleatórias unidimensionais assumem.

a

X(a)

Y(a) S

v.a.X

v.a.Y

Page 4: Apostila 5 - Variáveis aleatórias

4

3. VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS

3.1. Variável Aleatória Discreta

3.1.1. Definição: Seja X uma variável aleatória (v.a.). Se o número de valores possíveis de

X(a) (isto é o seu contradomínio) for finito ou infinito enumerável, denominaremos X de

variável aleatória discreta, assim, os valores possíveis de X são x1, x2,....,xn. No caso finito a

lista de valores de x acaba e no caso infinito enumerável, a lista continua indefinidamente.

Em geral uma variável aleatória é obtida mediante alguma forma de contagem.

3.1.2. Função de probabilidade (f.p.)

Utilizando o conceito de função em que uma quantidade é uma função de outra quando,

para cada quantidade da variável independente (x), corresponde a um único valor denominado

f(x) (variável dependente), chama-se FUNÇÃO DE PROBABILIDADE (f.p.) da variável

aleatória discreta X, a função:

F(x) = P (X = xi) = P (xi)

Pois a cada valor de xi associa-se sua probabilidade de ocorrência.

A função P (xi) será uma f. p. se satisfizer às seguintes condições:

* P(xi) ≥ 0, para todo xi, e,

* )(1)( SPxP i ==∑

OBS.: Mesmo que a variável assuma um número infinito enumerável de valores não há

nenhum problema em comprovar que cada xi contribui com uma quantidade f(xi) ao total, de

modo que,

∑ ∑∑∞

=

=

=

====1 11

1)()()(i i

i

i

ii xXPxpxf

À coleção de pares [xi, P(xi)], i = 1, 2,..., n, denominamos DISTRIBUIÇÃO DE

PROBABILIDADE da v. a. d. X, que pode ser representada por meio de tabelas e gráficos.

3.1.2.1. Representação tabular da DISTRIBUIÇÃO DE PROBABILIDADE de variável

aleatória discreta

É dada por:

Page 5: Apostila 5 - Variáveis aleatórias

5

xi x1 x2 … xn ∑

P(X=xi) P(x1) P(x2) ... P(xn) 1,0

3.1.2.1. Representação gráfica da DISTRIBUIÇÃO DE PROBABILIDADE de variável

aleatória discreta

É obtida alocando-se no eixo das abscissas os valores de x e no eixo das coordenadas

os valores de suas respectivas probabilidades. Uma linha horizontal é feita em cada valor de x

na altura de sua respectiva probabilidade.

Exemplo 1:

Considere o experimento probabilístico ou aleatório: lançamento de duas moedas

consecutivas, logo:

S = {cara-cara; cara-coroa; coroa-cara; coroa-coroa}

Considere agora que X é a variável aleatória definida como o NÚMERO DE COROAS

obtidas, ou seja:

X = {0, 1, 2},

Portanto,

X(cara-cara) = 0, X(cara-coroa) = X(coroa-cara) = 1, X(coroa-coroa) = 2. Cujas probabilidades de ocorrência

são: P (0) = 1/4, P (1) = 2/4 e P (2) = 1/4.

Logo, a representação tabular da DISTRIBUIÇÃO DE PROBABILIDADE de X é:

xi 0 1 2 ∑

P(X=xi) 1/4 2/4 1/4 1,0

Em que,

P (xi) ≥ 0 e ∑=

==k

i

ixXP1

1][

Nota-se que para uma variável aleatória discreta as probabilidades de cada valor x

correspondem à própria função, por isso esta é chamada de FUNÇÃO DE

PROBABILIDADE.

Page 6: Apostila 5 - Variáveis aleatórias

6

E a representação gráfica da DISTRIBUIÇÃO DE PROBABILIDADE de X é:

Exemplo 2:

Tem-se 5 animais: 2 animais de uma raça bovina A (A1 e A2) e 3 animais de uma raça

bovina B (B1, B2 e B3). Deseja-se obter uma amostra de 2 animais da raça A, escolhidos ao

acaso dentre os 5 animais.

a) Obter o espaço amostral desse experimento aleatório

S: {A1A2, A1B1, A1B2, A1B3, A2B1, A2B2, A2B3, B1B2, B1B3, B2B3}

b) Obter a variável aleatória X “número de animais da raça A” na amostra.

{B1B2, B1B3, B2B3}, ou seja, nenhum animal da raça A.

{A1B1, A1B2, A1B3, A2B1, A2B2, A2B3}, ou seja, um animal da raça A.

{A1A2}, ou seja, dois animais da raça A.

No entanto, na estatística, é mais fácil utilizar valores numéricos do que trabalhar

diretamente com elementos de um espaço como o anterior. Assim, se X se for a variável

aleatória NÚMERO DE ANIMAIS DA RAÇA A, os valores assumidos por X são x = 0, 1, 2.

Como essa associação de números aos pontos do espaço amostral, define-se uma

função sobre cada elemento desse espaço. Essas funções sobre os elementos do espaço são as

variáveis aleatórias. No caso, tem-se uma variável aleatória discreta, em que se atribui um

único número real a cada elemento do espaço amostral S.

c) Obter a tabela da DISTRIBUIÇÃO DE PROBABILIDADE de X.

Seja a v. a d. X o NÚMERO DE ANIMAIS DA RAÇA A, a representação tabular da

função de probabilidade da variável número de animais da raça A é dada por:

xi 0 1 2 ∑

P(X=xi) 10

3

10

6

10

1 1,0

0 1 2 x

2/4

1/4

Page 7: Apostila 5 - Variáveis aleatórias

7

Em que,

P (xi) ≥ 0 e ∑=

==k

i

ixXP1

1][

d) Obter o gráfico da DISTRIBUIÇÃO DE PROBABILIDADE de X.

A representação gráfica da função de probabilidade da variável número de animais da

raça A é dada por:

3.1.3. Variável aleatória discreta uniformemente distribuída

Este é o caso mais simples de variável aleatória discreta, em que cada possível valor

ocorre com a mesma probabilidade.

Definição: A variável aleatória discreta X, assumindo os valores x1, x2, ..., xn, tem distribuição

uniforme, se e se somente se:

f(x) = P (X = xi) = P (xi) = p = n

1, para todo i = 1, 2, …, n

Exemplo:

Considere o experimento aleatório o lançamento de um dado não-viciado.

S = {1, 2, 3, 4, 5, 6}

Considere a variável aleatória discreta X dada pelo NÚMERO DE PONTOS OBTIDOS.

Essa variável assume obviamente os valores de 1 a 6, e a cada valor é possível associar um

único número real, ou seja, um valor de probabilidade, que no caso, para todos é igual a 1/6.

1 2 0

3/10

6/10

1/10

x

Figura 1. Função de probabilidade da variável NÚMERO DE

ANIMAIS DA RAÇA A.

Page 8: Apostila 5 - Variáveis aleatórias

8

Portanto, a representação tabular da função de probabilidade F(x) = P (X = xi) = P (xi), ou

seja, a DISTRIBUIÇÃO DE PROBABILIDADE de X:

xi 1 2 3 4 5 6 ∑

P(X=xi) 1/6 1/6 1/6 1/6 1/6 1/6 1,0

3.1.3.1. Representação gráfica da DISTRIBUIÇÃO DE PROBABILIDADE de X.

3.2. Variável aleatória contínua

3.2.1. Definição:

Seja X uma variável aleatória (v.a.). Se o número de valores possíveis de X(a) (isto é o seu

contradomínio) for infinito não-enumerável como, por exemplo, um intervalo, X será

denominada de variável aleatória contínua.

Consideremos por exemplo o experimento que consiste em selecionar, ao acaso, um fruto

de tomate de uma área de produção e determinar o valor do peso do fruto em gramas. Nesse

caso, dentro de um determinado grau de precisão decorrente da limitação do equipamento de

mensuração, a variável aleatória X = PESO DO FRUTO pode assumir um valor qualquer em

um determinado intervalo da reta real, sendo, portanto, uma variável aleatória contínua.

Como uma variável aleatória contínua pode assumir uma infinidade de valores em um

intervalo real, ou seja, o conjunto de valores que a variável pode assumir é infinito não-

enumerável, a cada um dos infinitos valores da reta real é atribuída probabilidade nula.

Portanto, não faz sentido fazer uma soma das probabilidades de cada um dos valores como no

1 2 3 4 5 6

1/6

Figura 1. Função de probabilidade da variável NÚMERO DE

PONTOS OBTIDOS no lançamento de um dado.

Page 9: Apostila 5 - Variáveis aleatórias

9

caso das variáveis aleatórias discretas, mas sim fazer a soma das probabilidades dos valores

em intervalos da reta real. Nesse caso, o que generaliza o conceito de ∑ é o de integral ( ∫ ) ,

ou seja, calcular a integral significa “integrar” ou somar os valores da função.

3.2.2. Função de densidade probabilidade (f.d.p.)

Como para variável aleatória contínua a probabilidade de cada um dos infinitos valores na

reta real é igual a zero, não se tem uma função de probabilidade F(x) = P (X = xi) = P (xi)

como para variável aleatória discreta. Nesse caso, as probabilidades de ocorrência de cada um

dos possíveis resultados do experimento aleatório são determinadas por uma função contínua

f(x) denominada FUNÇÃO DENSIDADE PROBABILIDADE (f.d.p.), que satisfaça as

seguintes condições:

a) xtodoparaxf 0)( ≥

As probabilidades não podem ser negativas.

b) ∫+∞

∞−

=1dx)x(f

A probabilidade do espaço amostral é 1, isto é, a probabilidade de ocorrência dos

resultados dentro do intervalo é sempre 100% possível.

c) P(a ≤ X ≤ b) = ∫b

a

dx)x(f

A probabilidade de que a variável aleatória assuma valores em um intervalo é a área

sob a curva da função densidade probabilidade no intervalo entre a e b.

É importante ressaltar que, no cálculo da probabilidade de um intervalo, este pode ser

fechado ou aberto, pois a inclusão ou não dos extremos a e b do intervalo não altera o valor

desse cálculo, visto que a probabilidade de um ponto é nula.

IMPORTANTE: A f(x) de uma v. a c., função de densidade probabilidade,

não é probabilidade. Somente quando a função for integrada entre dois

limites, ela produzirá uma probabilidade, que será a área sob a curva da

função X = a e X = b, a < b, ou seja, a probabilidade de x em intervalo entre a e b da reta real.

Exemplo 1: Seja X a variável diâmetro (em mm) de frutos de mamão colhidos no estado

inicial, cuja função de x [f(x)] é dada por:

Page 10: Apostila 5 - Variáveis aleatórias

10

Dada a função desta variável, calcule k de modo que f (x) seja uma f.d.p.

Resposta:

Para isto, a f (x) deve atender as duas condições xtodoparaxf 0)( ≥ e ∫+∞

∞−

=1dx)x(f .

Assim,

∫+∞

∞−

=1)( dxxf

1)(20

10

=∫ dxkx

1)2

(.20

10

2

=x

k

150

1)1020(

2

1. 22 =−k

Logo, k = 1/150 também atende a primeira condição de xxf ∀≥ 0)( .

Portanto qualquer fruto com diâmetro entre 10 e 20 terá a mesma probabilidade de

ocorrência, ou seja, será igual a 1 ou 100%, e fora desse intervalo a probabilidade será sempre

igual a zero. Porém, se desejarmos saber a probabilidade de encontrarmos um fruto com

diâmetro entre 10 e 12, a forma de obtenção da mesma será pela resolução da integral

considerando esse intervalo, qual seja:

?)150

1()1210(

12

10

==≤≤ ∫ dxxxP

12

10

2

)2

(.150

1)1210(

xxP =≤≤

%15ou 15,0)1012(300

1)1210( 22 =−=≤≤ xP

kx, se 10 ≤ x ≤ 20

f(x) = 0, outros valores de x.

Page 11: Apostila 5 - Variáveis aleatórias

11

Exemplo 2: Considerando que a demanda diária, em quilogramas, de determinado produto

em um supermercado é uma variável aleatória, dada pela seguinte função densidade

probabilidade (f. d. p.):

a) Determinar o valor de k.

Para isto, a f (x) ser f.d.p deve atender as duas condições xtodoparaxf 0)( ≥ e

∫+∞

∞−

=1dx)x(f .

Assim,

∫+∞

∞−

=1)( dxxf

1)]1([)(1

2/1

2/1

0

=−+ ∫∫ dxxkdxkx

1)2

(.)1

(.)2

(.1

2/1

21

2/1

2/1

0

2

=−+x

kx

kx

k

1])2/1()1[(2

1.])2/1()1.[()]0)2/1[(

2

1. 222222 =−−−+− kkk

4=k

Logo, k = 4

Portanto,

b) Calcular a probabilidade de que a demanda diária do produto esteja entre 250 e 750g.

Sabe-se que para a demanda diária entre 0 e 500 g (ou 0 e 1/2) a função é 4x, e que

para a demanda entre 500g e 1000g (ou 1/2 e 1) a função é 4(x – 1). Logo, para saber a

demanda diária entre 250 e 750 deve-se integrar e somar nos intervalos de 250 a 500g (ou 1/4

e 1/2) e de 500 a 750g (ou 1/2 e 3/4). Ou seja:

f(x) =

kx, se 0 ≤ x ≤ 1/2

k(1 - x), se 1/2 ≤ x ≤ 1

0, outros valores de x.

f(x) =

4x, se 0 ≤ x ≤ 1/2

4(1 - x), se 1/2 ≤ x ≤ 1

0, outros valores de x.

Page 12: Apostila 5 - Variáveis aleatórias

12

dxxfdxxfdxxf )()()(4/3

2/1

2/1

4/1

750

250∫∫∫ +=

dxxdxxdxxf ∫∫∫ −+=4/3

2/1

2/1

4/1

750

250

)]1(4[)4()(

dxxdxxdxxf ∫∫∫ −+=4/3

2/1

2/1

4/1

750

250

)44()4()(

dxxdxdxxdxxf ∫∫∫∫ −+=4/3

2/1

4/3

2/1

2/1

4/1

750

250

)4()4()4()(

4/3

2/1

24/3

2/1

2/1

4/1

2750

250

)2

(.4)1

(.4)2

(.4)(xxx

dxxf −+=∫

])2/1()4/3.[(2

4)2/14/3.(4])4/1()2/1.[(

2

4)( 2222

750

250

−−−++=∫ dxxf

75,0)(750

250

=∫ dxxf ou 75%

Logo, a probabilidade de que a demanda diária do produto esteja entre 250 e 750 é 75%.

3.2.3. Variável aleatória contínua uniformemente distribuída

É o caso mais simples de variável aleatória contínua.

Definição: A v.a. contínua tem distribuição uniforme no intervalo [a,b], sendo a e b finitos, se

a sua função densidade de probabilidade (f. d. p.) for dada por:

≤≤−=

xde valoresoutros para ,0

a para ,1

)( bxabxf

4. VARIÁVEIS ALEATÓRIAS BIDIMENSIONAIS

Seja E um experimento aleatório e S um espaço amostral associado a E. Seja X uma

variável aleatória e Y outra variável aleatória e X(a) e Y(a) são duas funções, cada uma

associando um número real a cada resultado de a ∈ S, então determinaremos (X,Y) uma

variável aleatória bidimensional. Na prática, significa que para um determinado experimento

aleatório, cada resultado é proveniente da avaliação simultânea de duas variáveis.

Do mesmo modo que no caso unidimensional (X,Y) deve ter associada a cada valor

que pode assumir uma probabilidade de sua ocorrência. Assim, são definidas as funções e

Page 13: Apostila 5 - Variáveis aleatórias

13

distribuições de probabilidades da v.a. bidimensional (X,Y). Para o nosso estudo

consideraremos que X e Y são ambas discretas ou ambas contínuas.

4.1. Quando (X,Y) é variável aleatória discreta bidimensional

Se os valores possíveis da variável (X,Y) forem finitos ou infinitos enumeráveis, esta

será uma v.a. discreta bidimensional. Assim, os valores possíveis de (X,Y) podem ser

representados por (xi, yj) i = 1, 2, ..., n j = 1, 2, ..., m

4.1.1. Função de probabilidade conjunta de X e Y

É dada por:

),(),( jiji yxPyYxXP ===

Em que a cada valor de (xi, yi) associa-se a sua probabilidade de ocorrência.

Para que P(xi, yi) seja uma função de probabilidade conjunta é necessário que satisfaça

às seguintes condições:

i) P(xi, yi) ≥ 0, ∀ (xi,yj)

ii) 1),(1 1

=∑∑= =

m

j

n

i

ji yxP ,0

4.1.2. Distribuição de probabilidade conjunta de X e Y

É o conjunto {(xi,yj), P(xi,yj)} ∀ i = 1, 2, ..., n j = 1, 2, ..., m

Y X

y1 y2 K ym Total

x1 P(x1, y1) P(x1, y2) K P(x1, ym) P(X = x1) = P(x1) =∑=

m

j

jyxP1

1 ),(

X2 P(x2, y1) P(x2, y2) K P(x2, ym) P(X = x2) = P(x2) =∑=

m

j

jyxP1

2 ),(

M M M M M M

xn P(xn, y1) P(xn, y2) K P(xn, ym) P(X = xn) = P(xn) =∑=

m

j

jn yxP1

),(

Total

P(Y = y1) = P(y1)

=∑=

n

i

i yxP1

1 ),(

P(Y = y2) = P(y2)

=∑=

n

i

i yxP1

2 ),( K

P(Y = ym) = P(ym)

=∑=

n

i

mi yxP1

),( 1,0

Page 14: Apostila 5 - Variáveis aleatórias

14

A partir da distribuição conjunta das duas variáveis aleatórias X e Y podemos

determinar a distribuição de X sem considerar Y e a de Y sem considerar X. São as chamadas

DISTRIBUIÇÕES MARGINAIS.

A distribuição marginal é constituída pelos valores da variável aleatória e suas

respectivas probabilidades marginais. A probabilidade marginal para cada valor é obtida da

seguinte forma:

� Para X: P(X = xi) = P (xi) = ∑=

m

j

ji yxP1

),(

� Para Y: P(Y = yi) = P (yi) = ∑=

n

i

ji yxP1

),(

Ou seja, a marginal de X é a função de probabilidade da v.a. X sem considerar a v.a.Y,

e a marginal de Y é a função de probabilidade da v. a.X sem considerar a v.a.X.

Com as probabilidades marginais para cada valor, podemos construir a distribuição

marginal para a variável aleatória:

� Para X:

xi x1 x2 … xn

P(X=xi) P(x1) P(x2) ... P(xn)

� Para Y:

yi y1 y2 … ym

P(Y=yi) P(y1) P(y2) ... P(ym)

Page 15: Apostila 5 - Variáveis aleatórias

15

Exemplo:

Seja a variável discreta bidimensional (X, Y), cuja distribuição de probabilidade conjunta é

dada pela tabela:

Y X

-3 0 1

-2 1/9 0 2/9

0 0 2/9 2/9

1 1/9 1/9 0

a) Obter as probabilidades marginais de X e Y.

� Para X: P(X = xi) = P (xi) = ∑=

m

j

ji yxP1

),(

P(X = -2) = P (-2) = 1/9 + 0 + 2/9 = 3/9

P(X = 0) = P (0) = 0 + 2/9 + 2/9 = 4/9

P(X = 1) = P (1) = 1/9 + 1/9 + 0 = 2/9

Logo, ∑=

m

j

ji yxP1

),( = 3/9 + 4/9 + 2/9 = 1,0

Ou seja,

xi -2 0 1 ∑

P(X = xi) 3/9 4/9 2/9 1,0

� Para Y: P(Y = yi) = P (yi) = ∑=

n

i

ji yxP1

),(

P(Y = -3) = P (-3) = 1/9 + 0 + 1/9 = 2/9

P(Y = 0) = P (0) = 0 + 2/9 + 1/9 = 3/9

P(Y = 1) = P (1) = 2/9 + 2/9 + 0 = 4/9

Logo, ∑=

n

i

ji yxP1

),( = 2/9 + 3/9 + 4/9 = 1,0

Ou seja,

yi -2 0 1 ∑

P(Y = yi) 2/9 3/9 4/9 1,0

Page 16: Apostila 5 - Variáveis aleatórias

16

4.2. Quando (X,Y) é variável aleatória contínua bidimensional

Se a variável (X,Y) puder assumir todos os valores em algum conjunto infinito não-

enumerável, esta será uma v.a. contínua bidimensional.

4.2.1. Função de densidade probabilidade conjunta de X e Y

Seja (X,Y) uma v.a.c. bidimensional. Diz-se que f(x,y) é uma função de densidade

probabilidade conjunta de X e Y, se satisfazer as seguintes condições.

i) f(x,y) ≥ 0, ∀ todo (x,y)

ii) ∫ ∫= =

=m

j

n

i

dydxyxf1 1

1.),(

Em que, f(x,y) = 0 para (x,y) ∉ aos intervalos de x e y.

4.2.2. Distribuição de probabilidade conjunta de X e Y

A partir da distribuição conjunta das duas variáveis aleatórias X e Y podemos

determinar a distribuição de X sem considerar Y e a de Y sem considerar X. São as chamadas

DISTRIBUIÇÕES MARGINAIS. Porém, para (X,Y) variável aleatória contínua, as funções

de densidade probabilidade marginais de X e Y são dadas por:

∫+∞

∞−

= dyyxfxf ),()(

∫+∞

∞−

= dxyxfyf ),()(

Exemplo:

Sejam X e Y variáveis aleatórias contínuas com f.d.p. conjunta dada por:

a) Calcular o valor de k

0,1),(6

2

5

0=∫ ∫ dxdyyxf

0,1)2(6

2

5

0=+∫ ∫ dxdyyxk

0,1)()2(6

2

5

0

6

2

5

0=+ ∫ ∫∫ ∫ dxdykydxdyxk

0,1)()2(6

2

5

0

6

2

5

0=+ ∫ ∫∫ ∫ dxdykydxdyxk

k (2x +y), se 2 ≤ x ≤ 6 0 ≤ y ≤ 5

f(x,y) = 0, para outros valores de x e y

Page 17: Apostila 5 - Variáveis aleatórias

17

∫∫ =+5

2

6

2

15

0

6

2

2

0,1)1

(.)2

(.2 dyx

kydyx

k

∫∫ =−+−5

2

5

0

22 0,1)26(.)26(. dykydyk

∫∫ =+5

2

5

00,1.4.32 dykydyk

0,1)2

(4)1

(325

0

25

0

1

=+y

ky

k

0,1)05(2)05(32 22 =−+− kk

0,150160 =+k

0,1210 =k

210

1=k

b) Obter as funções marginais de X e Y

Função marginal de X:

dyyxxf ∫ +=5

0)2(

210

1)(

dyy

dyx

xf ∫∫ +=5

0

5

0 210210

2)(

5

0

25

0 2.

210

1

210

2)(

yy

xxf +=

( )05420

1)05(

105)( 2 −+−=

xxf

84

5

21)( +=

xxf

84

54)(

+=

xxf

Função marginal de Y:

dxyxyf ∫ +=6

2)2(

210

1)(

dxy

dxx

xf ∫∫ +=6

2

6

2 210210

2)(

Page 18: Apostila 5 - Variáveis aleatórias

18

6

2

6

2

2

.2102210

2)( x

yxyf +=

6

2

6

2

2 .210210

1)( x

yxyf +=

( )26210

)26(210

1)( 33 −+−=

yyf

4210

)8216(210

1)(

yyf +−=

210

4

210

208)(

yyf +=

105

2

105

16)(

yyf +=

105

216)(

yyf

+=

5. MEDIDAS DE POSIÇÃO E DISPERSÃO DE VARIÁVEIS ALEATÓRIAS

5.1. Medidas de posição

5.1.1. Esperança matemática (média ou valor esperado de uma v. a.) - E(X)

A ESPERANÇA MATEMÁTICA é a média ou valor esperado de uma variável

aleatória. A esperança matemática de uma distribuição é também denominada uma medida de

tendência central. Do ponto de vista científico, a esperança matemática corresponde ao que se

espera que aconteça em média.

� Se X for uma variável aleatória discreta

Definição. Dado uma v.a. X discreta, assumindo os valores x1, x2,...,xn, chamamos valor

médio ou esperança matemática de X o valor:

E(X) = ∑−

=n

i

ii xXPx1

)(.

Exemplo:

Considerando o experimento probabilístico ou aleatório: lançamento de duas moedas

consecutivas, em que X é a variável aleatória definida como o NÚMERO DE COROAS

obtidas, ou seja: X = {0, 1, 2}, cujas probabilidades de ocorrência são: P (0) = 1/4, P (1) = 2/4

e P (2) = 1/4.

Page 19: Apostila 5 - Variáveis aleatórias

19

E(X) = ∑−

=n

i

ii xXPx1

)(. = 0,14

12

4

2.1

4

1.0 =++

Interpretação: Se esse experimento aleatório constituído pelo lançamento de duas moedas for

realizado n vezes, espera-se, em média, obter 1,0 coroa.

� Se X for uma variável aleatória contínua

Definição. Dado uma v. a. X contínua, assumindo os valores x1, x2,...,xn, chamamos valor

médio ou esperança matemática de X o valor:

E(X)= ∫+∞

∞−

dxxfx )(.

Exemplo: Seja X a variável diâmetro (em mm) de frutos de mamão colhidos no estado

inicial, cuja função de x [f(x)] é dada por:

dxxxXE )150

1()(

20

10∫=

20

10

3

)3

(.150

1)(

xXE =

mmXE 56,15)1020(3

1.

150

1)( 33 =−=

Interpretação: Se esse experimento aleatório constituído pela colheita ao acaso de fruto de

mamão for realizado n vezes, espera-se, em média, obter fruto de 15,56 mm de diâmetro.

As propriedades da Esperança Matemática são: 1º) E (K) = K, sendo K uma constante.

2º) E (X + K) = E (X) + K

3º) E (K.X) = K. E (X)

4º) E (X + Y) = E (X) + E (Y)

5º) E (XY) = E(X).E (Y), se X e Y são independentes (Cov (X,Y) = 0)

150

1x, se 10 ≤ x ≤ 20

f(x) =

0, outros valores de x.

Page 20: Apostila 5 - Variáveis aleatórias

20

3.2. Medidas de dispersão

3.2.1. Variância - V(X) ou 2σ

Definição. A variância quantifica a dispersão dos dados em torno da média. É dada por:

V(X) = E[X - µX]2

V(X) = E[X2 – 2.X.µX + µX2]

V(X) = E(X2) – 2.E(X.µX) + E(µX2)

V(X) = E(X2) – 2. µX.E(X) + µX2

V(X) = E(X2) – 2. E(X).E(X) + [E(X)]2

V (X) = E(X2) – 2.[E(X)]2 +[E(X)]2

V (X) = E(X2) – [E(X)]2

A obtenção da variância depende se X é variável aleatória discreta ou contínua.

� Se X for uma variável aleatória discreta

Definição. A variância de uma variável aleatória discreta quantifica a dispersão dos dados em

torno da média esperada. É definida por:

V (X) = E(X2) – [E(X)]2

Em que, )(.)( 22i

n

ni

i xPxXE ∑=

=

Exemplo:

Considerando o experimento probabilístico ou aleatório: lançamento de duas moedas

consecutivas, em que X é a variável aleatória definida como o NÚMERO DE COROAS

obtidas, ou seja: X = {0, 1, 2}, cujas probabilidades de ocorrência são: P (0) = 1/4, P (1) = 2/4

e P (2) = 1/4.

E(X) = ∑−

=n

i

ii xXPx1

)(. = 0,1 e )(.)( 22i

n

ni

i xPxXE ∑=

= = =++4

12

4

2.1

4

11.0 222

V (X) = E(X2) – [E(X)]2

V (X) =1,5 – 1,02

V(X) = 0,5

� Se X for uma variável aleatória contínua

Definição. A variância de uma variável aleatória contínua quantifica a dispersão dos dados

em torno da média esperada. É definida por:

Page 21: Apostila 5 - Variáveis aleatórias

21

V (X) = E(X2) – [E(X)]2

Em que dxxfxXE )(.)( 22

∫∞

∞−

=

Exemplo: Seja X a variável diâmetro (em mm) de frutos de mamão colhidos no estado

inicial, cuja função de x [f(x)] é dada por:

220

10

2 ]56,15[)150

1()( −= ∫ dxxxXV

220

10

2 ]56,15[)150

1()( −= ∫ dxxxXV

20

10

4

)4

(.150

1)(

xXV = - [242,1136]

=−= [242,1136] - )1020(4

1.

150

1)( 44XV 7,8864 mm2

As propriedades da Variância são:

1º) V (K) = 0, sendo k uma constante.

2º) V (X + K) = V (X) + V(K) = V(X)

3º) V (K.X) = K2. V (X)

4º) V (XY) = V(X).V (Y)

5º) V (X + Y) = V (X) + V (Y) + 2Cov (X, Y), se X e Y são dependentes (Cov (X,Y) ≠ 0)

6º) V (X + Y) = V (X) + V (Y), se X e Y são independentes (Cov (X,Y) = 0)

4.2.2. Desvio padrão -σ

O desvio padrão de X, DP(X), é definido como a raiz quadrada positiva da variância. É

mais usada como medida de dispersão que a variância por estar na mesma unidade dos dados.

4.2.3. Covariância - Cov (X,Y)

É uma medida de associação entre variáveis aleatórias. É necessário que se tenha pelo

menos duas variáveis para que se obtenha a covariância.

150

1x, se 10 ≤ x ≤ 20

f(x) =

0, outros valores de x.

Page 22: Apostila 5 - Variáveis aleatórias

22

A covariância entre duas v. a. X e Y é o produto dos desvios das variáveis (medida de

discrepância), qual seja:

Cov (X,Y) = E[(X - µX).(Y - µY)]

Desenvolvendo a expressão acima, temos:

Cov (X, Y) = E [(XY – X. µY –YµX + µXµY]

Cov (X, Y) = E [(XY – X.E(X) –YE(X) + E(X)E(Y)]

Cov (X, Y) = E (XY) – E(X)E(Y) –E(Y)E(X) + E(Y)E(X)]

Cov (X,Y) = E(XY) – E(X).E(Y)

Em que,

∑−

==n

i

ii xXPxXE1

)(.)( e ∑∑= −

=m

j

n

i

jiji yxPyxXYE1 1

),(.)( ⇒ para (X,Y) discreta

∫+∞

∞−

= dxxfxXE )(.)( e dydxyxfxyXYE ∫ ∫+∞

∞−

+∞

∞−

= ),(.)( ⇒ para (X,Y) contínua

Como a covariância é, por definição, a média dos produtos dos desvios (X - µx) por (Y -

µy), a covariância será positiva se ocorrerem desvios do mesmo sinal com maior

probabilidade, e negativa se correrem, com maior probabilidade, desvios com sinais

contrários. Ou seja,

- ∞∞∞∞ <<<< Cov (X,Y) <<<< + ∞∞∞∞

Assim, o sinal da covariância indica a relação entre as variáveis:

- Se Cov (X,Y) = 0, as variáveis X e Y não possuem dependência linear, ou seja, são

independentes;

- Se Cov (X,Y) > 0, as variáveis X e Y possuem uma relação linear de dependência, cuja

variação ocorre no mesmo sentido, ou seja, à medida que uma variável aumenta a outra

também aumenta, ou à medida que uma variável diminui a outra também diminui;

- Se Cov (X,Y) < 0, as variáveis X e Y possuem uma relação linear de dependência, cuja

variação ocorre no sentido contrário, ou seja, à medida que uma variável aumenta a outra

diminui e vice-versa.

As propriedades da Covariância são:

1º) Cov (X, K) = 0, sendo k uma constante.

2º) Cov (X,Y) = Cov (Y,X)

Page 23: Apostila 5 - Variáveis aleatórias

23

3º) Cov (X,X) = V(X)

4º) Cov (aX, bY) = ab.Cov(X,Y)

4º) Cov (X + Z, Y) = Cov (X,Y) + Cov (Z,Y)

5º) Cov (X,Y) = 0, se X e Y são independentes

6º) Cov (X,Y) ≠ 0, se X e Y são dependentes

Exemplo 1: Sabendo-se que Y = 3X – 5 e que E(X) = 2 e V(X) = 1, calcular:

a) E(Y)

E(3X – 5) = E (3X) – E (5)

E(3X – 5) = 3.E (X) – E (5)

E(3X – 5) = 3.2 – 5

E(3X – 5) = 1,0

b) V(Y)

V(3X – 5) = 32.V(X) – V(5) = 9.1 – 0 = 9

c) Cov (X,Y)

Cov (X, 3X – 5) = Cov (X, 3X) - Cov (X, 5) = 3. Cov (X,X) – 0 = 3. V(X) = 3. 1 = 3

d) V(X/3 – Y)

V(X/3) – V(Y) = (1/3)2.V(X) + V(Y) – 2.Cov (X/3,Y) = 1/9.V(X) + V(Y) – 2.1/3.Cov (X,Y)

V(X/3 – Y) = 1/9.1 + 9 – 2/3.(3) = 64/9

Exemplo 2: Seja a variável aleatória bidimensional DISCRETA (X,Y), cuja distribuição de

probabilidade conjunta é dada pela tabela:

Verificar se as variáveis possuem dependência linear, ou seja, se Cov (X,Y) ≠ 0.

Cov (X,Y) = E(XY) – E(X). E(Y)

X

Y -1 0 2 P (yi)

1 1/9 2/9 0 3/9

3 3/9 1/9 2/9 6/9

P(xi) 4/9 3/9 2/9 1,0

Page 24: Apostila 5 - Variáveis aleatórias

24

E(X) = 9

2.2

9

3.0

9

4.1)(.

1

++−=∑−

n

i

ii xPx = 0

E(Y) = 9

6.3

9

3.1)(.

1

+=∑−

m

j

jj yPy = 2,33

E(XY) = 9

2.2.3

9

1.0.3

9

3).1.(30.2.1

9

2.0.1

9

1).1.(1),(..

1 1

++−+++−=∑∑= −

m

j

n

i

jiji yxPyx = 0,22

Logo, Cov (X,Y) = 0,22 – 0. 2,33

Cov (X,Y) = 0,22

Interpretação: Como a Cov (X,Y) ≠ 0, X e Y são dependentes, havendo uma relação linear

positiva entre as duas variáveis, ou seja, à medida que ocorre aumento em X ocorre aumento

em Y, ou à medida que ocorre decréscimo em X ocorre decréscimo em Y.

Exemplo 3: Sejam X e Y variáveis aleatórias CONTÍNUAS com f.d.p. conjunta dada por:

E funções de densidade probabilidade marginais:

Verificar se as variáveis possuem dependência linear, ou seja, se Cov (X,Y) ≠ 0.

Cov (X,Y) = E(XY) – E(X). E(Y)

dydxyxfxyXYE ∫ ∫+∞

∞−

+∞

∞−

= ),(.)(

( ) dydxyxxyXYE ∫ ∫

+=

5

0

6

2

2210

1.)(

210

1(2x +y), se 2 ≤ x ≤ 6 0 ≤ y ≤ 5

f(x,y) = 0, para outros valores de x e y

84

54)(

+=

xxf se 2 ≤ x ≤ 6

f(x) = 0, para outros valores de x

105

216)(

yyf

+= se 0 ≤ y ≤ 5

f(y) = 0, para outros valores de y

Page 25: Apostila 5 - Variáveis aleatórias

25

dydxxyyx

XYE ∫ ∫

+=

5

0

6

2

22

210210

2)(

dyxdxy

dxxy

XYE ∫ ∫ ∫

+=

5

0

6

2

6

2

22

210210

2)(

dyxyxy

XYE ∫

+=

5

0

6

2

226

2

3

22103210

2)(

[ ]dyyyXYE ∫ −+−=5

0

22233 )26(00238,0)26(00317,0)(

[ ]dyyyXYE ∫ +=5

0

207616,065936,0)(

∫ ∫+=5

0

5

0

207616,065936,0)( dyyydyXYE

∫ ∫+=5

0

5

0

207616,065936,0)( dyyydyXYE

5

0

35

0

2

307616,0

265936,0)(

yyXYE +=

)05(0254,0)05(32968,0)( 3322 −+−=XYE

4153,11)( =XYE

2540,484

54)(.)(

6

2=

+== ∫∫

+∞

∞−

dxx

xdxxfxXE

1429,2105

216)(.)(

5

0=

+== ∫∫

+∞

∞−

dyy

ydyyfyYE

Logo, Cov (X,Y) = 11,4153 – 4,2540.2,1429

Cov (X,Y) = 2,2996

Interpretação: Como a Cov (X,Y) ≠ 0, X e Y são dependentes, havendo uma relação linear

positiva entre as duas variáveis, ou seja, à medida que ocorre aumento em X ocorre aumento

em Y, ou à medida que ocorre decréscimo em X ocorre decréscimo em Y.

4.2.4. Coeficiente de correlação (ρρρρXY)

Uma vez que a covariância varia de - ∞ a + ∞, é difícil determinar a intensidade da

relação linear entre as duas variáveis observando simplesmente a partir do valor da

covariância, pois a mesma apenas indica o sentido da relação. Para contornar essa dificuldade,

Karl Pearson propôs uma versão padronizada da covariância (caracterizada pela divisão da

Page 26: Apostila 5 - Variáveis aleatórias

26

covariância pelos desvios-padrão de X e Y), que é o coeficiente de correlação linear

populacional de Pearson, representado por ρρρρXY.

O parâmetro é definido por:

)().(

)().()(

)().(

),(

YVXV

YEXEXYE

YVXV

YXCovXY

−==ρ

⇒⇒⇒⇒ É fácil notar que o coeficiente de correlação linear é uma medida mais eficiente de

associação entre variáveis que a covariância, por possibilitar a quantificação da associação.

Em outras palavras, a covariância apenas indica a existência ou não de relação linear entre as

variáveis e, se existir, se essa é positiva ou negativa. O coeficiente de correlação por sua vez,

além de fazer as mesmas indicações que a covariância sobre a relação linear entre as

variáveis, ainda a quantifica!

O intervalo de variação do coeficiente de correlação é - 1 <<<< ρρρρXY <<<< 1. Isso é facilmente

demonstrado pelo seguinte teorema:

Se X e Y são duas variáveis aleatórias, tem-se:

02

−±

Y

Y

X

X YX

σ

µ

σ

µ OU

02

−±

Y

Y

X

X YXE

σ

µ

σ

µ

0)()(

2)()(

22

−±

−+

Y

Y

X

X

Y

Y

X

X YXYXE

σ

µ

σ

µ

σ

µ

σ

µ

[ ] 0))((1

2)(1

)(1 2

22

2≥−−±−+− YX

YX

Y

Y

X

X

YXYEXE µµσσ

µσ

µσ

Como, 22)( XXX σµ =−E

22)( YYY σµ =−E

[ ]

ρσσ

µµ=

−−

YX

YX YXE ))((( , tem-se,

022

2

2

2

≥±+ ρσ

σ

σ

σ

Y

Y

X

X

2 ± 2 ρ > 0 ou

Page 27: Apostila 5 - Variáveis aleatórias

27

ρ > 1 e ρ < -1 , logo,

- 1 <<<< ρρρρXY <<<< 1

OBS.: O estimador não viesado para o parâmetro ρXY é denominado rxy.

O coeficiente de correlação é um número puro, sem unidade ou dimensão. É usado para

expressar o quanto os pontos se aproximam de uma reta imaginária. Um coeficiente próximo

da unidade positiva ou negativa significa uma grande concentração dos pontos em torno da

reta, enquanto que um coeficiente menor significa maior dispersão em relação a esta reta.

Valores positivos indicam a tendência de uma variável aumentar quando a outra aumenta, ou

diminuir quando a outra diminui. Quando o coeficiente de correlação é negativo significa que

a tendência de uma variável aumentar enquanto a outra diminui e vice-versa.

Na figura 1, cada eixo representa uma variável, X e Y e, são apresentadas graficamente

a associação entre duas variáveis. Na letra (a) as variáveis não são correlacionadas (r = 0),

então os pontos se encontram dispersos por todo o quadrante. Na letra (b) a correlação é alta e

negativa (r = - 0,95), evidenciada por uma dispersão inversa entre X e Y. Os maiores valores

de X correspondem aos menores valores de Y, concentrados em torno de uma diagonal

fictícia. Na letra (c), X e Y estão correlacionadas positiva e perfeitamente (r = 1,0), logo os

pontos estão alinhados em uma mesma direção ascendente. Por fim, na letra (d), X e Y estão

levemente correlacionados, então a dispersão dos pontos não é tão abrangente no quadrante

nem tão estreita em torno de uma linha.

Figura 1. Representação gráfica de duas variáveis X e Y com diversos graus de correlação.

Page 28: Apostila 5 - Variáveis aleatórias

28

3. DISTRIBUIÇÕES E FUNÇÕES DE PROBABILIDADES DISCRETAS E

CONTÍNUAS

Foi visto nos assuntos anteriores como os dados de uma investigação científica são

representados e como parâmetros da forma da distribuição, valores mais freqüentes e medidas

de posição e variabilidade, são estimados. Foram vistas, também, formas para lidar e

apresentar dados em função de seus tipos. Todavia, além da descrição amostral dos dados, a

estatística como parte integrante do método científico, lida também com aspectos que

envolvem a modelagem teórica das realizações das variáveis aleatórias nos fenômenos

estudados. Essa modelagem envolve os modelos probabilísticos, cujo conhecimento auxilia o

investigador científico na escolha do modelo mais adequado para estudar um determinado

fenômeno e daquele que mais se aproxima de uma situação real. Aqui, iremos estudar os

modelos probabilísticos de algumas variáveis aleatórias discretas e contínuas.

As distribuições de probabilidade (discretas e contínuas) ficam completamente

definidas conhecendo-se os diversos valores que a variável aleatória pode assumir, dentro do

seu intervalo de definição, e as respectivas probabilidades. O conhecimento da distribuição de

uma variável aleatória é importante na descrição dos fenômenos, na especificação dos testes

dos processos da teoria de decisão estatística e na teoria da estimação. Pode-se afirmar que, de

forma geral, os modelos probabilísticos formam a base da teoria estatística, e a linguagem

aplicada representa o fundamento da linguagem científica empreendida nos processos de

decisão e estimação.

3.1. DISTRIBUIÇÕES DE PROBABILIDADE DISCRETAS

3.1.1. Distribuição de Bernoulli

Consideremos experimentos aleatórios que possuem apenas dois resultados possíveis,

como por exemplo, uma peça selecionada de um lote, a qual pode ser boa ou defeituosa, um

aluno que é submetido a um exame que pode ser aprovado ou não, um animal em um rebanho

que pode ser sadio ou doente, etc. São experimentos cujos resultados pertencem a uma de

duas categorias possíveis, conforme possuam, ou não, uma determinada característica. O

resultado será chamado de sucesso S se possuir a citada característica, ou de fracasso F, se

não possuir.

Esses experimentos são conhecidos como experimentos de Bernoulli ou ensaios de

Bernoulli. A probabilidade de ocorrência de sucesso será indicada por p, e a de fracasso por q,

em que q = 1 – p. Qualquer um dos dois resultados possíveis do experimento poderá ser

Page 29: Apostila 5 - Variáveis aleatórias

29

chamado de sucesso, bastando somente que a probabilidade de ocorrência seja denominada

por p.

A distribuição de probabilidade para uma variável aleatória X que assume dois

valores: o valor 1 se ocorrer sucesso, e o valor 0 se ocorrer fracasso, é dada por:

xi P(xi)

1 p

0 1 - p

Média e Variância de uma v. a. com distribuição de Bernoulii

E(X) = px =µ

V (X) = qp =−1

Quando uma variável aleatória X tem distribuição de Bernoullii representamos

simbolicamente por X ~ B (p; q). Lê-se: X tende para uma distribuição de Bernoulii cujos

parâmetros são p e q.

3.1.2. Distribuição Binomial

A distribuição binomial consiste na realização de n ensaios de independentes de

Bernoulii, cada um com probabilidade de sucesso constante igual a p (e consequentemente de

fracasso constante a q). Desse modo, pode-se definir a variável aleatória X pelo número de

sucessos observados.

São exemplos de variáveis binomiais: florescimentos de plantas de uma espécie em

uma amostra de tamanho n; nascimento de fêmeas em uma amostra de tamanho n; etc. A

distribuição binomial é a mais importante das distribuições de v. a. discretas.

Se p é a probabilidade de sucesso de um evento ocorrer em uma única tentativa e q =

1- p é a probabilidade do fracasso, então, a probabilidade de que nos k primeiros ensaios de

Bernoulii ocorram sucessos e nos n-k restantes ocorram fracassos, considerando-se a

independência dos ensaios é dada por:

knk

knk

ppFFFFSSSSP −

−= )1.(),...,,,,,...,,,( 443442143421

Como os k sucessos podem ocorrer em qualquer uma das ordens possíveis nos n

experimentos de Bernoulii, que é igual a ao número de combinações de n elementos k a k

Page 30: Apostila 5 - Variáveis aleatórias

30

dada por )!(!

!

knk

nC n

k−

= , a probabilidade de obtenção de k sucessos nas n realizações do

experimento é calculada por:

f (x) = P (X=x) = knkpp

k

n−−

)1.(. = knkn

kqpC

−..

OBS: a denominação binomial decorre do fato de os coeficientes n

xC serem os coeficientes

binomiais das n potências (a + b).

Por exemplo: O binômio elevado à potência três:

(a + b)3 = a3 + 3a2b + 3ab2 + b3 corresponde a 33C a3 + 3

2C a2b + 31C ab2 + 3

0C b3

Suposições do modelo binomial:

1. Existe n repetições ou provas idênticas do experimento. Exemplo: número de

plantas sadias colhidas em parcelas de 20 m2 (foram plantadas 27 plantas em cada

parcela), X = 0, 1, 2, ....,27, então, n é o número total de casos possíveis da variável

que estamos estudando.

2. Só há dois tipos de resultados possíveis (Ex.: plantas sadias ou doentes).

3. As probabilidades p de sucesso e 1 – p = q de fracasso permanecem constantes em

todas as repetições.

4. Todos os resultados das repetições são independentes um do outro.

Média e Variância de uma v. a. com distribuição Binomial

E(X) = npx =µ

V (X) = npqpnpnpq =−= )1(

Quando uma variável aleatória X tem distribuição binomial representamos

simbolicamente por X ~ Bin (n; p). Lê-se: X tende para uma distribuição Binomial cujos

parâmetros são n e p.

Exemplo: No rebanho bovino 30% dos animais estão atacados por febre aftosa. Retira-se

por acaso uma amostra de 10 animais.

a) Verifique se a variável “número de animais doentes” pode ser estudada pelo

modelo binomial. Justifique sua resposta.

b) Estruturar a função de probabilidade.

c) Qual a probabilidade de se encontrar 6 animais doentes.

d) Qual a probabilidade de se encontrar pelo menos 6 animais doentes.

Page 31: Apostila 5 - Variáveis aleatórias

31

e) Qual a probabilidade de se encontrar no máximo 6 animais doentes

3.1.3. Distribuição de Poisson

A distribuição de Poisson é um caso limite da distribuição binomial, quando n → ∞, p

→ 0 e µ = np permanece constante, e se aplica no caso em que, em vez de se observar o

número de sucessos em n realizações independentes de um experimento de Bernoulli, o

interesse é o número de sucessos em um intervalo contínuo de observação t (∆∆∆∆t). Esse

intervalo contínuo de observação pode ser um intervalo qualquer em que se vai observar a

ocorrência de sucessos. Nas ciências agrárias e biológicas a distribuição de Poisson é

largamente utilizada para contagens de indivíduos, plantas, colônias de bactérias, itens,

objetos, dados num intervalo de tempo, numa área, num volume, num comprimento. A

unidade de medida deve ser definida de tal modo que as contagens sejam baixas. Considere-se

um número baixo com sendo menor que 10. Um aplicação importante dessa distribuição diz

respeito ao estudo do padrão de dispersão de certa espécie animal ou vegetal num campo ou

floresta, então numa determinada área. É muito utilizada, portanto, em estudos de dinâmica de

população e entomológicos.

São exemplos de variáveis com distribuição de Poisson: número de colônias de

bactérias por quadrante de 1m2; número de colônias de bactérias de uma dada cultura por 0,01

mm2 numa plaqueta de microscópio; número de defeitos por 100 m de tecido; número de

acidentes numa esquina movimentada e bem sinalizada por dia; número de chamadas

telefônicas numa central de PABX num intervalo de tempo de ½ minuto; número de

partículas radioativas emitidas numa unidade de tempo; número de micronúcleos/1000

células, etc.

Para que uma variável aleatória X tenha distribuição de Poisson, deve satisfazer às

seguintes condições:

i) Para intervalos de observação ∆t muito pequenos, a probabilidade de ocorrência de mais de

um sucesso é desprezível;

ii) Para intervalos de observação ∆t muito pequenos, a probabilidade de ocorrência de um

sucesso é proporcional ao tamanho do intervalo e igual a λλλλ.∆∆∆∆t, onde λ > 0 é a taxa de sucesso

por unidade de observação;

iii) As ocorrências de sucessos em intervalos disjuntos (não sobrepostos) são independentes.

Page 32: Apostila 5 - Variáveis aleatórias

32

Então, se uma variável aleatória X, igual ao número de sucessos em um intervalo t de

observação tem distribuição de Poisson, pode-se demonstrar que a sua distribuição de

probabilidade é dada por:

,...3,2,1,0,!

)()( ===

kk

tekXP

kt λλ

Sendo µ = λt o número médio de ocorrências no intervalo t, a expressão acima pode

ser escrita na forma:

!

)()(

k

ekXP

kt µλ−

==

Média e Variância de uma v.a. com distribuição de Poisson E(X) = µ

V(X) = µ

Exemplo: Sabendo-se que na fabricação de determinadas chapas aparecem defeitos à taxa

média de 0,5 defeito por m2, calcule a probabilidade de que:

a) uma chapa de 5 m2 seja perfeita;

b) uma chapa de 15 m2 apresente no mínimo três defeitos.

a) Seja X = número de defeitos por chapa de 5 m2, temos:

λ = 0,5 defeito por m2

t = 5 m2

µ = λt = 0,5.5 = 2,5

!0

5,2.)0(

05,2−

==e

XP =0,082 ou 8,2%

b) Seja X = número de defeitos por chapa de 15 m2, temos:

λ = 0,5 defeito por m2

t = 15 m2

µ = λt = 0,5.15 = 7,5

)3(1)3( <−=≥ XPXP

)]2()1()0([1)3( ++=+=−=≥ XPXPXPXP

Page 33: Apostila 5 - Variáveis aleatórias

33

++−=≥

−−−

!2

5,7.

!1

5,7.

!0

5,7.1)3(

25,715,705,7 eeeXP = 1 – 0,020256 = 0,9797 ou 97,97%

3.2. DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUAS

3.2.1. Distribuição Normal ou Gaussiana

A distribuição gaussiana também é denominada de distribuição normal, uma vez que

uma grande maioria das variáveis aleatórias contínuas (inclusive variáveis aleatórias discretas

podem ser aproximadas pela lei gaussiana) da natureza segue esta distribuição.

Diz-se que uma variável aleatória segue distribuição normal de parâmetros µ e 2σ ,

que representamos do modo X ~ N ( µ , 2σ ), se sua função densidade probabilidade for:

( )2

2

222

1 σ

µ−−

×σπ

=

x

e)x(f

Em que µ e 2σ são os parâmetros dessa distribuição, os quais são respectivamente a

média e variância dessa distribuição. O parâmetro µ indica o centro e σ a dispersão. A

distância do centro as pontos de inflexão é precisamente σ .

A forma da função densidade probabilidade é chamada sino de Gauss e o gráfico da

função normal é:

Figura 1. Distribuição normal com média µ e ponto de inflexão σµ ±

O suporte da distribuição é todo conjunto dos números reais, de modo que a maior

parte da massa de probabilidade (área compreendida entre a curva e o eixo de abscissa) se

encontra concentrado ao redor da média e as ramificações da curva se estendem

Page 34: Apostila 5 - Variáveis aleatórias

34

assintoticamente aos eixos, de modo que qualquer valor “muito distante” da média é possível

mesmo que pouco provável.

A forma do sino de Gauss depende dos parâmetros µ e σ . O parâmetro µ indica a

posição do sino de Gauss (parâmetro de centralização) e 2σ (ou equivalente, σ ) será o

parâmetro de dispersão. Quanto menor for, maior será a quantidade de massa de probabilidade

concentrada ao redor da média (gráfico de f muito pontiagudo em torno de µ ) e, quanto

maior for, “mais achatado” será.

·

Figura 2. Distribuições gaussianas com diferentes médias e igual dispersão.

Figura 3. Distribuições gaussianas com média igual, mas com variâncias diferentes.

Propriedades da curva de distribuição Normal:

(i) simétrica em relação a µ;

(ii) tem forma de sino;

(iii) fica completamente definido conhecendo a sua média e variância;

Page 35: Apostila 5 - Variáveis aleatórias

35

(iv) área total sob a curva é igual a 1.

Quando µ = 0 e 2σ = 1, temos uma distribuição padrão ou reduzida, ou X ~ N (0,1),

cuja função densidade probabilidade reduz-se a:

2

z2

e2

1)z(

φ

Logo, se X ~ N ( µ , 2σ ), então a variável aleatória definida por σ

µ−=

xz , terá

distribuição normal padronizada, com média 0 e variância 1. Sabe-se que a probabilidade de

X estar entre dois valores quaisquer (a, b) é dado pela área sob a curva normal entre estes

valores:

Figura 4. A probabilidade de x estar entre o ponto a e b corresponde a área

hachurada da figura.

a(P <X<b)= ∫b

a

dx)x(f

Como a cálculo dessa integral não é trivial, usam-se as tabelas obtidas a partir da curva

normal padronizada.

Vejamos, então, como obter probabilidades a partir da Tabela (ANEXO 1). Essa tábua dá

as probabilidades sob uma curva normal padrão, que nada mais são do que as correspondentes

áreas sob a curva.

P ( czZ ≤≤0 ) onde, Z ~ N (0,1)

Page 36: Apostila 5 - Variáveis aleatórias

36

Figura 5. Probabilidade de P(0≤ Z≤ Zc )

Exemplo: Calculemos algumas probabilidades.

(a) P (0 )73,1Z ≤≤ =

(b) P (-1,73 )0Z ≤≤ =

(c) P (Z≥ 1,73) =

(d) P (Z≥ 0) =

(e) P (0,47 )73,1Z ≤≤ =

Suponha, agora, que X seja uma v. a. N ( µ , 2σ ), com µ = 3 e 2σ = 16, e queiramos

calcular P(2≤ X ≤ 5). Temos:

P(2 ≤ X≤ 5)=

−≤

−≤

σ

µ

σ

µ

σ

µ 5X2P =

−≤

−≤

4

35X

4

32P

σ

µ

Exemplo. A quantidade de kg de leite produzidos por um animal diariamente,

considerando uma determinada raça e rebanho segue a distribuição normal e possui média

9,87kg/dia/animal e variância 8,87(kg/dia/animal)2. Calcule: a probabilidade de um animal

produzir menos de 3kg/dia, a probabilidade de um animal produzir mais de 8kg/dia e a

probabilidade de um animal produzir entre 10kg/dia e 12kg/dia.

2.2.2. Distribuição Qui-quadrado (χχχχ2)

A distribuição de Qui-quadrado é a distribuição amostral relacionada a 2σ̂ obtida de uma

população normal.

Se considerarmos uma variável aleatória Z com uma distribuição normal padrão

[Z ~ N (0, 1)], então a variável X = Z2 distribui-se conforme uma lei de probabilidade de

distribuição χχχχ2 com grau de liberdade, o que representa como: X ~ 2χ .

Page 37: Apostila 5 - Variáveis aleatórias

37

Se temos n variáveis aleatórias independentes Zi ~ N (0, 1), a soma de seus quadrados

respectivos é uma distribuição que denominaremos de LEI DE DISTRIBUIÇÃO DE χ2 com n

graus de liberdade, 2nχ .

Ou seja: ∑=

=+++=n

i

inn ZZZZ1

2222

21

2 ...χ

Se temos X1, X2, ..., Xn variáveis aleatórias independentes, onde cada Xi ~ N ( µ , 2σ ),

então, a variável :

~)( 2

n1

2

2

1

2

1

2 χσ

µχ ∑∑∑

===

−===

n

i

in

i

i

n

i

i

XZX , com n graus de liberdade.

Uma variável aleatória X que segue uma distribuição de Qui-quadrado tem densidade

dada por:

x

n

exxf 2

112

2

1

)2/1(

2/1)(

−−

Γ= em que x > 0

Figura 4. Função densidade probabilidade de χn2 para valores pequenos de n.

A média e a variância dessa variável são: E(X) = n e V(X) = 2n, respectivamente.

Sejam X1, X2, ..., Xn variáveis aleatórias independentes de uma distribuição normal com

média µ e variância 2σ [Xi ~ N ( µ , 2σ )], então, a variável :

2n

n

1i

2i

12

22 ~ )(Z

)(χ

σχ ∑∑

==

−=−

= ZXXn

i

i , com n - 1 graus de liberdade, sendo que Zi ~ N (0,1)

Se, 1

)(ˆ

22

−=

n

XX iσ é obtido de uma amostra aleatória de uma distribuição normal com

média µ e variância 2σ , então a variável: 2

22 ˆ).1(

σ

σχ

−=

n, com n - 1 graus de liberdade.

Page 38: Apostila 5 - Variáveis aleatórias

38

A distribuição de Qui-quadrado possui várias aplicações em estatística. Uma delas é a

de propiciar mecanismos para a realização de inferências sobre o parâmetro 2σ de uma

população normal. Outra aplicação refere-se aos testes de falta de ajuste de um modelo teórico

aos dados observados em um experimento ou levantamento amostral.

2.3.3. Distribuição t de Student

É importante no que se refere a inferência sobre médias populacionais.

A distribuição t de Student constitui-se como um quociente entre a normal e a raiz de

uma χ2 independentes. De modo preciso, chamamos distribuição t de Student com n graus

de liberdade, tn, a distribuição de uma variável aleatória T.

21n

n

ZT

χ

=

Em que Z ∼ N (0, 1) χn2 ∼∼∼∼ χn

2 . Esse tipo de distribuição aparece quando temos n + 1

variáveis aleatórias independentes.

A distribuição de probabilidade de t é dada por:

∑=

=n

i i

iiX

n

X

T

1

21

σ

µ

σ

µ

A distribuição de t tem propriedades parecidas com a Normal, quais sejam:

* É centrada na média igual a zero e simétrica com relação à mesma;

* É um pouco mais dispersa que a normal, mas a variância decresce até um quando o número

de graus de liberdade aumenta;

* Quando o número de graus de liberdade tende ao infinito, a distribuição de t tende à Normal

(os valores de ambas são satisfatoriamente próximos a partir do grau de liberdade igual a 30).

OBS.: grau de liberdade = n - 1

Page 39: Apostila 5 - Variáveis aleatórias

39

3.2.4. Distribuição F de Snedecor

A distribuição de F se define como o quociente de distribuições χ2 independentes.

Sejam X ∼ χ2 e Y ∼ χ2 variáveis aleatórias independentes. Dizemos então que a

variávelY

X

n

m

Ym

XnF ==1

1

∼ Fn,m segue distribuição de probabilidade de Snedecor, com (n, m)

graus de liberdade.

OBS.:Observa-se que Fn,m ≠ Fm,n

A distribuição de probabilidade de F é dada por:

=

=

=m

j j

jj

n

i i

ii

mY

m

X

nF

1

2

1

2

ˆ1

1

σ

σ

µ

∼ Fn,m

A forma mais habitual na qual se encontra essa distribuição é quando se tem n + m

variáveis aleatórias independentes.

Uma das aplicações da distribuição de F é na análise de variância, em que as

avaliações se baseiam em estimativas da variância populacional.

4. LITERATURA CONSULTADA

ARA, A. B.; MUSETTI, A. V.; SHNEIDERMAN, B. Introdução à estatística. São Paulo:

Egard Blucher: Instituto Mauá de Tecnologia, 2003.152p.

CARVALHO, S. Estatística básica. Rio de Janeiro: Campus/Elsevier, 2006. 464p.

FERREIRA, D. F. Estatística básica. Lavras: UFLA, 2005. 664p.

REGAZZI, A. Curso de iniciação à estatística (Apostila). Universidade Federal de Viçosa,

Viçosa – MG, 1997. 136p.

TRIOLA, M. F. Introdução à estatística. Rio de Janeiro: LTC, 2005. 656p.

Este conteúdo é resultado de pesquisa em vários livros e apostilas de estatística e bioestatística, portanto, ainda

deve ser revisado. Qualquer crítica, erro de digitação (ou outro qualquer), etc., por favor, me comunique.

Obrigada, Profa. Gisele

Page 40: Apostila 5 - Variáveis aleatórias

40

ANEXO 1: Tabela I - Distribuição Normal Padrão Z~N(0,1)

P(0<Z<Zc)

Segunda decimal de Zc Parte inteira da primeira decimal de Zc 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,00 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753

0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141

0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517

0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879

0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224

0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549

0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852

0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133

0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389

1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633

1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706

1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857

2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890

2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916

2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936

2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952

2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964

2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974

2,80 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981

2,90 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986

3,00 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990

3,10 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993

3,20 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995

3,30 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997

3,40 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998

3,50 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998

3,60 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999

3,70 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999

3,80 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999

3,90 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

4,00 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

Page 41: Apostila 5 - Variáveis aleatórias

41

UNIVERSIDADE FEDERAL DO PIAUÍ Campus Universitário “Profa. Cinobelina Elvas” – Bom Jesus, PI Lista de exercícios: Variáveis aleatórias

1. Cite pelo menos 5 exemplos de variáveis aleatórias discretas e 5 exemplos de variáveis aleatórias

contínuas na área de seu curso. Conceitualmente, como você diferenciaria essas variáveis das

quantitativas discretas e contínuas?

2. Seja X uma variável aleatória discreta com a seguinte distribuição de probabilidade:

xi -2 -1 2 4 Total

P(X=xi) 1/4 1/8 1/2 1/8 1,0

a) Traçar o gráfico da distribuição de probabilidade

b) Calcular E(X)

c) Calcular V(X)

d) Calcular E(X – 2)2

e) Calcular V(3X – 4)

Resposta: a) 2,625 b) 4,625 c) 38,106

3. Dado X,Y é uma variável aleatória discreta bidimensional com a seguinte distribuição conjunta:

Y X

-3 2 4

1 0,1 0,2 0,2

3 0,3 0,1 0,1

Calcular:

a) E (X), V (X) e DP (X)

b) E (Y), V (Y) e DP (Y)

c) E (X + Y), Cov (X,Y) e rxy

d) X e Y são independentes? Justifique.

Resposta:

a) 2; 1 e 1 b) 0,6; 9,24 e 3,04 c) 2,6; -1,2 e -0,395 d) não

Page 42: Apostila 5 - Variáveis aleatórias

42

4. Dado X,Y é uma variável aleatória discreta bidimensional com a seguinte distribuição conjunta:

Y X

-3 -2 -1

-2 1/15 1/15 3/30

0 8/30 4/30 2/15

1 2/30 1/30 4/30

Calcular:

a) E (X), V (X) e DP (X)

b) E (Y), V (Y) e DP (Y)

c) E

−− 10

5

2

3

2 YX,

d) Cov (X,Y), rxy. X e Y são independentes? Justifique.

Resposta:

a) -7/30 ; 1,112 e 1,055 b) -61/30; 0,766 e 0,875 c) -8,798 d) não

5. Seja a variável discreta bidimensional (X, Y), cuja distribuição de probabilidade conjunta é dada

pela tabela:

Y X

-3 0 1

-2 1/9 0 2/9

0 0 2/9 2/9

1 1/9 1/9 0

Calcular:

a) E (X)

b) E (Y)

c) V (X)

d) V (Y)

e) E (XY)

f) Cov (X,Y). Interprete.

g) rxy Interprete

Resposta:

a) -0,45 b) -0,22 c) 1,353 d) 0 e) 0

Page 43: Apostila 5 - Variáveis aleatórias

43

6. Dada a funçao de densidade probabilidade (f.d.p.) abaixo:

Calcular:

a) E(X)

b) V (X)

c) V(12X – 8)

d) P (0,5 ≤ x ≤ 1,5)

Resposta: a) 1,083 b) 1,667 c) 240,048 d) 0,469

7. Dada a função:

a) Determinar o valor de k para que f(x) seja f. d.p.

b) E(X)

c) E(X – 2)

d) V(X)

e) V(10X – 2)

f) P(1/2 ≤ x < 3/2)

g) P(X = 1)

h) P(1/2 ≤ x < 1,0)

Resposta: a) 2/5 b) 0,867 c) -1,267 d) 1,1 e) 110 f) 0,45

g) 0 h) 3/5

8. Dada função de densidade probabilidade conjunta da variável X,Y bidimensional contínua:

1/2, se 0 ≤ x ≤ 1

-1/4(x – 3), se 1 ≤ x ≤ 3

f(x) = 0, para outros valores de x.

k(2 – x), se 0 ≤ x < 1

k, se 1 ≤ x ≤ 2

f(x) = 0, para outros valores de x.

16

3 y−, se 0 ≤ x < 4 se 0 ≤ y < 2

f(x,y) = 0, para outros valores de x e y.

Page 44: Apostila 5 - Variáveis aleatórias

44

E as funções de densidade probabilidade marginais são:

Calcular:

a) E (X)

b) E (Y)

c) V (X)

d) V (Y)

e) E (XY)

f) Cov (X,Y). Interprete.

g) rxy Interprete

Resposta: a) 2,0 b) 0,83 c) 5,33 d) 1,0 e) -0,33 f) -1,996

g) -0,86

9. Suponha que as dimensões, X e Y, de uma chapa retangular de metal possam ser consideradas

variáveis aleatórias contínuas com a seguinte função de densidade probabilidade conjunta:

E funções de densidade probabilidade marginais:

4

1, se 0 ≤ x < 4

f(x) = 0, para outros valores de x.

)3(4

1y− , se 0 ≤ y < 2

f(y) = 0, para outros valores de y.

2

1−x, se 1 < x ≤ 2 2 < y < 4

f(x,y) =

2

3+− x se 2 < x < 3 2 < y < 4

0, para outros valores de x e y.

(x – 1) se 1 < x ≤ 2

f(x) = (- x + 3) se 2 < x < 3

0, para outros valores de x.

2

1, se 2 < y < 4

f(y) = 0, para outros valores de y.

Page 45: Apostila 5 - Variáveis aleatórias

45

Calcular:

a) E (X)

b) E (Y)

c) V (X)

d) V (Y)

e) E (XY)

f) Cov (X,Y). Interprete.

g) rxy Interprete

Resposta: a) 1,83 b) 3,0 c) 4,17 d) 9,33 e) 6,0 f) 0,51

g) 0,082

10. Numa família de 4 filhos, seja X = número de meninos e Y = número de variações na seqüência de

mesmo sexo. Relacionar o espaço amostral e, então:

a) Construir a distribuição de probabilidade conjunta de X e Y;

a) X e Y são independentes?

11. Demonstre, com base nas fórmulas gerais de média e variância de uma variável aleatória discreta

que, a média ou valor médio e a variância de uma variável aleatória binomial X [X ∼ Bin (n; p)]

correspondem a E(X) = np e V(X) = npq, respectivamente. Calcule a média e a variância de uma v. A.

X ∼ Bin (10; 0,3)].

Resposta: E(X) = 3 V(X) = 2,1

12. Entre 2000 famílias com 4 crianças cada uma, quantas se esperaria que tivessem:

a) Pelo menos um menino?

b) Exatamente dois meninos?

Resposta: a) 1875 b) 750

13. Supondo que o número de sementes que germine (Y) de uma espécie forrageira siga distribuição

binomial, e a probabilidade de uma semente germinar é 70%. Pede-se:

a) Qual a probabilidade, em um experimento com um vaso com n = 5 sementes, de pelo menos 4

germinarem?

b) Sabe-se que X representa o número de vasos que tem pelo menos 4 sementes germinadas dessa

espécie (originadas do item a), então qual é o número (tamanho da amostra) de vasos, semeados com 5

sementes, necessário para que um experimento venha a ser realizado com um número não inferior a

200 plantas.

Resposta: a) 0,528 ou 52,8%

Page 46: Apostila 5 - Variáveis aleatórias

46

14. Suponha que a peste suína siga a distribuição binomial, ocorrendo, em média em 1 a cada 50

animais em uma população de suínos de certa região. Qual é a probabilidade de que em uma amostra

aleatória de n = 100 suínos, seja encontrado, pelo menos, um com a doença?

Resposta: 0,87 ou 87%

15. Um fabricante de certo tipo de peças garante que uma caixa de suas peças conterá, no máximo,

duas defeituosas. Se a caixa contém 20 peças e a experiência tem demonstrado que o processo de

fabricação produz 5% de peças defeituosas.

a) Calcule a probabilidade de que uma caixa satisfaça a garantia;

b) Considerando que a caixa vendida determina um lucro de R$ 120,00, caso esteja conforme a

garantia, e um prejuízo de R$ 50,00, se não corresponder à garantia, indique qual será o lucro médio

por caixa vendida.

Resposta: a) 0,924 ou 9,24% b) R$ 107,08

16. Sementes certificadas de feijão são vendidas em um saco de 15 kg ao preço de R$ 20,00 cada. É

característica de produção que 20% das sementes apresentem poder germinativo abaixo do

especificado. Um comprador fez a seguinte proposta ao produtor de sementes: de cada saco escolhe 25

sementes, ao acaso, e paga por saco:

- R$ 25,00 se todas as sementes germinarem;

- R$ 17,00 se uma ou duas sementes não germinarem;

- R$ 10,00 se três ou mais sementes não germinarem.

O que é melhor para o produtor, manter o seu preço de 20,00 u.m. por saco ou aceitar a

proposta do comprador?

Sugestão: encontrar o preço médio esperado pelo produtor.

Resposta: O vendedor não deve aceitar a proposta do comprador [E(X) = 19,51)]

17. Suponhamos que a porcentagem de germinação de sementes de feijão seja de 70%. Vão ser

semeadas 4 sementes por cova, as quais serão espaçadas de 0,40m entre linhas e 0,20m entre covas.

Supondo-se que cada canteiro a ser semeado conste de 6 linhas de 5m de comprimento, qual o número

médio esperado de covas falhadas (nem uma semente germinou, das quatro semeadas) por canteiro?

Resposta: 0,9919 ou 99,19%

18. Um contador eletrônico de bactérias registra em média 5 bactérias por cm3 de um líquido.

Admitindo-se que esta variável tenha distribuição de Poisson:

a) qual é o desvio padrão do número de bactérias por cm3?

b) Encontre a probabilidade de que pelo menos duas bactérias ocorram num volume de líquido de

1cm3.

Page 47: Apostila 5 - Variáveis aleatórias

47

Resposta: a) V(X) = 5 b) 95,96%

19. Numa área dividida em quadrantes de 0,50m2, foram encontrados em média 2,5 espécimes.

Considerando que o modelo de Poisson é adequado, e seja X o número de espécimes por 0,5m2.

a) Qual é a probabilidade de se encontrar num quadrante exatamente 4 espécimes?

b) Qual é a probabilidade de encontrar no máximo 1 espécime por quadrante?

Resposta: a) 13,36% b) 28,7%

20. Numa placa de microscópio, dividida em quadrantes de 1mm2, encontra-se em média 5 colônias

por mm2. Considerando que a distribuição de Poisson é adequada, ou seja: as colônias distribuem-se

aleatoriamente na placa e, o número médio de colônias por mm2 permanece constante e é baixo.

a) Qual a probabilidade de um quadrante ter exatamente uma colônia?

b) Qual a probabilidade de encontrar duas colônias por mm2?

c) Qual a probabilidade de encontrar oito colônias em 2 mm2?

Resposta: a) 3,37% b) 8,42% c) 11,26%

21. Supondo que o peso de animais da raça Charolês, com dois meses de idade, obedeça a

uma distribuição normal com média igual a 75kg e desvio padrão de 10kg. Calcule a

probabilidade de que, um bovino dessa raça e dessa idade, escolhido ao acaso, pese:

a) mais de 69,8kg

b) menos de 97,2kg

c) entre 77,7kg e 82,2kg

d) menos de 77,7kg e mais de 82,2kg

Resposta: a) 69,85% b) 98,68% c) 15,78% c) 84,22%

22. Uma raça de coelhos híbrida, Norfolk, possui peso ao abate aos 90 dias X com distribuição N

(2,60; 0,04). Obter:

a) P (X > 2,70)

b) P (X < 2,45)

c) P (2,55 < X < 2,65)

d) P (X > x) = 0,80

e) P (-x < X < x) = 0,95

f) P (-x < X < x) = 0,90

Page 48: Apostila 5 - Variáveis aleatórias

48

23. Um agricultor usa uma máquina automática para encher sacos de trigo, cada um com um peso

nominal de 112 lb de grão. No entanto, devido a flutuações aleatórias do mecanismo de pesagem, o

peso de cada saco é uma V.A. Normal de média 112,375 lb e desvio padrão 0,226 lb;

a) Calcule a probabilidade de um saco escolhido ao acaso conter menos do que o peso nominal;

b) O agricultor fornece o trigo a um moleiro com a condição de que não mais do que 5% dos sacos são

sub-pesados. Determine o valor mais baixo do peso médio de cada saco que satisfaça a esta condição.

Resposta: a) 4,85% b) 112,0021

24. Num povoamento florestal temos uma distribuição aproximadamente normal dos Diâmetros na

altura do peito (D.A.P.) das árvores, com média de 12,6 cm e variância de 3,1 cm. Se cortarmos todas

as árvores de menos de 15 cm de diâmetro, qual a porcentagem de árvores que restarão de pé?

Resposta: 8,69%

25. As vendas de sementes de milho têm distribuição normal com média igual a 500 sacos e desvio

padrão 50 sacos. Se a empresa decide produzir 600 sacos no mês em estudo, qual é a probabilidade de

que não possa atender a todos os pedidos do mês, por estar com a produção esgotada?

Resposta: 22,28%

26. Sabe-se que o comprimento de pétalas de uma população de plantas da espécie X é normalmente

distribuída com média µ = 3,2 cm e σ = 1,8 cm. Qual proporção na população é ter um comprimento

de pétalas:

a) Maior do que 4,5 cm?

b) Entre 2,9 e 3,6 cm?

c) Determinar o valor do comprimento de pétalas que é superado por 65% das plantas.

Resposta: a) 23,89% b) 15,46% c) 4,874 cm