40
R R E E S S O O L L U U Ç Ç Ã Ã O O D D E E Q Q U U E E S S T T Õ Õ E E S S E E S S A A F F E E S S T T A A T T Í Í S S T T I I C C A A I I N N F F E E R R E E N N C C I I A A L L Prof. Weber Campos [email protected] www.olaamigos.com.br

estatística avançada

Embed Size (px)

DESCRIPTION

Estatística.

Citation preview

Page 1: estatística avançada

RREESSOOLLUUÇÇÃÃOO DDEE QQUUEESSTTÕÕEESS

EESSAAFF

EESSTTAATTÍÍSSTTIICCAA IINNFFEERREENNCCIIAALL

Prof. Weber Campos [email protected]

www.olaamigos.com.br

Page 2: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 2

ÍNDICE DA APOSTILA

Probabilidade

Variáveis Aleatórias

Distribuições de Probabilidades

Função Distribuição de Probabilidade

Valor Esperado de uma Variável Aleatória

Variância de uma Variável Aleatória

Distribuições Especiais de Probabilidade

Distribuições Discretas

Distribuição Uniforme Discreta

Distribuição de Bernoulli

Distribuição Binomial

Distribuição Hipergeométrica

Distribuição de Poisson

Distribuições Contínuas

Distribuição Uniforme Contínua

Distribuição Normal

Amostragem

Intervalo de Confiança

Intervalo de Confiança para a Média

Intervalo de Confiança para a Proporção

Determinação do tamanho da amostra

Correlação

Regressão Linear

Testes de Hipóteses

Passo a passo do teste de Hipótese para a Média

Passo a passo do teste de Hipótese para a Proporção

Tipos de erros em um teste de hipóteses

EXERCÍCIOS

Probabilidade

Distribuição Binomial

Distribuição Hipergeométrica

Distribuição de Poisson

Distribuição Normal

Valor Esperado de uma variável aleatória

Correlação

Regressão Linear

Intervalo de Confiança para a Média

Intervalo de Confiança para a Proporção

Determinação do tamanho da amostra

Testes de Hipóteses para médias e proporções

Page 3: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 3

PROBABILIDADE

1. CONCEITOS INICIAIS Ocorre que a Teoria da Probabilidade faz uso de uma nomenclatura própria, de modo que há três conceitos fundamentais que temos que passar imediatamente a conhecer: Experimento Aleatório, Espaço Amostral e Evento. # Experimento Aleatório: é o experimento que mesmo repetido diversas vezes sob as mesmas condições, podem apresentar resultados diferentes. Exemplos de experimento aleatório: lançar um dado e observar o resultado; lançar duas moedas e observar o número de caras obtidas; selecionar uma carta de um baralho de 52 cartas e observar seu naipe. # Espaço Amostral: é nada mais, senão o “conjunto dos resultados possíveis” de um Experimento Aleatório. Designaremos o Espaço Amostral por “S”. Consideremos os exemplos abaixo, e determinemos os respectivos espaços amostrais:

a) lançar um dado, e observar a face de cima. S = {1, 2, 3, 4, 5, 6}

b) lançar duas moedas e observar as faces de cima.

S = { (cara, cara); (cara, coroa); (coroa, cara); (coroa, coroa) }

c) lançar duas moedas e observar o número de caras. S = {0, 1, 2}

d) Verificar, uma a uma, o número de peças defeituosas em um lote de 15 peças.

S = {0, 1, 2, 3,..., 14, 15} O terceiro conceito essencial ao estudo da Probabilidade é o conceito de Evento. # EVENTO: um evento será um subconjunto do Espaço Amostral. Designaremos um evento por uma letra maiúscula. Diremos que ocorreu um evento A, quando o resultado do Experimento Aleatório for pertencente ao subconjunto A. Entendamos melhor por meio do exemplo abaixo: Experimento Aleatório: lançar um dado e observar a face para cima. Espaço Amostral: S={1, 2, 3, 4, 5, 6} n(S) = 6 Evento A: obter um resultado par no lançamento do dado. A = { 2, 4, 6 } n(A)=3 Evento B: obter um múltiplo de 2 no lançamento do dado. B = { 2, 4, 6 } n(B)=3 Evento C: obter um resultado maior ou igual a 7 no lançamento do dado. C = { } (ou seja: vazio!) n(C)=0 Quando isso acontecer, estaremos diante de um “evento impossível”! Evento D: obter um resultado menor do que 7 no lançamento do dado. D = {1, 2, 3, 4, 5, 6} (igual ao espaço amostral) n(D)=6 Quando isso acontecer, estaremos diante de um “evento certo”!

Page 4: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 4

2. FÓRMULA ELEMENTAR DA PROBABILIDADE Fórmula da Probabilidade: a probabilidade de ocorrência de um evento “X”, dado determinado experimento aleatório, e considerando que cada elemento do espaço amostral deste experimento tem a mesma probabilidade, será calculada por:

Prob(X) = n(X) = número de resultados favoráveis ao evento X n(S) número de resultados possíveis

Onde: n(S) é o número de elementos do espaço amostral do experimento; e

n(X) é o número de elementos do evento X.

Como dissemos, a fórmula acima é aplicável quando os elementos do espaço amostral tiverem a mesma probabilidade. Por exemplo, num lançamento de uma moeda “honesta” (não viciada), com faces cara e coroa, essas duas faces têm a mesma chance de serem sorteadas, daí terão a mesma probabilidade. No entanto, se tivermos uma moeda viciada, a chance de sorteio de uma das faces é maior que a da outra, daí as probabilidades das faces serão diferentes.

Portanto, podemos usar a fórmula da probabilidade supracitada para o primeiro caso (o da moeda honesta), mas, para o segundo caso (o da moeda viciada), não é possível.

3. TEOREMAS DA PROBABILIDADE

Destacamos os seguintes teoremas:

1. O menor valor que a probabilidade de um evento pode ter é 0 (indicando que o evento é impossível) e o maior valor é 1 (indicando que o evento certamente irá ocorrer). Então, em geral:

0 P(X) 1 2. A soma das probabilidades de cada elemento do espaço amostral é igual a 1. No caso do lançamento de um dado, teremos, então, que:

P(1)+P(2)+P(3)+P(4)+P(5)+P(6) = 1

3. A probabilidade de ocorrência de um evento X somada com a probabilidade de não ocorrência desse

mesmo evento é igual a 1. Prob(X ocorrer) + Prob(X não ocorrer) = 1

Dizemos que os eventos “X ocorrer” e “X não ocorrer” são eventos complementares. Portanto, a soma das probabilidades de eventos complementares é igual a 1.

Em termos de conjunto, dois eventos complementares A e B podem ser representados como:

São também exemplos de eventos complementares:

P(ganhar o jogo) + P(não ganhar o jogo) = 1

P(réu inocente) + P(réu culpado) = 1

P(cara) + P(coroa) = 1

P(par no dado) + P(ímpar no dado) = 1

P(a nota é no mínimo 2) + P(a nota é menor do que 2) = 1

P(a nota é no máximo 9) + P(nota igual a 10) = 1

P(nascer pelo menos 1 menina) + P(nascer nenhuma menina) = 1

A B

Page 5: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 5

Esta relação será utilizada muitas vezes nas soluções de questões de probabilidade. Através dela, podemos calcular a probabilidade de um evento ocorrer a partir da probabilidade do evento complementar. Por exemplo, se uma questão pede a probabilidade de ocorrer pelo menos uma cara no lançamento de três moedas viciadas. É mais fácil calcular a probabilidade do evento complementar, ou seja, calcular P(nenhuma cara), pois só temos uma situação favorável, a qual é: (coroa, coroa, coroa). Achada esta probabilidade, é só lançar na nossa relação para encontrar a probabilidade da ocorrência do evento desejado na questão. Resolveremos exemplos deste tipo mais adiante.

4. PROBABILIDADE DE EVENTOS INDEPENDENTES Dois eventos, A e B, são independentes quando a ocorrência, ou não-ocorrência, de um deles não afeta a probabilidade de ocorrência do outro.

Por exemplo, ao efetuarmos dois lançamentos sucessivos de uma moeda, os eventos “cara no primeiro lançamento” e “coroa no segundo lançamento” são eventos independentes, uma vez que o resultado do primeiro lançamento da moeda não afeta a probabilidade de ocorrência do resultado coroa no segundo lançamento.

Porém, ao retirarmos duas cartas sem reposição de um baralho, os eventos “às na primeira retirada” e “valete na segunda retirada” são eventos dependentes, porque ao retirarmos a primeira carta, dada a ocorrência, ou não, do “ás”, o total de cartas do baralho sofrerá uma redução, alterando desta forma a probabilidade da segunda carta.

E se retirarmos duas cartas com reposição, esses eventos serão independentes? Quando repomos a carta retirada, o número de cartas de cada tipo (às, valete, dama,...) não se altera e nem, é claro, o total de cartas. Desta forma, a probabilidade da segunda carta retirada não dependerá da primeira carta, por conseguinte, os eventos são independentes!

Quando dois eventos, A e B, são independentes a probabilidade do evento B ocorrer dado que A ocorreu, simbolizada por P(B|A), será sempre igual a P(B), porque, por definição, não existe relação entre a ocorrência de tais eventos. Logo, temos a igualdade:

Prob(B|A) = Prob(B)

Naturalmente, também teremos:

Prob(A|B) = Prob(A)

5. PROBABILIDADE DE EVENTOS MUTUAMENTE EXCLUSIVOS Dois eventos, A e B, são mutuamente exclusivos se eles não podem ocorrer simultaneamente. Quer dizer que se um evento ocorreu, o outro certamente não ocorreu.

Por exemplo, em apenas dois lançamentos de uma moeda, os resultados possíveis são:

S = { (cara, cara); (cara, coroa); (coroa, cara); (coroa, coroa) }

Os eventos “ocorrer duas caras” e “ocorrer duas coroas” são mutuamente exclusivos, pois eles não podem ocorrer simultaneamente. Se um deles ocorre, o outro não ocorre. Mas os eventos “ocorrer exatamente 1 cara” e “ocorrer exatamente 1 coroa” não são mutuamente exclusivos, pois se o resultado do primeiro lançamento for cara e o resultado do segundo lançamento for coroa, já teremos uma situação em que os dois eventos ocorrem ao mesmo tempo.

Se A e B forem eventos mutuamente exclusivos, ou seja, se eles não podem ocorrer

simultaneamente (ou em termos de conjunto: A B = ), então teremos:

P(A|B) = 0;

P(B|A) = 0;

Prob(A e B) = 0.

Dois eventos mutuamente exclusivos são representados graficamente por dois círculos sem interseção.

Exemplo: Considere o experimento aleatório do lançamento de um dado, e os seguintes eventos:

Evento A: “resultado no dado menor do que 3”

Evento B: “resultado no dado maior do que 4”

Page 6: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 6

Evento C: “resultado no dado maior do que 1 e menor do que 6”

Os eventos A e B são mutuamente exclusivos? E A e C? E B e C?

Solução:

O conjunto dos resultados do evento A é: {1, 2}.

O conjunto dos resultados do evento B é: {5, 6}.

O conjunto dos resultados do evento C é: {2, 3, 4, 5}.

Observe que A e B não têm elementos em comum (A B = ). Logo os eventos A e B são mutuamente exclusivos.

No entanto, temos elementos em comum entre A e C, e entre B e C. Logo “A e C” e “B e C” não são mutuamente exclusivos.

A representação por diagramas de conjuntos para esses três eventos é:

Vejamos mais alguns exemplos de eventos mutuamente exclusivos:

1) Evento A: “Em uma retirada, resultar um ás”

Evento B: “Em uma retirada, resultar um valete”

2) Evento A: “No nascimento de 2 crianças, nascer 2 meninas”

Evento B: “No nascimento de 2 crianças, nascer 2 meninos”

3) Evento A: “time do Inter ganhar”

Evento B: “time do Inter perder”

4) Evento A: “Em dois lançamentos, obter duas caras”

Evento B: “Em dois lançamentos, obter duas coroas”

5) Evento A: “o atleta brasileiro ganhar medalha de ouro”

Evento B: “o atleta brasileiro não ganhar medalha de ouro”

6) Evento A: “o número sorteado é ímpar”

Evento B: “o número sorteado é par”

7) Evento A: “No nascimento de 2 crianças, nascer pelo menos 1 menina”

Evento B: “No nascimento de 2 crianças, nascer nenhuma menina”

Existe, frequentemente, alguma confusão com respeito à distinção entre eventos mutuamente exclusivos, eventos independentes e eventos complementares.

Se dois eventos são complementares, então certamente eles são mutuamente exclusivos; mas a recíproca nem sempre é verdadeira. (Para dois eventos serem complementares, um evento deve ser a negação do outro!) Na lista acima de eventos mutuamente exclusivos, apenas os três últimos (5, 6 e 7) são eventos complementares.

Por que os eventos do terceiro exemplo da lista acima não são complementares? Para serem complementares, a negação do evento A deveria ser o evento B; mas não é, pois a negação do “Inter ganhar” é o “Inter perder ou empatar”.

B A

C

Page 7: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 7

E os eventos do segundo exemplo, por que não são complementares? A negação de “nascer 2 meninas” não é “nascer dois meninos”, e sim “nascer no máximo 1 menina” que inclui os resultados: (menina, menino); (menino, menina); (menino, menino).

Dois eventos complementares ou dois eventos mutuamente exclusivos apresentam a mesma característica de que não ocorrem simultaneamente, ou seja, a ocorrência de um evento implica na não-ocorrência do outro; enquanto eventos independentes são aqueles em que a probabilidade de ocorrência de um, não é afetada pela ocorrência do outro. Portanto, os eventos complementares e os eventos mutuamente exclusivos são altamente dependentes!

6. PROBABILIDADE DA INTERSECÇÃO DE EVENTOS (Regra do “e”)

Dados dois eventos, A e B, a probabilidade de ocorrência simultânea dos eventos A e B é igual a:

Prob(A e B) = Prob(A) x Prob(B|A)

Onde Prob(B|A) significa a probabilidade de ocorrer B sabendo que A já tenha ocorrido.

Se A e B forem eventos independentes (a ocorrência de um deles não afeta a probabilidade de ocorrência do outro), então a probabilidade de ocorrência de A e B, ao mesmo tempo, será encontrada pelo produto das probabilidades individuais! Assim, a regra do “e” fica simplificada para:

Prob(A e B) = Prob(A) x Prob(B)

E ainda, caso os eventos A e B sejam mutuamente exclusivos (eventos que não podem ocorrer

simultaneamente, ou em termos de conjunto: AB=). Assim, no nascimento de uma criança, o evento “nascer menina” e o evento “nascer menino” são mutuamente exclusivos, uma vez que ao se realizar um deles, o outro não se realiza. Desta forma, a probabilidade de ocorrência de A e B, ao mesmo tempo, será igual a zero. Na notação simbólica, teremos:

Prob(A e B) = 0.

7. PROBABILIDADE DA UNIÃO DE EVENTOS (Regra do “ou”) Prob(A ou B) = Prob(A) + Prob(B) – Prob(A e B)

Reparemos bem na terceira parcela da fórmula acima: Prob(A e B). Esta parcela trata acerca da probabilidade de ocorrência simultânea dos eventos A e B.

Aprendemos que, caso os eventos A e B sejam eventos independentes, então a probabilidade de ocorrência de A e B, ao mesmo tempo, será encontrada pelo produto das probabilidades individuais! Certo? Desta forma, para os eventos independentes, a regra do “ou” fica simplificada para:

Prob(A ou B) = Prob(A) + Prob(B) – Prob(A)xProb(B)

E também sabemos que se os eventos A e B forem mutuamente exclusivos, a probabilidade de ocorrência desses dois eventos, ao mesmo tempo, será igual a zero. Assim, para eventos mutuamente exclusivos, a regra do “ou” fica simplificada para:

Prob(A ou B) = Prob(A) + Prob(B)

8. PROBABILIDADE CONDICIONAL

Probabilidade condicional será a probabilidade de ocorrência de um evento “A”, dado que sabemos que ocorreu um outro evento “B”.

Fórmula de Probabilidade condicional:

)(

)()()(

YP

YeXPYXPYdadoXP

Page 8: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 8

VARIÁVEIS ALEATÓRIAS

1. VARIÁVEIS ALEATÓRIAS

Sejam E um experimento e S o espaço amostral associado ao experimento. Uma função X, que

associe a cada elemento sS um número real X(s) é denominada Variável Aleatória.

Exemplo: O experimento consiste no lançamento de duas moedas:

X: nº de caras obtidas nas duas moedas.

S: {(cara, cara), (cara, coroa), (coroa, cara), (coroa, coroa)}

Daí, a variável X define uma variável aleatória discreta, que pode assumir os valores 0, 1 e 2.

Exemplo: O um experimento consiste em verificar as alturas de 30 universitários, a função:

X = "Altura de um universitário"

S: [130cm, 220cm}

Daí, a variável X define uma variável aleatória contínua, que pode assumir quaisquer valores entre 130 cm e 220 cm.

Podemos, então, conceituar:

Variável aleatória discreta: assume um número finito de valores.

Variável aleatória contínua: assume qualquer valor dentro de um certo intervalo (quantidade não-enumerável de valores).

2. DISTRIBUIÇÂO DE PROBABILIDADE

Se uma variável aleatória X pode assumir os valores x1, x2, ... ,xn com probabilidades

respectivamente iguais a P(x1), P(x2), ... , P(xn) , tais que 1)(1

n

i ixP , tem-se definida uma

distribuição de probabilidade.

Se a variável X em questão for discreta, sua distribuição é caracterizada por uma função de probabilidade P(X=x) ou, simplesmente, P(x), também chamada de função massa de probabilidade, que associa probabilidades não nulas aos possíveis valores da variável aleatória.

P(x) pode ser expressa por uma tabela, gráfico ou fórmula.

Exemplo: Consideremos a v.a. X = "número de caras em duas jogadas de uma moeda". Daí, teremos a seguinte distribuição de probabilidades:

xi P(xi)

0 P(0) = 1/4 = 0,25

1 P(1) = 2/4 = 0,50

2 P(2) = 1/4 = 0,25

soma=1

X(s) s

X

S R

Page 9: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 9

Daí, podemos afirmar que:

- A função massa de probabilidade de X no ponto x=0 é: 0,25.

- A função massa de probabilidade de X no ponto x=1 é: 0,50.

- A função massa de probabilidade de X no ponto x=2 é: 0,25.

Representação Gráfica:

P(x)

Ao contrário de uma variável aleatória discreta, uma variável aleatória contínua pode assumir qualquer valor fracionário dentro de um intervalo definido de valores. Desta maneira, para distribuições de probabilidade, não se consegue enumerar todos os possíveis valores de uma variável aleatória contínua com os valores de probabilidade correspondentes. Em lugar disso, a abordagem mais conveniente é construir uma FUNÇÃO DE DENSIDADE DE PROBABILIDADE, ou curva de probabilidade.

A função densidade probabilidade (f.d.p.) - f(x) - deverá possuir as seguintes propriedades:

I. f(x) 0, para todo x .

II. A área sob f(x) é igual a 1.

A distribuição de probabilidade de uma variável contínua mais conhecida é a Distribuição Normal cuja expressão e gráfico da função densidade de probabilidade são mostrados a seguir:

2

2

.2

2.

..2

1)(

x

exf

f(x)

x

3. FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA DE PROBABILIDADE OU FUNÇÃO DE DISTRIBUIÇÃO DE PROBABILIDADE

Definimos esta função como sendo a probabilidade de que X assuma um valor menor ou igual a x, isto é:

F(x) = )( xXP

Para uma variável aleatória discreta, teremos:

0,50

0,25

Page 10: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 10

F(x) = )( xXP = xx

i

i

xP )(

Exemplo:

xi P(xi) xi F(xi)

0 0,25 0 F(0) = P(0) = 0,25

1 0,50 1 F(1) = P(0)+P(1) = 0,25+0,50 = 0,75

2 0,25 2 F(2) = P(0)+P(1)+P(2) = 0,25+0,50+0,25 = 1

Representação Gráfica:

F(x)

Para uma variável aleatória contínua, teremos:

F(x) = )( xXP = é igual à área sob f(x) delimitada a direita pelo valor x em questão.

O cálculo da probabilidade por meio da função distribuição:

P(a<X<b) = F(b) – F(a)

4. VALOR ESPERADO DE UMA VARIÁVEL ALEATÓRIA

O valor esperado de uma variável aleatória ou esperança matemática ou expectância ou Média,

simbolizada por E(X) ou , é definida:

- Para uma variável aleatória discreta:

E(X) = = )( ii xPx

Onde: )(xP é a função massa de probabilidade.

- Para uma variável aleatória contínua:

E(X) = =

dxxfx )(

Onde: )(xf é a função densidade de probabilidade.

O valor da integral acima equivale à área entre a curva da função )(xfx e o eixo X. (No cálculo

da área total lembrar que a área situada acima do eixo X é positiva e, abaixo do eixo X, negativa.)

Exemplo: Para a variável aleatória discreta "número de caras em duas jogadas de uma moeda", tem-se:

xi P(xi) xi . P(xi)

0 0,25 0

1 0,50 0,50

2 0,25 0,50

)( ii xPx = 1

Ou seja, a média (o valor esperado) é 1 cara!

0,75

0,25

1

1 2 x

Page 11: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 11

4.1. Propriedades do Valor Esperado Considerando as variáveis aleatórias X e Y, e a constante k, temos as seguintes propriedades para

o Valor Esperado (Média): I. O Valor Esperado de uma constante:

E(k) = k

II. O Valor Esperado do produto de uma constante por uma variável:

E(k.X) = k.E(X)

III. O Valor Esperado da soma (ou subtração) de uma variável por uma constante:

E(X ± k) = E(X) ± k

IV. O Valor Esperado da soma (ou subtração) de duas variáveis:

E(X ± Y) = E(X) ± E(Y)

V. O Valor Esperado do produto de duas variáveis independentes:

E(X.Y) = E(X).E(Y), se X e Y forem independentes.

5. VARIÂNCIA DE UMA VARIÁVEL ALEATÓRIA

A Variância é uma medida de dispersão que indica o quão próximos ou quão afastados estão os elementos, em relação a um determinado referencial - a média aritmética dos elementos.

A fórmula da Variância, numa população, é dada por:

n

XXV

i

2)( (1) ou

n

XX

nV

i

i

2

21 (2)

Sabendo que a média é dada por n

XX

i , podemos também expressar a fórmula da variância

em função de X :

2

2

Xn

XV

i

(3)

A equação acima tem o mesmo significado que:

Variância = média(X2) – (média(X))

2

Usando o símbolo E(x) para a média, teremos:

Variância = E(X2) - [E(X)]

2

Esta última expressão pode ser aplicada tanto para variável discreta como para variável contínua.

5.1. Propriedades da Variância:

I. A variância de uma constante k:

V(k) = 0

II. A variância do produto de uma constante por uma variável:

V(k.X) = k2.V(X)

III. A variância da soma (ou subtração) de uma variável por uma constante:

V(X ± k) = V(X)

IV. A variância da soma (ou subtração) de duas variáveis independentes:

V(X ± Y) = V(X) + V(Y)

Page 12: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 12

DISTRIBUIÇÕES ESPECIAIS DE PROBABILIDADE

1. DISTRIBUIÇÕES DISCRETAS

1.1 DISTRIBUIÇÃO UNIFORME DISCRETA Enquadram-se aqui as distribuições em que os possíveis valores da variável aleatória tenham todos a mesma probabilidades de ocorrência. Logo, se existem n valores possíveis, cada um terá probabilidade igual a 1/n. Ex.: Seja um lançamento de um dado e a variável aleatória X = “valor da face superior do dado”, tem-se que:

xi pi

1 1/6

2 1/6

3 1/6

4 1/6

5 1/6

6 1/6

soma=1

O gráfico da função massa de probabilidade para o caso do dado é mostrado abaixo. A média de uma variável aleatória discreta uniforme é a própria média aritmética dos valores extremos. EXEMPLO: Joga-se um dado uma única vez. Qual o valor esperado do número obtido? E sua variância? variável aleatória X = “valor da face superior do dado” A v.a. X assume: {1, 2, 3, 4, 5, 6} . Cada resultado tem a mesma probabilidade 1/6. Então, E(X) = 1.(1/6) + 2.(1/6) + 3.(1/6) + 4.(1/6) + 5.(1/6) + 6.(1/6) = 21/6 = 3,5 ou mais fácil: E(X) = (1 + 6)/2 = 3,5 E(X

2) = 1

2.(1/6) + 2

2.(1/6) + 3

2.(1/6) + 4

2.(1/6) + 5

2.(1/6) + 6

2.(1/6) = 91/6

Var(X) = E(X

2) – [E(X)]

2 = 91/6 – (21/6)

2 = 2,92

1.2 DISTRIBUIÇÃO DE BERNOULLI A distribuição de Bernoulli se caracteriza pela existência de apenas dois eventos, mutuamente exclusivos, que denominaremos de sucesso e fracasso, num experimento que é realizado uma única vez. Se a probabilidade de sucesso é p, a probabilidade de fracasso é, evidentemente, 1-p. É uma distribuição deste tipo o lançamento de uma moeda uma única vez. Se apostarmos na cara, sendo esta, então, a probabilidade de sucesso é p = 1/2. e a probabilidade de fracasso (coroa) é 1-p = 1- 1/2 = 1/2. Da mesma forma se, num lançamento de um dado, apostamos num número, digamos, o 3, este será o sucesso, sendo qualquer um dos outros cinco números o fracasso. Nesse caso, a probabilidade de sucesso é p = 1/6, e a probabilidade de fracasso é 1-p = 1 - 1/6 = 5/6.

Outros exemplos de v.a. de Bernoulli: - O sexo do primeiro filho de um casal ser masculino ou feminino. - Uma peça produzida por uma fábrica ser perfeita ou defeituosa.

1 2 3 4 5 6 x

P(x)

1/6

Page 13: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 13

Associando-se uma variável aleatória X aos possíveis resultados do experimento, de forma que: X = 1, se o resultado for sucesso e X = 0, se o resultado for fracasso. Então, a variável aleatória X tem distribuição de Bernoulli, com p sendo a probabilidade de ocorrer sucesso e (1-p) a probabilidade de ocorrer fracasso. P(X=x) = (1-p) para x = 0 p para x = 1 O gráfico da função massa de probabilidade para uma situação genérica é mostrado abaixo. A média e a variância de uma variável aleatória de Bernoulli são dadas por:

E(X) = p e Var(X) = p(1-p) EXEMPLO: No caso do dado, em que se aposta em um único número, atribuindo o valor 1 para o sucesso e 0 para o fracasso, determine a média e a variância do resultado após um jogada. E(X) = 1 . 1/6 + 0 . 5/6 = 1/6 ou E(X) = p = 1/6 Var(X) = p(1-p) = 1/6(1 – 1/6) = 5/36

1.3 DISTRIBUIÇÃO BINOMIAL

Em uma questão de distribuição binomial normalmente não vem explícito no enunciado que se trata de tal distribuição, então temos que saber reconhecer uma distribuição binomial, e faremos isso verificando as seguintes características:

1) Ela tratará de um experimento que se repetirá n vezes, sempre mantidas as mesmas condições originais.

2) Cada tentativa é independente da outra.

3) Este experimento só admite dois resultados: sucesso e fracasso.

4) Tais resultados (sucesso e fracasso) são mutuamente excludentes, ou seja, ocorrendo um, o outro está automaticamente descartado.

5) A cada repetição do experimento, as probabilidades de sucesso p e de fracasso q se mantêm constantes.

Se todas as características acima forem satisfeitas, então estaremos diante de uma questão de distribuição binomial.

Se uma variável tem distribuição binomial, diremos que:

X B(n,p)

Essa simbologia significa que os parâmetros n e p definem uma distribuição binomial.

Probabilidade Binomial:

A questão de distribuição binomial fará a seguinte pergunta:

Qual a probabilidade de se obter exatamente S sucessos, em n tentativas?

A resposta será encontrada a partir da seguinte fórmula:

0 1 x

P(x)

1-p

p

Page 14: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 14

Prob(S sucessos)=Cn,S.(p)S.(q)

F

Onde:

Cn,s= )!(!

!

sns

n

n é o número de repetições do experimento; p é a probabilidade de ocorrência de sucesso; q é a probabilidade de ocorrência de fracasso; S é o número de sucessos desejados; F é o número de fracassos.

A média e a variância de uma variável aleatória Binomial são dadas por:

E(X) = np e Var(X) = np(1-p) EXEMPLO: Num determinado processo de fabricação, 10% das peças produzidas são consideradas defeituosas. As peças são acondicionadas em caixas com 5 unidades cada uma. a) Qual a probabilidade de haverem quatro ou mais peças defeituosas em uma caixa? Sol.:

P(X4) = P(X=4) + P(X=5) = 14

4,5 )1,01(1,0 C + 05

5,5 )1,01(1,0 C

P(X4) = 0,00045 + 0,00001 = 0,00046 b) Qual o valor esperado do número de peças defeituosas em uma caixa que contém 5 unidades? Sol.: E(X) = np = 5 . Prob(peça defeituosa) = 5 . 0,1 = 0,5 peça

1.4 DISTRIBUIÇÃO HIPERGEOMÉTRICA

Quando a retirada de itens é feita sem reposição, a probabilidade de sucesso é modificada à medida que os itens são retirados, desta forma não podemos aplicar a probabilidade Binomial. A distribuição hipergeométrica é a distribuição discreta de probabilidade apropriada quando existir retiradas sem reposição.

Fórmula para determinar a probabilidade hipergeométrica:

P(elemento tal ocorra k vezes em n sorteios) = Cm,k.CN-m,n-k / CN,n

Onde: N = quantidade total de elementos do grupo

n = quantidade de elementos a serem sorteados (retirados aleatoriamente)

k = quantidade desejada de repetição do elemento especificado nos n sorteios

m = número de ocorrências do elemento especificado no grupo

1.5 DISTRIBUIÇÃO DE POISSON

A distribuição de Poisson é empregada em experimentos nos quais não se está interessado no número de sucessos obtidos em n tentativas, como ocorre no caso da distribuição binomial, mas sim no número de sucessos ocorridos durante um intervalo contínuo, que pode ser um intervalo de tempo, espaço, etc. Como por exemplo:

- O número de vezes que o telefone toca em um dia. - O número de acidentes automobilísticos ocorridos numa rodovia em um mês. - O número de defeitos encontrados em um rolo de arame de 500m. Note que nos exemplos acima, não há interesse em se determinar a probabilidade do telefone tocar, ou do acidente ocorrer, ou do defeito existir,... mas sim a freqüência de sua ocorrência, como, por exemplo, o telefone tocar 10 vezes por dia. Probabilidade de Poisson:

Page 15: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 15

Uma questão de probabilidade com a distribuição de Poisson fará a seguinte pergunta:

Qual a probabilidade de se obter S ocorrências, neste determinado intervalo (de tempo, de espaço etc)?

E essa probabilidade é obtida a partir da fórmula:

Prob(S ocorrências) = !S

eS

Onde: Prob(S) é a probabilidade de S ocorrências no intervalo;

é o valor esperado ou número médio de ocorrências no intervalo;

e = 2,71828...

2. DISTRIBUIÇÕES CONTÍNUAS

2.1 DISTRIBUIÇÃO UNIFORME CONTÍNUA A função densidade probabilidade da distribuição uniforme contínua é dada por: Parâmetros característicos:

E(X) = 2

ba e Var(X) =

12

)( 2ab

2.2 DISTRIBUIÇÃO NORMAL

Se uma variável tem distribuição normal, diremos que:

X N(,2)

A Curva Normal é simétrica em relação à média (ela divide a distribuição ao meio)! Assim, as três

medidas de posição: média, mediana e moda possuem o mesmo valor.

Porcentagens especiais sob a curva normal

Freqüência

-3 -2 -1 +1 +2 +3 Variável X

68,3%

95,5%

99,7%

a b x

f(x)

1/(b-a)

Page 16: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 16

A Curva Normal Padronizada apresenta: =0 e 2=1.

A variável normal padronizada será chamada de Z: Z N(0,1)

z=-3 z=-2 z=-1 0 z=1 z=2 z=3 Variável Z

Qualquer distribuição normal particular (X) pode ser transformada na variável normal padronizada (Z), da seguinte forma:

)(

XZ

Fazendo essa transformação, encontraremos na tabela a área sob a curva normal padronizada, e que corresponderá à probabilidade que estamos procurando!

68,3%

95,5%

99,7%

Page 17: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 17

CORRELAÇÃO

Coeficiente de Correlação Linear (r):

O valor de r varia de -1 a +1.

1) Correlação Perfeita Positiva (r=+1) 2) Correlação positiva (0<r<1)

3) Correlação Perfeita Negativa (r= -1) 4) Correlação negativa (-1<r<0)

5) Correlação Nula (r=0)

Mais algumas informações que precisamos conhecer:

1ª) A correlação entre x e x é igual a 1. Ou seja: r(x,x)=1,0. E também temos que:

r(-x, x)=-1,0

r(x, -x)=-1,0

r(-x,-x)=1,0

2ª) A correlação entre x e y é igual à correlação entre y e x. Ou seja:

r(x,y) = r(y,x)

3ª) A correlação não é influenciada nem por operações de soma, nem de subtração, nem de produto, e nem de divisão, exceto pelo sinal.

r(axb, cyd) = r(x,y)

r(axb, –cyd) = r(x,–y) = –r(x,y)

r(–axb, cyd) = r(–x,y) = –r(x,y)

r(–axb, –cyd) = r(–x,–y) = r(x,y)

Fórmula do Coeficiente de Correlação Linear:

n

YY

n

XX

n

YXYX

yxr

i

i

i

i

ii

ii

2

2

2

2

),( (I)

Mas há outra forma de calculá-lo, é através da seguinte fórmula:

22 )()(

))((),(

YYXX

YYXXyxr

ii

ii (II)

x

y y

x

y

y

y

x x

x

Page 18: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 18

REGRESSÃO LINEAR

Equação de uma reta

A equação de uma reta tem a seguinte cara: y = a + bx.

Esta reta sempre corta o eixo vertical no ponto (x=0, y=a) e o eixo horizontal no ponto (x=b

a , y=0).

O valor constante a da expressão (a+bx) é chamado coeficiente linear ou intercepto-y (porque a reta intercepta o eixo Oy em y=a).

O coeficiente b da expressão (a+bx) é chamado coeficiente angular e está associado ao grau de inclinação da reta em relação ao eixo horizontal Ox. Quanto maior o módulo (valor absoluto) de b, maior será a inclinação da reta, tendendo a vertical; e quando b se aproxima de zero a reta diminui a inclinação, tendendo a horizontal.

Através do sinal de b, podemos saber se a reta é crescente, decrescente ou constante.

Se b>0 a reta será crescente.

Se b<0 a reta será decrescente.

Se b=0 a reta será paralela ao eixo horizontal.

Reta da Regressão Linear:

Cada Y pode ser escrito em função de cada X da seguinte forma:

Yi = + Xi + i

Sendo +X a equação da reta, e o termo do erro. Este último termo tem de ser incluído porque o valor de Y não será dado exatamente pelo ponto da reta a ser encontrada.

O próximo passo é encontrar ou, melhor dizendo, estimar a reta de regressão, uma vez que sempre

estaremos trabalhando com uma amostra, o que implica que não teremos os valores de e , mas sim de seus estimadores.

Se a e b são estimativas de e , respectivamente, a reta de regressão estimada é:

ii bXaY ˆ

onde iY é o Yi estimado.

O método a ser utilizado pressupõe que queiramos estimar uma reta que tenha menos erro. O

método mais usado para ajustar uma linha reta a um conjunto de pontos é conhecido como método dos mínimos quadrados. Por este método, a reta resultante será aquela cuja soma dos quadrados dos erros for mínima (isto é, nenhuma outra reta daria menor soma dos quadrados de tais erros).

No processo de estimação via o método de mínimos quadrados, em uma amostra de n pares de valores de X e Y, as estimativas a e b dos parâmetros do modelo linear são apresentadas abaixo.

Estimativa b do parâmetro :

n

XX

n

YXYX

b

i

i

ii

ii

2

2

ou

2XX

YYXXb

i

ii

Estimativa a do parâmetro :

n

Xb

n

Ya

ii

Como n

XX

i e

n

YY

i , então podemos escrever: XbYa .

Page 19: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 19

Relação entre o Coeficiente de Correlação (r) e o Coeficiente Angular da Regressão Linear (b):

X

Y

S

Srb

Onde: b = coeficiente angular da reta de regressão r = coeficiente de correlação linear simples SX = desvio padrão dos dados da variável x (já foi vista a fórmula do desvio padrão) SY = desvio padrão dos dados da variável y (já foi vista a fórmula do desvio padrão)

Temos outras duas relações entre b e r que nos podem ser úteis:

n

XX

n

YY

rb

i

i

i

i

2

2

2

2

22

ou

2

2

22

XX

YYrb

i

i

Nas duas expressões acima aparece o termo 2r . Como bem sabemos, esse é o quadrado do

coeficiente de correlação linear (também chamado de coeficiente de correlação de Pearson). Mas existe um

nome especial para 2r que é: Coeficiente de Determinação (ou Explicação).

Page 20: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 20

AMOSTRAGEM

A inferência estatística envolve a formulação de certos julgamentos sobre um todo após examinar apenas uma parte – ou amostra – dele. E em nosso dia-a-dia, muitas vezes nós usamos uma amostra para julgar um todo, mas nem percebemos que fazemos isso. Quando queremos verificar se certo alimento é saboroso, comemos apenas um pequeno pedaço; a cozinheira prova a sopa para verificar se precisa de um pouco mais de sal; quando passamos os olhos sobre um novo livro ou uma revista para ver se vamos comprar; quando assistimos um programa de TV por uns poucos segundos ou minutos para decidir se mudamos ou não um canal,...

A amostragem estatística é semelhante a cada um dos exemplos acima, embora seus métodos sejam mais formais.

Mas, para as inferências serem corretas, é necessário garantir que a amostra seja representativa da população, isto é, a amostra deve possuir as mesmas características básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar. E para tanto, ela deve ser retirada segundo determinadas técnicas de amostragem.

# Técnicas (ou processos) de Amostragem

Ao coletarmos uma amostra podemos fazê-la com reposição ou sem reposição, caso a amostragem seja realizada com reposição, um mesmo indivíduo tem chance de pertencer mais de uma vez a amostra, o que não acontece, no caso da amostragem ser sem reposição. Independentemente da maneira como a amostra é coletada (com ou sem reposição) o importante é que os indivíduos que comporão a amostra deverão ser selecionados através de uma técnica de amostragem adequada.

Para a escolha do processo de amostragem, o pesquisador deve levar em conta o tipo de pesquisa, a acessibilidade aos elementos da população, a disponibilidade ou não de ter os elementos da população, a representatividade desejada ou necessária, a oportunidade apresentada pela ocorrência de fatos ou eventos, a disponibilidade de tempo, recursos financeiros e humanos etc.

As técnicas de amostragem são divididas em dois grupos: Amostragem Probabilística e Amostragem Não-Probabilística.

Amostragem Probabilística (ou Aleatória ou Casual): é aquela em que cada elemento da população tem uma chance conhecida e diferente de zero de ser selecionado para compor a amostra. Em outras palavras: todas as fases necessárias para a escolha dos elementos que constituirão a amostra são baseadas em “sorteios”.

As amostragens probabilísticas geram amostras probabilísticas (com distribuição normal, ou binomial, ...).

Dentre as amostragens probabilísticas se destacam:

- Amostragem Aleatória Simples

- Amostragem Sistemática

- Amostragem Estratificada

- Amostragem por Conglomerado

Amostragem Não-Probabilística (ou Não-Aleatória ou Não-Casual): é aquela em que a seleção dos elementos da população para compor a amostra depende ao menos em parte do julgamento do pesquisador ou do entrevistador no campo. Dentre estas se destacam:

- Amostragem por Conveniência

- Amostragem por julgamento

- Amostragem por quotas

# Detalhamento da Principais Técnicas de Amostragem Probabilística

o Amostragem Aleatória Simples

Este tipo de amostragem é equivalente a um sorteio lotérico.

Page 21: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 21

Na prática, a amostragem aleatória simples pode ser realizada enumerando-se todos os indivíduos da população (por exemplo, de 1 a n) e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, uma quantidade (digamos k) de números dessa seqüência, os quais corresponderão aos elementos pertencentes à amostra.

Exemplo: Deseja-se pesquisar a estatura dos 80 alunos que estudam em uma escola, para isso resolveu-se retirar uma amostra de 10% do total de alunos. Usando a amostragem aleatória simples, mostre como pode ser feita a seleção da amostra.

Sol.:

A população é formada pelos 80 alunos da escola. E a amostra será formada pelos alunos sorteados. Sendo o tamanho da amostra de 10% do total de 80 alunos, ou seja, 8 alunos.

1º passo: Numeramos os alunos de 01 a 80. Podemos elaborar uma lista com o número ao lado do nome do aluno.

2º passo: Escrevemos os números de 01 a 80 em pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos a caixa para misturar bem os pedaços de papel.

3º passo: Retiramos, um a um, oito números que formarão a amostra.

Pronto! Medindo as alturas dos alunos correspondentes aos números sorteados, obteremos uma amostra das estaturas dos noventa alunos.

Para evitar o trabalho de escrever os números em pedaços de papel, sobretudo se a população é muito grande, foi elaborada uma tabela – Tabela de Números Aleatórios – construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas. Então, para compor uma amostra de 8 números, só é preciso selecionar 8 números que estejam dispostos em uma coluna ou linha ou diagonal da tabela. Esse grupo de 8 números selecionados equivale ao sorteio dos 8 papeizinhos.

Não vou expor a tabela de números aleatórios, porque ela não virá na prova. A minha intenção é somente dar conhecimento da existência dessa tabela.

o Amostragem Sistemática

Quando os elementos da população já se acham ordenados, não há necessidade de construir um sistema de referência. São exemplos: os prontuários médicos de um hospital, as casas de uma rua, uma linha de produção etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos Sistemática.

Ela é uma simplificação do processo anterior. Neste caso, apenas o primeiro elemento da amostra será sorteado, e os demais serão retirados em uma progressão aritmética, com razão k, em que:

n

Nk ,

Onde: N = tamanho da população e n = tamanho da amostra até se completar o tamanho da amostra desejado.

Exemplo:

Suponhamos uma rua contendo 600 prédios, dos quais desejamos obter uma amostra formada de 50 prédios. Podemos, neste caso, usar o seguinte procedimento: como 600/50=12, escolhemos por sorteio um número de 1 a 12 (inclusive), o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 12 em 12. Assim, se o número sorteado fosse o número 10, tomaríamos, pelo lado direito da rua, o 10º prédio, o 22º, o 34º, o 46º etc., e ao terminar o lado direito voltamos ao início da rua, pelo lado esquerdo, para continuar a contagem, a fim de completar a amostra dos 50 prédios.

o Amostragem Estratificada

Muitas vezes a população se divide em subpopulações – estratos. Exemplos: Numa escola podemos separar os alunos em dois estratos: meninos e meninas; numa pesquisa podemos separar as pessoas por faixas (estratos) de idade; ou separar as pessoas de acordo com a formação escolar: nível

Page 22: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 22

secundário, nível médio e nível superior; para as propriedades rurais criar estratos de acordo com o tamanho: 0|--10, 10|--20, 20|--30 hectares.

Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio da amostra leve em consideração tais estratos.

É exatamente isso que fazemos quando empregamos a amostragem estratificada.

Quanto à forma de retirar os elementos dos estratos para compor a amostra, é classificada em:

Uniforme

Quando é retirado o mesmo número de elementos em cada estrato, independentemente do tamanho do estrato.

Proporcional

Quando o número de elementos retirado em cada estrato é proporcional ao tamanho do estrato.

Para exemplificar os dois tipos de amostragem estratificada descritos, consideremos o seguinte exemplo.

Exemplo: Supondo, no exemplo feito na amostragem aleatória simples, que, dos 80 alunos da escola, 50 são meninas e 30 são meninos, vamos realizar uma amostragem estratificada uniforme e proporcional para um tamanho de amostra de 10%.

Temos dois estratos na população considerada: meninos e meninas.

Por primeiro, analisaremos a amostragem estratificada uniforme.

Neste tipo, o número de meninos e de meninas que vão compor a amostra deve ser igual. Como a amostra é de 8 alunos (10% de 80), então vamos selecionar (de forma aleatória) 4 meninos e 4 meninas. Só isso!

E, agora, a amostragem estratificada proporcional.

A determinação do tamanho de cada estrato é mostrada na tabela abaixo.

Sexo População porcentagem da amostra (10%)

tamanho da amostra

menina 50 10% de 50 5

menino 30 10% de 30 3

Total 80 10% de 80 8

Ficou definido na tabela que a amostra de 8 alunos será formada por 5 meninas e 3 meninos. E o processo de seleção dessas crianças deve ser feito de maneira aleatória, por exemplo, através da amostragem aleatória simples.

o Amostragem por Conglomerados

A amostragem por Conglomerado pressupõe a disposição dos itens de uma população em subgrupos (conglomerados) representativos da população global. Idealmente, cada conglomerado pode ser encarado como uma minipopulação. Em geral, os conglomerados são grupos de itens que se acham em estreito contato físico, como casas, quarteirões, bairros, municípios etc.

A amostragem por conglomerados tem duas vantagens muito distintas sobre a amostragem aleatória simples. Uma é que se os itens da população se acham muito dispersos, uma amostragem aleatória simples pode acarretar uma considerável despesa, viagens, estadias etc., para ser bem extraída, ao passo que os itens de cada conglomerado estão próximos uns dos outros. Suponhamos, por exemplo, que a população de interesse consistisse dos proprietários de automóveis do estado de Minas Gerais. Sem dúvida uma amostragem aleatória simples incluiria proprietários em localidades demasiadamente afastadas no estado, o que dificultaria a coordenação e a padronização na coleta dos dados. Por outro lado, os conglomerados de municípios ou cidades conteriam proprietários de carros em áreas concentradas, reduzindo o custo e facilitando a coordenação. Após selecionar aleatoriamente os conglomerados em todo o estado de Minas Gerais, dentro de cada conglomerado, a amostragem poderia ser aleatória simples,

Page 23: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 23

estratificada, novamente por conglomerados (por exemplo, bairros de uma cidade), ou ainda ser feito um censo para o caso do conglomerado selecionado não possua muitos indivíduos.

Uma segunda vantagem da amostragem por conglomerado é que não é necessário uma listagem dos itens da população. Basta uma lista dos conglomerados. Assim, não é possível obter uma listagem de todos os proprietários de imóveis do Brasil, mas pode-se obter uma lista de estados, ou municípios, ou cidades. Ou então os conglomerados podem ser quarteirões. Embora não possamos obter uma listagem das casas de uma cidade, os quarteirões podem, em geral, ser identificados, fazendo-se a seleção por meio de mapas. Então os quarteirões escolhidos podem ser visitados, identificando-se as casa que comporão a amostra.

# Detalhamento das Principais Técnicas de Amostragem Não-Probabilísticas

o Amostragem por Conveniência

A amostragem por conveniência é adequada e freqüentemente utilizada para geração de idéias em pesquisas exploratórias, principalmente.

A amostra por conveniência é empregada quando se deseja obter informações de maneira rápida e barata. Uma vez que esse procedimento consiste em simplesmente contatar unidades convenientes da amostragem, é possível recrutar respondentes tais como estudantes em sala de aula, mulheres no shopping, alguns amigos e vizinhos, entre outros. Os autores comentam que este método também pode ser empregado em pré-testes de questionários.

Alguns exemplos de pesquisa com amostras por conveniência:

Solicitar as pessoas que voluntariamente testem um produto e que em seguida respondam a uma entrevista.

Parar pessoas no supermercado e colher suas opiniões.

Colocar linhas de telefone adaptadas para que durante um programa de televisão os telespectadores possam dar suas opiniões.

o Amostragem por julgamento

O pesquisador escolhe deliberadamente certos elementos da população para formar a amostra, baseado num pré-julgamento.

Exemplo: Pesquisa de mercado para lançar uma nova marca de leite longa vida tipo A. O pesquisador selecionará indivíduos com poder aquisitivo médio/alto, que são os principais consumidores deste produto (publico alvo), embora toda a população independentemente do poder aquisitivo possa ser consumidora deste produto.

o Amostragem por quotas

É também baseada em um julgamento e não em um processo aleatório. É freqüentemente usada em pesquisas de opinião e pesquisa de mercado. Neste método deve-se conhecer as características da população de antemão e, então, usar uma amostra semelhante à população em termos de composição.

O objetivo é obter-se uma amostra que seja representativa da população. A forma da população deve ser conhecida, pelo menos aproximadamente, à proporção que aparece uma certa quantidade, por exemplo, as proporções de pessoas de diferentes idades, sexo e grupos étnicos. A amostragem por quotas busca repetir esses percentuais na amostra. A amostragem por quotas pode ser comparada a uma amostragem estratificada. A população é estratificada por variáveis importantes, tais como idade, sexo e localidade e a quota necessária é obtida de cada estrato. Mas a diferença importante é que a amostragem por quotas não é selecionada por qualquer base aleatória.

Page 24: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 24

EXERCÍCIOS RESOLVIDOS

01. Para cada uma das seguintes situações diga qual o tipo de amostragem foi utilizada.

a) Para compor a amostra foram sorteados aleatoriamente 10% de homens e 10% de mulheres de uma cidade. Tipo de Amostragem:_Estratificada Proporcional______

b) Numa escola precisa-se dividir 20 pessoas em dois grupos. Para o primeiro grupo ele seleciona

aleatoriamente 10 pessoas, e considera os 10 restantes para o segundo grupo. Tipo de Amostragem: Aleatória Simples

c) Uma lista numerada contém 200 nomes, numerados consecutivamente a partir do número 1.

Iniciando pelo 10º nome, uma amostra foi composta considerando sorteados os nomes referentes aos números 20, 30, 40, 50 e assim sucessivamente até que fossem escolhidos 10 nomes. Tipo de amostragem: Amostragem Sistemática_

02. Complete:

a) Na amostragem aleatória simples_ cada elemento da população tem a mesma chance de ser incluído na amostra.

b) Na amostragem _sistemática_a seleção dos itens da população que farão parte da amostra são escolhidos seguindo uma seqüência fixa, isto é, são escolhidos os itens r, r+k, r+2k, r+3k, e assim por diante.

c) A amostragem estratificada_pressupõe a divisão da população em subgrupos de itens similares, procedendo-se então a amostragem em cada subgrupo.

d) A amostragem por Conglomerados_pressupõe a disposição dos itens de uma população em subgrupos heterogêneos representativos da população global, procedendo-se a amostragem dos subgrupos.

03. (ESAF/AFPS/2002/Administração Tributária Previdênciária) Assinale a opção correta em

referência ao significado do termo amostragem aleatória simples. a) Refere-se a um método de classificação da população. b) Refere-se à representatividade da amostra. c) É um método de escolha de amostras. d) Refere-se a amostras sistemáticas de populações infinitas. e) Refere-se à amostragem por quotas. Sol.: A amostragem aleatória simples é um técnica de amostragem que é usada na escolha dos elementos da população que constituirão a amostra.

Resposta: Alternativa C!

04. (AFCE-TCDF-2002/CESPE) Julgue os itens seguintes.

1. Quando aplicada em uma população de pessoas formada pelo mesmo número de homens e de mulheres, uma amostra aleatória simples também apresenta o mesmo número de homens e de mulheres.

Não necessariamente! Item errado!

05. (FTE-Alagoas-2002/CESPE) Julgue os seguintes itens.

1. Quando a escolha dos elementos que farão parte de uma amostra é realizada usando-se um mecanismo probabilístico, diz-se que se trata de amostra por quotas.

A amostragem por Quotas é uma técnica de amostragem NÃO-PROBABILISTICA. Item errado!

Page 25: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 25

INTERVALO DE CONFIANÇA

1. INTERVALO DE CONFIANÇA PARA A MÉDIA

O processo de construção do intervalo de confiança para a média de uma população depende se o

desvio padrão da população () é conhecido ou deve ser estimado com base nos valores amostrais (desvio

padrão amostral S ), e também se o tamanho da amostra é grande (n30).

Mostramos abaixo o intervalo de confiança de acordo com o tamanho da amostra e do conhecimento do desvio padrão da população:

n

zX

. : para amostra grande (n≥30) ou com σ conhecido.

n

tX

. : para amostra pequena (n<30) e com σ desconhecido.

Obs: Caso o desvio padrão populacional – σ – seja desconhecido (não é fornecido ou não pode ser

calculado), usaremos no seu lugar o desvio padrão amostral – s.

A questão fornecerá um nível de confiança (ou grau de confiança), para podermos definir o nosso intervalo de confiança!

Faremos uma ilustração do intervalo de confiança (IC) para a média populacional, no caso do desvio padrão populacional conhecido, que é dada pela seguinte fórmula:

IC = n

zX

.

Teremos o seguinte desenho:

O centro deste intervalo é o X , o limite inferior é X –n

z

. e o limite superior é X +n

z

. .

E o desenho do intervalo de confiança sob a curva normal para determinado grau de confiança:

O desenho acima é visto para a variável X, e o desenho equivalente para a variável padronizada Z é mostrado a seguir.

X –n

z

. X +n

z

.

X

grau de

confiança

X

X –n

z

. X +n

z

.

X

Z

grau de confiança

– z + z

0

Page 26: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 26

2. INTERVALO DE CONFIANÇA PARA A PROPORÇÃO

A estimativa de proporções populacionais é muito semelhante à de médias populacionais, com uma simplificação: a distribuição t de Student não é usada, e assim evita-se completamente o problema t versus z.

Fórmula do Intervalo de Confiança

A proporção amostral (p) é utilizada como estimativa pontual da verdadeira proporção. Por exemplo, se estamos interessados em saber a proporção (ou porcentagem) de peças defeituosas num grande lote, e selecionando uma amostra de 40 peças, encontramos 5 peças defeituosas, então a proporção p da amostra é 5/40 ou 12,5%.

A estimativa intervalar (intervalo de confiança) da proporção populacional é simétrica em relação à proporção amostral (p), tal como ocorre com o intervalo para a média populacional em relação à média

amostral ( X ). E a sua fórmula é a seguinte:

n

ppzp

)1(.

3. DETERMINAÇÃO DO TAMANHO DA AMOSTRA

O tamanho de uma amostra pode ser calculada com base na margem de erro (E) do intervalo de confiança!

Vimos que a margem de erro é o valor que é somado e subtraído a estimativa pontual para formar os limites do intervalo de confiança. Assim:

Para a Média: o intervalo de confiança é: n

zX

. , então: E=n

z

.

Para a proporção: o intervalo de confiança é: n

ppzp

)1(.

, então: E=

n

ppz

)1(.

Nesta última, se o valor da proporção p não puder ser obtido a partir dos dados do enunciado da

questão, então consideraremos p igual a 1/2 ou 0,5. (Entre os valores possíveis para p, o valor 1/2 é o pior

caso, no sentindo de a margem de erro ser máxima).

Para encontrarmos o tamanho da amostra, devemos isolar o valor de n na fórmula da margem de erro.

Page 27: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 27

TESTES DE HIPÓTESES

# PASSO A PASSO DO TESTE DE HIPÓTESE PARA MÉDIA

1º Passo) Verificar se o Teste é bilateral ou unilateral (à direita ou à esquerda).

Conforme o sinal de H1, teremos a definição do teste a ser realizado:

- H1 com sinal de , o teste deve ser bilateral;

- H1 com sinal de <, o teste deve ser unilateral esquerdo;

- H1 com sinal de >, o teste deve ser unilateral direito.

2º Passo) Definir, conforme os dados da questão, se será utilizada a Curva Normal (Z) ou a Curva de Student (t).

Lembraremos que a Curva de Student (t) só será usada em um único caso: se (desvio padrão populacional) for desconhecido e, ao mesmo tempo, n<30. Nos demais casos, será utilizada a curva Normal (Z).

3º Passo) Fazer o desenho do teste, definindo na linha horizontal inferior, sob a curva, onde estará localizado o z tabelado ou o t tabelado.

São as seguintes possibilidades:

Com a Curva Z (Normal Padronizada):

Teste Bilateral Teste Unilateral Direito Teste Unilateral Esquerdo

-ztab ztab ztab -ztab

Com a Curva t (de Student):

Teste Bilateral Teste Unilateral Direito Teste Unilateral Esquerdo

-ttab ttab ttab -ttab

4º Passo) Descobrir, usando a tabela adequada à situação (a da Curva Normal ou a da t de Student), o z tabelado ou o t tabelado.

Lembrando que para achar o z tabelado usaremos apenas o nível de significância que será fornecido pela questão.

Já no caso do t tabelado, usaremos, para encontrá-lo, além do nível de significância , também o número de graus de liberdade da curva: GL=n-1. (Onde n é o número de elementos da amostra)!

Com este passo, definimos no desenho do teste quais são as áreas de aceitação e de rejeição de Ho. Nos desenhos que vemos acima, no terceiro passo, as áreas de rejeição de Ho, também chamadas de regiões críticas, estão sempre marcadas com tracinhos horizontais.

/2 /2

/2 /2

Page 28: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 28

5º Passo) Calcular, usando a fórmula adequada à situação, o z calculado ou o t calculado.

Para tanto, haverá duas possibilidades:

1ª) Se desvio padrão populacional conhecido ou n30:

n

Xzcalc

2ª) Se desvio padrão populacional desconhecido e n<30:

n

Xtcalc

Obs: Caso o desvio padrão populacional – σ – seja desconhecido (não é fornecido ou não pode ser calculado), usaremos no seu lugar o desvio padrão amostral – s.

6º Passo) Localizar no desenho do teste onde está o z calculado ou o t calculado, se na área de aceitação ou na área de rejeição de Ho, para, finalmente, decidir.

O critério de decisão será sempre o mesmo:

Se o t calculado ou o z calculado estiver:

na área de aceitação de Ho, diremos que Ho será aceita;

na área de rejeição de Ho, diremos que Ho será rejeitada.

# PASSO A PASSO DO TESTE DE HIPÓTESE PARA A PROPORÇÃO

Quase tudo que foi explicado sobre o teste de hipótese para a Média, também se aplicará ao teste de hipótese para a Proporção, conforme veremos no passos mostrados a seguir.

1º Passo) Verificar se o Teste é bilateral ou unilateral (à direita ou à esquerda).

Conforme o sinal de H1, teremos a definição do teste a ser realizado:

- H1 com sinal de , o teste deve ser bilateral;

- H1 com sinal de <, o teste deve ser unilateral esquerdo;

- H1 com sinal de >, o teste deve ser unilateral direito.

2º Passo) Lembrar que devemos usar apenas a Curva Normal (Z).

Nas estimativas das proporções populacionais (assunto visto na aula passada) não usávamos a distribuição t de Student. Aqui faremos o mesmo, utilizaremos apenas a Curva Normal (Z).

3º Passo) Fazer o desenho do teste, definindo na linha horizontal inferior, sob a curva, onde estará localizado o z tabelado.

São as seguintes possibilidades:

Page 29: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 29

Com a Curva Z (Normal Padronizada):

Teste Bilateral Teste Unilateral Direito Teste Unilateral Esquerdo

-ztab ztab ztab -ztab

4º Passo) Descobrir, usando a tabela da Curva Normal, o z tabelado.

Lembrando que para achar o z tabelado usaremos apenas o nível de significância que será fornecido pela questão.

Com este passo, definimos no desenho do teste quais são as áreas de aceitação e de rejeição de Ho. Nos desenhos que vemos acima, no terceiro passo, as áreas de rejeição de Ho, também chamadas de regiões críticas, estão sempre marcadas com tracinhos horizontais.

5º Passo) Calcular o z calculado.

Haverá apenas uma possibilidade:

n

PP

Ppzcalc

)1(

Onde:

p é a proporção amostral;

P é a proporção presumida para a população (e que está sendo testada na hipótese H0);

n é o número de elementos da amostra.

No assunto de intervalo de confiança da Proporção, usávamos, dentro da raiz do denominador da fórmula acima, a proporção amostral p (pêzinho). Mas fazíamos isso porque não conhecíamos a proporção

da população, aliás, estávamos atrás dela. Aqui como temos a proporção presumida para a população – P(pêzão), então usaremos esta.

6º Passo) Localizar no desenho do teste onde está o z calculado, se na área de aceitação ou na área de rejeição de Ho, para, finalmente, decidir.

O critério de decisão será sempre o mesmo:

Se o z calculado estiver:

na área de aceitação de Ho, diremos que Ho será aceita;

na área de rejeição de Ho, diremos que Ho será rejeitada.

/2 /2

Page 30: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 30

# TIPOS DE ERROS EM UM TESTE DE HIPÓTESES

Erro do Tipo I: ocorre quando rejeitamos a hipótese nula quando ela é verdadeira.

Erro do Tipo II: ocorre quando aceitamos a hipótese nula quando ela é falsa.

A probabilidade de cometer o erro do tipo I é a própria significância do teste, portanto, ela é definida a priori.

Prob(erro do tipo I) = = significância do teste

Chamamos a probabilidade de cometer o erro do tipo II de . Ou seja:

Prob(erro do tipo II) =

Em um teste de hipóteses, espera-se, naturalmente, que a hipótese nula seja aceita quando verdadeira e rejeitada quando falsa. Logo, há quatro resultados possíveis num teste, conforme mostrado na tabela abaixo.

Se H0 é Verdadeira Se H0 é Falsa

Aceitamos H0 Decisão correta! Erro Tipo II

Rejeitamos H0 Erro Tipo I Decisão correta!

Page 31: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 31

EXERCÍCIOS

PROBABILIDADE 01. (ATRFB 2009 ESAF) Três amigas participam de um campeonato de arco e flecha. Em cada tiro,

a primeira das amigas tem uma probabilidade de acertar o alvo de 3/5, a segunda tem uma probabilidade de acertar o alvo de 5/6, e a terceira tem uma probabilidade de acertar o alvo de 2/3. Se cada uma das amigas der um tiro de maneira independente dos tiros das outras duas, qual a probabilidade de pelo menos dois dos três tiros acertarem o alvo?

a) 90/100 b) 50/100 c) 71/100 d) 71/90 e) 60/90 02. (ATRFB 2009 ESAF) Para acessar a sua conta nos caixas eletrônicos de determinado banco, um

correntista deve utilizar sua senha constituída por três letras, não necessariamente distintas, em determinada sequência, sendo que as letras usadas são as letras do alfabeto, com exceção do W, totalizando 25 letras. Essas 25 letras são então distribuídas aleatoriamente, três vezes, na tela do terminal, por cinco teclas, em grupos de cinco letras por tecla, e, assim, para digitar sua senha, o correntista deve acionar, a cada vez, a tecla que contém a respectiva letra de sua senha. Deseja-se saber qual o valor mais próximo da probabilidade de ele apertar aleatoriamente em sequência três das cinco teclas à disposição e acertar ao acaso as teclas da senha?

a) 0,001. b) 0,0001. c) 0,000125. d) 0,005. e) 0,008. 03. (Auditor Fiscal de Natal 2008 ESAF) Uma urna contém: 1 bola amarela; 4 bolas azuis; 10 bolas

brancas; 15 bolas vermelhas; e 20 bolas pretas. Dado que na primeira extração foi retirada uma bola vermelha, a probabilidade de na segunda tentativa retirar uma bola vermelha, novamente, é:

a) maior que retirar uma bola branca ou azul. b) maior que retirar uma bola preta. c) menor que retirar uma bola branca. d) menor que retirar uma bola azul. e) menor que retirar uma bola amarela ou branca ou azul. 04. (AFC/STN 2008 ESAF) Marco estuda em uma universidade na qual, entre as moças de cabelos

loiros, 18 possuem olhos azuis e 8 possuem olhos castanhos; entre as moças de cabelos pretos, 9 possuem olhos azuis e 9 possuem olhos castanhos; entre as moças de cabelos ruivos, 4 possuem olhos azuis e 2 possuem olhos castanhos. Marisa seleciona aleatoriamente uma dessas moças para apresentar para seu amigo Marco. Ao encontrar com Marco, Marisa informa que a moça selecionada possui olhos castanhos. Com essa informação, Marco conclui que a probabilidade de a moça possuir cabelos loiros ou ruivos é igual a: a) 0 c) 19/50 e) 19/31 b) 10/19 d) 10/50

Page 32: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 32

05. (AFC-CGU 2008 ESAF) Uma população de indivíduos é constituída 80% por um tipo genético A

e 20% por uma variação genética B. A probabilidade de um indivíduo do tipo A ter determinada doença é de 5%, enquanto a probabilidade de um indivíduo com a variação B ter a doença é de 40%. Dado que um indivíduo tem a doença, qual a probabilidade de ele ser da variação genética B?

a) 1/3. d) 0,6. b) 0,4. e) 2/3. c) 0,5. 06. (Gestor Fazendário MG 2005 ESAF) Em uma caixa há oito bolas brancas e duas azuis.

Retirasse, ao acaso, uma bola da caixa. Após, sem haver recolocado a primeira bola na caixa, retira-se, também ao acaso, uma segunda bola. Verifica-se que essa segunda bola é azul. Dado que essa segunda bola é azul, a probabilidade de que a primeira bola extraída seja também azul é: a) 1/3 d) 2/10 b) 2/9 e) 3/10 c) 1/9

07. (Analista de Planejamento e Orçamento APO 2010 ESAF) Um viajante, a caminho de

determinada cidade, deparou-se com uma bifurcação onde estão três meninos e não sabe que caminho tomar. Admita que estes três meninos, ao se lhes perguntar algo, um responde sempre falando a verdade, um sempre mente e o outro mente em 50% das vezes e consequentemente fala a verdade nas outras 50% das vezes. O viajante perguntou a um dos três meninos escolhido ao acaso qual era o caminho para a cidade e ele respondeu que era o da direita. Se ele fizer a mesma pergunta a um outro menino escolhido ao acaso entre os dois restantes, qual a probabilidade de ele também responder que é o caminho da direita?

a) 1. b) 2/3. c) 1/2. d) 1/3. e) 1/4. DISTRIBUIÇÃO BINOMIAL 08. (Processo Seletivo – vários ministérios 2008 ESAF) Carla, Cássio e Cecília foram colegas em um

curso de especialização em Bioestatística. Durante o curso, Cássio e Cecília casaram. Curiosos, os três colegas verificaram, através de cálculos estatísticos, que a probabilidade de Cássio e Cecília terem um filho do sexo masculino de olhos verdes é igual a 1/10. Após muitos anos sem ter notícias de Cássio e Cecília, Ana soube que eles tiveram cinco filhos. Com saudades, Carla resolveu visitá-los. Durante a viagem de ida, Carla fez alguns cálculos e concluiu que a probabilidade de Cássio e Cecília terem dois meninos de olhos verdes é igual a:

a) 0,0135 c) 0,0225 e) 0,02 b) 0,0729 d) 0,2

Page 33: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 33

09. (AFRFB 2009 ESAF) Em um experimento binomial com três provas, a probabilidade de ocorrerem dois sucessos é doze vezes a probabilidade de ocorrerem três sucessos. Desse modo, as probabilidades de sucesso e fracasso são, em percentuais, respectivamente, iguais a:

a) 20 % e 80 % b) 80 % e 20 % c) 60 % e 40 % d) 30 % e 70 % e) 25 % e 75 % 10. (Auditor Fiscal de Natal 2008 ESAF) Numa distribuição Binomial, temos que: I. A E[x] = n.p.q, ou seja, é o produto dos parâmetros n – número de elementos da avaliação, p –

probabilidade de ocorrência do evento e q – probabilidade contrária (q = 1 - p). II. O desvio-padrão é dado pela raiz quadrada do produto entre os parâmetros n e p. III. A variância é dada pelo somatório dos quadrados dos valores (Xi) menos o quadrado da média. Apontando os três itens acima como V – Verdadeiro e F – Falso, a opção correta é: a) F, V, F b) V, V, F c) F, F, F d) V, F, F e) V, V, V 11. (Auditor Fiscal de Natal 2008 ESAF) Apontando por V – Verdadeiro e F – Falso, indique a opção

correta para as seguintes sentenças: I. Uma v. a. – variável aleatória que pode assumir somente dois valores, diz-se possuir distribuição

de Bernoulli e sua integral, no intervalo [a; b], possui distribuição Binomial. II. Uma v. a. com distribuição de Bernoulli, se acumulados os resultados sem reposição, geram

uma distribuição hipergeométrica e se for com reposição geram uma distribuição Binomial. Assinale o respectivo conjunto: a) F, V b) V, F c) F, F d) V, V e) pode ser V, F DISTRIBUIÇÃO HIPERGEOMÉTRICA 12. (AFT 2010 ESAF) Em uma amostra aleatória simples de 100 pessoas de uma população, 15 das

40 mulheres da amostra são fumantes e 15 dos 60 homens da amostra também são fumantes. Ao se escolher ao acaso cinco pessoas da amostra, sem reposição, a probabilidade de exatamente quatro delas serem homens fumantes é dada por:

a) Cn.k pk (1-p)n-k, sendo p=0,15, n=5 e k=4.

b) Cm,k CN-m,n-k /CN,n, sendo N=100, n=5, m=15 e k=4. c) Cm,k CN-m,n-k /CN,n, sendo N=100, n=5, m=60 e k=4. d) Cm,k CN-m,n-k /CN,n, sendo N=100, n=15, m=5 e k=4. e) Cn.k p

k (1-p)n-k, sendo p=0,25, n=5 e k=4.

Page 34: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 34

DISTRIBUIÇÃO DE POISSON 13. (AFRFB 2009 ESAF) O número de petroleiros que chegam a uma refinaria ocorre segundo uma

distribuição de Poisson, com média de dois petroleiros por dia. Desse modo, a probabilidade de a refinaria receber no máximo três petroleiros em dois dias é igual a:

a)

d)

b)

e)

c)

DISTRIBUIÇÃO NORMAL

14. (Auditor Fiscal de Natal 2008 ESAF) Se x é uma v. a. – variável aleatória com função densidade

de probabilidade f(x), caracterizada pelo modelo normal, podemos afirmar que: a) o desvio-padrão é igual a 1 (um). b) a média tem valor 0 (zero). c) a função de distribuição acumulada f(x) é igual a 1, para todos os valores acima de b. d) os parâmetros média, moda e mediana são iguais. e) a variância tem o valor do quadrado da média. 15. (SEFAZ/SP APOFP 2009 ESAF) Seja Z uma variável aleatória Normal Padrão. Dados os valores de

z e de P(Z < z) a seguir, obtenha o valor mais próximo de P(-2,58 < Z < 1,96). z 1,96 2,17 2,33 2,41 2,58 P( Z < z ) 0,975 0,985 0,99 0,992 0,995

a) 0,99 b) 0,97 c) 0,98 d) 0,985 e) 0,95 16. (ESAF/Analista (Planej. e Execução Financeira) - CVM - 2000) Uma pessoa está indecisa se

compra uma casa agora ou se espera para comprar daqui a um ano. A pessoa acredita que o aumento do preço da casa em um ano tenha distribuição normal com média de 8% e desvio-padrão de 10%. Se o preço aumentar mais de 25% a pessoa não terá dinheiro para adquirir o imóvel. Por outro lado, se o preço da casa cair, a pessoa sairá lucrando. Assinale a opção que dá as probabilidades de ocorrência de cada um desses eventos, respectivamente. Nos cálculos use a tabela dos valores das probabilidades P(Z > z) para a distribuição normal padrão dada a seguir.

z P(Z>z) z P(Z>z)

0,5 0,309 1,5 0,067

0,6 0,274 1,6 0,055

0,7 0,242 1,7 0,045

0,8 0,212 1,8 0,036

0,9 0,184 1,9 0,029

Page 35: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 35

a) 4,5% e 10,4% c) 4,5% e 24,2% e) 4,5% e 21,2% b) 6,7% e 24,2% d) 2,9% e 18,4% 17. (AFRE-MG 2005 ESAF) As vendas em um mês de determinado produto, de custo unitário, em

reais, tem distribuição aproximadamente normal com média de R$ 500,00 e desvio padrão de R$ 50,00. Se a empresa decide fabricar, em dado mês, 600 unidades do produto, assinale a opção que dá a probabilidade de que a demanda não seja atendida. (Em sua resposta faça uso da tabela da função de distribuição φ(x) da normal padrão dada abaixo).

x φ(x)

1,85 0,968

1,96 0,975

2,00 0,977

2,12 0,983

a) 5,0% d) 2,5% b) 3,1% e) 4,0% c) 2,3% VALOR ESPERADO E VARIÂNCIA DE UMA VARIÁVEL ALEATÓRIA 18. (MPOG/ENAP 2006 ESAF) Suzana e Sandra jogam, cada uma, uma moeda. Se do lançamento

dessas duas moedas resultar duas caras, Suzana paga a Sandra R$ 6,00. Dando qualquer outro resultado, Sandra paga a Suzana R$ 4,00. Supondo que ambas as moedas sejam estatisticamente honestas, o valor esperado, em reais, dos ganhos de Sandra (considerando-se como ganhos negativos os valores que ela paga à Suzana) é igual a

a) 1,5. c) 0,75. e) 2,5. b) -0,75. d) -1,5.

19. (AFRFB 2009 ESAF) A função densidade de probabilidade de uma variável aleatória contínua x

é dada por:

Para esta função, a média de x, também denominada expectância de x e denotada por E(x) é igual a:

a)

d)

b)

e)

c)

Page 36: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 36

CORRELAÇÃO 20. (Técnico Receita Federal 2006 ESAF) O coeficiente de correlação entre duas variáveis Y e X é

igual a +0,8. Considere, agora, a variável Z definida como: Z = 0,2 - 0,5X. O coeficiente de correlação entre as variáveis Z e X, e o coeficiente de correlação entre as variáveis Z e Y serão iguais, respectivamente, a:” a) -1,0 e -0,8 c) -0,5 e -0,8 e) -0,2 e -0,4 b) +1,0 e +0,8 d) -0,5 e +0,8

21. (Técnico Receita Federal 2006 ESAF) Para 5 pares de observações das variáveis X e Y, obteve-se

os seguintes resultados:

X = Y = 15 ; X2 = Y2 = 55 ; XY = 39 Sabendo-se que esses 5 pares de observações constituem a totalidade da distribuição conjunta populacional dessas duas variáveis, o valor do coeficiente de correlação entre X e Y é igual a: a) +1,000 b) +0,709 c) +0,390 d) -0,975 e) -0,600 REGRESSÃO LINEAR

22. (AFRFB 2009 ESAF) Na análise de regressão linear simples, as estimativas e dos parâmetros e da reta de regressão podem ser obtidas pelo método de Mínimos Quadrados. Nesse caso, os valores dessas estimativas são obtidos através de uma amostra de n pares de valores

Xi Yi com (i =1, 2, ....,n), obtendo-se: i = + Xi , onde i é a estimativa de Yi = + Xi . Para cada par de valores Xi Yi com (i =1, 2, ...,n) pode-se estabelecer o desvio ou resíduo − aqui

denotado por ei − entre a reta de regressão Yi e sua estimativa i . Sabe-se que o Método de Mínimos Quadrados consiste em adotar como estimativas dos parâmetros e os valores que minimizam a soma dos quadrados dos desvios ei. Desse modo, o Método de Mínimos Quadrados consiste em minimizar a expressão dada por:

Page 37: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 37

23. (Fiscal de Rendas ISS/RJ 2010 ESAF) A partir de uma amostra aleatória simples formada por 22 observações das variáveis X e Y calculou-se

Obtenha a reta de regressão linear de Y em X.

a) = 13 + 0,65 Xi

b) = 13 + 1,3 Xi

c) = 20 + 0,65 Xi

d) = 20 + 2 Xi

e) = -13 + 1,3 Xi 24. (Fiscal de Rendas ISS/RJ 2010 ESAF) Com os dados da questão anterior, calcule o valor mais

próximo do coeficiente de determinação R2 da regressão linear de X em Y. a) 0,65 b) 0,81 c) 0,85 d) 0,91 e) 0,88 INTERVALO DE CONFIANÇA PARA A MÉDIA E A PROPORÇÃO 25. (ESAF/IBGE 1999) Uma amostra aleatória de tamanho 400 de uma distribuição normal foi

observada, verificando-se uma média amostral igual a 20,3 com um desvio padrão igual a 2,0. Um intervalo de confiança com 95% de nível de confiança para a média populacional será dado pôr a) (16,734; 23,866) b) (18,736; 21,864) c) (19,078; 21,522) d) (20,104; 20,496) e) (19,749; 20,851)

26. (SERPRO 2001 ESAF) Uma empresa grande de processamento de dados leva a efeito uma

pesquisa de opinião sobre o nível de satisfação de seus empregados com os respectivos empregos. Neste contexto 100 empregados, de uma população infinita, sob objetivos práticos, são selecionados ao acaso e questionados. Destes, 50 mostraram-se satisfeitos ou muito satisfeitos com seus empregos. Assinale a opção que caracteriza o intervalo com coeficiente de confiança de 95%, simétrico, para a proporção populacional desconhecida de empregados satisfeitos ou muito satisfeitos com seu emprego. (Use em seus cálculos o Teorema Central do Limite e a tabela da distribuição normal padrão dada abaixo, aproximando o valor encontrado na tabela para o inteiro imediatamente superior).

Page 38: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 38

A tabela abaixo dá os valores de P{0<X<Z} quando X tem distribuição normal padrão para valores selecionados de Z. Por exemplo, P{0<X<1,56}=0,4406.

Z 00 06 08

1,0 0,3413 0,3554 0,3599

1,5 0,4332 0,4406 0,4429

1,9 0,4332 0,4750 0,4761

2,0 0,4772 0,4803 0,4812

a) 0,40 – 0,60 d) 0,20 – 0,80 b) 0,49 – 0,51 e) 0,45 – 0,55 c) 0,30 – 0,70

DETERMINAÇÃO DO TAMANHO DA AMOSTRA

27. (ESAF) Tem-se uma população normal com média e variância 225. Deseja-se construir, a

partir de uma amostra de tamanho n dessa população, um intervalo de confiança para com amplitude 5 e coeficiente de 95%. Assinale a opção que corresponde ao valor de n. Use como aproximadamente 2 o quantil de ordem 97,5% da distribuição normal padrão. (Quantil de ordem 97,5% igual a 2, significa que: Prob(Z<2)=97,5%). a) 225 b) 450 c)500 d) 144 e) 200

28. (AFC-CGU 2008 ESAF) Grande parte de uma população de pessoas possui determinada característica. Deseja-se estimar a proporção de pessoas nesta população com esta característica. Qual o valor mais próximo do tamanho de uma amostra aleatória simples para se obter uma estimativa desta proporção na população com um erro padrão de 5%.

a) 389. b) 248. c) 156. d) 100. e) 25. TESTES DE HIPÓTESES PARA MÉDIAS E PROPORÇÕES 29. (Analista do Banco Central 1994 Esaf) Um teste de hipóteses foi aplicado e, ao nível de

significância de 5% rejeitou-se Ho. O que acontecerá, se forem adotados níveis de significância de 1% e de 10%, respectivamente?

a) Rejeitar-se-á Ho em ambos os casos. b) Rejeitar-se-á Ho a 1% e nada se pode afirmar quanto ao de 10%. c) Nada se pode afirmar quanto ao de 1% e rejeitar-se-á Ho a 10%. d) Nada se pode afirmar em ambos os casos. e) Aceitar-se-á Ho a 1% e rejeitar-se-á Ho a 10%. 30. (Gestor Fazendário MG 2005 ESAF) Lança-se uma moeda 20 vezes e observa-se a ocorrência de

7 caras. Seja θ a probabilidade de cara. Assinale a opção que dá o valor da estatística teste correspondente ao teste da hipótese H: θ ≥ 0,5 contra a alternativa A: θ < 0,5.

a) -0,3 20 c) 0,3 20 e) 0,5 20

b) -0,2 20 d) 0,2 20

Page 39: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 39

31. (AFC-CGU 2008 ESAF) Um fabricante divulga que a característica principal de seu produto tem uma média de 1000 unidades. Um pesquisador, duvidando desta afirmação, encontrou uma característica média de 935 e desvio-padrão amostral de 130 examinando uma amostra aleatória simples de tamanho 9 destes produtos. Calcule o valor mais próximo da estatística t para testar a hipótese nula de que a média da característica principal do produto é 1000, admitindo que a característica tem uma distribuição normal.

a) -1,5. c) -1,89. e) -2,115. b) -1,78. d) -1,96. 32. (AFRE-MG 2005 ESAF) Um fabricante afirma que pelo menos 95% dos equipamentos que

fornece à indústria encontram-se dentro de suas especificações. Uma amostra de 200 itens escolhidos ao acaso revelou 10 itens fora de especificação. Assinale a opção que corresponde ao valor probabilístico (p-valor) do teste de H0:θ≥0,95 contra H1:θ<0,95, sendo θ a proporção populacional de itens dentro de especificação.

a) 0,500 d) 0,010 b) 0,050 e) 0,100 c) 0,025 33. (SUSEP 2006 ESAF) Em uma distribuição de sinistro S, formulando-se a hipótese de que não há

diferença entre a freqüência esperada e a observada (hipótese nula: Ho). Donde, segundo um determinado nível de significância, podemos afirmar que ocorreu

a) um erro do tipo I, se for aceita a hipótese Ho. b) um erro do tipo II, se for rejeitada a hipótese Ho. c) um erro do tipo I, se for aceita a hipótese Ho, sendo esta correta. d) um erro do tipo II, se for rejeitada a hipótese Ho, sendo esta correta. e) um erro do tipo I, se for rejeitada a hipótese Ho, sendo esta correta. TESTE DO QUI-QUADRADO 34. (AFT 2010 ESAF) Em uma amostra aleatória simples de 100 pessoas de uma população, 15 das

40 mulheres da amostra são fumantes e 15 dos 60 homens da amostra também são fumantes. Desejando-se testar a hipótese nula de que nesta população ser fumante ou não independe da pessoa ser homem ou mulher, qual o valor mais próximo da estatística do correspondente teste de qui-quadrado?

a) 1,79. b) 2,45. c) 0,98. d) 3,75. e) 1,21.

Page 40: estatística avançada

Estatística Inferencial www.olaamigos.com.br

Prof. Weber Campos 40

GABARITO

01 D

02 E

03 E

04 B

05 E

06 C

07 D

08 B

09 A

10 C

11 A

12 A

13 E

14 D

15 B

16 E

17 C

18 D

19 E

20 A

21 E

22 Anulada

23 E

24 C

25 D

26 A

27 D

28 D

29 C

30 A

31 A

32 A

33 E

34 A