Upload
internet
View
116
Download
6
Embed Size (px)
Citation preview
Distribuição FConsidere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 1
2 e 22 .
Retire uma amostra aleatória de tamanho n1 da primeira população, tendo uma variância s1
2, e outra amostra aleatória de tamanho n2 da segunda população com variância s2
2 .
A estatística indica a relação entre as razões das variâncias amostral e da população.
Supondo que as variâncias amostrais sejam oriundas de amostras aleatórias independentes e com as mesmas variâncias populacionais, então: F=s1
2 /s22.
A distribuição teórica que modela essa razão denomina-se Distribuição F
)//()/( 22
22
21
21 ss
Teste igualdade de variâncias
Altura média de um país é de 1,68 m com variância 0,30m2. Em uma amostra de 31 pessoas de uma determinada região do país a variância foi 0,25m2 .
EXCELNo Menu Ferramentas, a opção Análise de Dados leva ao Teste F:duas amostras para variâncias, que realiza o teste de igualdade de variâncias.
Teste igualdade de variâncias
H0: 2 = 2
0
Ha: 2 2
0 (ou 2 > 20 ou 2 < 2
0 )
Para testar a hipótese H0, obtemos uma
amostra de tamanho n da população e
consideramos a quantidade:
2
2S)1n(
Teste igualdade de variâncias
S2 = variância amostral
se população da qual a amostra foi retirada se comporta de acordo com o modelo normal, então, sob a hipotese H0 temos que:
H0: 2 = 0,30
Ha: 2 < 0,30
21n2
2~
S)1n(
Utilizando-se a tabela 2 com 30 graus de liberdade e =0,05
crit= 18,49
logo obs > crit, portanto não rejeitamos H0
00,2530,0
25,0x30obs
Exercício - Teste F
X= medida do diâmetro de esferas por método antigo
Y= medida do diâmetro de esferas por método novo
xobs= 29,93 mm s2Xobs = 0,03 mm2 n1=15
yobs= 29,89 mm s2Yobs = 0,19 mm2 n2=15
Construir teste de hipótese
H0: 2X = 2
Y X ~ N(X, 2X)
Ha: 2X 2
Y Y ~ N(Y, 2Y)
Utilizaremos a quantidade:
F = S2X / S2
Y
Exercício - Teste F
Para a distribuição de Fisher-Snedecor utilizamos a notação F (a, b) sendo que a = n1-1 e b = n2-1 (portanto a e b são os graus de liberdade)
P (F > fc)
Exercício - Teste F
A região crítica para o teste bilateral é dada por:
RC= : < 1 ou > 2
Portanto se obs RC, rejeitamos a hipótese de
igualdade de variâncias
P (F < 1 ou F > 2 ) =
F F (n1-1; n2-1)
H0: 2X = 2
Y H0: 2X/2
Y =1
Ha: 2X 2
Y Ha: 2X/2
Y 1
F= S2X/S2
Y F (14; 14)
Exercício - Teste FDeterminamos a região crítica do teste, de modo que,
P(F < 1)=0,05 e P(F >2)=0,05
P (F >1) = 1 - P (F 1) = 0,95
Essas quantidades estão representadas nas figuras:
0,95 0,05
1 2
Exercício - Teste F
Da tabela a distribuição de Fisher-Snedecor com 14 GL para o numerador e 14 GL para o denominador temos: 1 = 0,403 e 2 = 2,484
Logo: RC= + : < 0,403 ou > 2,484
obs= S2X/S2
Y = 0,03/0,19 = 0,158 RC
Portanto, confirmando as evidências fornecidas pela análise descritiva, concluímos, ao nível de =10% que existem diferenças em termos de homogeniedades dos diâmetros das esferas, dependendo do método utilizado
Exercício - Teste F
Para panetones de 500 g, suspeita-se que o
produto de segunda qualidade apresenta maior
variabilidade que o de primeira, quanto ao peso.
X= peso de panetones de primeira qualidade
Y= peso de panetones de segunda qualidade
s2Xobs = 0,29 n1=26
s2Yobs = 0,73 n2=20
H0: 2X = 2
Y versus Ha: 2X < 2
Y
Exercício - Teste F
Para determinar a região crítica e quantidade de F
corretamente:
H0: 2X /2
Y=1 versus Ha: 2X / 2
Y <1 F = S2X /S2
Y
A região crítica será da forma:
RC= : < c
F~F(25, 19) para = 0,05 c=0,495
obs= S2X /S2
Y=0,29/0,73=0,356 RC, portanto,
concluímos que os panetones de segunda qualidade
apresentam pesos com maior variabilidade do que os de
primeira qualidade
Intervalo de Confiança para a Diferença de MédiasConsiderando iguais as variâncias das populações
A variável aleatória X1 é modelada por uma distribuição de Gauss com média 1 e variância 1
2, isto é, X1~N(1, 12) e a
variável X2, também é de Gauss, isto é, X2~N(2, 22)
O intervalo de 100(1-)% de confiança para a diferença (1 - 2 ) entre as médias das duas populações é dado por:
Com a variância comum, ponderada, dada por:
212,2/2121
212,2/21
11)(
112121 nn
stXXnn
stXX pnnpnn
2
)1()1(
21
222
2112
nn
snsns p
Distribuição Qui-quadrado
Considere uma população de tamanho n que tem uma distribuição de Gauss com média 0 e variância 1, ou seja,
z12, z2
2, ..., zn2.
A distribuição qui-quadrado(2) é definida como a soma
dos quadrados dos n valores de zi:
2=z12 + z2
2 + z32 + ... + zn
2
• Se continuarmos a retirar as amostras da mesma população, cada uma das n quantidades terá uma distribuição de probabilidade 2 que poderá ser representado por um histograma.
• Com o número de amostras(n) grande, tem-se a distribuição do qui-quadrado com n-1 graus de liberdade.
Análise de Variância
Considere um número qualquer de amostras amostras a>2, definidas por uma variável qualitativa (fator, por exemplo sexo, tratamento, etc.). A análise de variância faz a comparação entre as correspondentes médias de cada nível do fator.
É possível o cálculo:
• da variância total;
• da variância entre as amostras; e
• da variância dentro das amostras.
Análise de Variância
A variância total (sT2), é aquela que se obtém quando as a
amostras são reunidas de modo a constituir uma única amostra, composta de todos os seus elementos.
Consideremos a situação em que todas as a amostras têm o mesmo tamanho n, pode-se dizer a reunião de todas a amostras fornece an=N elementos
a
x
N
x
an
xa
1
N
1
a
1
n
1X
Análise de Variância
A soma de quadrados em relação as amostras reunidas(soma de quadrados total):
e considerando que esta soma de quadrados tem an-1 ou N-1 graus de liberdade, então tem-se também que a variância total é:
a
1
n
1
N
1
22T XxXxSQ
1N
Xx
1an
Xx2T
N
1
2a
1
n
1
2
s
Análise de Variância
A variância entre as amostras, ou simplesmente, a variância entre, que pode ser simbolizada por s2
E, mede a variação existente entre todas as a amostras. Consideremos as a médias fornecidas pelas amostras.
Soma de quadrados entre: Variância entre ou
Quadrado médio entre:
x
a
1
2E XxnSQ
1a
Xxn2E
a
1
2
s
Análise de Variância
A variância dentro das amostras, ou simplesmente, variância dentro pode ser simbolizada por s2
D, mede a variação dentro dentro das a amostras tomadas do em conjunto.
Soma de quadrados dentro: Variância dentro ou
Quadrado médio dentro:
a
1
n
1
2D xxSQ
aN
xx
)1n(a
xx2D
a
1
n
1
2a
1
n
1
2
s
Análise de Variância
Temos todos os elementos para testar a hipótese nula de que as a amostras representam a mesma população, contra a hipótese alternativa de que isto não é verdadeiro.
Ho:as a médias não diferem significativamente entre si
ou seja, as médias das a amostras estimam a mesma média .
Ha:as médias das a amostras não estimam a mesma média , porque elas diferem significativamente entre si.
x
Análise de Variância
De acordo com a fórmula geral da variância entre, tem-se que seu valor será tanto menor quanto mais semelhantes forem as médias amostrais , ocorrendo o inverso, quando as médias diferirem muito entre si.
A fórmula geral da variância dentro indica que seu valor não é afetado pela variação existente entre as diferentes médias amostrais.
A razão entre as variâncias entre e dentro, é o valor de F calculado por:
x
D
E2D
2E
QMQM
Fous
sF
Análise de Variância
O valor de F calculado, será tanto maior quanto forem as diferenças entre as médias das amostras analisadas.
Se F calculado for inferior ao F crítico ao nível de significância estabelecido, não rejeitamos Ho, ou seja, as médias das amostras não diferem significativamente.
Se F calculado for superior ao F crítico ao nível de significância estabelecido, rejeitamos Ho, ou seja, as médias das amostras diferem significativamente.
Análise de Variância
Fontes de Variação GL SQ QM F
--------------------------------------------------------------------------
entre tratamentos t -1 SQE E(QME) E(QME)
dentro tratamento N -t SQD E(QMD) E(QMD)
--------------------------------------------------------------------------
Total N - 1 SQT
E(QME)=E(QMtrat)=2res+ t2
trat E(QMD)=E(QMres)= 2res
2res
2trat
2res
res
trat t)QM(E)QM(E
F