Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
Aula 4 –Planejamento e Análise de Experimentos
Professores
Miguel Antonio Sovierzoski, [email protected];
Vicente Machado Neto, [email protected];
Revisão da aula anterior
Fatores – níveis – tratamentos;
Discussão sobre os trabalhos a serem desenvolvidos na disciplina,
fatores, níveis, tratamentos;
Valores aleatórios discretos e contínuos;
Função densidade de probabilidade;
Distribuições de probabilidade normal N, distribuição t de student, ,
distribuição gama, distribuição qui-quadrado e distribuição F;
Distribuição normal padrão;
Distribuição amostral da média;
Teorema Central do Limite TCL;
Intervalo de confiança conhecido e desconhecido;
Tamanho da Amostra
Uma das questões principais a serem respondidas em um projeto
de experimentos é : Quantas amostras ou observações devo usar?
Infelizmente não existe uma resposta definitiva para esta questão.
Contudo, com algumas informações adicional e fazendo-se
algumas suposições é possível estimar o número mínimo de
observações.
Tem-se que pensar que quando fala-se em tamanho da amostra
supõe-se a obtenção de dados nas mesmas condições.
Se os dados forem obtidos em diferentes condições, mesmo que
muitos, isto não significa replicata.
Também tem-se que tomar cuidado com uma grande quantidade de
dados obtidos na mesma condição de experimentação, os
experimentos tem que explorar as diversas variáveis presentes no
processo.
Tamanho da Amostra
O objetivo de se fazer replicatas é testar a variabilidade dos
resultados.
Uma replicata para ser válida deve ser feita tudo da condição
zero como se fosse um novo experimento.
Um grave erro de muitos experimentos é não se fazer
replicatas. Assim muito experimentos que dão um enorme
trabalho são invalidados pela falta das replicatas.
Observa-se ainda que a resposta obtida, pelo método aqui
apresentado a seguir, pode não contemplar o erro tipo desejado.
Tamanho da AmostraNúmero de amostras para uma largura de Intervalo de Confiança
Algumas vezes o objetivo é um particular intervalo de confiança. O
intervalo de confiança da média é calculado como:
ҧ𝑥 ± 𝑡𝑠
𝑛Infelizmente para resolver a equação, depende-se de um particular
valor de t student, que depende do número de amostras n. Assim a
equação só pode ser resolvida para grandes valores de n, onde t
torna-se constante (aproxima-se de uma distribuição normal), ou
quando o desvio padrão é conhecido a priori.
Para grandes valores de n, e uma largura pretendida de intervalo de
confiança ±C, a seguinte equação pode ser usada: 𝑛𝑚𝑖𝑛 ≥𝑠 𝑍1− Τ∝ 2
𝐶
2
Para 95% de intervalo de confiança 1 − Τ∝ 2 = 0,975 𝑒 𝑧 = 1,96;Para 99% de intervalo de confiança 1 − Τ∝ 2 = 0,995 𝑒 𝑧 = 2,65.A equação acima é razoavelmente precisa para n>50.
Tamanho da AmostraNúmero de amostras para uma largura de Intervalo de Confiança
Para pequenos valores de n e grandes C, a equação subestima o
número de observações.
Estimativas alternativas, para estes casos são:
1) Usar valores tabulados para pequenos valores de n. Para usar a
tabela, calcula-se C/s para a largura de intervalo desejada e o
desvio padrão esperado s. Encontre na tabela o valor
imediatamente acima e determine o correspondente valor de n.
2) Usar um método interativo, isto é, faça um chute inicial para n e
ajuste até que o desejado intervalo de confiança seja encontrado.
Tamanho da AmostraNúmero de amostras para uma largura de Intervalo de Confiança
Exemplo
No desenvolvimento de um protocolo de validação, para medição de
Oxido Etileno em amostras, um analista deseja assegurar que o
intervalo de confiança de 95% não seja maior do que C= 45 ppm.
Sabe-se de ensaios prévios que o desvio padrão é igual a 45 ppm.
Quantas observações são requeridas?
1) Usando-se a tabela. Para C= intervalo de confiança = 45ppm e s =
45 ppm. Observa-se na coluna de 95% de confiança que o valor
imediatamente abaixo de C/s =1 é 0,925 que corresponde a n=7.
Assim a validação do protocolo requer um mínimo de 7 replicatas.
Tamanho da AmostraNúmero de amostras para uma largura de Intervalo de Confiança
Exemplo
Tamanho da AmostraNúmero de amostras para uma largura de Intervalo de Confiança
Exemplo
No desenvolvimento de um protocolo de validação, para medição de
Oxido Etileno em amostras, um analista deseja assegurar que o
intervalo de confiança de 95% não seja maior do que 45 ppm.
Sabe-se de ensaios prévios que o desvio padrão é igual a 45 ppm.
Quantas observações são requeridas?
2) Resolvendo de
maneira iterativa
utilizando o Excel,
temos a figura abaixo,
extraída do Excel, que
comprova que o
número de amostras
fica entre 6 e 7:
Tamanho da AmostraNúmero de amostras no software Minitab
Stat > Power and Sample Size > Sample Size for Estimation
Tendo-se uma margem de erro para um intervalo de confiança da média pode-se determinar o tamanho da amostra.Inversamente conhecendo-se o tamanho da amostra pode-se determinar a margemde erro para um intervalo de confiança.
Tamanho da AmostraNúmero de amostras no software Minitab
Tamanho da Amostra
Planning Value The necessary planning value depends on the chosen parameter.
Statistical analysis you plan to conduct
Estimated parameter
Planning value
1-Sample z 1-Sample tPaired t
Mean from a normal distribution
Standard deviation
To estimate samples size or margins of error , you need information about the
data you expect to collect. You can obtain planning values from:
Design specifications
Expert opinions
Prior studies or small pilot studies
The planning value you need depends on the parameter you want to estimate.
Número de amostras no software Minitab
Tamanho da Amostra
An electronics company wants to estimate the voltage of a new line of
resistors used in circuit boards. They want to know what sample size they
need to obtain a margin of error of 5. Based on prior studies, the standard
deviation is 22.5.
1 Choose Stat > Power and Sample Size > Sample Size for Estimation.
2 In Parameter, choose Mean (Normal).
3 Under Planning Value, enter 22.5 in Standard deviation.
4 Choose Estimate sample sizes.
5 In Margins of error for confidence intervals, 5.
6 Click OK.
Session window outputInterpreting the results
To achieve a margin of error of 5 when estimating the mean voltage of resistors, the
electronics company needs to collect 81 samples.
Número de amostras no software Minitab
Tamanho da Amostra
Sample Size for Estimation
Method
Parameter MeanDistribution NormalStandard deviation 22.5 (estimate)Confidence level 95%Confidence interval Two-sided
Results
Margin Sampleof Error Size
5 81
No software Minitab - Exemplo
Número de amostras no software Minitab
Tamanho da AmostraNúmero de amostras no software Minitab
Exemplo - Resolvendo o mesmo exercício anterior com o MinitabNo desenvolvimento de um protocolo de validação, para medição de Oxido
Etileno em amostras, um analista deseja assegurar que o intervalo de
confiança de 95% não seja maior do que 45 ppm. Sabe-se de ensaios prévios
que o desvio padrão é igual a 45 ppm. Quantas observações são requeridas?
Testes de hipóteses
O teste de hipóteses é um procedimento estatístico em que se
busca verificar uma hipótese a respeito da população, no sentido
de aceitá-la ou rejeita-la, a partir de dados amostrais, tendo por
base a teoria das probabilidades.
Em geral, um problema científico (expresso na forma de pergunta)
conduz a uma hipótese científica (resposta provisória a esta
pergunta) que requer uma pesquisa científica para a sua
verificação. O teste de hipótese é um dos procedimentos mais
utilizados na pesquisa científica, sobretudo na pesquisa
experimental.
Testes de hipóteses
No uso de um teste de hipóteses fazemos algumas suposições tais
como: a) Ambas as amostras foram extraídas de populações
independentes que podem ser descritas por distribuições normais; b)
Que o desvio padrão ou variância das populações são iguais; c) E que
os dados são variáveis aleatórias independentes.
A suposição de independência é crítica, mas se as rodadas de
experimentação forem sorteadas e demais variáveis forem
selecionadas aleatoriamente, normalmente, satisfaz-se a suposição de
independência.
As suposições de variância igual e normalidade são facilmente
verificadas usando-se gráficos de verificação da normalidade.
Normalmente softwares incorporam opções de verificação da
normalidade, ou mesmo o procedimento pode ser executado
manualmente, colocando os dados em ordem crescente e seguindo
procedimento específico.
Testes de hipótesesO gráfico mostra a verificação da normalidade de medições de glicose
em amostras de materiais de referência.
Testes de hipóteses
De modo geral, podemos definir cinco passos para construção de um
teste de hipóteses:
1) Definir as hipóteses estatísticas;
2) Fixar a taxa de erro aceitável;
3) Escolher a estatística para testar a hipótese e verificar as
pressuposições para o seu uso;
4) Usar as observações da amostra para calcular o valor da
estatística do teste;
5) Decidir sobre a hipótese testada e concluir.
Testes de hipóteses – média
1) Definir as hipóteses estatísticas; A hipótese estatística é uma
suposição feita a respeito de um ou mais parâmetros, tais como,
média de populações (), variâncias de populações (𝜎2), etc. As
hipóteses estatísticas surgem de problemas científicos.
Existem dois tipos básicos de hipóteses estatísticas:
Hipótese de nulidade (𝐻0): é a hipótese que está sob verificação. Esta
hipótese supõe a igualdade dos parâmetros que estão sendo
testados;
Hipótese alternativa (𝐻𝐴): é a hipótese que será considerada caso a
hipótese de nulidade seja rejeitada. Esta hipótese supõe que os
parâmetros testados são diferentes.
Testes de hipóteses – média
Duas situações são comuns em testes de hipóteses a respeito da média
da população ():
1. Comparação de uma média () com um valor (𝜇0).
Nesta situação, temos uma população da qual é extraída uma amostra e
a média desta amostra é comparada com um valor já conhecido (valor
padrão) que serve como referência.
𝐻0: 𝜇 = 𝜇0 𝑜𝑢 𝜇 − 𝜇0 = 0
𝐻𝐴: 𝜇 ≠ 𝜇0 𝑜𝑢 𝜇 − 𝜇0 ≠ 0 hipótese bilateral
𝜇 > 𝜇0 𝑜𝑢 𝜇 − 𝜇0 > 0 hipótese unilateral direita
𝜇 < 𝜇0 𝑜𝑢 𝜇 − 𝜇0 < 0 hipótese unilateral esquerda
Devemos escolher a 𝐻𝐴 mais apropriada
Testes de hipóteses – média
2. Comparação entre duas médias (𝜇1 𝑒 𝜇2).
Nesta situação, temos duas populações, de cada uma é extraída uma
amostra, e as médias das duas amostras são comparadas.
𝐻0: 𝜇1 = 𝜇2 𝑜𝑢 𝜇1 − 𝜇2 = 0
𝐻𝐴: 𝜇1 ≠ 𝜇2 𝑜𝑢 𝜇1 − 𝜇2 ≠ 0 hipótese bilateral
𝜇1 > 𝜇2 𝑜𝑢 𝜇1 − 𝜇2 > 0 hipótese unilateral direita
𝜇1 < 𝜇2 𝑜𝑢 𝜇1 − 𝜇2 < 0 hipótese unilateral esquerda
Devemos escolher a 𝐻𝐴 mais apropriada
Testes de hipóteses – média
Exemplificando com um teste de hipóteses no qual pretende-se avaliar
duas formulações de argamassas, que devem ser avaliadas com
respeito à resistência a compressão. Obviamente, seria impossível
avaliar todas as argamassas produzidas.
População 1 é a formulação
1 da argamassa, a
População 2 é a formulação
2 da argamassa.
Nestas populações vamos
estudar a variável contínua
X= resistência da
argamassa, supondo que
𝑋~𝑁 𝜇, 𝜎2 e que 𝜎12 = 𝜎2
2.
Testes de hipóteses – média
Assim nossos parâmetros de interesse são:
𝐸 𝑋1 = 𝜇1 = resistência média da população 1;
𝐸 𝑋2 = 𝜇2 = resistência média da população 2;
Assim devemos considerar
as seguintes hipóteses
estatísticas.
𝐻0: 𝜇1 = 𝜇2𝐻𝐴: 𝜇1 ≠ 𝜇2
Testes de hipóteses – média
Observemos que a hipótese alternativa não corresponde
necessariamente à expectativa do pesquisador, ou seja, à hipótese
científica. A hipótese a ser testada em um teste é sempre a hipótese de
igualdade entre os parâmetros, enquanto a hipótese alternativa deve ser
definida pelo pesquisador, podendo ser bilateral ou unilateral.
A escolha entre uma e outra, entretanto, jamais deve ser feita com base
nos dados da amostra, tampouco na expectativa do pesquisador.
A hipótese bilateral é mais genérica e
deve ser utilizada quando não temos
motivos suficientes para esperar que um
dos parâmetros seja maior ou menor que
outro. Assim, supomos apenas que os
parâmetros serão diferentes, caso a
hipótese de igualdade seja rejeitada.
Testes de hipóteses – média
As situações de aplicação da hipótese unilateral são mais restritas e
nem sempre são muito claras. A opção por uma hipótese unilateral
exige que tenhamos mais informações sobre o comportamento da
variável de interesse na situação da pesquisa. Estudos anteriores, por
exemplo, podem prover evidências que suportem uma hipótese
unilateral.
Testes de hipóteses – médiaA hipótese unilateral pode ser também uma decorrência lógica da
situação de pesquisa, como, por exemplo, quando comparamos a
média de um grupo tratado (que recebe determinado tratamento) com
a média de um grupo controle ou testemunha (que não recebe o
tratamento).
Neste caso, se o tratamento
não tem efeito, esperamos
que as médias dos dois
grupos sejam iguais; mas se
o tratamento tem efeito
significativo é bastante
razoável esperar que a
média do grupo tratado (que
expressa este efeito) seja
maior (e nunca menor do que
a média do grupo controle.
Testes de hipóteses – erros Um elemento intrínseco ao processo de inferência é o erro. Como as
conclusões são obtidas a partir de dados amostrais, eventualmente, a
amostra pode não representar o todo (população).
Como a hipótese sob verificação é 𝐻0 , dois tipos de erro estão
associados à decisão a respeito dela, são eles:
Erro Tipo I: rejeitar 𝐻0 quando ela é verdadeira
= P(erro tipo I) probabilidade de cometer o erro tipo I
Erro Tipo II: não rejeitar 𝐻0 quando ela é falsa
= P(erro tipo II) probabilidade de cometer o erro tipo II
Decisão Situação de 𝑯𝟎
Verdadeira Falsa
Não rejeitar Acerto Erro Tipo II -
Rejeitar Erro Tipo I - Acerto
Testes de hipóteses – erros Como consequência, temos que: (1-) é a probabilidade de não
cometer o erro tipo I, ou seja, é a capacidade de não rejeitar 𝐻0verdadeira, e (1-) é a probabilidade de não cometer o erro tipo II, ou
seja, é a capacidade de rejeitar 𝐻0 falsa. A probabilidade (1-) é
denominada poder do teste. Podemos dizer, então, que o poder do
teste é a probabilidade de declarar diferenças quando elas, de fato
existem. O poder de um teste está relacionado com os seguintes
fatores: tamanho da amostra, variabilidade da variável e magnitude
da diferença existente entre as médias.
Decisão Situação de 𝑯𝟎
Verdadeira Falsa
Não rejeitar Acerto Erro Tipo II -
Rejeitar Erro Tipo I - Acerto
Testes de hipóteses – erros É importante ressaltar ainda que as duas taxas de erro ( e ) estão
relacionadas negativamente, de modo que a redução de implica no
aumento de e vice-versa. Para que os testes de hipóteses tenham
validade, é necessário que sejam delineados de modo a minimizar os
erros de conclusão. Entretanto, o único meio de reduzir ambos os
tipos de erro é aumentando o tamanho da amostra, o que nem
sempre é viável. Via de regra a preocupação está voltada para
minimizar o erro tipo I. A probabilidade de ocorrência do erro tipo I ()
é chamada de nível de significância do teste.
Decisão Situação de 𝑯𝟎
Verdadeira Falsa
Não rejeitar Acerto Erro Tipo II -
Rejeitar Erro Tipo I - Acerto
Testes de hipóteses – critério de decisão
A regra de decisão a respeito de 𝐻0 pode ser estabelecida com base
num valor crítico:
Teste bilateral: se a hipótese alternativa for bilateral, o valor crítico
será:
𝑡 Τ𝛼 2(𝜈): valor da estatística t, para graus de liberdade, que delimita a
área Τ𝛼 2, encontrado na tabela da distribuição t (limites bilaterais);
Teste unilateral: se a hipótese alternativa for unilateral, o valor crítico
será:
𝑡𝛼(𝜈): valor da estatística t, para graus de liberdade, que delimita a
área , encontrado na tabela da distribuição t (limites unilaterais);
Para decidir comparamos o valor da estatística t=𝜃
𝑆(𝜃)com o valor
crítico:
Rejeitamos 𝑯𝟎, ao nível , se o valor da estatística, em módulo,
for maior que o valor crítico: 𝒕 > valor crítico
Testes de hipóteses – critério de decisão
O Excel tem uma função que retorna o valor de t.A função =INV.T(probabilidade; graus de liberdade) retorna o valor de t.
Para a função =INV.T(0,025;22) o valor retornado será -2,07387, ou se vocêentrar com a função =INV.T(0,975;22) obterá o valor 2,073873.
No teste de hipóteses compara-se sempre o valor do t crítico
como positivo, assim mesmo a função =INV.T(0,025;22) retornar
o valor -2,07387 o valor do t crítico a ser comparado é 2,07387.
Em alguns critérios de rejeição o sinal – está a frente do valor
crítico, neste caso o valor a ser comparado será negativo.
Testes de hipóteses – critério de decisão
Não temos motivos suficientes para rejeitar 𝑯𝟎, ao nível , se o
valor da estatística, em módulo, for menor que o valor crítico:
𝒕 < valor crítico.
Podemos observar a seguir as regiões de rejeição 𝐻0 na curva da
distribuição t para cada uma das três possibilidades de hipótese
alternativa:
Para hipótese alternativa bilateral, ou seja, 𝐻𝐴: 𝜇1 − 𝜇2 ≠ 0
Testes de hipóteses – critério de decisão
Para hipótese alternativa unilateral direita ou seja, 𝐻𝐴: 𝜇1 − 𝜇2 > 0
Testes de hipóteses – critério de decisão
Para hipótese alternativa unilateral esquerda ou seja, 𝐻𝐴: 𝜇1 − 𝜇2 < 0
Testes de hipóteses – P valor
Outro critério tem sido frequentemente utilizado para decidir sobre 𝐻0.
Essa decisão também pode ser baseada em um valor que expressa a
probabilidade de que seja obtido um valor t mais extremo que o valor
observado, dado que 𝐻0 é verdadeiro. Esta probabilidade é conhecida
como P valor.
Testes de hipóteses – P valor
A decisão a respeito de 𝐻0 é tomada da seguinte forma:
Se o valor P for maior ou igual
a , não rejeitamos a hipótese
nula, pois t é típico ou está em
uma região de alta
probabilidade.
Se o valor P for menor que ,
rejeitamos a hipótese nula, pois
t é atípico ou está em uma
região de baixa probabilidade.
Testes de hipóteses – P valor
O P valor para distribuição Z é calculado para testes bilaterais como: 𝑃 =2 1 − Φ 𝑍0No caso dos testes unilaterais, o P valor é calculado pela equação:
𝑃 = 1 − Φ 𝑍0 para o teste unilateral superior;
𝑃 = Φ 𝑍0 para o teste unilateral inferior.
Testes de hipóteses – P valor
Para simplificar o cálculo do P valor para uma hipótese bicaudal,
utilizando a distribuição t, podemos utilizar a função do Excel
DIST.T.BC(𝑡0; graus de liberdade). A função retorna diretamente o P
valor.
Da mesma forma a função DIST.T.CD (𝑡0; graus de liberdade), retorna o
valor percentual da cauda direita e pode ser usada para cálculo do P
valor para hipóteses unilaterais.
Testes de hipóteses – P valor
Testes de hipóteses – P valor
Testes de hipóteses – P valor
Testes de hipóteses – P valor
Testes de hipóteses – P valor
Testes de hipóteses médias –variância conhecida
Testes de hipóteses médias – variância conhecida – Intervalos de confiança
ത𝑦 − 𝑍 Τ∝ 2 Τ𝜎 𝑛 ≤ 𝜇 ≤ ത𝑦 + 𝑍 Τ∝ 2 Τ𝜎 𝑛
ത𝑦 − 𝑍∝ Τ𝜎 𝑛 ≤ 𝜇 ≤ ത𝑦 + 𝑍∝ Τ𝜎 𝑛
ത𝑦1 − ത𝑦2 − 𝑍 Τ∝ 2
𝜎12
𝑛1+𝜎2
2
𝑛2≤ 𝜇1 − 𝜇2 ≤ ത𝑦1 − ത𝑦2 + 𝑍 Τ∝ 2
𝜎12
𝑛1+𝜎2
2
𝑛2
Testes de hipóteses médias –variância desconhecida
Testes de hipóteses médias – variância desconhecida – Intervalos de Confiança
ത𝑋 − 𝑡 Τ∝ 2
𝑆
𝑛< 𝜇 < ത𝑋 + 𝑡 Τ∝ 2
𝑆
𝑛
Intervalos de Confiança Bilaterais
𝑆𝑝 =𝑛1 − 1 𝑆1
2 + 𝑛2 − 1 𝑆22
𝑛1 + 𝑛2 − 2
ത𝑦1 − ത𝑦2 − 𝑡 Τ𝛼 2;𝜈
𝑆12
𝑛1+𝑆2
2
𝑛2≤ 𝜇1 − 𝜇2 ≤ ത𝑦1 − ത𝑦2 + 𝑡 Τ∝ 2;𝜈
𝑆12
𝑛1+𝑆2
2
𝑛2
ത𝑦1 − ത𝑦2 − 𝑡 Τ∝ 2;𝑛1+𝑛2−2𝑆𝑝1
𝑛1+
1
𝑛2≤ 𝜇1 − 𝜇2 ≤ ത𝑦1 − ത𝑦2 + 𝑡 Τ∝ 2;𝑛1+𝑛2−2𝑆𝑝
1
𝑛1+
1
𝑛2
Testes de hipóteses variâncias
Testes de hipóteses variâncias
𝑛 − 1 𝑆2
𝜒2 Τ𝛼 2;𝑛−1
≤ 𝜎2 ≤𝑛 − 1 𝑆2
𝜒2 Τ1−(𝛼 2);𝑛−1
Intervalos de confiança bilaterais
𝑆12
𝑆22 𝐹1− Τ∝ 2,𝑛2−1,𝑛1−1 ≤
𝜎12
𝜎22 ≤
𝑆12
𝑆22 𝐹 Τ∝ 2,𝑛2−1,𝑛1−1
𝐹1−∝,𝜈2,𝜈1 =1
𝐹𝛼,𝜈2,𝜈1
Exercício 1 - Testes de hipóteses
A resistência de um freio de fibra deve ser de pelo menos 150psi.
Experiência anterior indica que o desvio padrão da resistência do freio é
de =3psi. Uma amostragem aleatória de 4 peças são testadas e os
resultados foram: y1= 145; y2=153; y3=150 e y4=147.
(a) Estabeleça as hipóteses que você acha que deveriam ser testadas
neste experimento.
(b) Teste as hipóteses usando α = 0,05. Qual a sua conclusão?
(c) Encontre o p-value para o teste do item (b).
(d) Construa o intervalo de confiança de 95% da resistência média do
freio.
Exercício 1 - Testes de hipóteses
(a) Exercício envolve a comparação da média de uma população com
um valor específico.
Hipóteses: H0 : μ = 150 psi
H1 : μ 150 psi
A hipótese pode ser testada se a população é normal com uma variância
conhecida.
Resultados do Minitab:One-Sample Z: Resis Freios
Test of mu = 150 vs not = 150The assumed standard deviation = 3
Variable N Mean StDev SE Mean 95% CI Z PResis Freios 4 148,75 3,50 1,50 (145,81; 151,69) -0,83 0,405
Exercício 1 - Testes de hipóteses
O gráfico mostra em azul o intervalo de confiança de 95%
Exercício 1 - Testes de hipóteses
O gráfico mostra os quartis e bigodes do box plot
Exercício 1 - Testes de hipóteses
H0 : µ= 150 pode ser rejeitada se 𝑍0 > 𝑍 Τ∝ 2
𝑍0 =ത𝑦 − 𝜇0Τ𝜎 𝑛
=148,75 − 150
Τ3 4= −0,833. .
𝑍 Τ∝ 2 = 𝑍0,025 = 1,960
Exercício 1 - Testes de hipóteses
Ou tabela Z aproximadamente pegando a probabilidade 97,5%
(0,97500) correspondente ao Z de 1,96.
Pelo excel =INV.NORMP.N(0,975)=1,959964 (ou INV.NORMP)
Como 𝑍0 < 𝑍 Τ∝ 2 = −0,833 < 1,96 a hipótese nula não pode ser
descartada.
Ou seja não podemos descartar com 95% de certeza que a resistência
dos freios seja igual a 150 psi.
Exercício 1 - Testes de hipóteses
O P valor pode ser definido como o menor nível de significância que
podemos rejeitar a hipótese nula.
No software Minitab nota-se que o p-value é de 0,405 indicando que
não podemos rejeitar a hipótese nula já que o p-value é maior que
α=0,05.
Pode-se utilizar a função do Excel =DIST.NORMP.N(-
0,833;VERDADEIRO) e obter o resultado 0,202422 e multiplicar por 2
para obter o P valor = 0,404845
Pela tabela (Z) encontramos o valor para P=(0,83) =0,79673 (aprox).
Como o P valor é calculado para testes bilaterais como: 𝑃 =2 1 − Φ 𝑍0 = 2.[1-0,797577635]=0,40484473
Ou seja não podemos descartar a hipótese nula de igualdade da
resistência a 150 psi com o nível de significância de 95% como foi
pedido.
Exercício 1 - Testes de hipóteses
(d) O intervalo de confiança especificado para a condição em que temos
uma população normalmente distribuída com variância conhecida é:
ത𝑦 − 𝑍 Τ∝ 2 Τ𝜎 𝑛 ≤ 𝜇 ≤ ത𝑦 + 𝑍 Τ∝ 2 Τ𝜎 𝑛
148,75 − 1,96𝑥 Τ3 4 ≤ 148,75 ≤ 148,75 + 1,96𝑥 Τ3 4
Assim o intervalo de confiança de 95% da resistência do freio é :
145,81 ≤ 148,75 ≤ 151,69
Exercício 1 - Testes de hipóteses
Test of mu = 150 vs not = 150The assumed standard deviation = 3
Variable N Mean StDev SE Mean 60% CI Z PResistência Freios 4 148,75 3,50 1,50 (147,49; 150,01) -0,83 0,405
Podemos testar
ainda 𝐻0 de
igualdade contra a
hipótese que a
média seja igual a
150 psi, diminuindo
a significância para
60%. Pelo software
Minitab obtemos
os valores abaixo.153152151150149148147146145144
X_
Ho
Resistência Freios
Boxplot of Resistência Freios(with Ho and 60% Z-confidence interval for the Mean, and StDev = 3)
Exercício 1 - Testes de hipóteses
Test of mu = 150 vs not = 150The assumed standard deviation = 3
Variable N Mean StDev SE Mean 60% CI Z PResistência Freios 4 148,75 3,50 1,50 (147,49; 150,01) -0,83 0,405
Neste caso ficamos
no limite de aprovar
ou descartar a
hipótese H0 com o
nível de significância
de 60%.
Já que 150 psi está
no limite inferior do
IC de 60%.
153152151150149148147146145144
X_
Ho
Resistência Freios
Boxplot of Resistência Freios(with Ho and 60% Z-confidence interval for the Mean, and StDev = 3)
Exercício 1 - Testes de hipóteses
Test of mu = 150 vs > 150The assumed standard deviation = 3
95% LowerVariable N Mean StDev SE Mean Bound Z PC1 4 148,75 3,50 1,50 146,28 -0,83 0,798
153152151150149148147146145144
X_
Ho
C1
Boxplot of C1(with Ho and 95% Z-confidence interval for the Mean, and StDev = 3)
Podemos testar
ainda 𝐻0 de
igualdade contra a
hipótese que a
média seja maior
do que 150 psi.
Pelo software
Minitab obtemos
os valores abaixo.
Exercício 1 - Testes de hipótesesPela tabela Z apêndice I observamos que 𝑍0 está entre 1,64 (prob de 0,94950) e 1,65 (prob de 0,95053), já que o valor a ser procurado é a probabilidade de 0,95 e não mais 0,975 como no teste bilateral. Pelo Excel usando-se a função =INV.NORMP.N(0,95) obtemos o valor 1,644854.
Para rejeitar 𝐻0 𝑑𝑒𝑣𝑒𝑚𝑜𝑠 𝑡𝑒𝑟 𝑎 𝑐𝑜𝑛𝑑𝑖çã𝑜 𝑞𝑢𝑒 𝑍0 > 𝑍∝. Como 𝑍0 = −0,833não é maior que 1,644854, não podemos descartar a hipótese 𝐻0 de igualdade contra a hipótese alternativa que a média seja maior do que 150 psi.
Exercício 1 - Testes de hipótesesObtemos o P valor usando a função excel =DIST.NORMP.N(-0,833;VERDADEIRO),que retorna o valor 0,202422, fazendo (1-0,202422) obtemos 0,797578 que é oP valor. Pelo P valor observamos que a hipótese de igualdade da média a 150psi é forte já que o P valor é alto.
Assim não podemos afirmar que o valor da resistência seja maior do que
150 psi. Desejávamos descartar a hipótese 𝐻0 de igualdade contra a
hipótese que a resistência fosse maior do que 150 psi, já que a condição
estabelecida pelo problema é que a resistência tem que ser de no
mínimo 150 psi.
Exercício 2 - Testes de hipóteses
Duas máquinas são usadas para o enchimento de garrafas plásticas com 16,0ml. O processo de enchimento pode ser assumido como normal, com umdesvio padrão de 𝜎1 = 0,015 𝑒 𝜎2 = 0,018. O departamento de engenhariasuspeita da qualidade das maquinas, se ambas as máquinas encham o mesmovolume ou não. A referência é o volume de 16,0 ml. Um experimento éelaborado pegando amostras aleatórias da saída da cada máquina.
Máquina 1 Máquina 2
16,03 16,01 16,02 16,03
16,04 15,96 15,97 16,04
16,05 15,98 15,96 16,02
16,05 16,02 16,01 16,01
16,02 15,99 15,99 16,00
(a) Estabeleça as hipóteses que
deveriam ser testadas neste
experimento;
(b) Teste estas hipóteses usando
α=0,05. Quais suas conclusões?
(c) Encontre o valor de P para este
teste;
(d) Encontre o intervalo de
confiança de 95%, da média de
preenchimento das duas
máquinas.
Exercício 2 - Testes de hipóteses(a) Estabeleça as hipóteses que deveriam ser testadas neste experimento;Hipóteses:
𝐻0: 𝜇1 = 𝜇2𝐻1: 𝜇1 ≠ 𝜇2
(b) Teste estas hipóteses usando α=0,05. Quais suas conclusões?
𝑍0 =ത𝑦1 − ത𝑦2
𝜎12
𝑛1+𝜎2
2
𝑛2
ത𝑦1 = 16,0150 ത𝑦2 = 16,0050
𝑍0 =16,0150 − 16,0050
0,01510 +
0,01810
= 0,17407765
Exercício 2 - Testes de hipóteses
𝑍 Τ∝ 2 = 𝑍0,025 = 1,960 Pelo excel =INV.NORMP.N(0,975)=1,959964
Critério de Rejeição: |𝑍0 | > 𝑍 Τ∝ 2 ∴ 𝑐𝑜𝑚𝑜 0,1741 < 1,960 portanto não
podemos rejeita 𝐻0.
Exercício 2 - Testes de hipóteses(c) Encontre o valor de P para este teste;
Pode-se utilizar a função do Excel =DIST.NORMP.N(0,1741;VERDADEIRO)
e obter o resultado 0,569106, diminuir de 1 (1-0,569106) e multiplicar por 2
para obter o P valor = 0,861787.
Pela tabela podemos obter o P Valor aproximado já que Z=0,17 indica uma
probabilidade de 0,56749
𝑃 = 2 1 − Φ 𝑍0 = 2[1 − Φ 0,17410 ] =2[1-0,56749]= 2.[0,43251]=0,8650
Como o valor de P é maior do que 0,025 o critério de decisão para uma
hipótese bilateral com =0,05, não podemos rejeitar 𝐻0.
(d) Encontre o intervalo de confiança de 95%, da diferenças das médias de
preenchimento das duas máquinas.
ത𝑋1 − ത𝑋2 + 𝑍 Τ𝛼 2
𝜎12
𝑛1+𝜎2
2
𝑛2> 𝛿 > ത𝑋1 − ത𝑋2 − 𝑍 Τ𝛼 2
𝜎12
𝑛1+𝜎2
2
𝑛2
16,015 − 16,005 ± 1,960,0152
10+0,0182
10
0,01 ± 0,014522 ∴ −0,004522 < 0,01 < 0,024522
Exercício 2 - Testes de hipótesesResolvendo usando-se o Mini Tab.
Sample N Mean StDev SE Mean1 10 16,0150 0,0150 0,00472 10 16,0050 0,0180 0,0057
Difference = mu (1) - mu (2)Estimate for difference: 0,0100095% CI for difference: (-0,00563; 0,02563)T-Test of difference = 0 (vs not =): T-Value =1,35 P-Value = 0,195 DF = 17
Os resultados deram diferentes dos calculados anteriormente, porque o software calcula considerando valores da distribuição t e anteriormente considerou-se distribuição Z.
Exercício 3 - Testes de hipóteses
O tempo de reparo de um instrumento eletrônico é normalmente
distribuído, sendo a variável aleatória medida em horas. Os tempos de
reparo de 16 destes instrumentos escolhidos aleatoriamente estão na
tabela abaixo.
Horas
159 280 101 212
224 379 179 264
222 362 168 250
149 260 485 170
(a) Deseja-se saber se o tempo de reparo
excede 225 horas. Estabeleça as hipóteses
apropriadas;
(b) Teste as hipóteses, quais as conclusões?
Use =0,05;
(c) Encontre o P valor do teste;
(d) Construa o intervalo de confiança de 95% do
tempo médio de reparo.
Exercício 3 - Testes de hipóteses(a) Deseja-se saber se o tempo de reparo excede 225 horas. Estabeleça as
hipóteses apropriadas;
One-Sample T: Tempo de reparo Test of mu = 225 vs not = 225Variable N Mean StDev SE Mean 95% CI T PTempo de reparo 16 241,5 98,7 24,7 (188,9; 294,1) 0,67 0,514
500400300200100
X_
Ho
Tempo de reparo
Boxplot of Tempo de reparo(with Ho and 95% t-confidence interval for the mean)
SE Mean = StDev / RAIZ(n)
Exercício 3 - Testes de hipóteses(a) Deseja-se saber se o tempo de reparo excede 225 horas. Estabeleça as
hipóteses apropriadas;𝐻0: 𝜇 = 225𝐻1: 𝜇 ≠ 225
(b) Teste as hipóteses, quais as conclusões? Use =0,05;
𝑡0 =ത𝑦−𝜇0Τ𝑆 𝑛
critério de rejeição: 𝑡0 > 𝑡 Τ∝ 2;𝑛−1
𝑡0 =241,5 − 225
Τ98,7 16= 0,6687
𝑡 Τ∝ 2;𝑛−1 = 𝑡0,025;15 = 2,131
Pelo Excel =INV.T(0,975;15) = 2,13245Como 𝑡0 < 𝑡0,025;15 ∴ 0,6687 < 2,131 Não podemos descartar 𝐻0.
(c) Encontre o P valor do teste;
Pelo Excel = 𝐷𝐼𝑆𝑇. 𝑇. 𝐵𝐶(0,6687; 15) = 0,513847
Como o valor de P é maior do que 0,025 o critério de decisão para uma
hipótese bilateral com =0,05, não podemos rejeitar 𝐻0.
Exercício 3 - Testes de hipóteses(d) Construa o intervalo de confiança de 95% do tempo médio de reparo.
𝐼𝐶 𝜇; 1 − 𝛼 : ത𝑋 ± 𝑡 Τ∝ 2𝑆
𝑛⋯ 241,5±2,131
98,7
16⋯241,5 ± 52,58 ∴ 188,92 −
294,08
Exercício 4 - Testes de hipótesesA tabela a seguir mostra os tempos de queima de duas diferentes
formulações químicas combustíveis. O engenheiro projetista está
interessado na média e na variância dos tempos de queima das formulações.
Tipo 1 Tipo 2
65 82 64 56
81 67 71 69
57 59 83 74
66 75 59 82
82 70 65 79
(a) Teste as hipótese que as duas variâncias são
iguais. Use =0,05.
(b) Use os resultados de (a), teste as hipótese que a
média dos tempos de queima são iguais. Use
=0,05. Qual o valor de P para este teste?
(c) Discuta o papel da normalidade assumida neste
problema. Verifique a normalidade das duas
formulações.
Exercício 4 - Testes de hipóteses(a) Teste as hipótese que as duas variâncias são iguais. Use =0,05.Pelo software Minitab obtemos:
Test and CI for Two Variances: Tipo 1; Tipo 2
Method
Null hypothesis Variance(Tipo 1) / Variance(Tipo 2) = 1
Alternative hypothesis Variance(Tipo 1) / Variance(Tipo 2) not = 1
Significance level Alpha = 0,05
Statistics
Variable N StDev Variance
Tipo 1 10 9,264 85,822
Tipo 2 10 9,367 87,733
Ratio of standard deviations = 0,989
Ratio of variances = 0,978
Exercício 4 - Testes de hipóteses(a) Teste as hipótese que as duas variâncias são iguais. Use =0,05.Test and CI for Two Variances: Tipo 1; Tipo 2 95% Confidence Intervals
CI forDistribution CI for StDev Varianceof Data Ratio RatioNormal (0,493; 1,985) (0,243; 3,938)Continuous (0,508; 1,933) (0,258; 3,735)
Tests
TestMethod DF1 DF2 Statistic P-ValueF Test (normal) 9 9 0,98 0,974Levene's Test (any continuous) 1 18 0,00 1,000
Exercício 4 - Testes de hipóteses(a) Teste as hipótese que as duas variâncias são iguais. Use =0,05.
Teste estatístico 𝐹0 =𝑆1
2
𝑆22 =
85,822
87,732= 0,97823
Critério de rejeição: 𝐹0 > 𝐹 Τ∝ 2,𝑛1−1,𝑛2−1 𝑜𝑢 𝐹0 < 𝐹 Τ1−∝ 2,𝑛1−1,𝑛2−1
𝐹 Τ∝ 2,𝑛1−1,𝑛2−1=4,03 ou 𝐹 Τ1−∝ 2,𝑛1−1,𝑛2−1= 0,25
Pelo Excel =INV.F.CD(0,025;9;9) = 4,025994Pelo Excel =INV.F.CD(0,975;9;9) = 0,248386
Como 𝐹0 < 4,03 e 𝐹0 > 0,25não podemos descartar 𝐻0 de igualdade das variâncias.
Podemos determinar o P Valor para o teste F, usando-se a seguinte função
do Excel =DIST.F(0,97823;9;9;VERDADEIRO) =0,487191 e multiplicarmos
por dois por ser hipótese bilateral, onde teremos o valor 0,974382.
Exercício 4 - Testes de hipóteses(b) Use os resultados de (a), teste as hipótese que a média dos tempos de
queima são iguais. Use =0,05. Qual o valor de P para este teste?𝐻0: 𝜇1 = 𝜇2𝐻1: 𝜇1 ≠ 𝜇2
Teste estatístico: 𝑡0 =ത𝑦1−ത𝑦2
𝑆𝑝1
𝑛1+
1
𝑛2
=70,40−70,20
9,31471
10+1
10
= 4,8011 10−2 = 0,048011
𝑆𝑝 =𝑛1 − 1 𝑆1
2 + 𝑛2 − 1 𝑆22
𝑛1 + 𝑛2 − 2=
10 − 1 85,74 + 10 − 1 87,79
10 + 10 − 2
= 9,3147Critério de decisão: 𝑡0 > 𝑡 Τ∝ 2; 𝜈 ∴ 𝜈 = 𝑛1 + 𝑛2 − 2 = 18 ∴ 𝑡 Τ∝ 2; 𝜈 = 𝑡0,025;18 =
2,101 Pelo Excel =INV.T(0,975;18) = 2,100922Como: 𝑡0 > 𝑡 Τ∝ 2; 𝜈 ∴0,048< 2,101 não podemos descartar 𝐻0 de igualdade.
Encontre o P valor do teste;
Pelo Excel =DIST.T.BC(0,048011;18)= 0,962236
Como o valor de P é maior do que 0,025 o critério de decisão para uma
hipótese bilateral com =0,05, não podemos rejeitar 𝐻0.
Exercício 4 - Testes de hipótesesTwo-sample T for Tipo 1 vs Tipo 2
N Mean StDev SE MeanTipo 1 10 70,40 9,26 2,9Tipo 2 10 70,20 9,37 3,0
Difference = mu (Tipo 1) - mu (Tipo 2)Estimate for difference: 0,2095% CI for difference: (-8,55; 8,95)T-Test of difference = 0 (vs not =): T-Value = 0,05 P-Value = 0,962 DF = 18Both use Pooled StDev = 9,3155
Exercício 4 - Testes de hipóteses(c) Discuta o papel da normalidade assumida neste problema. Verifique a
normalidade das duas formulações.
9080706050
99
95
90
80
70
60
50
40
30
20
10
5
1
Tipo 1
Pe
rce
nt
Mean 70,4
StDev 9,264
N 10
AD 0,344
P-Value 0,409
Probability Plot of Tipo 1Normal
Exercício 4 - Testes de hipóteses(c) Discuta o papel da normalidade assumida neste problema. Verifique a
normalidade das duas formulações.
9080706050
99
95
90
80
70
60
50
40
30
20
10
5
1
Tipo 2
Pe
rce
nt
Mean 70,2
StDev 9,367
N 10
AD 0,186
P-Value 0,876
Probability Plot of Tipo 2Normal
Exercício 4 - Testes de hipóteses(c) Discuta o papel da
normalidade
assumida neste
problema. Verifique a
normalidade das duas
formulações.
Observando os
gráficos de
normalidade das duas
formulações, pode-se
dizer que as duas
formulações podem
ser admitidas como
normais, a segunda
formulação com os
pontos mais próximo
de uma reta que a
primeira formulação.
9080706050
0,04
0,03
0,02
0,01
0,00
Data
De
nsit
y
70,4 9,264 10
70,2 9,367 10
Mean StDev N
Tipo 1
Tipo 2
Variable
Histogram of Tipo 1; Tipo 2Normal
Exercício 5 - Testes de hipótesesCinco medidas do conteúdo de alcatrão em um cigarro X acusaram: 14,5;
14,2; 14,4; 14,8 e 14,1 miligramas por cigarro. Este conjunto de cinco valores
tem média de 14,4 e desvio padrão 0,274. O leitor pretende testar a hipótese
nula Ho: µ=14,1 (conforme declarado no maço) ao nível de 0,05 de
significância.
Ho seria aceita, contra a alternativa Ha: µ≠14,1?
Ho seria aceita, contra a alternativa Ha: µ<14,1?
Ho seria aceita, contra a alternativa Ha: µ>14,1?
Que suposições são necessárias para fazer o teste de hipóteses?
Exercício 5 - Testes de hipótesesTest of mu = 14,1 vs not = 14,1
Variable N Mean StDev SE Mean 95% CI T PC1 5 14,400 0,274 0,122 (14,060; 14,740) 2,45 0,070
Não rejeitamosH0 contra ahipótese que amédia sejadiferente do que14,1.Obs: Podemosver que ointervalo deconfiança emazul inclui H0.
Exercício 5 - Testes de hipóteses
𝑡0 =14,4 − 14,1
Τ0,274 5= 2,44825
Pela tabela 𝑡 Τ∝ 2;𝑛−1 = 𝑡0,025;4 = 2,776
Pelo Excel =INV.T(0,975;4) = 2,7764
Como 𝑡0 < 𝑡0,025;4 ∴ 2,45 < 2,78 Não podemos descartar 𝐻0.
O P Valor do teste;
Pelo Excel = 𝐷𝐼𝑆𝑇. 𝑇. 𝐵𝐶(2,44825; 4) = 0,070578
Como o valor de P é maior do que 0,025 o critério de decisão para uma
hipótese bilateral com =0,05, não podemos rejeitar 𝐻0.
Exercício 5 - Testes de hipótesesTest of mu = 14,1 vs < 14,1
95% UpperVariable N Mean StDev SE Mean Bound T PC1 5 14,400 0,274 0,122 14,661 2,45 0,965
Não rejeitamos H0contra a hipóteseque a média sejamenor do que14,1.
Exercício 5 - Testes de hipóteses
𝑡0 =14,4 − 14,1
Τ0,274 5= 2,44825
Pela tabela 𝑡∝;𝑛−1 = 𝑡0,05;4 = 2,132
Pelo Excel =INV.T(0,95;4) = 2,131847
Como 𝑡0 > 𝑡0,05;4 ∴ 2,45 > −2,132 não podemos descartar 𝐻0 contra a hipótese que a média seja menor do que 14,1.
O P valor do teste;
Pelo Excel temos que fazer = 𝐷𝐼𝑆𝑇. 𝑇. 𝐶𝐷(2,44825; 4) = 0,035289 depois
diminuir este valor de 1, assim (1-0,035289)=0,964711 que é o P Valor.
Como o valor de P é bem maior do que 0,05 o critério de decisão para uma
hipótese unilateral com =0,05, não podemos rejeitar 𝐻0.
Podemos notar que como o P valor é bem maior do que ∝, ficamos seguros
em rejeitar a hipótese alternativa que a média seja menor do que 14,1.
Exercício 5 - Testes de hipótesesTest of mu = 14,1 vs > 14,1
95% LowerVariable N Mean StDev SE Mean Bound T PC1 5 14,400 0,274 0,122 14,139 2,45 0,035
Rejeitamos H0contra a hipóteseque a média sejamaior do que 14,1.
Exercício 5 - Testes de hipóteses
𝑡0 =14,4 − 14,1
Τ0,274 5= 2,44825
Pela tabela 𝑡∝;𝑛−1 = 𝑡0,05;4 = 2,132
Pelo Excel =INV.T(0,95;4) = 2,131847
Como 𝑡0 > 𝑡0,05;4 ∴ 2,45 > 2,132descartamos 𝐻0 contra a hipótese que a média seja maior do que 14,1.
O P valor do teste;
Pelo Excel temos que fazer = 𝐷𝐼𝑆𝑇. 𝑇. 𝐶𝐷(2,44825; 4) = 0,035289 este já é o P
valor.
Como o valor de P é menor do que 0,05, o critério de decisão, para uma
hipótese unilateral com =0,05, podemos rejeitar 𝐻0.
Podemos notar que como o P valor é menor do que ∝, indicando que
devemos rejeitar a hipótese 𝐻0 que a média seja igual a 14,1.
Exercício 5 - Testes de hipóteses
No exercício 5 fizemos 3 testes de hipóteses.
No primeiro a hipótese de igualdade da média a 14,1, não pode ser
descartada, contra a hipótese alternativa de que a média seria
diferente de 14,1. Assim soubemos que a média era diferente, mas
não sabíamos se para cima ou para baixo de 14,1.
No segundo a hipótese de igualdade da média a 14,1, também não
pode ser descartada, contra a hipótese alternativa de que a média
seria menor do que 14,1. Neste caso o P Valor deu alto, indicando
uma conclusão forte, que a média não era menor do que 14,1.
No terceiro a hipótese de igualdade da média a 14,1, foi descartada,
contra a hipótese alternativa de que a média seria superior a 14,1.
Concluímos assim, estatisticamente, que a média é maior do que
14,1. Indicando que o cigarro está com mais alcatrão que o
permitido.
Exercício 5 - Testes de hipóteses
Observamos pelo exercício que já poderíamos suspeitar que a
média das amostras estavam acima de 14,1 pelo próprio box plot
das amostras e partir diretamente para uma hipótese alternativa que
a média era maior do que 14,1.
Exercício 6 - Testes de hipóteses
Na validação de um método de medição de óxido de etileno em
produtos médicos, fez-se 7 medições de uma substância padrão
que possuía o valor de referência de 1,697 ppm de OE. Determine
com níveis de confiança de 95%, 99% e outros níveis, se os
resultados obtidos validam ou não o método de medição.
OE (ppm)1,7151,5811,9431,8821,9541,9751,715 Fazendo inicialmente o teste
de hipóteses para o nível de confiança de 95%.
Exercício 6 - Testes de hipóteses
2,01,91,81,71,6
X_
Ho
OE
Boxplot of OE(with Ho and 95% t-confidence interval for the mean)
Exercício 6 - Testes de hipóteses
Fazendo agora o testede hipóteses para onível de confiança de99%.
Observa-se que aocontrário do quepensamos é mais fácilaprovar o teste comnível de confiança de99%.
2,12,01,91,81,71,6
X_
Ho
OE
Boxplot of OE(with Ho and 99% t-confidence interval for the mean)
Exercício 6 - Testes de hipóteses
Fazendo agora o testede hipóteses para onível de confiança de92,9%.
Neste caso ficamosna dúvida já que queo p value é igual a pcrítico ou seja 0,071.Note que H0 está nolimite do IC de 92,9%
2,01,91,81,71,6
X_
Ho
OE
Boxplot of OE(with Ho and 92,9% t-confidence interval for the mean)
Exercício 6 - Testes de hipóteses
Fazendo agora o testede hipóteses para onível de confiança de90%.
Neste caso a hipóteseH0 é descartada jáque o P Valor é 0,071e deveria ser maiorou igual a 0,1.
2,01,91,81,71,6
X_
Ho
OE
Boxplot of OE(with Ho and 90% t-confidence interval for the mean)
Testes de hipóteses – Comparação pareada
Em alguns experimentos comparativos podemos aumentar grandemente
a precisão fazendo comparações combinadas aos pares do material. Por
exemplo, considere uma máquina de medição de dureza, que com uma
ponteira pressiona uma amostra, com uma determinada força. Pela
medição da profundidade do afundamento causado pela ponteira, a
dureza do material é determinada. Duas ponteiras diferentes estão
disponíveis pela máquina, embora a precisão (variabilidade) das
medições feitas pelas duas ponteiras seja a mesma, suspeita-se que
uma ponteira produza diferente leitura em relação a outra.
Um experimento poderia ser delineado como a seguir. Um número de
amostras de metal (10) poderia ser aleatoriamente selecionado. Metade
das amostras poderia ser testada por uma ponteira 1 e a outra metade
pela ponteira 2.
Testes de hipóteses – Comparação pareada
Por ser um projeto completamente aleatório, as médias das durezas das
duas amostras podem ser comparadas usando-se um teste t.
Pode haver uma desvantagem deste projeto de aleatorização. Suponha
que as amostras são obtidas em diferentes têmperas, ou que não seja
completamente homogênea entre amostras.
Esta falta de homogeneidade entre as amostras, ira contribuir para a
variabilidade das medições de dureza aumentando o erro experimental.
Para se proteger contra isto um projeto experimental alternativo pode ser
feito. Este projeto pode dividir cada amostra em duas partes,
submetendo, aleatoriamente, cada parte a um tipo de ponteira.
Testes de hipóteses – Comparação pareada
Podemos escrever a modelo estatístico que descreve os dados para
este experimento como:
𝑦𝑖𝑗 = 𝜇𝑖 + 𝛽𝑗 + 𝜖𝑖𝑗 ሼ𝑖 = 1,2 𝑗 = 1,2, … , 10
Onde 𝑦𝑖𝑗 e a medição de dureza da ponteira 𝑖 na amostra 𝑗, 𝜇𝑖 é a média
de dureza da amostra 𝑖 ésima, 𝛽𝑗 é um efeito da dureza devido à 𝑗 ésima
amostra e 𝜖𝑖𝑗 é o erro experimental aleatório com média zero e variância
𝜎𝑖2. Isto é 𝜎1
2 é a variância das medições de dureza com a ponteira 1 e
𝜎22 é a variância das medições de dureza com a ponteira 2.
Note que teremos se computarmos a diferença pareada das amostras.
𝑑𝑗 = 𝑦1𝑗 − 𝑦2𝑗 𝑗 = 1,2, … , 10
A diferença esperada é: 𝜇𝑑 = 𝐸 𝑑𝑗 = 𝐸 𝑦1𝑗 − 𝑦2𝑗 = 𝐸 𝑦1𝑗 − 𝐸 𝑦2𝑗 =
𝜇1 + 𝛽𝑗 − 𝜇2 − 𝛽𝑗 = 𝜇1 − 𝜇2Nota-se que o feito aditivo das amostras 𝛽𝑗 é cancelado quando as
medições pareadas desta forma.
Testes de hipóteses – Comparação pareada
Assim testar a hipótese: 𝐻0: 𝜇1 = 𝜇2 é equivalente a testar:
𝐻0: 𝜇𝑑 = 0𝐻1: 𝜇𝑑 ≠ 0
O teste estatístico para esta hipótese é: 𝑡0 =ത𝑑
Τ𝑆𝑑 𝑛onde ҧ𝑑 =
1
𝑛σ𝑗=1𝑛 𝑑𝑗
é a média da diferença das amostras e
𝑆𝑑 =σ𝑗=1𝑛 (𝑑𝑗 − ҧ𝑑)2
𝑛 − 1
Τ1 2
=σ𝑗=1𝑛 𝑑𝑗
2 −1𝑛(σ𝑗=1
𝑛 𝑑𝑗)2
𝑛 − 1
Τ1 2
É o desvio padrão da diferença .
𝐻0: 𝜇𝑑 = 0 será rejeitada se 𝑡0 > 𝑡 Τ∝ 2;𝑛−1
Este planejamento é usualmente chamado de teste t pareado.
Testes de hipóteses – Comparação pareada
Voltando ao nosso exemplo de
medições de dureza.
ҧ𝑑 =1
𝑛
𝑗=1
𝑛
𝑑𝑗 =1
10−1 = −0,10
𝑆𝑑 =σ𝑗=1𝑛 𝑑𝑗
2 −1𝑛(σ𝑗=1
𝑛 𝑑𝑗)2
𝑛 − 1
Τ1 2
=
=13 −
110
−12
10 − 1
Τ1 2
= 1,20
Supondo =0,05
Amostra
Ponteira 1
Ponteira 2
Diferença
1 7 6 1
2 3 3 0
3 3 5 -2
4 4 3 1
5 8 8 0
6 3 2 1
7 2 4 -2
8 9 9 0
9 5 4 1
10 4 5 -1
Testes de hipóteses – Comparação pareada
Supondo =0,05. Para tomarmos uma
decisão, precisamos determinar 𝑡0 e rejeitar
𝐻0 se 𝑡0 > 𝑡0,025 ;9 = 2,262.
A função Excel =INV.T(0,975;9) retorna
2,262157163.
A função Excel =INV.T(0,025;9) retorna -
2,262157163.
Amostra
Ponteira 1
Ponteira 2
Diferença
1 7 6 1
2 3 3 0
3 3 5 -2
4 4 3 1
5 8 8 0
6 3 2 1
7 2 4 -2
8 9 9 0
9 5 4 1
10 4 5 -1
Testes de hipóteses – Comparação pareada
O valor de 𝑡0 =ത𝑑
Τ𝑆𝑑 𝑛=
−0,10
Τ1,20 10= −0,26
Como 𝑡0 = 0,26 ≯ 𝑡0,025;9 = 2,262 , não
podemos rejeitar a hipótese 𝐻0: 𝜇𝑑 = 0. Ou
seja não evidências que as duas ponteiras
produzam diferentes leituras de dureza.
Amostra
Ponteira 1
Ponteira 2
Diferença
1 7 6 1
2 3 3 0
3 3 5 -2
4 4 3 1
5 8 8 0
6 3 2 1
7 2 4 -2
8 9 9 0
9 5 4 1
10 4 5 -1
Testes de hipóteses – Comparação pareada
Analisando o ensaio notamos que embora 2n=2(10)=20 medições
tenham sido feitas, temos somente n-1=9 graus de liberdade.
Comparando o desvio padrão de todas as 20 medições obtemos o
valor 𝑆𝑝 = 2,32, comparando com o desvio padrão das diferenças
temos 𝑆𝑑 = 1,20, ou seja uma variabilidade quase 50% menor.
Os intervalos de confiança para o ensaio pareado contra a análise
independente são:ҧ𝑑 ± 𝑡0,025;9 Τ𝑆𝑑 𝑛 = −0,10 ± 2,262 Τ1,20 10 = −0,10 ± 0,86
ത𝑦1 − ത𝑦2 ± 𝑡0,025;18𝑆𝑝1
𝑛1+
1
𝑛2= 4,80 − 4,90 ± 2,101 2,32
1
10+
1
10
= −0,10 ± 2,18O intervalo de confiança bem mais estreito da comparação pareada,
ilustra a redução do ruído próprio da blocagem.
Testes de hipóteses – Comparação pareada
Nem sempre a comparação pareada é a melhor escolha, caso a
variação da comparação pareada seja igual ao do ensaio normal,
neste caso a melhor opção é o ensaio normal devido a redução de n-1
graus de liberdade do ensaio pareado.
Testes de hipóteses – Comparação pareada
Exercício resolvido no Minitab:
Pelo P Valor = 0,798 não podemos afirmar que as ponteiras sejam diferentes.
Exercício teste de hipóteses
Produtos médicos foram submetidos à esterilização com óxido etileno.
Após o processo de esterilização os resíduos devem ser removidos, já
que são nocivos à saúde humana. São aceitos limites máximos de 25
ppm.
Utilizando o worksheet Minitab_worksheet_comp_residuos.MTW que
contém os resíduos de óxido etileno e etilenocloridrina. Faça os testes
de hipóteses necessários para comprovar se o produto cateter está
dentro dos limites de norma de 25 ppm.
Teste 1.
Exercício teste de hipóteses
Teste 1.
5004003002001000
X_
Ho
Cateter OE
Boxplot of Cateter OE(with Ho and 95% t-confidence interval for the mean)
Exercício teste de hipóteses
Teste 2.
5004003002001000
X_
Ho
Cateter OE
Boxplot of Cateter OE(with Ho and 95% t-confidence interval for the mean)
Exercício teste de hipóteses
Teste 3.
5004003002001000
X_
Ho
Cateter OE
Boxplot of Cateter OE(with Ho and 95% t-confidence interval for the mean)
Testes de hipóteses – Proporçõesestudos baseados na dist normal
O mesmo teste de hipóteses feito com respeito às médias pode ser
feito com relação a dados obtidos na forma de proporções.
Exercício:
Um estudo foi projetado para investigar se um certo detonador usado
em explosivos de uma mina de cal, atingem o requisito de 90% de
funcionamento. No teste realizado com 200 detonadores, 174
funcionaram adequadamente. Determine com 95% de certeza se o
detonador está dentro das especificações de 90% de funcionamento.
Resolvendo o exercício pelo Minitab sem maiores explicações da
formulação utilizada temos:
Testes de hipóteses – Proporçõesestudos baseados na dist normal
Exercício:
No teste realizado com 200 detonadores, 174 funcionaram
adequadamente, resolução pelo Minitab.
Exercício:
No teste realizado com 200 detonadores, 174 funcionaram
adequadamente, resolução pelo Minitab.
Concluímos que não podemos descartar a hipótese que a proporção
de detonadores que funcionam adequadamente seja igual a 90%. Já
que o p value deu 0,079, portanto maior do que 0,05 , valor de .
Testes de hipóteses – Proporçõesestudos baseados na dist normal
Exercício:
Um estudo mostra que 16 de 200 bebes recém natos apresentam
complicações em um hospital A. Um hospital B tem uma taxa de 14
complicações para 400. Para um nível de confiança de 99%, podemos
afirmar que o hospital B é melhor que o hospital A para os recém
natos?
Hipótese nula 𝑝𝐴 = 𝑝𝐵Hipótese alternativa 𝑝𝐴 > 𝑝𝐵
Testes de hipóteses – Proporçõesestudos baseados na dist normal
Exercício:
Hipótese nula 𝑝𝐴 = 𝑝𝐵 16/200 = 14/400
Hipótese alternativa 𝑝𝐴 > 𝑝𝐵
Testes de hipóteses – Proporçõesestudos baseados na dist normal
Exercício:
Hipótese nula 𝑝𝐴 = 𝑝𝐵 16/200 = 14/400
Hipótese alternativa 𝑝𝐴 > 𝑝𝐵
Concluindo podemos descartar a hipótese de igualdade das
proporções contra a hipótese alternativa que 𝑝𝐴 > 𝑝𝐵. Esta conclusão
pode ser tirada já que o p valor = 0,009 é menor que =0,01.
Testes de hipóteses – Proporçõesestudos baseados na dist normal
A maioria das medições industriais usam escalas, micrometros e
outros dispositivos que fornecem diretamente a medida física de um
produto. Contudo, as vezes as medidas são subjetivas, classificações
e avaliações, por exemplo: a) Classificação da fábrica pelo tipo de
defeito; b) Classificação da solda como boa ou ruim; c) Ranking da
qualidade do vinho na escala de 1 a 10; d) Ranking das bolhas de ar
no vidro na escala de 1 a 5;
Usa-se Análise de atributos para avaliar a consistência e a correção
em rankings subjetivos.
- Avaliações da taxa de acerto do avaliador em relação a um padrão;
- Avaliação entre os avaliadores;
- Consistência das avaliações de um mesmo avaliador.
Testes baseados em atributos
Uma das preocupações em testes baseados em atributos é a
consistência dos avaliadores. Por exemplo um mesmo avaliador pode
avaliar um vinho com alta pontuação e em um segundo momento,
avaliar o mesmo vinho com baixa pontuação.
Caso não se confie na consistência dos avaliadores, não se pode
confiar nos dados que eles reportam.
Uma análise de atributos pode ajudar a decidir se os avaliadores são
consistentes nas suas pontuações.
Análises também podem ser feitas levando-se em conta padrões
estabelecidos e as avaliações dos avaliadores.
Testes baseados em atributos
Tipos de dados
As variáveis devem ser colocadas em colunas de dados numéricos ou
texto. Os dados podem ser tipo binário (good/bad), nominal
(blue/yellow/red) ou ordinal (ruim/razoável/bom). Deve-se distinguir as
respostas de acordo com o avaliador e tentativa.
Para se criar uma planilha de atributos no Minitab, use o Create
Attribute Agreement Analysis Worksheet.
Testes baseados em atributos
Exercício
Dois avaliadores avaliaram três substâncias, cada uma duas vezes.
Tem-se um padrão de referência, para comparar os resultados.
Testes baseados em atributos
Os dados devem ser
colocados no formato doMinitab.
Exercício
Dois avaliadores avaliaram três substâncias, cada uma duas vezes.
Tem-se um padrão de referência, para comparar os resultados.
Testes baseados em atributos
Analisando a consistência dos resultados dos dois avaliadores.
Testes baseados em atributosExercício
Caso os avaliadores tenham duas ou mais avaliações do mesmo
item, pode-se avaliar a consistência do avaliador. Deve-se observar
que aqui não se faz uma comparação com o padrão, assim mesmo
que as avaliações sejam consistentes, elas não sãonecessariamente corretas.
No exercício houve
coincidência de duas das
três avaliações feitas,
para os dois avaliadores,
Jim e Vanessa, ou seja
66,67% IC95% (9,43;99,16).
Testes baseados em atributosExercício
Utilizando o coeficiente kappa para comparar os resultados dos
avaliadores, tem-se que kappa=1 caso haja perfeita concordância dos
resultados, caso kappa = 0 a concordância é aleatória. Valores
negativos é uma concordância menor do que a aleatória. Valores de
kappa menores do que 0,7, indicam que o sistema de mensuração
precisa melhorias. Valores de kappa maiores que 0,9 são consideradosexcelentes.
Testes baseados em atributosExercício
Tem-se a comparação estatística conforme a estatística kappa para
cada resposta e geral, assim pode-se responder à questão: “Os
avaliadores tem dificuldades com uma resposta em particular?”
Um teste de hipóteses é feito com as hipóteses:
H0: A concordância do avaliador é igual a aleatória.H1: A concordância do avaliador não é igual a aleatória.
Testes baseados em atributosExercício
Analisando os resultados abaixo pode-se observar que os avaliadores
Jim e Vanessa não apresentam resultados consistentes. A média geral
dos dois para o p valor é de 0,0603 valor este que não permitedescartar a hipótese de aleatoriedade dos resultados obtidos.
Testes baseados em atributosExercício
Coeficiente de concordância de Kendall expressa o grau de
associação entre as várias avaliações feitas por um avaliador. Ele usa
informações sobre as classificações relativas e é sensível à gravidadedo erro de classificação.
O coeficiente de concordância de Kendall é possível de ser obtido
quando o avaliador faz duas ou mais avaliações da mesma unidade.
Com 3 ou mais níveis o coeficiente Kendall pode ser calculado.
O coeficiente de concordância de Kendall pode variar de 0 a 1, quanto
maior o coeficiente de Kendal mais forte é a associação.
O p valor testa as hipóteses:
H0: Não há associação entre os vários rankings de um mesmo
avaliador;
H1: Os rankings de um mesmo avaliador estão associados entre si.
Testes baseados em atributosExercício
Para o exemplo observa-se que os rankings de um mesmo avaliador
estão associados entre si, já que os p valores deram valores acima de
, descartando a hipótese H0.
Observa-se que embora as classificações dos avaliadores possam ser
consistentes, elas podem não ser corretas, já que não faz-se um
comparação com o padrão estabelecido.
Testes baseados em atributosExercício
Caso tenha-se um padrão pode-se avaliar a assertividade de cada
avaliador.
No caso do avaliador Jim ele acertou 1 de 3 avaliações feitos, ou seja
33,33% - IC95% (0,84; 90,57). No caso do avaliador Vanessa esta
acertou 2 de 3 avaliações, ou seja 66,67% IC95% (9,43; 99,16).
Testes baseados em atributosExercício
Caso tenha-se um padrão pode-se avaliar a assertividade de cada
avaliador.
No caso do
avaliador Jim ele
acertou 1 de 3
avaliações feitos,
ou seja 33,33% -
IC95% (0,84; 90,57).
No caso do
avaliador Vanessa
esta acertou 2 de 3
avaliações, ou seja
66,67% IC95% (9,43;
99,16).VanessaJim
100
80
60
40
20
0
Appraiser
Pe
rce
nt
95,0% C I
Percent
VanessaJim
100
80
60
40
20
0
Appraiser
Pe
rce
nt
95,0% C I
Percent
Date of study:
Reported by:
Name of product:
Misc:
Assessment Agreement
Within Appraisers Appraiser vs Standard
Testes baseados em atributosExercício
O primeiro gráfico mostra o porcentual de concordância das avaliações
de um mesmo avaliador. O segundo o porcentual de concordância das
avaliações dos avaliadores com o padrão.
O círculo azul
indica o porcentual
de acerto atual;
A linha vermelha
mostra o intervalo
de confiança do
acerto;
E os Xs indicam os
limites inferior e
superior do
intervalo de
confiança.VanessaJim
100
80
60
40
20
0
Appraiser
Pe
rce
nt
95,0% C I
Percent
VanessaJim
100
80
60
40
20
0
Appraiser
Pe
rce
nt
95,0% C I
Percent
Date of study:
Reported by:
Name of product:
Misc:
Assessment Agreement
Within Appraisers Appraiser vs Standard
Testes baseados em atributosExercício
Utilizando a estatística de Fleiss´Kappa para avaliar a assertividade
dos avaliadores, teremos kappa =1 caso haja uma perfeita
concordância, se kappa =0 a concordância é a mesma esperada para
aleatoriedade. Kappa menores que 0,7 indicam que o sistema de
medição precisa de melhorias e Kappa acima de 0,9 indicam que o
sistema é excelente.
O p valor testa as hipóteses:
H0: A concordância entre os avaliadores e o padrão é aleatória;
H1: A concordância entre os avaliadores e o padrão não é aleatória.
Testes baseados em atributosExercício
Para o exemplo em estudo observa-se que para a resposta 4 o
avaliador Jim apresenta perfeita concordância com o padrão Kappa = 1
e p valor 0,0072. No entanto para a resposta 10 o avaliador Jim está
abaixo da aleatoriedade com p valor 0,6879.
Testes baseados em atributosExercício
O coeficiente de correlação médio de Kendall é um coeficiente de
correlação entre todas as avaliações de um mesmo avaliador.
Coeficiente de concordância de Kendall expressa o grau de
associação entre as várias avaliações feitas por um avaliador. Ele usa
informações sobre as classificações relativas e é sensível à gravidadedo erro de classificação.
O coeficiente de Kendall pode variar de -1 até 1. Um valor positivo
indica uma associação positiva e um valor negativo indica uma
associação negativa. Quanto maior o coeficiente maior a associação.
O p valor testa as hipóteses:
H0: A concordância dos rankings são devido a aleatoriedade;
H1: A concordância dos rankings não são devido a aleatoriedade.
Testes baseados em atributosExercício
Observa-se para o exemplo que com os p valor são altos (maior que )
não podemos descartar a hipótese da aleatoriedade H0.
O p valor testa as hipóteses:
H0: A concordância dos rankings são devido a aleatoriedade;
H1: A concordância dos rankings não são devido a aleatoriedade.
Testes baseados em atributosExercício
Observa-se para o exemplo que com os p valor são altos (maior que )
não podemos descartar a hipótese da aleatoriedade H0.
O p valor testa as hipóteses:
H0: A concordância dos rankings são devido a aleatoriedade;
H1: A concordância dos rankings não são devido a aleatoriedade.
Testes baseados em atributosExercício
No exercício pode-se determinar o quanto cada avaliador concorda
com o outro.
Observa-se um índice de 33,33% de concordância entre os
avaliadores IC95% (0,84; 90,57).
Testes baseados em atributosExercício
No exercício pode-se determinar a concordância entre os avaliadores e
a resposta.
No exemplo observa-se uma boa concordância entre os avaliadores
somente para a resposta 4.
O p valor testa as hipóteses:
H0: A concordância entre os avaliadores e devido a aleatoriedade;
H1: A concordância entre os avaliadores não é devido a aleatoriedade.
Testes baseados em atributosExercício
No exercício pode-se avaliar a concordância geral entre os avaliadores
e o padrão estabelecido.
O p valor testa as hipóteses:
H0: A concordância entre os avaliadores e o padrão é devido a
aleatoriedade;
H1: A concordância entre os avaliadores e o padrão não é devido a
aleatoriedade;
Testes baseados em atributosExercício
No exercício pode-se avaliar a concordância geral entre os avaliadores
e o padrão estabelecido.
O p valor testa as hipóteses:
H0: Não há associação entre os rankings dos avaliadores e o padrão
estabelecido;
H1: Há associação entre os rankings dos avaliadores e o padrão
estabelecido.