Aula 1 –Planejamento e Análise de Experimentos · 2016. 4. 5. · Testes de hipóteses –média 1) Definir as hipóteses estatísticas; A hipótese estatística é uma suposição

Aula 4 –Planejamento e Análise de Experimentos

Professores

Miguel Antonio Sovierzoski, [email protected];

Vicente Machado Neto, [email protected];

Revisão da aula anterior

Fatores – níveis – tratamentos;

Discussão sobre os trabalhos a serem desenvolvidos na disciplina,

fatores, níveis, tratamentos;

Valores aleatórios discretos e contínuos;

Função densidade de probabilidade;

Distribuições de probabilidade normal N, distribuição t de student, ,

distribuição gama, distribuição qui-quadrado e distribuição F;

Distribuição normal padrão;

Distribuição amostral da média;

Teorema Central do Limite TCL;

Intervalo de confiança conhecido e desconhecido;

Tamanho da Amostra

Uma das questões principais a serem respondidas em um projeto

de experimentos é : Quantas amostras ou observações devo usar?

Infelizmente não existe uma resposta definitiva para esta questão.

Contudo, com algumas informações adicional e fazendo-se

algumas suposições é possível estimar o número mínimo de

observações.

Tem-se que pensar que quando fala-se em tamanho da amostra

supõe-se a obtenção de dados nas mesmas condições.

Se os dados forem obtidos em diferentes condições, mesmo que

muitos, isto não significa replicata.

Também tem-se que tomar cuidado com uma grande quantidade de

dados obtidos na mesma condição de experimentação, os

experimentos tem que explorar as diversas variáveis presentes no

processo.

Tamanho da Amostra

O objetivo de se fazer replicatas é testar a variabilidade dos

resultados.

Uma replicata para ser válida deve ser feita tudo da condição

zero como se fosse um novo experimento.

Um grave erro de muitos experimentos é não se fazer

replicatas. Assim muito experimentos que dão um enorme

trabalho são invalidados pela falta das replicatas.

Observa-se ainda que a resposta obtida, pelo método aqui

apresentado a seguir, pode não contemplar o erro tipo desejado.

Tamanho da AmostraNúmero de amostras para uma largura de Intervalo de Confiança

Algumas vezes o objetivo é um particular intervalo de confiança. O

intervalo de confiança da média é calculado como:

ҧ𝑥 ± 𝑡𝑠

𝑛Infelizmente para resolver a equação, depende-se de um particular

valor de t student, que depende do número de amostras n. Assim a

equação só pode ser resolvida para grandes valores de n, onde t

torna-se constante (aproxima-se de uma distribuição normal), ou

quando o desvio padrão é conhecido a priori.

Para grandes valores de n, e uma largura pretendida de intervalo de

confiança ±C, a seguinte equação pode ser usada: 𝑛𝑚𝑖𝑛 ≥𝑠 𝑍1− Τ∝ 2

𝐶

2

Para 95% de intervalo de confiança 1 − Τ∝ 2 = 0,975 𝑒 𝑧 = 1,96;Para 99% de intervalo de confiança 1 − Τ∝ 2 = 0,995 𝑒 𝑧 = 2,65.A equação acima é razoavelmente precisa para n>50.


Para pequenos valores de n e grandes C, a equação subestima o

número de observações.

Estimativas alternativas, para estes casos são:

1) Usar valores tabulados para pequenos valores de n. Para usar a

tabela, calcula-se C/s para a largura de intervalo desejada e o

desvio padrão esperado s. Encontre na tabela o valor

imediatamente acima e determine o correspondente valor de n.

2) Usar um método interativo, isto é, faça um chute inicial para n e

ajuste até que o desejado intervalo de confiança seja encontrado.


Exemplo

No desenvolvimento de um protocolo de validação, para medição de

Oxido Etileno em amostras, um analista deseja assegurar que o

intervalo de confiança de 95% não seja maior do que C= 45 ppm.

Sabe-se de ensaios prévios que o desvio padrão é igual a 45 ppm.

Quantas observações são requeridas?

1) Usando-se a tabela. Para C= intervalo de confiança = 45ppm e s =

45 ppm. Observa-se na coluna de 95% de confiança que o valor

imediatamente abaixo de C/s =1 é 0,925 que corresponde a n=7.

Assim a validação do protocolo requer um mínimo de 7 replicatas.


Exemplo


Exemplo

No desenvolvimento de um protocolo de validação, para medição de

Oxido Etileno em amostras, um analista deseja assegurar que o

intervalo de confiança de 95% não seja maior do que 45 ppm.

Sabe-se de ensaios prévios que o desvio padrão é igual a 45 ppm.

Quantas observações são requeridas?

2) Resolvendo de

maneira iterativa

utilizando o Excel,

temos a figura abaixo,

extraída do Excel, que

comprova que o

número de amostras

fica entre 6 e 7:

Tamanho da AmostraNúmero de amostras no software Minitab

Stat > Power and Sample Size > Sample Size for Estimation

Tendo-se uma margem de erro para um intervalo de confiança da média pode-se determinar o tamanho da amostra.Inversamente conhecendo-se o tamanho da amostra pode-se determinar a margemde erro para um intervalo de confiança.


Tamanho da Amostra

Planning Value The necessary planning value depends on the chosen parameter.

Statistical analysis you plan to conduct

Estimated parameter

Planning value

1-Sample z 1-Sample tPaired t

Mean from a normal distribution

Standard deviation

To estimate samples size or margins of error , you need information about the

data you expect to collect. You can obtain planning values from:

Design specifications

Expert opinions

Prior studies or small pilot studies

The planning value you need depends on the parameter you want to estimate.

Número de amostras no software Minitab

Tamanho da Amostra

An electronics company wants to estimate the voltage of a new line of

resistors used in circuit boards. They want to know what sample size they

need to obtain a margin of error of 5. Based on prior studies, the standard

deviation is 22.5.

1 Choose Stat > Power and Sample Size > Sample Size for Estimation.

2 In Parameter, choose Mean (Normal).

3 Under Planning Value, enter 22.5 in Standard deviation.

4 Choose Estimate sample sizes.

5 In Margins of error for confidence intervals, 5.

6 Click OK.

Session window outputInterpreting the results

To achieve a margin of error of 5 when estimating the mean voltage of resistors, the

electronics company needs to collect 81 samples.


Tamanho da Amostra

Sample Size for Estimation

Method

Parameter MeanDistribution NormalStandard deviation 22.5 (estimate)Confidence level 95%Confidence interval Two-sided

Results

Margin Sampleof Error Size

5 81

No software Minitab - Exemplo



Exemplo - Resolvendo o mesmo exercício anterior com o MinitabNo desenvolvimento de um protocolo de validação, para medição de Oxido

Etileno em amostras, um analista deseja assegurar que o intervalo de

confiança de 95% não seja maior do que 45 ppm. Sabe-se de ensaios prévios

que o desvio padrão é igual a 45 ppm. Quantas observações são requeridas?

Testes de hipóteses

O teste de hipóteses é um procedimento estatístico em que se

busca verificar uma hipótese a respeito da população, no sentido

de aceitá-la ou rejeita-la, a partir de dados amostrais, tendo por

base a teoria das probabilidades.

Em geral, um problema científico (expresso na forma de pergunta)

conduz a uma hipótese científica (resposta provisória a esta

pergunta) que requer uma pesquisa científica para a sua

verificação. O teste de hipótese é um dos procedimentos mais

utilizados na pesquisa científica, sobretudo na pesquisa

experimental.


No uso de um teste de hipóteses fazemos algumas suposições tais

como: a) Ambas as amostras foram extraídas de populações

independentes que podem ser descritas por distribuições normais; b)

Que o desvio padrão ou variância das populações são iguais; c) E que

os dados são variáveis aleatórias independentes.

A suposição de independência é crítica, mas se as rodadas de

experimentação forem sorteadas e demais variáveis forem

selecionadas aleatoriamente, normalmente, satisfaz-se a suposição de

independência.

As suposições de variância igual e normalidade são facilmente

verificadas usando-se gráficos de verificação da normalidade.

Normalmente softwares incorporam opções de verificação da

normalidade, ou mesmo o procedimento pode ser executado

manualmente, colocando os dados em ordem crescente e seguindo

procedimento específico.

Testes de hipótesesO gráfico mostra a verificação da normalidade de medições de glicose

em amostras de materiais de referência.


De modo geral, podemos definir cinco passos para construção de um

teste de hipóteses:

1) Definir as hipóteses estatísticas;

2) Fixar a taxa de erro aceitável;

3) Escolher a estatística para testar a hipótese e verificar as

pressuposições para o seu uso;

4) Usar as observações da amostra para calcular o valor da

estatística do teste;

5) Decidir sobre a hipótese testada e concluir.

Testes de hipóteses – média

1) Definir as hipóteses estatísticas; A hipótese estatística é uma

suposição feita a respeito de um ou mais parâmetros, tais como,

média de populações (), variâncias de populações (𝜎2), etc. As

hipóteses estatísticas surgem de problemas científicos.

Existem dois tipos básicos de hipóteses estatísticas:

Hipótese de nulidade (𝐻0): é a hipótese que está sob verificação. Esta

hipótese supõe a igualdade dos parâmetros que estão sendo

testados;

Hipótese alternativa (𝐻𝐴): é a hipótese que será considerada caso a

hipótese de nulidade seja rejeitada. Esta hipótese supõe que os

parâmetros testados são diferentes.


Duas situações são comuns em testes de hipóteses a respeito da média

da população ():

1. Comparação de uma média () com um valor (𝜇0).

Nesta situação, temos uma população da qual é extraída uma amostra e

a média desta amostra é comparada com um valor já conhecido (valor

padrão) que serve como referência.

𝐻0: 𝜇 = 𝜇0 𝑜𝑢 𝜇 − 𝜇0 = 0

𝐻𝐴: 𝜇 ≠ 𝜇0 𝑜𝑢 𝜇 − 𝜇0 ≠ 0 hipótese bilateral

𝜇 > 𝜇0 𝑜𝑢 𝜇 − 𝜇0 > 0 hipótese unilateral direita

𝜇 < 𝜇0 𝑜𝑢 𝜇 − 𝜇0 < 0 hipótese unilateral esquerda

Devemos escolher a 𝐻𝐴 mais apropriada


2. Comparação entre duas médias (𝜇1 𝑒 𝜇2).

Nesta situação, temos duas populações, de cada uma é extraída uma

amostra, e as médias das duas amostras são comparadas.

𝐻0: 𝜇1 = 𝜇2 𝑜𝑢 𝜇1 − 𝜇2 = 0

𝐻𝐴: 𝜇1 ≠ 𝜇2 𝑜𝑢 𝜇1 − 𝜇2 ≠ 0 hipótese bilateral

𝜇1 > 𝜇2 𝑜𝑢 𝜇1 − 𝜇2 > 0 hipótese unilateral direita

𝜇1 < 𝜇2 𝑜𝑢 𝜇1 − 𝜇2 < 0 hipótese unilateral esquerda

Devemos escolher a 𝐻𝐴 mais apropriada


Exemplificando com um teste de hipóteses no qual pretende-se avaliar

duas formulações de argamassas, que devem ser avaliadas com

respeito à resistência a compressão. Obviamente, seria impossível

avaliar todas as argamassas produzidas.

População 1 é a formulação

1 da argamassa, a

População 2 é a formulação

2 da argamassa.

Nestas populações vamos

estudar a variável contínua

X= resistência da

argamassa, supondo que

𝑋~𝑁 𝜇, 𝜎2 e que 𝜎12 = 𝜎2

2.


Assim nossos parâmetros de interesse são:

𝐸 𝑋1 = 𝜇1 = resistência média da população 1;

𝐸 𝑋2 = 𝜇2 = resistência média da população 2;

Assim devemos considerar

as seguintes hipóteses

estatísticas.

𝐻0: 𝜇1 = 𝜇2𝐻𝐴: 𝜇1 ≠ 𝜇2


Observemos que a hipótese alternativa não corresponde

necessariamente à expectativa do pesquisador, ou seja, à hipótese

científica. A hipótese a ser testada em um teste é sempre a hipótese de

igualdade entre os parâmetros, enquanto a hipótese alternativa deve ser

definida pelo pesquisador, podendo ser bilateral ou unilateral.

A escolha entre uma e outra, entretanto, jamais deve ser feita com base

nos dados da amostra, tampouco na expectativa do pesquisador.

A hipótese bilateral é mais genérica e

deve ser utilizada quando não temos

motivos suficientes para esperar que um

dos parâmetros seja maior ou menor que

outro. Assim, supomos apenas que os

parâmetros serão diferentes, caso a

hipótese de igualdade seja rejeitada.


As situações de aplicação da hipótese unilateral são mais restritas e

nem sempre são muito claras. A opção por uma hipótese unilateral

exige que tenhamos mais informações sobre o comportamento da

variável de interesse na situação da pesquisa. Estudos anteriores, por

exemplo, podem prover evidências que suportem uma hipótese

unilateral.

Testes de hipóteses – médiaA hipótese unilateral pode ser também uma decorrência lógica da

situação de pesquisa, como, por exemplo, quando comparamos a

média de um grupo tratado (que recebe determinado tratamento) com

a média de um grupo controle ou testemunha (que não recebe o

tratamento).

Neste caso, se o tratamento

não tem efeito, esperamos

que as médias dos dois

grupos sejam iguais; mas se

o tratamento tem efeito

significativo é bastante

razoável esperar que a

média do grupo tratado (que

expressa este efeito) seja

maior (e nunca menor do que

a média do grupo controle.

Testes de hipóteses – erros Um elemento intrínseco ao processo de inferência é o erro. Como as

conclusões são obtidas a partir de dados amostrais, eventualmente, a

amostra pode não representar o todo (população).

Como a hipótese sob verificação é 𝐻0 , dois tipos de erro estão

associados à decisão a respeito dela, são eles:

Erro Tipo I: rejeitar 𝐻0 quando ela é verdadeira

= P(erro tipo I) probabilidade de cometer o erro tipo I

Erro Tipo II: não rejeitar 𝐻0 quando ela é falsa

= P(erro tipo II) probabilidade de cometer o erro tipo II

Decisão Situação de 𝑯𝟎

Verdadeira Falsa

Não rejeitar Acerto Erro Tipo II -

Rejeitar Erro Tipo I - Acerto

Testes de hipóteses – erros Como consequência, temos que: (1-) é a probabilidade de não

cometer o erro tipo I, ou seja, é a capacidade de não rejeitar 𝐻0verdadeira, e (1-) é a probabilidade de não cometer o erro tipo II, ou

seja, é a capacidade de rejeitar 𝐻0 falsa. A probabilidade (1-) é

denominada poder do teste. Podemos dizer, então, que o poder do

teste é a probabilidade de declarar diferenças quando elas, de fato

existem. O poder de um teste está relacionado com os seguintes

fatores: tamanho da amostra, variabilidade da variável e magnitude

da diferença existente entre as médias.


Verdadeira Falsa



Testes de hipóteses – erros É importante ressaltar ainda que as duas taxas de erro ( e ) estão

relacionadas negativamente, de modo que a redução de implica no

aumento de e vice-versa. Para que os testes de hipóteses tenham

validade, é necessário que sejam delineados de modo a minimizar os

erros de conclusão. Entretanto, o único meio de reduzir ambos os

tipos de erro é aumentando o tamanho da amostra, o que nem

sempre é viável. Via de regra a preocupação está voltada para

minimizar o erro tipo I. A probabilidade de ocorrência do erro tipo I ()

é chamada de nível de significância do teste.


Verdadeira Falsa



Testes de hipóteses – critério de decisão

A regra de decisão a respeito de 𝐻0 pode ser estabelecida com base

num valor crítico:

Teste bilateral: se a hipótese alternativa for bilateral, o valor crítico

será:

𝑡 Τ𝛼 2(𝜈): valor da estatística t, para graus de liberdade, que delimita a

área Τ𝛼 2, encontrado na tabela da distribuição t (limites bilaterais);

Teste unilateral: se a hipótese alternativa for unilateral, o valor crítico

será:

𝑡𝛼(𝜈): valor da estatística t, para graus de liberdade, que delimita a

área , encontrado na tabela da distribuição t (limites unilaterais);

Para decidir comparamos o valor da estatística t=𝜃

𝑆(𝜃)com o valor

crítico:

Rejeitamos 𝑯𝟎, ao nível , se o valor da estatística, em módulo,

for maior que o valor crítico: 𝒕 > valor crítico


O Excel tem uma função que retorna o valor de t.A função =INV.T(probabilidade; graus de liberdade) retorna o valor de t.

Para a função =INV.T(0,025;22) o valor retornado será -2,07387, ou se vocêentrar com a função =INV.T(0,975;22) obterá o valor 2,073873.

No teste de hipóteses compara-se sempre o valor do t crítico

como positivo, assim mesmo a função =INV.T(0,025;22) retornar

o valor -2,07387 o valor do t crítico a ser comparado é 2,07387.

Em alguns critérios de rejeição o sinal – está a frente do valor

crítico, neste caso o valor a ser comparado será negativo.


Não temos motivos suficientes para rejeitar 𝑯𝟎, ao nível , se o

valor da estatística, em módulo, for menor que o valor crítico:

𝒕 < valor crítico.

Podemos observar a seguir as regiões de rejeição 𝐻0 na curva da

distribuição t para cada uma das três possibilidades de hipótese

alternativa:

Para hipótese alternativa bilateral, ou seja, 𝐻𝐴: 𝜇1 − 𝜇2 ≠ 0


Para hipótese alternativa unilateral direita ou seja, 𝐻𝐴: 𝜇1 − 𝜇2 > 0


Para hipótese alternativa unilateral esquerda ou seja, 𝐻𝐴: 𝜇1 − 𝜇2 < 0

Testes de hipóteses – P valor

Outro critério tem sido frequentemente utilizado para decidir sobre 𝐻0.

Essa decisão também pode ser baseada em um valor que expressa a

probabilidade de que seja obtido um valor t mais extremo que o valor

observado, dado que 𝐻0 é verdadeiro. Esta probabilidade é conhecida

como P valor.


A decisão a respeito de 𝐻0 é tomada da seguinte forma:

Se o valor P for maior ou igual

a , não rejeitamos a hipótese

nula, pois t é típico ou está em

uma região de alta

probabilidade.

Se o valor P for menor que ,

rejeitamos a hipótese nula, pois

t é atípico ou está em uma

região de baixa probabilidade.


O P valor para distribuição Z é calculado para testes bilaterais como: 𝑃 =2 1 − Φ 𝑍0No caso dos testes unilaterais, o P valor é calculado pela equação:

𝑃 = 1 − Φ 𝑍0 para o teste unilateral superior;

𝑃 = Φ 𝑍0 para o teste unilateral inferior.


Para simplificar o cálculo do P valor para uma hipótese bicaudal,

utilizando a distribuição t, podemos utilizar a função do Excel

DIST.T.BC(𝑡0; graus de liberdade). A função retorna diretamente o P

valor.

Da mesma forma a função DIST.T.CD (𝑡0; graus de liberdade), retorna o

valor percentual da cauda direita e pode ser usada para cálculo do P

valor para hipóteses unilaterais.






Testes de hipóteses médias –variância conhecida

Testes de hipóteses médias – variância conhecida – Intervalos de confiança

ത𝑦 − 𝑍 Τ∝ 2 Τ𝜎 𝑛 ≤ 𝜇 ≤ ത𝑦 + 𝑍 Τ∝ 2 Τ𝜎 𝑛

ത𝑦 − 𝑍∝ Τ𝜎 𝑛 ≤ 𝜇 ≤ ത𝑦 + 𝑍∝ Τ𝜎 𝑛

ത𝑦1 − ത𝑦2 − 𝑍 Τ∝ 2

𝜎12

𝑛1+𝜎2

2

𝑛2≤ 𝜇1 − 𝜇2 ≤ ത𝑦1 − ത𝑦2 + 𝑍 Τ∝ 2

𝜎12

𝑛1+𝜎2

2

𝑛2

Testes de hipóteses médias –variância desconhecida

Testes de hipóteses médias – variância desconhecida – Intervalos de Confiança

ത𝑋 − 𝑡 Τ∝ 2

𝑆

𝑛< 𝜇 < ത𝑋 + 𝑡 Τ∝ 2

𝑆

𝑛

Intervalos de Confiança Bilaterais

𝑆𝑝 =𝑛1 − 1 𝑆1

2 + 𝑛2 − 1 𝑆22

𝑛1 + 𝑛2 − 2

ത𝑦1 − ത𝑦2 − 𝑡 Τ𝛼 2;𝜈

𝑆12

𝑛1+𝑆2

2

𝑛2≤ 𝜇1 − 𝜇2 ≤ ത𝑦1 − ത𝑦2 + 𝑡 Τ∝ 2;𝜈

𝑆12

𝑛1+𝑆2

2

𝑛2

ത𝑦1 − ത𝑦2 − 𝑡 Τ∝ 2;𝑛1+𝑛2−2𝑆𝑝1

𝑛1+

1

𝑛2≤ 𝜇1 − 𝜇2 ≤ ത𝑦1 − ത𝑦2 + 𝑡 Τ∝ 2;𝑛1+𝑛2−2𝑆𝑝

1

𝑛1+

1

𝑛2

Testes de hipóteses variâncias

Testes de hipóteses variâncias

𝑛 − 1 𝑆2

𝜒2 Τ𝛼 2;𝑛−1

≤ 𝜎2 ≤𝑛 − 1 𝑆2

𝜒2 Τ1−(𝛼 2);𝑛−1

Intervalos de confiança bilaterais

𝑆12

𝑆22 𝐹1− Τ∝ 2,𝑛2−1,𝑛1−1 ≤

𝜎12

𝜎22 ≤

𝑆12

𝑆22 𝐹 Τ∝ 2,𝑛2−1,𝑛1−1

𝐹1−∝,𝜈2,𝜈1 =1

𝐹𝛼,𝜈2,𝜈1

Exercício 1 - Testes de hipóteses

A resistência de um freio de fibra deve ser de pelo menos 150psi.

Experiência anterior indica que o desvio padrão da resistência do freio é

de =3psi. Uma amostragem aleatória de 4 peças são testadas e os

resultados foram: y1= 145; y2=153; y3=150 e y4=147.

(a) Estabeleça as hipóteses que você acha que deveriam ser testadas

neste experimento.

(b) Teste as hipóteses usando α = 0,05. Qual a sua conclusão?

(c) Encontre o p-value para o teste do item (b).

(d) Construa o intervalo de confiança de 95% da resistência média do

freio.


(a) Exercício envolve a comparação da média de uma população com

um valor específico.

Hipóteses: H0 : μ = 150 psi

H1 : μ 150 psi

A hipótese pode ser testada se a população é normal com uma variância

conhecida.

Resultados do Minitab:One-Sample Z: Resis Freios

Test of mu = 150 vs not = 150The assumed standard deviation = 3

Variable N Mean StDev SE Mean 95% CI Z PResis Freios 4 148,75 3,50 1,50 (145,81; 151,69) -0,83 0,405


O gráfico mostra em azul o intervalo de confiança de 95%


O gráfico mostra os quartis e bigodes do box plot


H0 : µ= 150 pode ser rejeitada se 𝑍0 > 𝑍 Τ∝ 2

𝑍0 =ത𝑦 − 𝜇0Τ𝜎 𝑛

=148,75 − 150

Τ3 4= −0,833. .

𝑍 Τ∝ 2 = 𝑍0,025 = 1,960


Ou tabela Z aproximadamente pegando a probabilidade 97,5%

(0,97500) correspondente ao Z de 1,96.

Pelo excel =INV.NORMP.N(0,975)=1,959964 (ou INV.NORMP)

Como 𝑍0 < 𝑍 Τ∝ 2 = −0,833 < 1,96 a hipótese nula não pode ser

descartada.

Ou seja não podemos descartar com 95% de certeza que a resistência

dos freios seja igual a 150 psi.


O P valor pode ser definido como o menor nível de significância que

podemos rejeitar a hipótese nula.

No software Minitab nota-se que o p-value é de 0,405 indicando que

não podemos rejeitar a hipótese nula já que o p-value é maior que

α=0,05.

Pode-se utilizar a função do Excel =DIST.NORMP.N(-

0,833;VERDADEIRO) e obter o resultado 0,202422 e multiplicar por 2

para obter o P valor = 0,404845

Pela tabela (Z) encontramos o valor para P=(0,83) =0,79673 (aprox).

Como o P valor é calculado para testes bilaterais como: 𝑃 =2 1 − Φ 𝑍0 = 2.[1-0,797577635]=0,40484473

Ou seja não podemos descartar a hipótese nula de igualdade da

resistência a 150 psi com o nível de significância de 95% como foi

pedido.


(d) O intervalo de confiança especificado para a condição em que temos

uma população normalmente distribuída com variância conhecida é:

ത𝑦 − 𝑍 Τ∝ 2 Τ𝜎 𝑛 ≤ 𝜇 ≤ ത𝑦 + 𝑍 Τ∝ 2 Τ𝜎 𝑛

148,75 − 1,96𝑥 Τ3 4 ≤ 148,75 ≤ 148,75 + 1,96𝑥 Τ3 4

Assim o intervalo de confiança de 95% da resistência do freio é :

145,81 ≤ 148,75 ≤ 151,69



Variable N Mean StDev SE Mean 60% CI Z PResistência Freios 4 148,75 3,50 1,50 (147,49; 150,01) -0,83 0,405

Podemos testar

ainda 𝐻0 de

igualdade contra a

hipótese que a

média seja igual a

150 psi, diminuindo

a significância para

60%. Pelo software

Minitab obtemos

os valores abaixo.153152151150149148147146145144

X_

Ho

Resistência Freios

Boxplot of Resistência Freios(with Ho and 60% Z-confidence interval for the Mean, and StDev = 3)



Variable N Mean StDev SE Mean 60% CI Z PResistência Freios 4 148,75 3,50 1,50 (147,49; 150,01) -0,83 0,405

Neste caso ficamos

no limite de aprovar

ou descartar a

hipótese H0 com o

nível de significância

de 60%.

Já que 150 psi está

no limite inferior do

IC de 60%.

153152151150149148147146145144

X_

Ho

Resistência Freios

Boxplot of Resistência Freios(with Ho and 60% Z-confidence interval for the Mean, and StDev = 3)


Test of mu = 150 vs > 150The assumed standard deviation = 3

95% LowerVariable N Mean StDev SE Mean Bound Z PC1 4 148,75 3,50 1,50 146,28 -0,83 0,798

153152151150149148147146145144

X_

Ho

C1

Boxplot of C1(with Ho and 95% Z-confidence interval for the Mean, and StDev = 3)

Podemos testar

ainda 𝐻0 de

igualdade contra a

hipótese que a

média seja maior

do que 150 psi.

Pelo software

Minitab obtemos

os valores abaixo.

Exercício 1 - Testes de hipótesesPela tabela Z apêndice I observamos que 𝑍0 está entre 1,64 (prob de 0,94950) e 1,65 (prob de 0,95053), já que o valor a ser procurado é a probabilidade de 0,95 e não mais 0,975 como no teste bilateral. Pelo Excel usando-se a função =INV.NORMP.N(0,95) obtemos o valor 1,644854.

Para rejeitar 𝐻0 𝑑𝑒𝑣𝑒𝑚𝑜𝑠 𝑡𝑒𝑟 𝑎 𝑐𝑜𝑛𝑑𝑖çã𝑜 𝑞𝑢𝑒 𝑍0 > 𝑍∝. Como 𝑍0 = −0,833não é maior que 1,644854, não podemos descartar a hipótese 𝐻0 de igualdade contra a hipótese alternativa que a média seja maior do que 150 psi.

Exercício 1 - Testes de hipótesesObtemos o P valor usando a função excel =DIST.NORMP.N(-0,833;VERDADEIRO),que retorna o valor 0,202422, fazendo (1-0,202422) obtemos 0,797578 que é oP valor. Pelo P valor observamos que a hipótese de igualdade da média a 150psi é forte já que o P valor é alto.

Assim não podemos afirmar que o valor da resistência seja maior do que

150 psi. Desejávamos descartar a hipótese 𝐻0 de igualdade contra a

hipótese que a resistência fosse maior do que 150 psi, já que a condição

estabelecida pelo problema é que a resistência tem que ser de no

mínimo 150 psi.


Duas máquinas são usadas para o enchimento de garrafas plásticas com 16,0ml. O processo de enchimento pode ser assumido como normal, com umdesvio padrão de 𝜎1 = 0,015 𝑒 𝜎2 = 0,018. O departamento de engenhariasuspeita da qualidade das maquinas, se ambas as máquinas encham o mesmovolume ou não. A referência é o volume de 16,0 ml. Um experimento éelaborado pegando amostras aleatórias da saída da cada máquina.

Máquina 1 Máquina 2

16,03 16,01 16,02 16,03

16,04 15,96 15,97 16,04

16,05 15,98 15,96 16,02

16,05 16,02 16,01 16,01

16,02 15,99 15,99 16,00

(a) Estabeleça as hipóteses que

deveriam ser testadas neste

experimento;

(b) Teste estas hipóteses usando

α=0,05. Quais suas conclusões?

(c) Encontre o valor de P para este

teste;

(d) Encontre o intervalo de

confiança de 95%, da média de

preenchimento das duas

máquinas.

Exercício 2 - Testes de hipóteses(a) Estabeleça as hipóteses que deveriam ser testadas neste experimento;Hipóteses:

𝐻0: 𝜇1 = 𝜇2𝐻1: 𝜇1 ≠ 𝜇2

(b) Teste estas hipóteses usando α=0,05. Quais suas conclusões?

𝑍0 =ത𝑦1 − ത𝑦2

𝜎12

𝑛1+𝜎2

2

𝑛2

ത𝑦1 = 16,0150 ത𝑦2 = 16,0050

𝑍0 =16,0150 − 16,0050

0,01510 +

0,01810

= 0,17407765


𝑍 Τ∝ 2 = 𝑍0,025 = 1,960 Pelo excel =INV.NORMP.N(0,975)=1,959964

Critério de Rejeição: |𝑍0 | > 𝑍 Τ∝ 2 ∴ 𝑐𝑜𝑚𝑜 0,1741 < 1,960 portanto não

podemos rejeita 𝐻0.

Exercício 2 - Testes de hipóteses(c) Encontre o valor de P para este teste;

Pode-se utilizar a função do Excel =DIST.NORMP.N(0,1741;VERDADEIRO)

e obter o resultado 0,569106, diminuir de 1 (1-0,569106) e multiplicar por 2

para obter o P valor = 0,861787.

Pela tabela podemos obter o P Valor aproximado já que Z=0,17 indica uma

probabilidade de 0,56749

𝑃 = 2 1 − Φ 𝑍0 = 2[1 − Φ 0,17410 ] =2[1-0,56749]= 2.[0,43251]=0,8650

Como o valor de P é maior do que 0,025 o critério de decisão para uma

hipótese bilateral com =0,05, não podemos rejeitar 𝐻0.

(d) Encontre o intervalo de confiança de 95%, da diferenças das médias de

preenchimento das duas máquinas.

ത𝑋1 − ത𝑋2 + 𝑍 Τ𝛼 2

𝜎12

𝑛1+𝜎2

2

𝑛2> 𝛿 > ത𝑋1 − ത𝑋2 − 𝑍 Τ𝛼 2

𝜎12

𝑛1+𝜎2

2

𝑛2

16,015 − 16,005 ± 1,960,0152

10+0,0182

10

0,01 ± 0,014522 ∴ −0,004522 < 0,01 < 0,024522

Exercício 2 - Testes de hipótesesResolvendo usando-se o Mini Tab.

Sample N Mean StDev SE Mean1 10 16,0150 0,0150 0,00472 10 16,0050 0,0180 0,0057

Difference = mu (1) - mu (2)Estimate for difference: 0,0100095% CI for difference: (-0,00563; 0,02563)T-Test of difference = 0 (vs not =): T-Value =1,35 P-Value = 0,195 DF = 17

Os resultados deram diferentes dos calculados anteriormente, porque o software calcula considerando valores da distribuição t e anteriormente considerou-se distribuição Z.


O tempo de reparo de um instrumento eletrônico é normalmente

distribuído, sendo a variável aleatória medida em horas. Os tempos de

reparo de 16 destes instrumentos escolhidos aleatoriamente estão na

tabela abaixo.

Horas

159 280 101 212

224 379 179 264

222 362 168 250

149 260 485 170

(a) Deseja-se saber se o tempo de reparo

excede 225 horas. Estabeleça as hipóteses

apropriadas;

(b) Teste as hipóteses, quais as conclusões?

Use =0,05;

(c) Encontre o P valor do teste;

(d) Construa o intervalo de confiança de 95% do

tempo médio de reparo.

Exercício 3 - Testes de hipóteses(a) Deseja-se saber se o tempo de reparo excede 225 horas. Estabeleça as

hipóteses apropriadas;

One-Sample T: Tempo de reparo Test of mu = 225 vs not = 225Variable N Mean StDev SE Mean 95% CI T PTempo de reparo 16 241,5 98,7 24,7 (188,9; 294,1) 0,67 0,514

500400300200100

X_

Ho

Tempo de reparo

Boxplot of Tempo de reparo(with Ho and 95% t-confidence interval for the mean)

SE Mean = StDev / RAIZ(n)

Exercício 3 - Testes de hipóteses(a) Deseja-se saber se o tempo de reparo excede 225 horas. Estabeleça as

hipóteses apropriadas;𝐻0: 𝜇 = 225𝐻1: 𝜇 ≠ 225

(b) Teste as hipóteses, quais as conclusões? Use =0,05;

𝑡0 =ത𝑦−𝜇0Τ𝑆 𝑛

critério de rejeição: 𝑡0 > 𝑡 Τ∝ 2;𝑛−1

𝑡0 =241,5 − 225

Τ98,7 16= 0,6687

𝑡 Τ∝ 2;𝑛−1 = 𝑡0,025;15 = 2,131

Pelo Excel =INV.T(0,975;15) = 2,13245Como 𝑡0 < 𝑡0,025;15 ∴ 0,6687 < 2,131 Não podemos descartar 𝐻0.

(c) Encontre o P valor do teste;

Pelo Excel = 𝐷𝐼𝑆𝑇. 𝑇. 𝐵𝐶(0,6687; 15) = 0,513847



Exercício 3 - Testes de hipóteses(d) Construa o intervalo de confiança de 95% do tempo médio de reparo.

𝐼𝐶 𝜇; 1 − 𝛼 : ത𝑋 ± 𝑡 Τ∝ 2𝑆

𝑛⋯ 241,5±2,131

98,7

16⋯241,5 ± 52,58 ∴ 188,92 −

294,08

Exercício 4 - Testes de hipótesesA tabela a seguir mostra os tempos de queima de duas diferentes

formulações químicas combustíveis. O engenheiro projetista está

interessado na média e na variância dos tempos de queima das formulações.

Tipo 1 Tipo 2

65 82 64 56

81 67 71 69

57 59 83 74

66 75 59 82

82 70 65 79

(a) Teste as hipótese que as duas variâncias são

iguais. Use =0,05.

(b) Use os resultados de (a), teste as hipótese que a

média dos tempos de queima são iguais. Use

=0,05. Qual o valor de P para este teste?

(c) Discuta o papel da normalidade assumida neste

problema. Verifique a normalidade das duas

formulações.

Exercício 4 - Testes de hipóteses(a) Teste as hipótese que as duas variâncias são iguais. Use =0,05.Pelo software Minitab obtemos:

Test and CI for Two Variances: Tipo 1; Tipo 2

Method

Null hypothesis Variance(Tipo 1) / Variance(Tipo 2) = 1

Alternative hypothesis Variance(Tipo 1) / Variance(Tipo 2) not = 1

Significance level Alpha = 0,05

Statistics

Variable N StDev Variance

Tipo 1 10 9,264 85,822

Tipo 2 10 9,367 87,733

Ratio of standard deviations = 0,989

Ratio of variances = 0,978

Exercício 4 - Testes de hipóteses(a) Teste as hipótese que as duas variâncias são iguais. Use =0,05.Test and CI for Two Variances: Tipo 1; Tipo 2 95% Confidence Intervals

CI forDistribution CI for StDev Varianceof Data Ratio RatioNormal (0,493; 1,985) (0,243; 3,938)Continuous (0,508; 1,933) (0,258; 3,735)

Tests

TestMethod DF1 DF2 Statistic P-ValueF Test (normal) 9 9 0,98 0,974Levene's Test (any continuous) 1 18 0,00 1,000

Exercício 4 - Testes de hipóteses(a) Teste as hipótese que as duas variâncias são iguais. Use =0,05.

Teste estatístico 𝐹0 =𝑆1

2

𝑆22 =

85,822

87,732= 0,97823

Critério de rejeição: 𝐹0 > 𝐹 Τ∝ 2,𝑛1−1,𝑛2−1 𝑜𝑢 𝐹0 < 𝐹 Τ1−∝ 2,𝑛1−1,𝑛2−1

𝐹 Τ∝ 2,𝑛1−1,𝑛2−1=4,03 ou 𝐹 Τ1−∝ 2,𝑛1−1,𝑛2−1= 0,25

Pelo Excel =INV.F.CD(0,025;9;9) = 4,025994Pelo Excel =INV.F.CD(0,975;9;9) = 0,248386

Como 𝐹0 < 4,03 e 𝐹0 > 0,25não podemos descartar 𝐻0 de igualdade das variâncias.

Podemos determinar o P Valor para o teste F, usando-se a seguinte função

do Excel =DIST.F(0,97823;9;9;VERDADEIRO) =0,487191 e multiplicarmos

por dois por ser hipótese bilateral, onde teremos o valor 0,974382.

Exercício 4 - Testes de hipóteses(b) Use os resultados de (a), teste as hipótese que a média dos tempos de

queima são iguais. Use =0,05. Qual o valor de P para este teste?𝐻0: 𝜇1 = 𝜇2𝐻1: 𝜇1 ≠ 𝜇2

Teste estatístico: 𝑡0 =ത𝑦1−ത𝑦2

𝑆𝑝1

𝑛1+

1

𝑛2

=70,40−70,20

9,31471

10+1

10

= 4,8011 10−2 = 0,048011

𝑆𝑝 =𝑛1 − 1 𝑆1

2 + 𝑛2 − 1 𝑆22

𝑛1 + 𝑛2 − 2=

10 − 1 85,74 + 10 − 1 87,79

10 + 10 − 2

= 9,3147Critério de decisão: 𝑡0 > 𝑡 Τ∝ 2; 𝜈 ∴ 𝜈 = 𝑛1 + 𝑛2 − 2 = 18 ∴ 𝑡 Τ∝ 2; 𝜈 = 𝑡0,025;18 =

2,101 Pelo Excel =INV.T(0,975;18) = 2,100922Como: 𝑡0 > 𝑡 Τ∝ 2; 𝜈 ∴0,048< 2,101 não podemos descartar 𝐻0 de igualdade.

Encontre o P valor do teste;

Pelo Excel =DIST.T.BC(0,048011;18)= 0,962236



Exercício 4 - Testes de hipótesesTwo-sample T for Tipo 1 vs Tipo 2

N Mean StDev SE MeanTipo 1 10 70,40 9,26 2,9Tipo 2 10 70,20 9,37 3,0

Difference = mu (Tipo 1) - mu (Tipo 2)Estimate for difference: 0,2095% CI for difference: (-8,55; 8,95)T-Test of difference = 0 (vs not =): T-Value = 0,05 P-Value = 0,962 DF = 18Both use Pooled StDev = 9,3155

Exercício 4 - Testes de hipóteses(c) Discuta o papel da normalidade assumida neste problema. Verifique a

normalidade das duas formulações.

9080706050

99

95

90

80

70

60

50

40

30

20

10

5

1

Tipo 1

Pe

rce

nt

Mean 70,4

StDev 9,264

N 10

AD 0,344

P-Value 0,409

Probability Plot of Tipo 1Normal

Exercício 4 - Testes de hipóteses(c) Discuta o papel da normalidade assumida neste problema. Verifique a

normalidade das duas formulações.

9080706050

99

95

90

80

70

60

50

40

30

20

10

5

1

Tipo 2

Pe

rce

nt

Mean 70,2

StDev 9,367

N 10

AD 0,186

P-Value 0,876

Probability Plot of Tipo 2Normal

Exercício 4 - Testes de hipóteses(c) Discuta o papel da

normalidade

assumida neste

problema. Verifique a

normalidade das duas

formulações.

Observando os

gráficos de

normalidade das duas

formulações, pode-se

dizer que as duas

formulações podem

ser admitidas como

normais, a segunda

formulação com os

pontos mais próximo

de uma reta que a

primeira formulação.

9080706050

0,04

0,03

0,02

0,01

0,00

Data

De

nsit

y

70,4 9,264 10

70,2 9,367 10

Mean StDev N

Tipo 1

Tipo 2

Variable

Histogram of Tipo 1; Tipo 2Normal

Exercício 5 - Testes de hipótesesCinco medidas do conteúdo de alcatrão em um cigarro X acusaram: 14,5;

14,2; 14,4; 14,8 e 14,1 miligramas por cigarro. Este conjunto de cinco valores

tem média de 14,4 e desvio padrão 0,274. O leitor pretende testar a hipótese

nula Ho: µ=14,1 (conforme declarado no maço) ao nível de 0,05 de

significância.

Ho seria aceita, contra a alternativa Ha: µ≠14,1?

Ho seria aceita, contra a alternativa Ha: µ<14,1?

Ho seria aceita, contra a alternativa Ha: µ>14,1?

Que suposições são necessárias para fazer o teste de hipóteses?

Exercício 5 - Testes de hipótesesTest of mu = 14,1 vs not = 14,1

Variable N Mean StDev SE Mean 95% CI T PC1 5 14,400 0,274 0,122 (14,060; 14,740) 2,45 0,070

Não rejeitamosH0 contra ahipótese que amédia sejadiferente do que14,1.Obs: Podemosver que ointervalo deconfiança emazul inclui H0.


𝑡0 =14,4 − 14,1

Τ0,274 5= 2,44825

Pela tabela 𝑡 Τ∝ 2;𝑛−1 = 𝑡0,025;4 = 2,776

Pelo Excel =INV.T(0,975;4) = 2,7764

Como 𝑡0 < 𝑡0,025;4 ∴ 2,45 < 2,78 Não podemos descartar 𝐻0.

O P Valor do teste;

Pelo Excel = 𝐷𝐼𝑆𝑇. 𝑇. 𝐵𝐶(2,44825; 4) = 0,070578



Exercício 5 - Testes de hipótesesTest of mu = 14,1 vs < 14,1

95% UpperVariable N Mean StDev SE Mean Bound T PC1 5 14,400 0,274 0,122 14,661 2,45 0,965

Não rejeitamos H0contra a hipóteseque a média sejamenor do que14,1.


𝑡0 =14,4 − 14,1

Τ0,274 5= 2,44825

Pela tabela 𝑡∝;𝑛−1 = 𝑡0,05;4 = 2,132

Pelo Excel =INV.T(0,95;4) = 2,131847

Como 𝑡0 > 𝑡0,05;4 ∴ 2,45 > −2,132 não podemos descartar 𝐻0 contra a hipótese que a média seja menor do que 14,1.

O P valor do teste;

Pelo Excel temos que fazer = 𝐷𝐼𝑆𝑇. 𝑇. 𝐶𝐷(2,44825; 4) = 0,035289 depois

diminuir este valor de 1, assim (1-0,035289)=0,964711 que é o P Valor.

Como o valor de P é bem maior do que 0,05 o critério de decisão para uma

hipótese unilateral com =0,05, não podemos rejeitar 𝐻0.

Podemos notar que como o P valor é bem maior do que ∝, ficamos seguros

em rejeitar a hipótese alternativa que a média seja menor do que 14,1.

Exercício 5 - Testes de hipótesesTest of mu = 14,1 vs > 14,1

95% LowerVariable N Mean StDev SE Mean Bound T PC1 5 14,400 0,274 0,122 14,139 2,45 0,035

Rejeitamos H0contra a hipóteseque a média sejamaior do que 14,1.


𝑡0 =14,4 − 14,1

Τ0,274 5= 2,44825

Pela tabela 𝑡∝;𝑛−1 = 𝑡0,05;4 = 2,132

Pelo Excel =INV.T(0,95;4) = 2,131847

Como 𝑡0 > 𝑡0,05;4 ∴ 2,45 > 2,132descartamos 𝐻0 contra a hipótese que a média seja maior do que 14,1.

O P valor do teste;

Pelo Excel temos que fazer = 𝐷𝐼𝑆𝑇. 𝑇. 𝐶𝐷(2,44825; 4) = 0,035289 este já é o P

valor.

Como o valor de P é menor do que 0,05, o critério de decisão, para uma

hipótese unilateral com =0,05, podemos rejeitar 𝐻0.

Podemos notar que como o P valor é menor do que ∝, indicando que

devemos rejeitar a hipótese 𝐻0 que a média seja igual a 14,1.


No exercício 5 fizemos 3 testes de hipóteses.

No primeiro a hipótese de igualdade da média a 14,1, não pode ser

descartada, contra a hipótese alternativa de que a média seria

diferente de 14,1. Assim soubemos que a média era diferente, mas

não sabíamos se para cima ou para baixo de 14,1.

No segundo a hipótese de igualdade da média a 14,1, também não

pode ser descartada, contra a hipótese alternativa de que a média

seria menor do que 14,1. Neste caso o P Valor deu alto, indicando

uma conclusão forte, que a média não era menor do que 14,1.

No terceiro a hipótese de igualdade da média a 14,1, foi descartada,

contra a hipótese alternativa de que a média seria superior a 14,1.

Concluímos assim, estatisticamente, que a média é maior do que

14,1. Indicando que o cigarro está com mais alcatrão que o

permitido.


Observamos pelo exercício que já poderíamos suspeitar que a

média das amostras estavam acima de 14,1 pelo próprio box plot

das amostras e partir diretamente para uma hipótese alternativa que

a média era maior do que 14,1.


Na validação de um método de medição de óxido de etileno em

produtos médicos, fez-se 7 medições de uma substância padrão

que possuía o valor de referência de 1,697 ppm de OE. Determine

com níveis de confiança de 95%, 99% e outros níveis, se os

resultados obtidos validam ou não o método de medição.

OE (ppm)1,7151,5811,9431,8821,9541,9751,715 Fazendo inicialmente o teste

de hipóteses para o nível de confiança de 95%.


2,01,91,81,71,6

X_

Ho

OE

Boxplot of OE(with Ho and 95% t-confidence interval for the mean)


Fazendo agora o testede hipóteses para onível de confiança de99%.

Observa-se que aocontrário do quepensamos é mais fácilaprovar o teste comnível de confiança de99%.

2,12,01,91,81,71,6

X_

Ho

OE



Fazendo agora o testede hipóteses para onível de confiança de92,9%.

Neste caso ficamosna dúvida já que queo p value é igual a pcrítico ou seja 0,071.Note que H0 está nolimite do IC de 92,9%

2,01,91,81,71,6

X_

Ho

OE

Boxplot of OE(with Ho and 92,9% t-confidence interval for the mean)


Fazendo agora o testede hipóteses para onível de confiança de90%.

Neste caso a hipóteseH0 é descartada jáque o P Valor é 0,071e deveria ser maiorou igual a 0,1.

2,01,91,81,71,6

X_

Ho

OE


Testes de hipóteses – Comparação pareada

Em alguns experimentos comparativos podemos aumentar grandemente

a precisão fazendo comparações combinadas aos pares do material. Por

exemplo, considere uma máquina de medição de dureza, que com uma

ponteira pressiona uma amostra, com uma determinada força. Pela

medição da profundidade do afundamento causado pela ponteira, a

dureza do material é determinada. Duas ponteiras diferentes estão

disponíveis pela máquina, embora a precisão (variabilidade) das

medições feitas pelas duas ponteiras seja a mesma, suspeita-se que

uma ponteira produza diferente leitura em relação a outra.

Um experimento poderia ser delineado como a seguir. Um número de

amostras de metal (10) poderia ser aleatoriamente selecionado. Metade

das amostras poderia ser testada por uma ponteira 1 e a outra metade

pela ponteira 2.


Por ser um projeto completamente aleatório, as médias das durezas das

duas amostras podem ser comparadas usando-se um teste t.

Pode haver uma desvantagem deste projeto de aleatorização. Suponha

que as amostras são obtidas em diferentes têmperas, ou que não seja

completamente homogênea entre amostras.

Esta falta de homogeneidade entre as amostras, ira contribuir para a

variabilidade das medições de dureza aumentando o erro experimental.

Para se proteger contra isto um projeto experimental alternativo pode ser

feito. Este projeto pode dividir cada amostra em duas partes,

submetendo, aleatoriamente, cada parte a um tipo de ponteira.


Podemos escrever a modelo estatístico que descreve os dados para

este experimento como:

𝑦𝑖𝑗 = 𝜇𝑖 + 𝛽𝑗 + 𝜖𝑖𝑗 ሼ𝑖 = 1,2 𝑗 = 1,2, … , 10

Onde 𝑦𝑖𝑗 e a medição de dureza da ponteira 𝑖 na amostra 𝑗, 𝜇𝑖 é a média

de dureza da amostra 𝑖 ésima, 𝛽𝑗 é um efeito da dureza devido à 𝑗 ésima

amostra e 𝜖𝑖𝑗 é o erro experimental aleatório com média zero e variância

𝜎𝑖2. Isto é 𝜎1

2 é a variância das medições de dureza com a ponteira 1 e

𝜎22 é a variância das medições de dureza com a ponteira 2.

Note que teremos se computarmos a diferença pareada das amostras.

𝑑𝑗 = 𝑦1𝑗 − 𝑦2𝑗 𝑗 = 1,2, … , 10

A diferença esperada é: 𝜇𝑑 = 𝐸 𝑑𝑗 = 𝐸 𝑦1𝑗 − 𝑦2𝑗 = 𝐸 𝑦1𝑗 − 𝐸 𝑦2𝑗 =

𝜇1 + 𝛽𝑗 − 𝜇2 − 𝛽𝑗 = 𝜇1 − 𝜇2Nota-se que o feito aditivo das amostras 𝛽𝑗 é cancelado quando as

medições pareadas desta forma.


Assim testar a hipótese: 𝐻0: 𝜇1 = 𝜇2 é equivalente a testar:

𝐻0: 𝜇𝑑 = 0𝐻1: 𝜇𝑑 ≠ 0

O teste estatístico para esta hipótese é: 𝑡0 =ത𝑑

Τ𝑆𝑑 𝑛onde ҧ𝑑 =

1

𝑛σ𝑗=1𝑛 𝑑𝑗

é a média da diferença das amostras e

𝑆𝑑 =σ𝑗=1𝑛 (𝑑𝑗 − ҧ𝑑)2

𝑛 − 1

Τ1 2

=σ𝑗=1𝑛 𝑑𝑗

2 −1𝑛(σ𝑗=1

𝑛 𝑑𝑗)2

𝑛 − 1

Τ1 2

É o desvio padrão da diferença .

𝐻0: 𝜇𝑑 = 0 será rejeitada se 𝑡0 > 𝑡 Τ∝ 2;𝑛−1

Este planejamento é usualmente chamado de teste t pareado.


Voltando ao nosso exemplo de

medições de dureza.

ҧ𝑑 =1

𝑛

𝑗=1

𝑛

𝑑𝑗 =1

10−1 = −0,10

𝑆𝑑 =σ𝑗=1𝑛 𝑑𝑗

2 −1𝑛(σ𝑗=1

𝑛 𝑑𝑗)2

𝑛 − 1

Τ1 2

=

=13 −

110

−12

10 − 1

Τ1 2

= 1,20

Supondo =0,05

Amostra

Ponteira 1

Ponteira 2

Diferença

1 7 6 1

2 3 3 0

3 3 5 -2

4 4 3 1

5 8 8 0

6 3 2 1

7 2 4 -2

8 9 9 0

9 5 4 1

10 4 5 -1


Supondo =0,05. Para tomarmos uma

decisão, precisamos determinar 𝑡0 e rejeitar

𝐻0 se 𝑡0 > 𝑡0,025 ;9 = 2,262.

A função Excel =INV.T(0,975;9) retorna

2,262157163.

A função Excel =INV.T(0,025;9) retorna -

2,262157163.

Amostra

Ponteira 1

Ponteira 2

Diferença

1 7 6 1

2 3 3 0

3 3 5 -2

4 4 3 1

5 8 8 0

6 3 2 1

7 2 4 -2

8 9 9 0

9 5 4 1

10 4 5 -1


O valor de 𝑡0 =ത𝑑

Τ𝑆𝑑 𝑛=

−0,10

Τ1,20 10= −0,26

Como 𝑡0 = 0,26 ≯ 𝑡0,025;9 = 2,262 , não

podemos rejeitar a hipótese 𝐻0: 𝜇𝑑 = 0. Ou

seja não evidências que as duas ponteiras

produzam diferentes leituras de dureza.

Amostra

Ponteira 1

Ponteira 2

Diferença

1 7 6 1

2 3 3 0

3 3 5 -2

4 4 3 1

5 8 8 0

6 3 2 1

7 2 4 -2

8 9 9 0

9 5 4 1

10 4 5 -1


Analisando o ensaio notamos que embora 2n=2(10)=20 medições

tenham sido feitas, temos somente n-1=9 graus de liberdade.

Comparando o desvio padrão de todas as 20 medições obtemos o

valor 𝑆𝑝 = 2,32, comparando com o desvio padrão das diferenças

temos 𝑆𝑑 = 1,20, ou seja uma variabilidade quase 50% menor.

Os intervalos de confiança para o ensaio pareado contra a análise

independente são:ҧ𝑑 ± 𝑡0,025;9 Τ𝑆𝑑 𝑛 = −0,10 ± 2,262 Τ1,20 10 = −0,10 ± 0,86

ത𝑦1 − ത𝑦2 ± 𝑡0,025;18𝑆𝑝1

𝑛1+

1

𝑛2= 4,80 − 4,90 ± 2,101 2,32

1

10+

1

10

= −0,10 ± 2,18O intervalo de confiança bem mais estreito da comparação pareada,

ilustra a redução do ruído próprio da blocagem.


Nem sempre a comparação pareada é a melhor escolha, caso a

variação da comparação pareada seja igual ao do ensaio normal,

neste caso a melhor opção é o ensaio normal devido a redução de n-1

graus de liberdade do ensaio pareado.


Exercício resolvido no Minitab:

Pelo P Valor = 0,798 não podemos afirmar que as ponteiras sejam diferentes.

Exercício teste de hipóteses

Produtos médicos foram submetidos à esterilização com óxido etileno.

Após o processo de esterilização os resíduos devem ser removidos, já

que são nocivos à saúde humana. São aceitos limites máximos de 25

ppm.

Utilizando o worksheet Minitab_worksheet_comp_residuos.MTW que

contém os resíduos de óxido etileno e etilenocloridrina. Faça os testes

de hipóteses necessários para comprovar se o produto cateter está

dentro dos limites de norma de 25 ppm.

Teste 1.


Teste 1.

5004003002001000

X_

Ho

Cateter OE

Boxplot of Cateter OE(with Ho and 95% t-confidence interval for the mean)


Teste 2.

5004003002001000

X_

Ho

Cateter OE



Teste 3.

5004003002001000

X_

Ho

Cateter OE


Testes de hipóteses – Proporçõesestudos baseados na dist normal

O mesmo teste de hipóteses feito com respeito às médias pode ser

feito com relação a dados obtidos na forma de proporções.

Exercício:

Um estudo foi projetado para investigar se um certo detonador usado

em explosivos de uma mina de cal, atingem o requisito de 90% de

funcionamento. No teste realizado com 200 detonadores, 174

funcionaram adequadamente. Determine com 95% de certeza se o

detonador está dentro das especificações de 90% de funcionamento.

Resolvendo o exercício pelo Minitab sem maiores explicações da

formulação utilizada temos:


Exercício:

No teste realizado com 200 detonadores, 174 funcionaram

adequadamente, resolução pelo Minitab.

Exercício:

No teste realizado com 200 detonadores, 174 funcionaram

adequadamente, resolução pelo Minitab.

Concluímos que não podemos descartar a hipótese que a proporção

de detonadores que funcionam adequadamente seja igual a 90%. Já

que o p value deu 0,079, portanto maior do que 0,05 , valor de .


Exercício:

Um estudo mostra que 16 de 200 bebes recém natos apresentam

complicações em um hospital A. Um hospital B tem uma taxa de 14

complicações para 400. Para um nível de confiança de 99%, podemos

afirmar que o hospital B é melhor que o hospital A para os recém

natos?

Hipótese nula 𝑝𝐴 = 𝑝𝐵Hipótese alternativa 𝑝𝐴 > 𝑝𝐵


Exercício:

Hipótese nula 𝑝𝐴 = 𝑝𝐵 16/200 = 14/400

Hipótese alternativa 𝑝𝐴 > 𝑝𝐵


Exercício:

Hipótese nula 𝑝𝐴 = 𝑝𝐵 16/200 = 14/400

Hipótese alternativa 𝑝𝐴 > 𝑝𝐵

Concluindo podemos descartar a hipótese de igualdade das

proporções contra a hipótese alternativa que 𝑝𝐴 > 𝑝𝐵. Esta conclusão

pode ser tirada já que o p valor = 0,009 é menor que =0,01.


A maioria das medições industriais usam escalas, micrometros e

outros dispositivos que fornecem diretamente a medida física de um

produto. Contudo, as vezes as medidas são subjetivas, classificações

e avaliações, por exemplo: a) Classificação da fábrica pelo tipo de

defeito; b) Classificação da solda como boa ou ruim; c) Ranking da

qualidade do vinho na escala de 1 a 10; d) Ranking das bolhas de ar

no vidro na escala de 1 a 5;

Usa-se Análise de atributos para avaliar a consistência e a correção

em rankings subjetivos.

- Avaliações da taxa de acerto do avaliador em relação a um padrão;

- Avaliação entre os avaliadores;

- Consistência das avaliações de um mesmo avaliador.

Testes baseados em atributos

Uma das preocupações em testes baseados em atributos é a

consistência dos avaliadores. Por exemplo um mesmo avaliador pode

avaliar um vinho com alta pontuação e em um segundo momento,

avaliar o mesmo vinho com baixa pontuação.

Caso não se confie na consistência dos avaliadores, não se pode

confiar nos dados que eles reportam.

Uma análise de atributos pode ajudar a decidir se os avaliadores são

consistentes nas suas pontuações.

Análises também podem ser feitas levando-se em conta padrões

estabelecidos e as avaliações dos avaliadores.


Tipos de dados

As variáveis devem ser colocadas em colunas de dados numéricos ou

texto. Os dados podem ser tipo binário (good/bad), nominal

(blue/yellow/red) ou ordinal (ruim/razoável/bom). Deve-se distinguir as

respostas de acordo com o avaliador e tentativa.

Para se criar uma planilha de atributos no Minitab, use o Create

Attribute Agreement Analysis Worksheet.


Exercício

Dois avaliadores avaliaram três substâncias, cada uma duas vezes.

Tem-se um padrão de referência, para comparar os resultados.


Os dados devem ser

colocados no formato doMinitab.

Exercício

Dois avaliadores avaliaram três substâncias, cada uma duas vezes.

Tem-se um padrão de referência, para comparar os resultados.


Analisando a consistência dos resultados dos dois avaliadores.

Testes baseados em atributosExercício

Caso os avaliadores tenham duas ou mais avaliações do mesmo

item, pode-se avaliar a consistência do avaliador. Deve-se observar

que aqui não se faz uma comparação com o padrão, assim mesmo

que as avaliações sejam consistentes, elas não sãonecessariamente corretas.

No exercício houve

coincidência de duas das

três avaliações feitas,

para os dois avaliadores,

Jim e Vanessa, ou seja

66,67% IC95% (9,43;99,16).


Utilizando o coeficiente kappa para comparar os resultados dos

avaliadores, tem-se que kappa=1 caso haja perfeita concordância dos

resultados, caso kappa = 0 a concordância é aleatória. Valores

negativos é uma concordância menor do que a aleatória. Valores de

kappa menores do que 0,7, indicam que o sistema de mensuração

precisa melhorias. Valores de kappa maiores que 0,9 são consideradosexcelentes.


Tem-se a comparação estatística conforme a estatística kappa para

cada resposta e geral, assim pode-se responder à questão: “Os

avaliadores tem dificuldades com uma resposta em particular?”

Um teste de hipóteses é feito com as hipóteses:

H0: A concordância do avaliador é igual a aleatória.H1: A concordância do avaliador não é igual a aleatória.


Analisando os resultados abaixo pode-se observar que os avaliadores

Jim e Vanessa não apresentam resultados consistentes. A média geral

dos dois para o p valor é de 0,0603 valor este que não permitedescartar a hipótese de aleatoriedade dos resultados obtidos.


Coeficiente de concordância de Kendall expressa o grau de

associação entre as várias avaliações feitas por um avaliador. Ele usa

informações sobre as classificações relativas e é sensível à gravidadedo erro de classificação.

O coeficiente de concordância de Kendall é possível de ser obtido

quando o avaliador faz duas ou mais avaliações da mesma unidade.

Com 3 ou mais níveis o coeficiente Kendall pode ser calculado.

O coeficiente de concordância de Kendall pode variar de 0 a 1, quanto

maior o coeficiente de Kendal mais forte é a associação.

O p valor testa as hipóteses:

H0: Não há associação entre os vários rankings de um mesmo

avaliador;

H1: Os rankings de um mesmo avaliador estão associados entre si.


Para o exemplo observa-se que os rankings de um mesmo avaliador

estão associados entre si, já que os p valores deram valores acima de

, descartando a hipótese H0.

Observa-se que embora as classificações dos avaliadores possam ser

consistentes, elas podem não ser corretas, já que não faz-se um

comparação com o padrão estabelecido.


Caso tenha-se um padrão pode-se avaliar a assertividade de cada

avaliador.

No caso do avaliador Jim ele acertou 1 de 3 avaliações feitos, ou seja

33,33% - IC95% (0,84; 90,57). No caso do avaliador Vanessa esta

acertou 2 de 3 avaliações, ou seja 66,67% IC95% (9,43; 99,16).


Caso tenha-se um padrão pode-se avaliar a assertividade de cada

avaliador.

No caso do

avaliador Jim ele

acertou 1 de 3

avaliações feitos,

ou seja 33,33% -

IC95% (0,84; 90,57).

No caso do

avaliador Vanessa

esta acertou 2 de 3

avaliações, ou seja

66,67% IC95% (9,43;

99,16).VanessaJim

100

80

60

40

20

0

Appraiser

Pe

rce

nt

95,0% C I

Percent

VanessaJim

100

80

60

40

20

0

Appraiser

Pe

rce

nt

95,0% C I

Percent

Date of study:

Reported by:

Name of product:

Misc:

Assessment Agreement

Within Appraisers Appraiser vs Standard


O primeiro gráfico mostra o porcentual de concordância das avaliações

de um mesmo avaliador. O segundo o porcentual de concordância das

avaliações dos avaliadores com o padrão.

O círculo azul

indica o porcentual

de acerto atual;

A linha vermelha

mostra o intervalo

de confiança do

acerto;

E os Xs indicam os

limites inferior e

superior do

intervalo de

confiança.VanessaJim

100

80

60

40

20

0

Appraiser

Pe

rce

nt

95,0% C I

Percent

VanessaJim

100

80

60

40

20

0

Appraiser

Pe

rce

nt

95,0% C I

Percent

Date of study:

Reported by:

Name of product:

Misc:

Assessment Agreement

Within Appraisers Appraiser vs Standard


Utilizando a estatística de Fleiss´Kappa para avaliar a assertividade

dos avaliadores, teremos kappa =1 caso haja uma perfeita

concordância, se kappa =0 a concordância é a mesma esperada para

aleatoriedade. Kappa menores que 0,7 indicam que o sistema de

medição precisa de melhorias e Kappa acima de 0,9 indicam que o

sistema é excelente.


H0: A concordância entre os avaliadores e o padrão é aleatória;

H1: A concordância entre os avaliadores e o padrão não é aleatória.


Para o exemplo em estudo observa-se que para a resposta 4 o

avaliador Jim apresenta perfeita concordância com o padrão Kappa = 1

e p valor 0,0072. No entanto para a resposta 10 o avaliador Jim está

abaixo da aleatoriedade com p valor 0,6879.


O coeficiente de correlação médio de Kendall é um coeficiente de

correlação entre todas as avaliações de um mesmo avaliador.

Coeficiente de concordância de Kendall expressa o grau de

associação entre as várias avaliações feitas por um avaliador. Ele usa

informações sobre as classificações relativas e é sensível à gravidadedo erro de classificação.

O coeficiente de Kendall pode variar de -1 até 1. Um valor positivo

indica uma associação positiva e um valor negativo indica uma

associação negativa. Quanto maior o coeficiente maior a associação.


H0: A concordância dos rankings são devido a aleatoriedade;

H1: A concordância dos rankings não são devido a aleatoriedade.


Observa-se para o exemplo que com os p valor são altos (maior que )

não podemos descartar a hipótese da aleatoriedade H0.





Observa-se para o exemplo que com os p valor são altos (maior que )

não podemos descartar a hipótese da aleatoriedade H0.





No exercício pode-se determinar o quanto cada avaliador concorda

com o outro.

Observa-se um índice de 33,33% de concordância entre os

avaliadores IC95% (0,84; 90,57).


No exercício pode-se determinar a concordância entre os avaliadores e

a resposta.

No exemplo observa-se uma boa concordância entre os avaliadores

somente para a resposta 4.


H0: A concordância entre os avaliadores e devido a aleatoriedade;

H1: A concordância entre os avaliadores não é devido a aleatoriedade.


No exercício pode-se avaliar a concordância geral entre os avaliadores

e o padrão estabelecido.


H0: A concordância entre os avaliadores e o padrão é devido a

aleatoriedade;

H1: A concordância entre os avaliadores e o padrão não é devido a

aleatoriedade;


No exercício pode-se avaliar a concordância geral entre os avaliadores

e o padrão estabelecido.


H0: Não há associação entre os rankings dos avaliadores e o padrão

estabelecido;

H1: Há associação entre os rankings dos avaliadores e o padrão

estabelecido.

Documents

Aula 1 –Planejamento e Análise de Experimentos · 2016. 4. 5. · Testes de hipóteses –média 1) Definir as hipóteses estatísticas; A hipótese estatística é uma suposição