28
Inferência Estatística

5 - Inferência Estatística (Minitab)

Embed Size (px)

Citation preview

Page 1: 5 - Inferência Estatística (Minitab)

Inferência Estatística

Page 2: 5 - Inferência Estatística (Minitab)

1 - Introdução Diversos problemas da Engenharia e outras ciências requerem que decidamos entre aceitar ou rejeitar uma afirmação acerca de algum parâmetro. Essa afirmação é chamada de hipótese e o procedimento de tomada de decisão sobre a hipótese é chamado de teste de hipóteses. Para se realizar um teste de hipótese estatística, retira-se uma amostra da população em estudo, com base nessa amostra e utilizando um estimador não tendencioso do parâmetro toma-se a decisão de rejeitar ou aceitar a afirmação. De uma forma geral, a estrutura do teste de hipóteses é:

(i) H0: θ = θ0 (ou ≥) (2) H0: θ = θ0 (ou ≤) (3) H0: θ = θ0 H1: θ < θ0 H0: θ > θ0 H1: θ ≠ θ0

Nessa estrutura, H0 é chamado de hipótese nula e H1 é chamada de hipótese alternativa. Em (i), temos o teste unilateral esquerdo, que irá testar desvios no parâmetro que sejam inferiores ao valor a ser testado. Em (ii), temos o teste unilateral direito, que irá testar desvios no parâmetro que sejam superiores ao valor a ser testado. Em (iii), temos o teste bilateral, que testa diferenças no parâmetro em ambos os lados. Um conceito importante a ser definido é o nível de significância α, que é utilizado para se definir as regiões de aceitação e rejeição do teste de hipóteses. O valor mais utilizado é 5%, que é o valor a ser utilizado nesse curso. Outro importante conceito é o P-value (ou Valor P) que é o menor nível de significância que conduz à rejeição da hipótese nula H0 com os dados fornecidos. Quando uma estimativa de um parâmetro não fornece informação suficiente é interessante fazermos o intervalo de confiança para um parâmetro.

2 - Inferência Estatística para uma Única Amostra 2.1 - Inferência Estatística sobre a Média Sabemos que a média amostral é um estimador não tendencioso da média populacional µ, assim de posse de uma amostra, deve-se calcular o valor da média amostral para se testar hipóteses sobre a média populacional.

2.1.1 - Uso da Distribuição Normal Para utilizar-se a distribuição normal considera-se que a população de origem seja normalmente distribuída, ou que as condições do Teorema Central do Limite sejam satisfeitas. Assim, a distribuição da média amostral é aproximadamente normal, com média µ e variância σ2/n. De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses:

(1)H0: µ = µ0 (ou ≥) (2)H0: µ = µ0 (ou ≤) (3)H0: µ = µ0 H1: µ < µ 0 H1: µ > µ 0 H1: µ ≠ µ 0 A estatística de testes a ser utilizada é:

Page 3: 5 - Inferência Estatística (Minitab)

Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas: - Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {Z < - 1,645}; - Para o Teste Unilateral Direito, a região crítica será: Rc = {Z > 1,645 }; - Para o Teste Bilateral, a região crítica sera: Rc = {│Z│> 1,96}.

(1) (2) (3)

Figura 1 – Gráficos da estatística de teste, com suas respectivas regiões críticas Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0. A tomada de decisão também pode ser feita utilizando-se o P-value:

- rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α

Para o teste bilateral teremos o seguinte intervalo de confiança:

EXEMPLO 1 Proposta: Testar a média de uma população, quando o desvio padrão da população for conhecido. Problema: Considere que uma indústria compra de um certo fabricante, pinos cuja resistência média à ruptura é especificada em 12 kgf (valor nominal da especificação). Em um determinado dia, a indústria recebeu um grande lote de pinos e a equipe técnica da industria deseja verificar se o lote atende às especifições. Considere o desvio padrão como igual 4 e que a resistência à ruptura é normalmente distribuída. Adote um nível de significância de 5%. Tem-se interesse em testar as seguintes hipóteses:

H0: µ = 12 H1: µ ≠ 12

A região crítica será: Rc = {│Z│> 1,96}. Ferramentas: 1-Sample Z

Page 4: 5 - Inferência Estatística (Minitab)

Fonte de dados: TH-1.mpj 1-SAMPLE Z 1. Abra o arquivo TH-1 2. Selecione Static > Basic Statics > 1-Sample Z 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK SAÍDA DO MINITAB One-Sample Z: Resistência Média à Ruptura; Resistência Média à Ruptura Test of mu = 12 vs not = 12 The assumed standard deviation = 4 Variable N Mean StDev SE Mean 95% CI Z P Resistência Média 22 13,4773 3,1954 0,8528 (11,8058; 15,1487) 1,73 0,083 INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a 1,73. Esse valor encontrado não pertence à região crítica, logo não rejeitamos a hipótese nula H0 e rejeitamos a hipótese alternativa H1.

Page 5: 5 - Inferência Estatística (Minitab)

Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos um P-value igual a 0,083, que é maior que o nível de significância α adotado (0,05). Logo não rejeitamos a hipótese nula H0. CONCLUSÃO Há evidências estatísticas para considerarmos que a resistência média à ruptura dos pinos produzidos pelo fabricante seja realmente igual a 12, assim esses pinos estão dentro das especificações estabelecidas. INTERVALO DE CONFIANÇA De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança:

IC(µ; 0,95) = (11,8058; 15,1487)

A interpretação é que temos 95% de chances de encontrarmos valores de resistência à ruptura dentro do Intervalo de Confiança acima. Como o Intervalo de Confiança acima contém o 12, podemos concluir então que a resistência média à ruptura dos pinos produzidos pelo fabricante seja realmente igual a 12.

2.1.2 Uso da Distribuição T-Student Utilizar-se a distribuição T-Student quando o desvio-padrão é desconhecido e o tamanho da amostra é menor que 30. Se a população for normalmente distribuída, podemos utilizar o desvio-padrão amostral s para estimar o desvio-padrão populacional σ. De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses:

(1)H0: µ = µ0 (ou ≥) (2)H0: µ = µ0 (ou ≤) (3)H0: µ = µ0

H1: µ < µ 0 H1: µ > µ 0 H1: µ ≠ µ 0 A estatística de testes a ser utilizada é:

Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas:

- Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {T < - t 0,05; n-1}; - Para o Teste Unilateral Direito, a região crítica será: Rc = {T > t 0,05; n-1}; - Para o Teste Bilateral, a região crítica sera: Rc = {│T│> t 0,025; n-1}.

Page 6: 5 - Inferência Estatística (Minitab)

(i) (ii) (iii)

Figura 2 – Gráficos da estatística de teste, com suas respectivas regiões críticas Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0. A tomada de decisão também pode ser feita utilizando-se o P-value:

- rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α Para o teste bilateral teremos o seguinte intervalo de confiança:

EXEMPLO 2 Proposta: Testar a média da população, quando o desvio padrão da população for desconhecido (não importando o tamanho da amostra). Problema: O exemplo é o mesmo anterior, só que agora o desvio-padrão não é conhecido. Tem-se interesse em testar as seguintes hipóteses:

H0: µ = 12 H1: µ ≠ 12

A região crítica será: Rc = {│T│> t 0,025; 21} => Rc = {│T│> 2,08}. Ferramentas 1-Sample T Fonte de dados: TH-1.mpj 1-SAMPLE T

Page 7: 5 - Inferência Estatística (Minitab)

1. Abra o arquivo TH-1 2. Selecione Static > Basic Statics > 1-Sample T 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK

SAÍDA DO MINITAB

One-Sample T: Resistência Média à Ruptura Test of mu = 12 vs not = 12 Variable N Mean StDev SE Mean 95% CI T P Resistência Média 22 13,4773 3,1954 0,6813 (12,0605; 14,8940) 2,17 0,042

INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a 2,17. Esse valor encontrado pertence à região crítica, logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1. Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos um P-value igual a 0,042, que é menor que o nível de significância α adotado (0,05), logo rejeitamos a hipótese nula H0. CONCLUSÃO

Page 8: 5 - Inferência Estatística (Minitab)

Há evidências estatísticas fortes para considerarmos que a resistência média à ruptura dos pinos produzidos pelo fabricante seja diferente de 12, assim esses pinos não estão dentro das especificações estabelecidas. UTILIZANDO O INTERVALO DE CONFIANÇA De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança:

IC(µ; 0,95) = (12,0605; 14,8940)

A interpretação é que temos 95% de chances de encontrarmos valores de resistência à ruptura dentro do Intervalo de Confiança acima. Como o Intervalo de Confiança acima não contém o 12, podemos concluir então que a resistência média à ruptura dos pinos produzidos pelo fabricante não seja igual a 12. Como o intervalo de confiança está um pouco acima do 12, podemos considerar que o valor da resistência média à ruptura desses pinos seja superior ao valor especificado. 2.2 - Inferência sobre a Proporção de uma População Freqüentemente, é necessário testar hipóteses e construir intervalos de confiança para a proporção de uma população. Se o número de sucessos e o número de fracassos forem pelo menos iguais a 5, a distribuição de amostragem de uma proporção irá seguir aproximadamente uma normal. As hipóteses a serem testadas são:

(1)H0: p = p0 (ou ≥) (2)H0: p = p0 (ou ≤) (3) H0: p = p0 H1: p < p0 H1: p > p0 H1: p ≠ p0 Nesse caso, a estatística de testes a ser utilizada é:

Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas:

- Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {Z < - 1,645}; - Para o Teste Unilateral Direito, a região crítica será: Rc = {Z > 1,645 }; - Para o Teste Bilateral, a região crítica sera: Rc = {│Z│> 1,96}.

Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0. A tomada de decisão também pode ser feita utilizando-se o P-value:

- rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α

Para o teste bilateral teremos o seguinte intervalo de confiança:

Page 9: 5 - Inferência Estatística (Minitab)

EXEMPLO 3 Proposta: Testar a proporção de uma população. Problema: Um fabricante de semicondutores produz controladores usados em aplicações no motor de automóveis. O consumidor requer que a fração defeituosa em uma etapa crítica de fabricação não exceda 0,05 e que o fabricante demonstre uma capacidade de processo nesse nível de qualidade, usando um nível de significância de 5%. O fabricante dos semicondutores retira uma amostra aleatória de 200 aparelhos e encontra que 4 deles são defeituosos. O fabricante pode demonstrar uma capacidade de processo para o consumidor? Tem-se interesse em testar as seguintes hipóteses:

Temos a seguinte Hipótese: H0: p = 0,05 H1: p <0,05

A região crítica será: Rc = { Z < - 1,645} Ferramentas 1-Proportion Fonte de Dados: 1 - PROPORTION 1. Abra o MINITAB 14; 2. Selecione Static > Basic Statics > 1-Proportion; 3. Preencha o quadro de acordo a figura seguinte:

Page 10: 5 - Inferência Estatística (Minitab)

4. Clique em Options; 5. Preencha o quadro de acordo a figura seguinte:

6. Clique em OK;

SAÍDA DO MINITAB

Test and CI for One Proportion Test of p = 0,05 vs p < 0,05 95% Upper Sample X N Sample p Bound Z-Value P-Value

Page 11: 5 - Inferência Estatística (Minitab)

1 4 200 0,020000 0,036283 -1,95 0,026

INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a -1,95. Esse valor encontrado pertence à região crítica, logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1. Obtivemos um P-value igual a 0,026, que é menor que o nível de significância α adotado (0,05), logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1. CONCLUSÃO Há evidências estatísticas fortes para considerarmos que proporção defeituosa do processo é menor que 0,05. Assim o fabricante de semicondutores demonstra uma capacidade de processo no nível de qualidade requerida pelo seu consumidor. UTILIZANDO O INTERVALO DE CONFIANÇA De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança:

IC(µ; 0,95) = ( ≤ 0,036283)

A interpretação é que temos 95% de chances de encontrarmos proporções de controladores que sejam no máximo iguais a 0,036283.

2.3 - Teste de Normalidade

Em muitos casos é importante testarmos a normalidade da população estudada. Nos teste anteriores, fazíamos a suposição de normalidade.

Para o teste de Normalidade, as hipóteses a serem testadas são: Ho: X é aproximadamente normal – X ~ N(µ, σ2) H1: A População X não é normalmente distribuída No MINITAB 14, podemos plotar um gráfico de Normalidade, se os pontos estiverem bem

alinhados, pode-se considerar que a população seja normalmente distribuída. Esse julgamento é subjetivo, podendo se também calcular o valor de 3 diferentes Estatísticas

de Teste: Anderson-Darling, Ryan-Joiner e Kolmogorov-Smirnov. A tomada de decisão também é feita utilizando-se o P-value: - rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α

EXEMPLO 4 Proposta: Problema: Teste se a Resistência Media à Ruptura é normalmente distribuída. Ferramentas: Normality Test Probability Plot

Page 12: 5 - Inferência Estatística (Minitab)

Fonte de dados: TH-1.mpj NORMALITY TEST 1. Abra o MINITAB 14 2. Selecione Static > Basic Statics > Normality Test 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK SAÍDA DO MINITAB

Page 13: 5 - Inferência Estatística (Minitab)

Resistência Média à Ruptura

Perc

ent

22,520,017,515,012,510,07,55,0

99

95

90

80

70

60504030

20

10

5

1

Mean

>0,150

13,71StDev 3,554N 22KS 0,085P-Value

Gráfico de Normalidade para a Resistência Média à RupturaNormal

INTERPRETAÇÃO DOS RESULTADOS Obtivemos um P-value ligeiramente inferior a 0,15, que é maior que o nível de significância α adotado (0,05), logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1.

CONCLUSÃO Há evidências estatísticas para se aceditar a Resistência à Ruptura dos pinos seja normalmente distribuída. 3 - Inferência Estatística para uma Duas Amostras Agora iremos expandir os resultados anteriormente obtidos para comparações entre duas populações independentes.

3.1 - Inferência Sobre Diferença de Médias No MINITAB 14, temos apenas 2 aplicações: quando as variâncias são desconhecidas e iguais e quando as variâncias são desconhecidas e diferentes. Devemos considerar que as 2 populações de interesse sejam normalmente distribuídas e independentes.

3.1.1 - Inferência Sobre Diferença de Médias com Variâncias Desconhecidas e Iguais

Nesse caso, é necessário supor que as variâncias das duas populações sejam iguais σ12 = σ2

2 = σ2.

De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses: (1)H0: µ1 – µ2 = ∆0 (ou ≥) (2) H0:µ1 – µ2 = ∆0 (ou ≤) (3) H0: µ1 – µ2 = ∆0 H1: µ1 – µ2 < ∆0 H1: µ1 – µ2 = ∆0 H1: µ1 – µ2 ≠ ∆0

Page 14: 5 - Inferência Estatística (Minitab)

A estatística de testes a ser utilizada é:

onde Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas: - Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {T < - t 0,05; n+m-2}; - Para o Teste Unilateral Direito, a região crítica será: Rc = {T > t 0,05; n+m-2}; - Para o Teste Bilateral, a região crítica sera: Rc = {│T│> t 0,025; n+m-2}.

Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a

hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0. A tomada de decisão também pode ser feita utilizando-se o P-value: - rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α Para o teste bilateral teremos o seguinte intervalo de confiança:

EXEMPLO 5 Proposta: Testar a diferença entre as médias de duas poluações. Problema: Dois catalisadores estão sendo analisados para determinar como eles afetam o rendimento médio de um processo químico. Especificamente, o catalisador 1 está correntemente um uso, mas o catalisador 2 aceitável. Já que o catalisador 2 é mais barato, ele deve ser adotado se não alterar o rendimento do processo. Um teste é feito em uma planta piloto. Há alguma diferença entre os rendimentos médios? Considere as variâncias iguais. Nesse caso, as hipóteses a serem testadas são:

H0: µ1 – µ2 = 0 → H0: µ1 = µ2 H1: µ1 – µ2 ≠ 0 → H1: µ1 ≠ µ2

A região crítica será: Rc = {│T│> t 0,025; 14} => Rc = {│T│> 2,145}. Ferramentas: 2-Sample T Fonte de dados: TH2.mpj 2-SAMPLE T

Page 15: 5 - Inferência Estatística (Minitab)

1. Abra o arquivo TH-2 2. Selecione Static > Basic Statics > 2-Sample T 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK SAÍDA DO MINITAB Two-Sample T-Test and CI: Catalisador 1; Catalisador 2 Two-sample T for Catalisador 1 vs Catalisador 2 N Mean StDev SE Mean Catalisador 1 8 92,26 2,39 0,84 Catalisador 2 8 92,73 2,98 1,1 Difference = mu (Catalisador 1) - mu (Catalisador 2) Estimate for difference: -0,477500 95% CI for difference: (-3,373886; 2,418886) T-Test of difference = 0 (vs not =): T-Value = -0,35 P-Value = 0,729 DF = 14 Both use Pooled StDev = 2,7009

INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a -0,35. Esse valor encontrado não pertence à região crítica, logo não rejeitamos a hipótese nula H0 e rejeitamos a hipótese alternativa H1.

Page 16: 5 - Inferência Estatística (Minitab)

Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos um P-value igual a 0,729, que é maior que o nível de significância α adotado (0,05), logo não rejeitamos a hipótese nula H0. CONCLUSÃO Há evidências estatísticas fortes para considerarmos que o catalisador 2 não altere o rendimento médio do processo químico, assim seu rendimento pode ser considerado como igual ao rendimento médio do catalisador 1. Logo, por ser mais barato, o catalisador 2 pode substituir o catalisador 1 nessa indústria. UTILIZANDO O INTERVALO DE CONFIANÇA De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança:

IC(µ1 – µ2; 0,95) = (-3,373886; 2,418886)

A interpretação é que temos 95% de chances de encontrarmos diferenças entre o rendimento dos catalisadores no processo químico que se encontrem dentro do intervalo de confiança acima calculado. Como o Intervalo de Confiança acima contém o 0, podemos concluir os rendimentos do processo químico utilizando ambos catalisadores seja aproximadamente iguais.

3.1.1 - Inferência Sobre Diferença de Médias com Variâncias Desconhecidas e Diferentes Nesse caso, é necessário supor que as variâncias das duas populações sejam iguais σ1

2 ≠ σ22.

De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses:

(1)H0: µ1 – µ2 = ∆0 (ou ≥) (2) H0:µ1 – µ2 = ∆0 (ou ≤) (3) H0: µ1 – µ2 = ∆0 H1: µ1 – µ2 < ∆0 H1: µ1 – µ2 = ∆0 H1: µ1 – µ2 ≠ ∆0

A estatística de testes a ser utilizada é:

onde Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas:

- Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {T < - t 0,05; ν}; - Para o Teste Unilateral Direito, a região crítica será: Rc = {T > t 0,05; ν }; - Para o Teste Bilateral, a região crítica sera: Rc = {│T│> t 0,025; ν }.

Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0.

Page 17: 5 - Inferência Estatística (Minitab)

A tomada de decisão também pode ser feita utilizando-se o P-value:

- rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α

Para o teste bilateral teremos o seguinte intervalo de confiança:

EXEMPLO 6 Proposta: Problema: Considere o exemplo anterior, mas agora temos variâncias diferentes.

Nesse caso, as hipóteses a serem testadas são: H0: µ1 – µ2 = 0 → H0: µ1 = µ2 H1: µ1 – µ2 ≠ 0 → H1: µ1 ≠ µ2 A região crítica será: Rc = {│T│> t 0,025; 13} => Rc = {│T│> 2,16}.

Ferramentas 2-Sample T Fonte de dados: TH-2.mpj 2 – SAMPLE T 1. Abra o arquivo TH-2; 2. Selecione Static > Basic Statics > 2-Sample T; 3. Preencha o quadro de acordo a figura seguinte:

Page 18: 5 - Inferência Estatística (Minitab)

4. Clique em OK SAÍDA DO MINITAB Two-Sample T-Test and CI: Catalisador 1; Catalisador 2 Two-sample T for Catalisador 1 vs Catalisador 2 N Mean StDev SE Mean Catalisador 1 8 92,26 2,39 0,84 Catalisador 2 8 92,73 2,98 1,1 Difference = mu (Catalisador 1) - mu (Catalisador 2) Estimate for difference: -0,477500 95% CI for difference: (-3,394928; 2,439928) T-Test of difference = 0 (vs not =): T-Value = -0,35 P-Value = 0,729 DF = 13

INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a -0,35. Esse valor encontrado não pertence à região crítica, logo não rejeitamos a hipótese nula H0 e rejeitamos a hipótese alternativa H1. Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos um P-value igual a 0,729, que é maior que o nível de significância α adotado (0,05), logo não rejeitamos a hipótese nula H0. Conclusão

Page 19: 5 - Inferência Estatística (Minitab)

Há evidências estatísticas fortes para considerarmos que o catalisador 2 não altere o rendimento médio do processo químico, assim seu rendimento pode ser considerado como igual ao rendimento médio do catalisador 1. Logo, por ser mais barato, o catalisador 2 pode substituir o catalisador 1 nessa indústria. UTILIZANDO O INTERVALO DE CONFIANÇA De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança:

IC(µ1 – µ2; 0,95) = (-3,394928; 2,439928)

A interpretação é que temos 95% de chances de encontrarmos diferenças entre o rendimento dos catalisadores no processo químico que se encontrem dentro do intervalo de confiança acima calculado. Como o Intervalo de Confiança acima contém o 0, podemos concluir os rendimentos do processo químico utilizando ambos catalisadores seja aproximadamente iguais. 3.2 - Teste t Emparelhado É um caso especial de testes t para duas amostras onde X e Y são variáveis que representam a primeira e a segunda medição de uma característica de interesse. Nesse caso, espera-se que exista alguma correlação entre essas duas medições. Para cada par de medições deve-se calcular a diferença entre as Y e X:

Di = Yi - Xi Supõe-se que Di ~ N(µD, σD

2), onde µD = µY – µX e σD2 é a variância de Di (desconhecida).

(1)H0: µD = ∆0 (ou ≥) (2) H0: µD = ∆0 (ou ≤) (3) H0: µD = ∆0 H1: µD < ∆0 H1: µD = ∆0 H1: µD ≠ ∆0

Que equivale a: (1)H0: µY – µX = ∆0 (ou ≥) (2) H0: µY – µX = ∆0 (ou ≤) (3) H0: µY – µX = ∆0 H1: µY – µX < ∆0 H1: µY – µX = ∆0 H1: µY – µX ≠ ∆0

A estatística de teste utilizada é:

Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas:

- Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {T < - t 0,05; n-1}; - Para o Teste Unilateral Direito, a região crítica será: Rc = {T > t 0,05; n-1}; - Para o Teste Bilateral, a região crítica sera: Rc = {│T│> t 0,025; n-1}.

Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0. A tomada de decisão também pode ser feita utilizando-se o P-value:

- rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α

Para o teste bilateral teremos o seguinte intervalo de confiança:

Page 20: 5 - Inferência Estatística (Minitab)

EXEMPLO 7 Proposta: Testar a diferença entre as médias de duas populações, quando as populações forem dependentes. Problema: Um artigo no Journal of Strain Analysis (1983, Vol.18, N°2) compara vários métodos para predizer a resistência de cisalhamento para traves planas metálicas. Dados para dois desses métodos, os procedimentos de Karlsruhe e Lehigh, quando aplicados a nove traves específicas, são mostrados a seguir. Considere os dados como normalmente distribuídos. Nesse caso, as hipóteses a serem testadas são:

H0: µK – µL = 0 → H0: µD = 0 H1: µK – µL ≠ 0 → H1: µD ≠ 0 A região crítica será: Rc = {│T│> t 0,025; 8} => Rc = {│T│> 2,306}.

Ferramentas Paired t Arquivo de dados: TH-3.mpj PAIRED T 1. Abra o arquivo TH-3; 2. Selecione Static > Basic Statics > Paired t; 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em OK;

Page 21: 5 - Inferência Estatística (Minitab)

SAÍDA DO MINITAB Paired T-Test and CI: Método de Karlsruhe; Método de Lehigh Paired T for Método de Karlsruhe - Método de Lehigh N Mean StDev SE Mean Método de Karlsr 9 1,34011 0,14603 0,04868 Método de Lehigh 9 1,06622 0,04938 0,01646 Difference 9 0,273889 0,135099 0,045033 95% CI for mean difference: (0,170042; 0,377736) T-Test of mean difference = 0 (vs not = 0): T-Value = 6,08 P-Value = 0,000

INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a 6,08. Esse valor encontrado pertence à região crítica, logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1. Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos um P-value aproximadamente igual a 0, que é menor que o nível de significância α adotado (0,05), logo rejeitamos a hipótese nula H0. CONCLUSÃO Não há evidências estatísticas para considerarmos que dois os métodos de previsão da resistência não forneçam resultados iguais. Os dados indicam que o método de Karlsruhe produz, em média, previsões maiores para a resistência do que o método de Lehigh. UTILIZANDO O INTERVALO DE CONFIANÇA De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança:

IC(µD; 0,95) = (0,170042; 0,377736)

A interpretação é que temos 95% de chances de encontrarmos diferenças nas previsões da resistência dos que se encontrem dentro do intervalo de confiança acima calculado. Como o Intervalo de Confiança acima não contém o 0, podemos concluir que as previsões de resistência utilizando os 2 métodos são diferentes. Como o intervalo é positivo, concluímos que o método de Karlsruhe produz, em média, previsões maiores para a resistência do que o método de Lehigh. 3.3 - Inferência sobre as Variâncias de Duas Populações Normais Devemos supor que as duas populações de origem sejam normais e independentes distribuídas, com médias µ1 e µ2, com variâncias σ1

2 e σ22.

De acordo com a estrutura apresentada anteriormente, podemos testar as seguintes hipóteses:

H0: σ1

2 = σ22 → H0: σ1

2/ σ22 = 1

H1: σ12 ≠ σ2

2 → H1: σ12/ σ2

2 ≠ 1

Page 22: 5 - Inferência Estatística (Minitab)

A estatística de testes a ser utilizada é:

Adotando-se um nível de significância de 5%, teremos a seguinte região crítica:

- Rc = { F > f 0,025; n – 1; m -1 ou F < f 0,975; n – 1; m -1}.

Figura 3 – Gráficos da estatística de teste, com suas respectivas regiões críticas

Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0. A tomada de decisão também pode ser feita utilizando-se o P-value:

- rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α

Para o teste bilateral teremos o seguinte intervalo de confiança:

Onde

EXEMPLO 8 Proposta: Problema: Considere os exemplos 6 e 7, agora iremos testar se as variâncias dos rendimentos ao se utilizar os catalisadores 1 e 2 são iguais. Adote um nível de 5% de significância. Nesse caso, as hipóteses a serem testadas são:

H0: σ12 = σ2

2 → H0: σ12/ σ2

2 = 1 H1: σ1

2 ≠ σ22 → H1: σ1

2/ σ22 ≠ 1

A região crítica será: Rc = { F < f 0,975; 7; 7 ou F > f 0,025; 7; 7 }.

Page 23: 5 - Inferência Estatística (Minitab)

Rc = { F < 0,200204 ou F> 4,994909 } Ferramentas 2 Variances Fontes de dados: TH-2.mpj 2 VARIANCES 1. Abra o arquivo TH-2 2. Selecione Static > Basic Statics > 2 Variances 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em Options 5.Preencha o quadro de acordo com a figura seguinte

6. Clique em OK

Page 24: 5 - Inferência Estatística (Minitab)

SAÍDA DO MINITAB Test for Equal Variances: Catalisador 1; Catalisador 2 95% Bonferroni confidence intervals for standard deviations N Lower StDev Upper Catalisador 1 8 1,49210 2,38502 5,46285 Catalisador 2 8 1,86648 2,98345 6,83355 F-Test (normal distribution) Test statistic = 0,64; p-value = 0,569 Levene's Test (any continuous distribution) Test statistic = 0,31; p-value = 0,589

INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a 0,64. Esse valor encontrado não pertence à região crítica, logo não rejeitamos a hipótese nula H0 e rejeitamos a hipótese alternativa H1. Também podemos utilizar o P-value para interpretar os resultados: nesse caso, obtivemos um P-value igual a 0,569, que é maior que o nível de significância α adotado (0,05), logo não rejeitamos a hipótese nula H0. CONCLUSÃO Há evidências estatísticas para considerarmos as variâncias dos rendimentos do processo utilizando os catalisadores 1 e 2 sejam iguais. UTILIZANDO O INTERVALO DE CONFIANÇA

Page 25: 5 - Inferência Estatística (Minitab)

Analisando o gráfico dos intervalos de confiança para os catalisadores 1 e 2, podemos ver que o ponto central do intervalo de confiança do catalisador 1 está dentro dos limites do intervalo de confiança do catalisador 2 e vice-versa, logo, podemos considerar que as variâncias dos catalisadores 1 e 2 sejam iguais.

3.3 Inferência sobre Proporções de Duas Populações Freqüentemente, é necessário comparar proporções de duas populações distintas, onde há 2 parâmetros binomiais de interesse: p1 e p2. Para amostras grandes, podemos fazer a aproximação da binomial pela normal. As hipóteses a serem testadas são:

(1)H0: p1 - p2 = 0 (ou ≥) (2)H0: p1 - p2 = 0 (ou ≤) (3) H0: p1 - p2 = 0 H1: p1 - p2 < 0 H1: p1 - p2 > 0 H1: p1 - p2 ≠ 0 Nesse caso, a estatística de testes a ser utilizada é:

Onde Adotando-se um nível de significância de 5%, teremos as seguintes regiões críticas:

- Para o Teste Unilateral Esquerdo, a região crítica será: Rc = {Z < - 1,645}; - Para o Teste Unilateral Direito, a região crítica será: Rc = {Z > 1,645 }; - Para o Teste Bilateral, a região crítica sera: Rc = {│Z│> 1,96}.

Se o valor observado da Estatística de Teste pertencer à região crítica, deve-se rejeitar a hipótese nula H0, caso contrário não rejeita-se a hipótese nula H0.

A tomada de decisão também pode ser feita utilizando-se o P-value: - rejeita-se a hipótese nula se: P-value ≤ α - não rejeita-se a hipótese nula se: P-value > α O Intervalo de confiança no caso bilateral será:

EXEMPLO 9 Proposta: Problema: Dois tipos diferentes de solução de polimento estão sendo avaliados para possível uso em uma operação de polimento na fabricação de lentes intra-oculares usadas no olho humano depois de uma operação de catarata. Trezentas lentes foram polidas usando a primeira solução de polimento e desse número, 235 não tiveram defeitos induzidos pelo polimento. Outras 300 lentes foram polidas, usando a segunda solução depolimento, sendo 196 lentes

Page 26: 5 - Inferência Estatística (Minitab)

consideradas satisfatória. Há qualquer razão para acreditar que a primeira solução de polimento seja melhor que a segunda? Adote α=0,05. Tem-se interesse em testar as seguintes hipóteses: Temos a seguinte Hipótese:

H0: p1 - p2 = 0 → H0: p1 = p2 H1: p1 - p2 > 0 → H1: p1 > p2

A região crítica será: Rc = {│ Z│ < 1,645} Ferramentas 2-Proportion Fonte de dados: 2 – PROPORCION 1. Abra o MINITAB 14; 2. Selecione Static > Basic Statics > 2-Proportion 3. Preencha o quadro de acordo a figura seguinte:

4. Clique em Options; 5. Preencha o quadro de acordo a figura seguinte:

Page 27: 5 - Inferência Estatística (Minitab)

6. Clique em OK SAÍDA DO MINITAB

Test and CI for Two Proportions Sample X N Sample p 1 253 300 0,843333 2 196 300 0,653333 Difference = p (1) - p (2) Estimate for difference: 0,19 95% lower bound for difference: 0,133131 Test for difference = 0 (vs > 0): Z = 5,36 P-Value = 0,000

INTERPRETAÇÃO DOS RESULTADOS Assim, vemos que a estatística de teste observada foi igual a 5,36. Esse valor encontrado pertence à região crítica, logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1. Obtivemos um P-value igual a 0,000, que é menor que o nível de significância α adotado (0,05), logo rejeitamos a hipótese nula H0 e não rejeitamos a hipótese alternativa H1. CONCLUSÃO Há evidências estatísticas fortes para considerarmos que a primeira solução tenha um desempenho superior ao da segunda lente. A proporção de lentes sem defeitos que foram polidas com a primeira solução é maior que a proporção de lentes sem defeitos polidas com a segunda solução. UTILIZANDO O INTERVALO DE CONFIANÇA De acordo com a saída do MINITAB 14, temos o seguinte Intervalo de Confiança:

IC(p1 – p2; 0,95) = ( ≥ 0,133131)

Page 28: 5 - Inferência Estatística (Minitab)

A interpretação é que temos 95% de chances de encontrarmos diferenças entre a proporção de lentes sem defeitos utilizando a primeira solução e a utilizando a segunda solução sejam no mínimo iguais a 0,133131.