26
Estatíst Estatíst ica ica Aula 23 Aula 23 Universidade Federal de Alagoas Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Prof. Marllus Gustavo Ferreira Passos das Neves Neves

Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

Embed Size (px)

Citation preview

Page 1: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

EstatísticaEstatísticaAula 23Aula 23

Universidade Federal de AlagoasUniversidade Federal de AlagoasCentro de Tecnologia

Prof. Marllus Gustavo Ferreira Passos das NevesProf. Marllus Gustavo Ferreira Passos das Neves

Page 2: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

Aula 23Aula 23

Teste de Hipóteses para 3 ou mais médias: Teste de Hipóteses para 3 ou mais médias: ANOVA fator únicoANOVA fator único

Page 3: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médias

Objetivo: dadas 3 ou mais amostras, verificar a hipótese de igualdade de 3 ou mais médias populacionais

Suponha que a equipe de engenheiros de uma fábrica de papel desconfia que a porcentagem (concentração) de madeira de lei na fabricação aumenta a resistência à tensão.

Eles resolvem fazer experimentos com 4 níveis de concentração: 5%, 10%, 15% e 20%, fabricando 6 corpos de prova para cada nível, totalizando 24 corpos de prova

Page 4: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médiasO quadro abaixo o experimento com os resultados

Observações

Concentração de madeira de lei

5% 10% 15% 20%

1 7 12 14 19

2 8 17 18 253 15 13 19 224 11 18 17 235 9 19 16 186 10 15 18 20

Médias 10,00 15,67 17,00 21,17

Neste tipo deexperimento, há um único fator concentração de madeira de Lei.

O fator no nosso exemplo possui 4 níveis chamados de tratamentos

Cada tratamento teve 6 observações 6 replicatas

Page 5: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médias

A pergunta a ser respondida: o nível do fator ou os diferentes tratamentos fazem melhorar a resistência à tensão do papel?

Outro Exemplo: testar a hipótese de que o CRs acumulados médios dos alunos de engenharia são diferentes para 3 diferentes populações: iniciantes, intermediários e concluintes.

Os dados estão a seguir amostras de tamanhos iguais a 30

Quem é o fator? Quem são os tratamentos?

Page 6: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médias

Hipóteses:

H0: 1 = 2 = 3 = ...

H1: pelo menos uma é diferente das demais

População/estatística

Iniciantes

Intermediários

Concluintes

n 30 30 30

Média amostral 6,564 6,736 7,105

s 1,739 1,148 1,041

Usaremos a chamada análise de variância (ANOVA) médias muito diferentes ocasionam variância entre elas alta

Page 7: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

Ideia geral do teste: como se supõe que as populações têm variâncias iguais, ou seja,1

2 = 22 = 3

2 = ... = 2, estimamos 2 com 2 abordagens diferentes. Com a estatística F descobriremos se estas 2 abordagens possuem estimativas muito direfentes F alto ou parecidas F próximo de 1. O 1º caso será evidência em favor de H1 e o 2º caso em favor de H0

Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médias

Quais são as Quais são as 2 2 abordagens?abordagens?

Variância entre amostras (variância devido ao tratamento)

Variância dentro das amostras (variância devido ao erro)

Page 8: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médias

amostras das dentro variânciaamostras entre variância

F

Médias muito diferentes ocasionam variância entre elas alta (variância entre amostras) F alto Região de rejeição rejeitamos H0 evidência contra a igualdade de médias Médias parecidas ocasionam variância entre elas baixa (variância entre amostras) F baixo Região de não rejeição não rejeitamos H0 evidência a favor da igualdade de médias

População/estatística

Iniciantes

Intermediários

Concluintes

n 30 30 30

Média amostral 6,564 6,736 7,105

s 1,739 1,148 1,041

numeradordenominad

or

Page 9: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médias

Suposições:

1)As amostras são independentes umas das outras;2)As populações têm distribuições que são aproximadamente normais3)As populações têm a mesma variância (exigência leve tamanhos de amostras iguais podem ter variâncias bem diferentes: a maior ser até 9 vezes a menor os resultados ainda são confiáveis)4)Amostras aleatórias5)As amostras são de populações que são categorizadas de uma só maneira

Page 10: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

Exemplo (continuação): testar a hipótese de que o CRs acumulados médios dos alunos de engenharia são diferentes para 3 diferentes populações: iniciantes, intermediários e concluintes. População/estatística

Iniciantes

Intermediários

Concluintes

n 30 30 30

Média amostral 6,564 6,736 7,105

s 1,739 1,148 1,041

numeradordenominad

or

2,2920,076430ns2X

1,8083

(1,041)(1,148)(1,739)s

2222p

AplicaçõesAplicações

Page 11: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

AplicaçõesAplicações

1,2681,8082,292

s

nsF 2

p

2X

Como sempre achar o valor crítico de F da tabela

Para = 0,05 e graus de liberdade:

glnumerador = k – 1 = 3 – 1 = 2gldenominador = k.(n – 1) = 3.(30 – 1) = 87

onde k é o no de amostras e n o tamanho das amostras (por enquanto o mesmo para todas elas)

Page 12: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

AplicaçõesAplicações

A tabela não possui 87, mas sim 60 e 120, cujos valores são 3,1504 e 3,0718. Tomando o valor médio, temos

Fc = 3,111

Como F = 1,268 < Fc = 3,111

não há evidência estatística suficiente, ao nível de significância de 5%, para afirmar que as 3 médias sejam diferentes

Page 13: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

Inferência sobre 3 ou mais médiasInferência sobre 3 ou mais médias

Esse foi o caso da aplicação da ANOVA de um critério ou ANOVA de fator único, pois usamos uma única característica ou propriedade para categorizar populações. Essa característica é, algumas vezes chamada de tratamento ou fator.

Outra observação: os tamanhos das amostras foram iguais, o que facilitou bastante o cálculo e o entendimento

A seguir veremos como fica o caso de amostras A seguir veremos como fica o caso de amostras com tamanhos diferentescom tamanhos diferentes

Page 14: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentesPara o caso de amostras com tamanhos diferentes, também usamos a estatística F como a razão entre duas estimativas diferentes da variância populacional comum 2, mas agora elas envolvem medidas ponderadas

Variação dentro das amostras (erro)

1)(n

1)s(n

1-k

x-xn

F

i

2ii

ii

2

Variação entre as médias das amostras (tratamento)

Page 15: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentes

k

1)(n

1)s(n

1-k

x-xn

F

i

2ii

ii

2

Média de todos os valores amostrais combinados

x

No de médias populacionais sendo comparadas

ni

ix

2is

Média dos valores da i-ésima amostra

Variância dos valores da i-ésima amostra

No de valores da i-ésima amostra

Page 16: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentes

k = 3 3 médias populacionais sendo comparadas: 1, 2 e 3

x

Amostra 1

Amostra 2 Amostra 3

a1 b1 c1

a2 b2 c2

b3

Suponhamos 3 amostras (tabela abaixo)

n1 = 2

n2 = 3n3 =

2

321

2132121

nnnccbbbaa

x

média de todosos valores amostraiscombinados

1x

21s

2x

22s

3x

23s

médias amostrais

variâncias amostrais

= 7

Page 17: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentes

x

Amostra 1

Amostra 2 Amostra 3

a1 b1 c1

a2 b2 c2

b3

Suponhamos 3 amostras (tabela abaixo)

n1 = 2

n2 = 3n3 =

2

7ccaa

x 3221

...

1x 21s2x 2

2s3x 23s

2222

x-xnx-xnx-xnx-xn 332211ii 233

222

211

2ii 1)s(n1)s(n1)s(n1)s(n

e

1)(n1)(n1)(n1)(n 321i

1)(n

1)s(n

1-k

x-xn

F

i

2ii

ii

2

Page 18: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentesHá uma nomenclatura para estes somatórios

onde SQ = Soma dos quadrados

SQ(erro)1)s(n1)s(n1)s(n1)s(n 233

222

211

2ii

ou SQ(dentro das amostras)

nto)SQ(tratamex-xnx-xnx-xnx-xn 332211ii 2222

ou SQ(entre amostras) ou SQ(entre grupos) ou SQ(fator)

Dividindo SQ(tratamento) e SQ(erro) por seus respectivos graus de liberdade MQ(tratamento) e MQ(erro)

onde MQ = Média quadrática

Page 19: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentes

1knto)SQ(tratame

nto)MQ(tratame

k-NSQ(erro)

MQ(erro)

onde N = n1 + n2 + n3 no total de valores em todas as amostras combinadas

3 - N 1)(n1)(n1)(n1)(n 321i k do nosso exemplo

Page 20: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

Então para testarmos a hipótese de diferenças de 3 ou mais médias

H0: 1 = 2 = 3 = ...H1: pelo menos uma é diferente das demais

ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentes

MQ(erro)nto)MQ(tratame

F Estatística de teste:

amostras) das MQ(dentroamostras) MQ(entre

F gl = k - 1 gl = N - k

Page 21: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

Este tipo de teste costuma ser feito com o auxílio da tabela ANOVA

ANOVA fator único: amostras de tamanhos ANOVA fator único: amostras de tamanhos diferentesdiferentes

Col 1 Col 2 Col 3 Col 4 Col 5

Fonte de variação

Soma dos Quadrados

(SQ)

Graus de liberdad

e

Média Quadrática (MQ)

Estatística de teste F

Tratamento

k - 1 Num = Col 2/Col 3 Num / Den

Erro N - k Den = Col 2/Col 3

TotalN - 1

2

x-xn ii

2ii 1)s(n

Page 22: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

AplicaçõesAplicações

Um engenheiro ambiental está analisando o efeito da vazão de um efluente contaminado com chumbo na concentração de saída do chumbo em um sistema de tratamento. A tabela abaixo apresenta o resultado dos ensaios realizados com 5 vazões diferentes.

a) Há qualquer diferença na concentração de saída do chumbo devido à variação na vazão? Use = 0,05

Page 23: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

AplicaçõesAplicações

Uso do Statdisk

Page 24: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

AplicaçõesAplicações

Page 25: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

AplicaçõesAplicações

Revisitando o teste dos CRs acumulados

Page 26: Estatística Aula 23 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves

EstatísticaEstatísticaAula 23Aula 23

Universidade Federal de AlagoasUniversidade Federal de AlagoasCentro de Tecnologia

Prof. Marllus Gustavo Ferreira Passos das NevesProf. Marllus Gustavo Ferreira Passos das Neves