Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)1
“Pensar estatisticamente será um dia, para a eficiente prática da
cidadania, tão necessário como a habilidade de ler e escrever.”
H. G. Wells (Escritor, considerado o pai da moderna Ficção Científica, 1895)
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)2
Processo
Fatores Incontroláveis (ruído)
Fatores Controláveis
Entrada Saída
...
...x1 x2 xp
z1 z2 zq
y1
y2
ym
Motivação das empresas para estudo e uso de Estatística:
Foco no Processo: Um dos principais requisitos da ISO 9001:2000
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)3
X•Pressão de ar air strip•Pressão de ar air bag•Pressão de ar front piston•Pressão Hidráulica•Temperatura•Vazão de óleo Solúvel•Pressão do Nitrogênio
Y•Espessura da parede Top Wall•Espessura da Parede Mid Wall•Profundidade do Dome•Altura da Lata•Visualização
Processo Bodymaker de fabricação de latas
Z•Operador•Rede Elétrica•Qualidade da Bobina
Exemplo de Processo
Aplicação: Pense em um problema similar em sua área de atuação
É complexo inferir sobre X,Y e Z sem Estatística!
Y=f(X)+Z
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)4
DO THE REAL
THING!
Faça anotações! Aplicando os conhecimentos na sua área é a únicaforma de sedimentá-los!
Cone of Learning
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)5
Statgame e Statquiz(Interessante para verificar
o conhecimento básico)
Recursos de Software
O uso de recursos computacionais tornou os cálculos atividades fáceis permitindo uma maior ênfase na compreensão e interpretação dos resultados
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)6
Pratique:
1. Gere a planilha ao lado e entenda a diferença entre Worksheet e Project. Observe o que é Session.
2. Calcule as principais Estatísticas Descritivas da planilha gerada.
Siga o caminho: <Stat> <Basic Statistics> <Graphical Summary>
3. Navegue no Statguide
4. Navegue pelo Tutorial do Minitab
5. Observe os ícones para Worksheet, Session, Show Graphs Folder e Edit Last Dialog
www.minitab.comwww.e-academy.com
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)7
6. Gere uma série de 100 valores aleatórios que poderia simular uma variabilidade em Temperatura;
Use <Calc> <Random Data> <Normal Distribution> e inclua os parâmetros convenientes (Ex.: Média=100, S=10).
7. Calcule as principais estatísticas descritivas da planilha usando Graphical Summary. Faça outros gráficos.
8. Entenda o procedimento <Calc> <Set Base>?
9. Salve a planilha na Desktop com um nome qualquer.
10. Feche o programa minitab e depois abra a planilha que você salvou.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)8
Obtenha domínio sobre o Minitab a partir do arquivo minitab.pdf.
Um bom Material de Apoio
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)9
Uma ótima bibliografia:
Montgomery, D.C., Runger, G.C., Estatística Aplicada e Probabilidade para Engenheiros, 2ª ed., LTC Livros Técnicos e Científicos, 2002, 461 p.
Não deixe de ler:Fora de Série (Outliers) – Malcolm Gladwell –Editora Sextante – Descubra por que algumas pessoas tem sucesso e outras não
Uma Senhora Toma Chá – David Salsburg –Editora Zahar – Como a estatística revolucionou a ciência no século XX
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)10
SUMÁRIO
1 – Estatística Descritiva
2 – Distribuições de Probabilidade
3 – Estimação e Intervalos de Confiança
4 – Testes de Hipótese
5– Análise de Variância
6 – Correlação e Regressão
7– Testes de Independência
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)
11
1 - Estatística Descritiva
“Deus não joga dados com o universo” (Albert Einstein)
“Os experimentos geralmente não são determinísticos” (Fisher)
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)12
A essência da ciência é a observação. Estatística: A ciência que se preocupa com a organização, descrição, análise e interpretação dos dados experimentais. Ramo da Matemática Aplicada. A palavra estatística provêm de Status.
Do que trata a Estatística
Estatística Básica (Anova, TH, Regressão)
Séries Temporais
Data Mining
Six Sigma
Redes Neurais
Controle de Qualidade
Estatística Bayseana
Simulação / PO
DOE /Taguchi /RSM
Análise do Sistema de Medição
Estatística Multivariada
Amostragem / Pesquisa
Confiabilidade
Caos
Em 1662, John Graunt publicou os primeiros informes estatísticos. Era sobre nascimento e mortes.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)13
A População (ou Distribuição) é a coleção de todas as observações potenciais sobre determinado fenômeno.
O conjunto de dados efetivamente observados, ou extraídos, constitui uma Amostra da população.
Um Censo é uma coleção de dados relativos a Todos os elementos de uma população.
Um Parâmetro está para a População assim como uma Estatística está para a Amostra.
População e Amostra
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)14
Variável
Qualitativa
Quantitativa
Ordinal
Nominal
Discreta
Contínua
Ex.: Para uma população de peças produzidas em um determinado processo, poderíamos ter:
Variável TipoEstado: Perfeita ou defeituosa Qualitativa NominalQualidade: 1a, 2a ou 3a categoria Qualitativa OrdinalNo de peças defeituosas Quantitativa DiscretaDiâmetro das peças Quantitativa Contínua
(Também Dados Categóricos ou de Atributos)
Tipos de Dados
(Variáveis)
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)15
Aplicação: Gere sequências de valores aleatórios que represente problemas em sua área.
O que significa o procedimento <Calc> <Set Base>?
Amostragem: Gere a sequência 1 2 3 ...100.
<Calc> <Make Patterned Data>
Selecione uma amostra com 10 valores a partir das sequências geradas anteriormente.
Use <Calc> Random Data> <Sample from Column>
<Calc> <Random Data> Números Aleatórios
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)16
Aplicação:
Gere uma sequência de dados que represente um processo em sua área e calcule as estatísticas desse conjunto de dados.
Use:
<Random> e
<Graphical Summary>
Ex.:Número de acessos à página do Site da Empresa durante os últimos 100 dias úteis.
<Graphical Summary>
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)17
Medidas de Posição: Média
xx x x
n
x
nn
ii
n
=+ + +
==
∑1 2 1L
∑
∑
=
==++++++
= n
ii
n
iii
n
nn
p
px
ppppxpxpxx
1
1
21
2211
L
L
Aritmética Simples
Aritmética Ponderada
+...+
+...+
+...+
Um pouco sobre arredondamento de médias:Tome uma decimal acima da dos dados: Ex.: 2,4 3,4 e 5,7 => média =3,73
Em várias operações, arredonde apenas o resultado final
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)18
Chama-se Robert
Pesa 78 Kg
Manequim 48
85 cm de cintura
Consome anualmente 8,5 Kg massa, 11,8Kg de bananas, 1,8 Kg de batatas fritas, 8,15Kg de sorvete e 35,8 Kg de carne.
Vê TV por ano 2567 horas
Recebe anualmente 585 “coisas” por correio (cartas e outros)
Diariamente dorme 7,7 horas, gasta 21 minutos para chegar ao trabalho e trabalha 6,1 horas
Um Cidadão Americano “Médio”
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)19
~xn o
=+⎛
⎝⎜
⎞⎠⎟
12
termo ~x
n n
=
⎛⎝⎜
⎞⎠⎟ + +
⎛⎝⎜
⎞⎠⎟
2 21
2
o o
termo termo
{ }35 36 37 38 40 40 41 43 46 40, , , , , , , , ~⇒ =x
{ }12 14 14 15 16 16 17 2015 16
215 5, , , , , , , ~ ,⇒ =
+=x
Ex.:
Se n é ímpar: Se n é par:
Medidas de Posição: Mediana
Mediana é o valor “do meio” de um conjunto de dados dispostos em ordem crescente ou decrescente.
Inconveniente: Não considera todos os valores da amostra!
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)20
Média x Mediana
x = 345 7,~x = 300
Ex.: { 200, 250, 250, 300, 450, 460, 510 }
Ambas são boas medidas de Tendência Central.
Prefira a média
x
{ 200, 250, 250, 300, 450, 460, 2300 }
= 601~x = 300
Devido ao Outlier 2300, a mediana é
melhor estatística que a média.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)21
Medidas de Dispersão
Rode e Entenda o programa Interativo da
PQ Systems
Discuta:
1) Porque os bancos adotam fila única?
2) “Por favor, com quantos dias de antecedência eu devo postar uma carta de aniversário para minha mãe?”
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)22
A = { 3, 4, 5, 6, 7 }B = { 1, 3, 5, 7, 9 }C = { 5, 5, 5, 5 }D = { 3, 5, 5, 7 }E = { 3.5, 5, 6.5 }
Uma medida de Posição não ésuficiente para descrever um conjunto de dados. Os Conjuntos ao lado mostram isso! Eles possuem mesma média, sendo diferentes.
Algumas medidas de Variabilidade:
Amplitude (H): Tem o inconveniente de levar em conta apenas os dois valores extremos:
HÁ =7-3=4
Variabilidade
Amplitude=Range
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)23
Considerando os desvios em relação à média, temos, para A, por exemplo:
A = { 3, 4, 5, 6, 7 } xxi - {-2, -1, 0, 1, 2}
Medidas de Dispersão
0)(1 11
≡−=−=− ∑ ∑∑= ==
xnxnxxxxn
i
n
ii
n
iiInconveniente:
Uma opção para analisar os desvios das observações é:considerar o total dos quadrados dos desvios.
( )x xii
− = + + + + ==∑ 2
1
5
4 1 0 1 4 10
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)24
Desvio Padrão
.
( )x x
n
ii
n
−=∑ 2
1
Associando ao número de elementos da amostra (n), tem-se:
...que é a Variância ( Var(x))S2 =
S S= 2 ...que é o Desvio Padrão (DP(x)), uma medida que é expressa na mesma unidade dos dados originais
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)25
Dispersão: Fórmulas Alternativas
( )21
2
1
2
2 xn
x
n
xxn
ii
n
ii
−=−
=∑∑
==σ( )
Sx x
n
ii
n
2
2
1
1=
−
−=∑
Variância Amostraln-1 está
Relacionado a um problema de tendenciosidade
Variância Populacional(σ2 ou σn
2 )
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)26
Média = 3 Média = 3
Soma daúltima coluna= 10
Soma daúltima coluna= 10
Divide a Soma por (n-1):= Variância = S2
= 2,5
Divide a Soma por (n-1):= Variância = S2
= 2,5
X =Soma dos pontos de dados
Número dos pontos de dados
X54312
X210-2-1
( )X X−41041
( )X X−2
Raiz Qadrada da Variância = Desv.Pa. = S= 1,58
Raiz Qadrada da Variância = Desv.Pa. = S= 1,58
S S= 2
Calcular a Variância e o Desvio Padrão de X
S2
Exemplo
Uma Regra Prática para
conjunto de dados típicos:
S=Amplitude/4
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)27
Média da PopulaçãoN
X=µ
N
1i∑
=i
Média da Amostra
Desvio Padrão da População σµ
=(X )
N
i2
i=1
N
−∑
Desvio Padrão da Amostra
x =x
n
ii=1
n
∑
s =(X )
N -1
i2
i=1
N
−∑ X
Expressões para Média e Variância
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)28
25%
50%
75%109
104
99
94
DBP
* Outlier ( fora da distância do Q3 + 1,5D )
Q3=75ª Percentil
Observação Máxima
Q1=25ª Percentil
Q2=Mediana (50ª Percentil)
D=Q3-Q1
InterquartilEDA (Exploratory Data Analysis) e Método dos
Cinco Números
Outra Estratégia: Percentis e Boxplot
Boxplot é desgastante quando feito sem computador pois supõe a ordenação de dados.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)29
Valor do meio
Quartis:
Q1=Quarta Observação Crescente=71.7
Q3=Quarta Observação Decrescente=150.6
Outliers: Q3+1.5D=150.6+1.5(150.6-71.7)=268.95
São outliers valores maiores que 268.95
Percentis e Boxplot
2.(n+1)/4 0
3.(n+1)/4 0
(n+1)/4 0
Para valores não inteiros dos quartis,
usa-se interpolação
graficos.mtw
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)
30
Escores padronizados (z)
zx x
sii=
− x
Grupo Peso médio Desvio PadrãoA 66.5 kg 6.38 kgB 72.9 kg 7.75 kg
Ex.: Dois grupos de pessoas acusam os seguintes dados:
e 3,238,6
5,662,81 : em =−
=AzA 95,175,7
9,7288 : em =−
=BzB
xi - considera o afastamento de xi em relação à média.
A divisão por s torna s como unidade ou padrão de medida.
Nesses grupos há duas pessoas que pesam respectivamente, 81.2 kg e 88.0 kg.
Logo, a pessoa de A revela um maior excesso relativo de peso.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)31
ϕ(z)
z
xµ-3σ µ -2σ µ -σ µ µ+σ µ+2σ µ+3σ
-3 -2 -1 0 1 2 3
Distribuião Normal Reduzida ou Padronizada
σµ−
=xz);(: σµNX Z: N(0; 1)
Tal fórmula está tabelada e fornece valores acumulados
Qual o formato da curva acumulada?
Distribuição Normal
N(0,1) é a distribuição Benchmark
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)32
Escores padronizados (z)
zx x
sii=
−
Uma mulher deu à luz um filho 308 dias após a visita de seu marido que serve na marinha dos EUA. Sabendo-se que uma gravidez normal tem média de 268 dias e desvio-padrão de 15 dias, determine se o tempo de gravidez da mulher pode ser considerado comum.
O marido tem razão de se preocupar?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)33
Escores padronizados (z)
zx x
sii=
−
Regra 68 -- 95 -- 99Cerca de 68% dos valores estão a menos de 1 desvio padrão a
contar da média (-1 < z < 1)
Cerca de 95% dos valores estão a menos de 2 desvios padrão a contar da média (-2 < z < 2)
Cerca de 99% dos valores estão a menos de 3 desvios padrão a contar da média (-3 < z < 3)
Regra 68 -- 95 -- 99
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)34
Assimetria (Skewness)
Próximo de 0: Simétrico
Menor que 0: Assimétrico àEsquerda
Maior que 0: Assimétrico àDireita
Achatamento (Kurtosis)
Próximo de 0: Pico Normal
Menor que 0: Mais achatada que o Normal (Uniforme)
Maior que 0: Menos achatada que o normal (Afinada)
Skewness and Kurtosis
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)35
Assimetria, Percentis e Boxplot
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)36
Exercício
Encontre todas as estatísticas descritivas para a série da tabela a seguir.
10 23 34 40 58 7413 24 35 41 58 8015 25 37 48 63 8215 25 38 53 64 8820 30 39 58 70 25021 32 39 58 70 254
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)37
Ex.: População = X=Diâmetro de determinada peça (em mm).Dados brutos: { 168, 164, 164, 163, 165, 168, 165, 164, 168, 168 }Rol: { 163, 164, 164, 164, 165, 165, 168, 168, 168, 168 }Amplitude (H) = 168 - 163 = 5
Xni
(Frequência Absoluta)
fi(Frequência
Relativa)
Ni(Frequência
Absoluta Acumulada)
FiFrequência
Relativa Acumulada)
163 1 0.1 1 0.1
164 3 0.3 4 0.4
165 2 0.2 6 0.6
168 4 0.4 10 1.0
Σ 10 1
Distribuição de Freqüências
n ni
K
1∑ =
fnni
i=
f ii
K
=∑ =
11
FNni
i=
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)38
x(Variável)
xi (ponto médio)
ni(frequência absoluta)
fi(frequência
relativa)
f%(frequência percentual)
Ni(AbsolutaAcum.)
Fi(RelativaAcum.)
F%(Percentual
Acum.)
10 ├ ─ 20 15 2 0.04 4 2 0.04 420 ├ ─ 30 25 12 0.24 24 14 0.28 2830 ├ ─ 40 35 18 0.36 36 32 0.64 6440 ├ ─ 50 45 13 0.26 26 45 0.9 9050 ├ ─ 60 55 5 0.1 10 50 1.0 100
Σ 50 1 100
Classes (ou Categorias)
DISTRIBUIÇÃO DE FREQUÊNCIAS
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)39
x(Variável)
xi (ponto médio)
ni(frequência absoluta)
(Xi).(ni)
10 ├ ─ 20 15 2 3020 ├ ─ 30 25 12 30030 ├ ─ 40 35 18 63040 ├ ─ 50 45 13 58550 ├ ─ 60 55 5 275
Σ 50 1820
Classes (ou Categorias)
EXEMPLO – MÉDIA P/DADOS AGRUPADOS
4,3650
1820
.
1
1
==
==
∑
∑
=
=
X
n
nxXMédia n
ii
n
iii
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)40
10
8
6
4
2
10 20 30 40 60 x
ni
Construção da tabela de distribuição de freqüências a partir do histograma de classes desiguais. Exercício: Complete a tabela.
X ni fi
10 |-- 20
20 |-- 30
30 |-- 40
40 |-- 60
Σ 1
Histogramas
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)41
3 7
Processo A
Processo B
Tempo Total (A+B)
?
= 3s = 1
X = 7s = 2
X
321
2.23 5 (2) (1) S S S 222B
2ABA
=+≠
==+=+=+
Correto; Some as
variâncias e depois
obtenha o Desvio Padrão
Incorreto;
Soma de Normais
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)42
-10 -5 0 5 10 15
Linha A
Linha B
Diferença:Linha A – Linha B
?
= 3s = 1X = 7
s = 2X
4 - 7 - 3 X -X X BABA ===−
121
2.235(2)(1)SSS 222B
2ABA
= −−≠
==+=+=–Correto
Incorreto
Diferença de Normais
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)43
Representação Gráfica:Ramo-e-folhas
⎯ xRamos ⎯ x x Folhas
⎯ x x x x x⎯ x x x
81 113 108 74 79 78 90 93 105 109 93
106 103 100 100 100 101 101 101 95 90 94
90 91 92 93 87 89 78 89 85 94 86
11 3
10 8 5 9 6 3 0 0 0 1 1 1
9 0 3 3 5 0 4 0 1 2 3 4
8 1 7 9 9 5 6
7 4 9 8 8
11 3
10+ 8 5 9 6
10- 3 0 0 0 1 1 1
9- 0 3 3 5 0 4 0 1 2 3 4
8 1 7 9 9 5 6
7 4 9 8 8
Ex.:
graficos.mtw
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)44
Stem-and-Leaf Display: folha_ramo
Stem-and-leaf of Ramo N = 33Leaf Unit = 1.0
1 7 44 7 8895 8 1
10 8 56799(10) 9 000123334413 9 512 10 00011135 10 56891 11 3
Obtendo o seguinte Folha
e Ramo.
Compare os resultados
fazendo um Histograma.
O que representa tal
coluna?
Coluna folha_ramo
Ramo-e-folhas
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)45
Exercício no Minitab: Faça o gráfico abaixo a partir dos dados seguintes.
Plot
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)46
Faça o gráfico bidimensional a partir dos dados a seguir
<Marginal Plot>
graficos.mtw
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)47
Os dados representam uma série temporal
Tal gráfico é útil para ver a estabilidade de um processo.
Control Chart é Melhor!
<Stat> <Quality Tools>
<Run Chart>
•Column=Tempo na fila
•Subgroup Size=1
Runchart
runchart.mtw
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)48
•Identifica Diversos tipos de variação
•A análise de efeitos é similar em DOE
•Permite identificar interações
•Não é o mesmo que Estatística Multivariada
15 18 21
17,5
18,5
19,5
20,5
21,5
22,5
23,5
TipoMetal
Forç
a
0,5
1,0
2,0
TempoSinterUse os
Dados a seguir
<Stat>
<Quality Tools>
<Multi-Vari>:
Response: Força (y)
Factor1: TempoSinter (x1)
Factor2: TipoMetal (x2)
Multi-Vari
Sinter.mtw
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)49
Multi-Vari – Monte a Tabela
x1 x2 y x1 x2 y x1 x2 y0,5 15 23 1 15 22 2 15 180,5 15 20 1 15 20 2 15 180,5 15 21 1 15 19 2 15 160,5 18 22 1 18 24 2 18 210,5 18 19 1 18 25 2 18 230,5 18 20 1 18 22 2 18 200,5 21 19 1 21 20 2 21 200,5 21 18 1 21 19 2 21 220,5 21 21 1 21 22 2 21 24
Nível 0,5 Nível 1,0 Nível 2,0
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)50
2 - DISTRIBUIÇÕES DE PROBABILIDADE
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)51
1 - Motivação2 - Distribuições de Probabilidade
• Distribuições Contínuas• Distribuição Discretas
Sumário
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)52
Motivação
•O reconhecimento da importância dos processos estocásticos;
•A consideração da “Incerteza” associada aos eventos;
•Exatidão na modelagem matemática;
•Correta determinação da probabilidade de ocorrência dos fenômenos;
•A otimização de processos industriais e de serviços através de técnicas de SIMULAÇÃO.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)53
DISTRIBUIÇÕES DE PROBABILIDADE
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)54
Formatos de Distribuições
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)55
( ) 0≥xf
( ) 1=∫∞
∞−xf
( ) ∫ >=≤≤b
aabdxxfbXaP )( )(
Algumas Distribuições Contínuas:
Normal Uniforme Chi-square Fisher(F) Student(t)
Beta Cauchy Exponential Gamma Laplace Logistic Lognormal Weibull
f(x) => fdp
Função densidade de probabilidade
Área da curva é unitária
Probabilidade estáassociada a área
Distribuições Contínuas de Probabilidade
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)56
e) M áx f(x) o co rre em x = µ
f) O s po nto s de inflexão são x = µ ± σ
g) E (X ) = µ
h) V ar(X ) = σ 2
f(x)
xµ µ+σ
a) f x dx( )− ∞
∞∫ = 1
b) f(x) ≥ 0
c) lim ( ) lim ( )x x
f x f x→ ∞ → − ∞
= =0 0 e
d ) f(µ + x) = f(µ - x)
( )2
21
21)(
⎥⎦⎤
⎢⎣⎡ −
−= σ
µ
πσ
x
exf
Distribuição Normal
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)57
Distribuição Normal
Pouca Utilidade Prática
Retorna a probabilidade Acumulada
Retorna a Variável quando é dada a probabilidade
acumulada
Exemplo
X:N(100,5)P(X<=95)=0,1587
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)58
µµ
1σ1σ
TT LSELSE
p(d)
3σUsed With Permission
© 6 Sigma Academy Inc. 1995
Distribuição Normal
);(: σµNX
Se a dimensão de uma peça segue uma distribuição Normal X: N(80,3) qual a Probabiliade de ter uma peça defeituosa de
acordo com a figura?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)59
Exercício 1:Em uma população onde as medidas tem Média 100 e Desvio Padrão 5, determine a probabilidade de se ter uma medida:
a) Entre 100 e 115
b) Entre 100 e 90
c) Superior a 110
d) Inferior a 95
e) Inferior a 105
f) Superior a 97
g) Entre 105 e 112
h) Entre 89 e 93
i) 98
Dica:
Crie uma coluna com os valores 100 115...98 no Minitab
Crie uma coluna com
os valores 0,74...0,05 no Minitab
Exercício 2:Em uma população onde as medidas tem Média 100 e Desvio Padrão 5, determine os valores k tais que se tenha a probabilidade:
a) P(X>k)=0,26
b) P(X<k)=0,32
c) P(100-k<100<100+k)=0,47
d) P(x<100-k)+P(x>100+k)=5%
Distribuição Normal
Use: <Calc><Probability Distribution><Normal>
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)60
Probabilidades e Escores padronizados (z)
σµ−
= ii
xz
Exemplo
Um cliente tem um portfólio de investimentos cuja média é US$ 500.000 com desvio padrão de US$ 15.000. Determine a probabilidade de que o valor de seu portfólio esteja entre US$ 485.000 e US$ 530.000.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)61
Probabilidades e Escores padronizados (z)
Exemplo
Se X tem distribuição normal N(15, 4), encontre a probabilidade de X ser maior que 18.
Exemplo
Uma companhia produz lâmpadas cuja vida segue uma distribuição normal com média 1.200 horas e desvio padrão de 250 horas. Escolhendo-se aleatoriamente uma lâmpada, qual é a probabilidade de sua durabilidade estar entre 900 e 1.300 horas?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)62
Probabilidades e Escores padronizados (z)
Exemplo
Um grupo de estudantes obtém notas que são normalmente distribuídas com média 60 e desvio padrão 15. Que proporção dos estudantes obtiveram notas entre 85 e 95?
Exemplo
No caso da prova do exercício anterior, determine a nota acima da qual estão 10% dos melhores alunos da classe.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)63
Probabilidades e Escores padronizados (z)
Exercício
É sabido que a quantidade anual de dinheiro gasto em livros por alunos de uma universidade, segue uma distribuição normal com média $380 e desvio padrão de $50.
Qual é a probabilidade de que um aluno escolhido aleatoriamente no campus gaste mais do que $ 360 por ano?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)64
Probabilidades e Produção
Exercício
A demanda antecipada de consumo de um certo produto érepresentada por uma distribuição normal com média 1.200 unidades e desvio padrão de 100.
a) Qual é a probabilidade de que as vendas excedam 1.000 unidades?
b) Qual é a probabilidade de que as vendas estejam entre 1.100 e 1300 unidades?
c) A probabilidade de se vender mais do que k unidades é de 10%. Determine k.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)65
Probabilidades e Investimentos
Exercício
Um portfólio de investimentos contém ações de um grande número de empresas. Ao longo do último ano as taxas de retorno das ações dessas corporações seguiram distribuição normal com média de 12,2% e desvio padrão de 7,2%.
a) Para que proporção de empresas o retorno foi maior que 20%?
b) Para que proporção de empresas o retorno foi negativo?
c) Que proporção de empresas tiveram retornos entre 5% e 15%?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)66
Probabilidades e Investimentos
Exercício
Considere dois investimentos. Em ambos, a taxa de retorno segue uma distribuição normal, com média e desvio padrão conhecidos conforme tabela a seguir. Deseja saber qual dos investimentos émais provável de produzir retornos de no mínimo 10%. Que investimento deveria ser escolhido?
Média Desvio
Investimento A 10,4 1,2
Investimento B 11,0 4,0
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)67
Probabilidades e Finanças
Exercício
Um portifólio de investimentos contém ações de um grande número de empresas. Ao longo do último ano as taxas de retorno das ações dessas corporações seguiram distribuição normal com média de 12,2% e desvio padrão de 7,2%.
a) Para que proporção de empresas o retorno foi maior que 20%?
b) Para que proporção de empresas o retorno foi negativo?
c) Que proporção de empresas tiveram retornos entre 5% e 15%?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)68
Distribuição Uniforme
F(x)
a b
( ) ∫+∞
∞−
== dxxxfXE )(µ
( ) ( ) ( )12
12
)(22
22 abdxab
baxdxxfxXVar −=⎟
⎠⎞
⎜⎝⎛
−⎥⎦
⎤⎢⎣
⎡⎟⎠⎞
⎜⎝⎛ +
−=−== ∫∫+∞
∞−
+∞
∞−
µσ
1)()(.1
=−===
xfabhbAA
( )2
1 badxab
xXEb
a
+=
−== ∫µ
( ) ( )∫+∞
∞−
−== dxxfxXVar )(22 µσ
)(1)(
abxf
−=
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)69
x
F(x)
140120100806040200
0,06
0,05
0,04
0,03
0,02
0,01
0,00
0
0
Função Exponencial
Distribuição Exponencial
( ) ( ) 20
222 11)(
λλ
λµσ λ =⎥
⎦
⎤⎢⎣
⎡⎟⎠⎞
⎜⎝⎛−=−== ∫∫
+∞−
+∞
∞−
dxexdxxfxXVar x
( )λ
λµ λ 1
0
=== ∫∞
− dxexXE x
( ) ixexf λλ −= .
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)70
X-Data
Y-D
ata
1086420
1,0
0,8
0,6
0,4
0,2
0,0
0
0
VariableC7 * Weibull 1 1C8 * Weibull 3,4 2C9 * Weibull 4,5 6.2
Weibull
Distribuição Weibull
( )β
δβ
δδβ ⎟
⎠⎞
⎜⎝⎛−−
⎟⎠⎞
⎜⎝⎛=
x
exxf1
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)71
Distribuição Uniforme
Exemplo
A espessura de um componente é uma variável aleatória uniformemente distribuída entre os valores 0,95 a 1,05 cm.
a) Determine a proporção de componentes que excedem a espessura de 1,02 cm.
b) Qual é o valor de espessura que é excedida por 90% dos componentes?
c) Qual é o valor da espessura abaixo da qual estão 75% dos componentes?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)72
Distribuição Uniforme
Exemplo
Suponha que uma variável aleatória seja uniformemente distribuída no intervalo [1.5; 5.5].
a) Determine a probabilidade de x ser menor que 2,5.
b) Qual é a probabilidade de x ser maior que 3,5?
c) Determine o valor de k, de modo que a probabilidade de x ser maior que k seja de 40%
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)73
Distribuição Exponencial
Exemplo
Considere o seguinte conjunto de dados: [26, 22, 21, 19, 8, 4]. Ajustando estes dados por distribuição exponencial, determine:
a) A probabilidade de uma v.a. x ser menor que 10.
b) A probabilidade de uma v.a. x ser menor que 5.
c) P(5< x < 10).
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)74
Distribuição Exponencial
Exemplo
Suponha que X tem uma distribuição exponencial com média igual a 10. Determine:
a) A probabilidade de uma v.a. x ser maior que 10.
b) A probabilidade de uma v.a. x ser menor que 20.
c) Encontre k tal que P(X<k)=0,95
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)75
Distribuição Exponencial
Exemplo
O tempo entre as chamadas telefônicas para uma loja de suprimentos é distribuído exponencialmente com um tempo médio de 15 minutos entre as chamadas. Determine:
a) A probabilidade de não haver chamadas por um período de 30 minutos.
b) A probabilidade de que no mínimo uma chamada chegue dentro do intervalo de 10 minutos.
c) A probabilidade de que a primeira chamada chegue entre 5 e 10 minutos.
d) O intervalo de tempo, tal que exista uma probabilidade de 90% de haver no mínimo uma chamada no intervalo.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)76
Distribuição Exponencial
Exemplo
O tempo entre as chegadas de ônibus a uma estação rodoviária édistribuído exponencialmente, com média 10 min. Determine:
a) x, tal que a probabilidade de vc esperar mais de x minutos seja de 10%.
b) x, tal que a probabilidade de vc esperar menos de x minutos seja de 90%.
c) x, tal que a probabilidade de vc esperar menos de x minutos seja de 50%.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)77
Distribuição Exponencial
Exemplo
O tempo entre a chegada de e-mails em seu computador édistribuído exponencialmente com média igual a duas horas. Determine:
a) Qual a probabilidade de vc não receber uma mensagem durante o período de duas horas?
b) Se vc não tiver recebido uma mensagem na últimas quatro horas, qual será a probabilidade de vc não receber mensagens nas próximas duas horas?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)78
Distribuição Exponencial
Exemplo
O tempo entre as chamadas para o escritório do CEO de uma corporação é exponencialmente distribuído com média igual a 10 minutos. Determine:
a) Qual a probabilidade de não haver chamadas dentro de meia hora?
b) Se a secretária do CEO se ausentar por 5 minutos, qual será probabilidade dela não atender (e repassar) uma “importante” ligação para o chefe?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)79
( ) 0≥ixf
( ) 11
=∑=
n
iixf
( ) ( )ii xfxXP ==
Algumas Distribuições Discretas
A Distribuição Binomial
A Distribuição de Poisson
A Distribuição Geométrica
A Distribuição de Pascal
A Distribuição Multinomial
A Distribuição Hipergeométrica
A soma das frequências é
unitária
A probabilidade é a frequência
Distribuição Discretas de Probabilidade
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)80
Use o programa Statdisk
<Analysis>
<Probability Distribution>
<Binomial Distribution>
Observe em <Options> os valores acumulados
Distribuição Binomial
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)81
Ex.: A probabilidade de um teste “Burn in / Burn out”queimar um componente eletrônico é 0,2 (p). Colocando-se três (n) componentes sob teste, qual a probabilidade de que pelo menos dois deles (x) se “queime”?
E(X) = np e Var (X) = npq
( ) ( )valores outrospara
0
,...2,1,0)1(!!
!
=
=−⎟⎟⎠
⎞⎜⎜⎝
⎛−
== − nxppxnx
nxXP xnx
Distribuição Binomial
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)82
E = {QQQ, QQN, QNQ, NQQ, NNQ, NQN, QNN, NNN}onde Q e N representam a queima ou não do componente
x
0
1
2
3
P(x)
P{NNN} = P(X = 0) = q3 = (0.8)3
P{NNQ} + P{NQN} + P{QNN} = P(X = 1) = 3pq2 = 3(0.2)(0.8)2
P{QQN} + P{QNQ} + P{NQQ} = P(X = 2) = 3p2q = 3(0.2)2(0.8)
P{QQQ} = P(X = 3) = p3 = (0.2)3
P(X ≥ 2) = P(X=2) + P(X= 3) = 3p2q + p3 = 0.104 = 10,4%
X: Número de Queimas Q
Distribuição Binomial
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)83
Exercício:
Suponha que uma válvula eletrônica, instalada em determinado circuito, tenha probabilidade 0.2 de funcionar durante o tempo de garantia. São ensaiadas 20 válvulas.
a) Qual a probabilidade de que delas, exatamente k, funcionem durante o tempo de garantia (k = 0, 1, 2, ... 20)?
b) Qual a probabilidade de que 4 funcionem durante o tempo de garantia?
c) Qual o número médio e o desvio padrão de válvulas que irão funcionar durante o tempo de garantia?
X ≡ Número de válvulas que funcionam durante o tempo de garantia.p = 0.2X = 0, 1, 2, ... 20
Distribuição Binomial
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)84
P(X = x)
x0 1 2 3 4 5 6 7 8 9 18
com média E(x) = np = 20.(0.2) = 4
e desvio padrão npq = 1788.
( ) ( ) kk
kkXP −
⎟⎟⎠
⎞⎜⎜⎝
⎛ 208.02.020
=)=(
E(X) = np e Var (X) = npq
( ) valoresoutros para 0
,2,1,0 )1(
=
=−⎟⎟⎠
⎞⎜⎜⎝
⎛== − nxpp
xn
xXP xnx L
Distribuição Binomial
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)85
Exercício: Complete a tabela referente a Distribuição Binomial a seguir:
n p k P(X=k) F(k) P(X>k) P(X<k) E(x)
4 0,2 2
8 0,5 4
12 0,7 3
20 0,8 12
100 0,6 63
Distribuição Binomial
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)86
n p k P(X=k) F(k) P(X>k) P(X<k) E(x)
4 0,2 2 0,1536 0,1536 0,0272 0,8192 0,8
8 0,5 4 0,2734 0,2734 0,3633 0,0899 4
12 0,7 3 0,0015 0,0015 0,9983 0,0002 8,4
20 0,8 12 0,0222 0,0222 0,9679 0,0099 16
100 0,6 63 0,0682 0,0682 0,2386 0,6932 60
Distribuição Binomial
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)87
Distribuição Hipergeométrica
Ex.: Pequenos motores elétricos são expedidos em lotes de 50unidades. Antes que uma remessa seja aprovada, um inspetor escolhe 5 desses motores e os inspeciona. Se nenhum dos motores inspecionados for defeituoso, o lote é aprovado. Se um ou mais forem verificados defeituosos, todos os motores da remessa são inspecionados. Suponha que existam, de fato, três motores defeituosos no lote. Qual a probabilidade de que a inspeção 100% seja necessária?
P X P X( ) ( ) .≥ = − = = −
⎛
⎝⎜
⎞
⎠⎟⎛
⎝⎜
⎞
⎠⎟
⎛
⎝⎜
⎞
⎠⎟
≅1 1 0 1
30
475
505
0 28
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)88
Distribuição Hipergeométrica
)0(1)1( =−=≥ XPXP
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)89
Ex.: Em uma experiência de laboratório passam, em média, por um contador, quatro partículas radioativas por milissegundo. Qual a probabilidade de entrarem no contador seis partículas em determinado milissegundo?
Utilizando a distribuição de Poisson com λ = 4, então:
1042.0!64)6(
64
===−eXP
npnp
Xk
ekXPk
====
===−
µσµλ
λλ
2,1, , L0!
)(
Distribuição de Poisson
No Minitab use: <Calc> <Probability Distribution> <Poisson>
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)90
Use o programa Statdisk
<Analysis>
<Probability Distribution>
<Poisson Distribution>
Observe em <Options> os valores acumulados
Distribuição de Poisson
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)91
Exercício: Complete a tabela referente à Distribuição Poisson:
Média k P(X=k) F(k) P(X>k) P(X<k)
4 2
8 4
12 3
20 12
100 63
Distribuição de Poisson
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)92
Ex.: Chegam, em média, 10 navios-tanque por dia a um movimentado porto, que tem capacidade para 15 desses navios. Qual a probabilidade de que, em determinado dia, um ou mais navios tanque tenham de ficar ao largo, aguardando vaga?
Temos aqui que, para λ = 10:
0487.09513.01)15(1)15( =−=≤−=> XPXP
Distribuição de Poisson
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)93
Ex.: Uma central telefônica recebe em média 300 chamadas por hora e pode processar no máximo 10 ligações por minuto. Estimar a probabilidade de a capacidade da mesa ser ultrapassada.
Temos agora:λ = 300/60 = 5 chamadas/minuto em média
%4,1014.0986.01)10(1)10( ==−=≤−=> XPXP
Distribuição de Poisson
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)94
Distribuição de Poisson
Aproximação da Distribuição Binomial
P X knk
p pk n k( ) ( )= =⎛
⎝⎜
⎞
⎠⎟ − −1
!)(lim
kekXP
k
n
λλ−
∞→==
Seja X uma v.a. distribuída binomialmente com parâmetro p(baseado em n repetições de um experimento). Isto é,
Admita-se que quando n → ∞, p →0 e np → λ.Nessas condições é possível demonstrar uma importante consideração:
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)95
Ex.: A probabilidade de um indivíduo ter reação negativa a certa injeção é de 0,001. Determinar a probabilidade de que de 2.000 indivíduos injetados, exatamente 3 tenham reação negativa.
Usando a distribuição binomial com n = 2.000 e p = 0.001 temos:
19973 )999.0()001.0(3
2000)3( ⎟⎟
⎠
⎞⎜⎜⎝
⎛==XP
O cálculo desses números dá origem a considerável dificuldade. Pela aproximação de Poisson temos:
1804.0!32)3(
32
===−eXP
Distribuição de Poisson
2)001.0)(2000( === npα
Aproximação da Distribuição Binomial
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)96
Ex.: Consideremos um experimento binomial com n = 200, p = 0.04 em que se pede a probabilidade de, no máximo, 5 sucessos.
kk
k kXP −
=∑ ⎟⎟
⎠
⎞⎜⎜⎝
⎛=≤ 5
5
0
)96.0()04.0(200
)5(
λ = np = (200) (0.04) = 8
P(X ≤ 5) = 0.1912 Obtido de Tabela (ou micro)
O cálculo direto é impraticável, usando a Distribuição Binomial
Aproximação da Distribuição Binomial
Distribuição de Poisson
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)97
Ex.: A probabilidade de um indivíduo ter reação negativa a certa injeção é de 0,001. Determinar a probabilidade de que de 2.000 indivíduos injetados, mais de quatro tenham reação negativa.
( ) ( ) ( ) ( ) ( ) ( )
0526.01224
68
24161
!02
!12
!32
!421
]01234[14
2
0223242
=⎥⎦⎤
⎢⎣⎡ ++++−=
⎥⎦
⎤⎢⎣
⎡+++−=
=+=+=+=+=−=>
−
−−−−
e
eeeeXPXPXPXPXPXP
Distribuição de Poisson
2)001.0)(2000( === npα
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)
3 - Estimação de Parâmetros e Intervalos de Confiança
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)99
Idéia Central:Criar e avaliar intervalos de Confiança para dados amostrais.
Tópicos abordados:• Inferência Estatística• O Teorema Central do Limite • Intervalos de Confiança• A Distribuição t de Student.
EstimaEstimaçção de Parâmetros e ICão de Parâmetros e IC
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)100
População
Amostragem
Estimação de parâmetros
e escolha da Distribuição
Cálculo de Probabilidades
(Usando a Distribuição acima)
Inferência
Estatística
Informação para
tomada de decisão
Ex.: Para a distribuição normal os
parâmetros são µ e σ2.
Os termos população e
distribuição são equivalentes.
Estimação de Parâmetros -
Noções
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)101
Nomenclatura
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)102
“Para uma população não normal com média µ e desvio padrão σ, a distribuição da média amostral para amostras de tamanho nsuficientemente grande é aproximadamente normal com média µ e desvio padrão ,isto é:
~ N : (0,1)”
X
nσ
nXσ
µ−=Ζ
Ou seja:
Se X:(µ, σ) então a distribuição amostral de é N(:(µ, ) X nσ
O Teorema Central do Limite
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)103
“Para uma população normal com média µ e desvio padrão σ, a média amostral para amostras de tamanho n suficientemente grande éaproximadamente normal com média µ e desvio padrão , isto é:
~ N : (0,1)”
X
nσ
nXσ
µ−=Ζ
Ou seja:
Se X:N(µ, σ) então a média amostral de é N:(µ, ) X nσ
TCL
nσErro Padrão = Standard Error=SE=
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)104
z
X
-1.96 0 1.96
0.0250.025
0.95
Consideremos uma população normal com média µ, desvio padrão σ e uma amostra dessa população.
nuX
σ−
~ N : (0,1)
Pelos resultados do Teorema do Limite Central
Fixando α em 0.05, ou seja, 1- α=0.95,
95.0)96.196.1( =<<− ZP
%)95:(µIC ... para Sigma conhecido
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)105
População normal com média µ e desvio padrão σ
nuX
σ−
~ N : (0,1)
Pelos resultados do TCL: α : Nível de significância
1- α: Nível de confiança
95.0)96.196.1( =<<− ZP
95.096.196.1 =⎥⎦
⎤⎢⎣
⎡<
−<−
nXPσ
µ
[ ] 95.0)(96.1)(96.1 =+<<− nXnXP σµσ
[ ] ( ) ( )[ ]nXnX σσθθ 96.1; 96.1ˆ;ˆ10 +−= %)95:(µIC=
Confiança e Significância
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)106
θ
Ela não significa que a probabilidade do parâmetro µ cair dentro de um intervalo especificado seja igual a 0.95. µ sendo o parâmetro, está ou não, dentro do intervalo.
“0.95 é a probabilidade de que um intervalo aleatório contenha µ .”
[ ] 95.0)(96.1)(96.1 =+<<− nXnXP σµσ
IC - Interpretação
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)107
- tα/2 0 tα/2
α/2 α/2
1-α
t
( ) ( )[ ]nStXnStXIC 22 ; )100)1(:( αααµ +−=−
nSXt )( µ−
= ∑=
−−
=n
ii XX
nS
1
22 )(1
1
%)95:(µIC ... para Sigma Desconhecido
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)108
(Distribuição t de Student)
nSXt )( µ−
= ∑=
−−
=n
ii XX
nS
1
22 )(1
1
“Distribuição t de Student”, com v
graus de liberdade
v = n - 1Tal distribuição é
usualmente tabelada para alguns valores de v e α
Normal
hv(t)
t
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)109
Intervalos de Confiança para PROPORÇÕES
Exemplo
Uma amostra aleatória de 85 camisas, 10 apresentaram algum tipo de defeito (furos, manchas, costuras soltas etc). Construa um intervalo de confiança de 95% para a proporção populacional de defeituosos.
( ) ( )n
ppZppn
ppZpˆ1ˆˆˆ1ˆˆ 22
−+≤≤
−− αα
Usando a aproximação pela NORMAL.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)110
ExemploUm candidato político deseja avaliar se as
suas intenções de votos são maiores do que as do concorrente, com uma margem de pelo menos 5%. Possui, na última pesquisa realizada, 35% da preferência do eleitorado.
Admitindo a = 1% e b = 5%, qual o tamanho de amostra necessária?
Tamanho de Amostra
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)111
Power and Sample Size
selecionar: Stat > Power and Sample Size > 2 Proportions“Proportion 1 values”: < 0,35 >
“Power values”: < 0,95 >“Proportion 2”: < 0,30 >
selecionar: Optionsmarcar “Greater Then”
“Significance level”: < 0,01 >OK OK
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)
4 – TESTES DE HIPÓTESE
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)113
Idéia Central:Estudar os experimentos envolvendo Teste de Hipóteses para um e dois tratamentos.
Tópicos abordados:• Teste de Hipóteses
Experimentos Experimentos Comparativos SimplesComparativos Simples
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)114
Exemplos:
• Duas linhas de produção supostamente idênticas estão apresentando resultados diferentes. Como confirmar isso?
• A variabilidade de um processo é maior que outro. Temos certeza?
• Os dados estão normalmente distribuídos?
• Como saber estatisticamente se dois funcionários tem o mesmo desempenho?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)115
Um produto original é identificado pelo seu peso (em libras) e reconhecidamente segue uma distribuição normal N(50; 0.8).
Do mesmo modo, produtos falsificados tem pesos significativamente maiores que 50 lb, seguindo distribuição também normal N(52, 0.8).
Uma amostra aleatória revelou um peso médio de 51,3 lb.
Baseado nesta amostra a que conclusões se pode chegar?
Decisão Estatística
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)116
• Qual é a probabilidade de que (em função da amostra) um produto original seja classificado como Falso?
• Qual a probabilidade de que o produto original seja corretamente identificado?
• Qual a probabilidade de que um produto falsificado seja classificado como original?
• Qual é a probabilidade de se detectar produtos falsificados neste caso?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)117
54535251504948
100
80
60
40
20
0
50 52
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)118
54535251504948
100
80
60
40
20
0
51,350 52
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)119
54535251504948
100
80
60
40
20
0
51,350 52
5%Erro Tipo 1 (Alfa)
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)120
54535251504948
100
80
60
40
20
0
51,350 52
5%19%
Erro Tipo 1 (Alfa)
Erro Tipo 2 (Beta)
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)121
54535251504948
100
80
60
40
20
0
51,350 52
5%19%
Erro Tipo 1 (Alfa)
Erro Tipo 2 (Beta)
CONFIANÇA (1-Alfa)
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)122
54535251504948
100
80
60
40
20
0
51,350 52
5%19%
Erro Tipo 1 (Alfa)
Erro Tipo 2 (Beta)
POWER(1-Beta)CONFIANÇA
(1-Alfa)
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)123
• Na afirmação: “Uma pessoa é considerada inocente até que se prove o contrário pois é um erro maior condenar um inocente do que libertar um culpado.”, defina:
• Erros Tipo I e Tipo II
• Hipóteses Nula e Alternativa
H0: o réu é inocente (hipótese fundamental)
H1: o réu é culpado (hipótese alternativa)
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)124
Os erros de julgamento poderiam ser : condenar um réu inocente ou, então, absolver um réu culpado.
REALIDADE
H0 verdadeira H0 falsa
aceitarH0
decisão correta1 - α
erro tipo IIβ
DECISÃO
rejeitarH0
erro tipo Iα
decisão correta1 - β
Hipóteses e Erros
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)125
• ERRO DO TIPO I
Rejeitar Ho sendo Ho verdadeira
P(Erro I) = P(rejeitar Ho|Ho é verdadeira) = α
• ERRO DO TIPO II
Não rejeitar Ho sendo Ho falsa
P(Erro II) = P(não rejeitar Ho|Ho é falsa) = β
Tipos de Erros
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)126
No Minitab: Análise do P-value !
1) Definir as hipóteses;
2) Escolher a estatística de teste adequada;
3) Escolher α e estabelecer a Região Crítica (RC);
4) Com base em uma amostra de tamanho n, extraída da população, calcular θ;
5) Rejeitar Ho caso θ ∈ RC. Não rejeitar Ho em caso contrário.
Construção de T.H.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)127
Testes de Hipóteses Estatísticas
Os testes de hipóteses em Estatística podem ser empregados para avaliar ou comparar:
• médias;• variâncias (ou desvios-padrão);• proporções;• distribuições de probabilidade e correlação.
Estas análises podem se do tipo “igual”, “menor que” ou, ainda, “maior que”.
Testes Paramétricos
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)128
• Para avaliar médias, empregam-se dois diferentes tipos de testes: z ou t.
• o teste z é empregado somente se o desvio-padrão da população (s) é conhecido (caso pouco provável);
• o teste t é utilizado nas demais circunstâncias e, por isso, este é que serávisto no curso.
TH p/ Média
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)129
Ex.
The production manager of a company has asked you to evaluate a proposed new procedure for producing its double-hung windows. The present process has a mean production of 80 units per hour with a population standard deviation of 8 units. The manager indicates that she does not want to change to a new procedure unless there is strong evidence that the mean production level is higher with the new process.
A random sample of 25 units revealed the sample mean was 83. Based on this sample, is there strong evidence to support the conclusion that the new process resulted in higher productivity?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)130
nXZσ
µ0−=
⎪⎩
⎪⎨
⎧
>
≤
80:
80:
1
0
µ
µ
H
H
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)131
•P-Value é a área ou probabilidade que fica acima (ou abaixo) do valor obtido experimentalmente.
Quanto menor o P-Value, menor seráa chance de se cometer um erro do tipo 1!
P-Value = P(1-Ø)
P-Value
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)132
Alfa
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)133
Teste Unilateral Esquerdo
Teste Unilateral Direito
Teste Bilateral
α
α
α/2
A1A2
A1
A2
A2A1
P-Value = A1 Aceita-se Ho
P-Value = A2 Rejeita-se Ho
P-Value = A1 Aceita-se Ho
P-Value = A2 Rejeita-se Ho
P-Value = A1+A2
Unilateral e Bilateral
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)134
Exemplo
A manufacturing process involves drilling holes whose diameters are normally distributed with population mean of 2 inches and population standard deviation 0.06 inches. A random sample of 9 measurements had a sample mean of 1.95 inches. Use a significance level of 5% to determine if the observed sample mean is unusual and suggests that the drilling machine should be adjusted.
nXZσ
µ0−=
⎩⎨⎧
≠=
2:2:
1
0
µµ
HH
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)135
Question 1:A company which receives shipments of batteries tests a random sample of nine of them before agreeing to take a shipment. The company is concerned that the true mean lifetime for all batteries in the shipment should be at least 50 hours. From past experience, it is safe to conclude that the population distribution of lifetimes is normal, with standard deviation of 3 hours. For one particular shipment, the mean lifetime for a sample of nine batteries was 48.2 hours. Test at 5% level the null hypothesis that the population mean lifetime is at least 50 hours.
EXERCÍCIOS
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)136
Question 2:An engineering research center claims that through the use of a new computer control system, automobiles should achieve on average an additional 3 miles per gallon of gas. A random sampleof 100 automobiles was used to evaluate this product. The samplemean increase in miles per gallon achieved was 2.4 and the sample standard deviation was 1.8 miles per gallon.
EXERCÍCIOS
Test the hypothesis that the population mean is at least 3 miles per gallon using 5% significance level. Find the P-value of this test, and interpret your findings.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)137
Question 3:A beer distributor claims that a new display, featuring a life-size picture of a well-known rock singer, will increase product sales in supermarkets by an average of 50 cases in a week. For a random sample of 20 liquor weekly sales, the average sales increase was 41.3 cases and the sample standard deviation was 12.2 cases. Test at the 5% level the hypothesis that the population mean sales increase is at least 50 cases.
EXERCÍCIOS
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)138
Question 4:In contract negotiations, a company claims that a
new incentive scheme has resulted in average weekly earning of at least $400 for all customer service workers. A union representative takes a random sample of 15 workers and finds that their weekly earnings have an average of $381.25 and a standard deviation of $48.60. Assume a normal distribution.
a) Test the company’s claim;b) If the same sample results had been obtained
from a random sample of 50 employees, could the company’s claim be rejected at a lower significance level than in part (a)?
EXERCÍCIOS
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)139
Question 5:A bearing used in an automotive application is supposed to have a nominal inside diameter of 1.5 inches. A random sample of 25 bearings is selected and the average inside diameter of these bearing is 1.4975 inches. Bearing diameter is known to be normally distributed with standard deviation 0.01 inch. Test the null hypothesis using a two-sided approach and considering.
EXERCÍCIOS
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)140
Question 6:A process that produces bottles of
shampoo, when operating correctly, produces bottles whose contents weigh, on average, 20 ounces. A random sample of nine bottles from a single production run yielded the following content weights (in ounces):
EXERCÍCIOS
21,4 19,7 19,7 20,6 20,8 20,1 19,7 20,3 20,9.
Assuming that the population distribution is normal, test at the 5% level against a two-sided alternative the null hypothesis that the process is operating correctly.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)141
A Resistência ao Estufamento das latas para a inspeção final deve ser maior que 90 psi. Tal resistência obedece a uma distribuição normal com desvio padrão de 1 psi . As medidas da Resistência para uma determinada linha/turno estão dadas na planilha Resistência.MTW
Teste a Hipótese de que as medidas da Resistência ao Estufamento estão dentro do limite de especificação. (Prove que as medidas são maiores que 90)
Gere: N(91; 0.83)
Exemplo 1Z
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)142
•TH - Proporções
01
00
:H
:H
π<π
π≥π
01
00
:H
:H
π>π
π≤π
01
00
:H
:H
π≠π
π=π
Onde: π é a proporção populacional e π0 é uma constante
T.U.E BilateralT.U.D
T.U.E T.U.D Bilateral
211
210
:H
:H
π<π
π≥π
211
210
:H
:H
π>π
π≤π
211
210
:H
:H
π≠π
π=π
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)143
Em uma indústria de autopeças, historicamente 3,5% das peças produzidas contém algum tipo não-conformidade. Uma equipe está trabalhando na redução desta incidência de defeitos e, no último mês, foram produzidas 1500 peças e somente 45 estavam fora da especificação. A equipe obteve melhoria no desempenho ?
035,0:
035,0:
1
0
<
≥
π
π
H
H
Exemplo – 1 Proportion
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)144
<Stat > <Basic Statistics > <1 Proportion>Selecione Summarized data
“Number of trials”: 1500“Number of successes”: 45
Options “test proportion”: < 0,035 >“alternative”: < less than >
%0,31500
45==p
π0
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)145
Uma equipe deseja aumentar a porcentagem (ou proporção) de pedidos aceitos pelos clientes.A equipe acredita ter identificado uma das causas de perdas de pedidos que é o prazo elevado para envio da cotação ao cliente. Conseguiram reduzir este tempo e os resultados das últimas 10 semanas estão fornecidos no arquivo pedidos.mtw.
Qual é a conclusão ?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)146
<Stat > <Basic Statistics > <2 Proportions>Selecione Samples in different columns
First= antesSecond= depois
Options “test difference”: < 0 >“alternative”: < less than >
Obs: no arquivo, “s”indica pedido aceito, e “n”, pedido recusado
2 Proportions
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)147
Test and CI for Two Proportions: antes; depois
Success = s
Variable X N Sample p
antes 11 43 0,255814depois 14 30 0,466667
Estimate for p(antes) - p(depois): -0,21085395% upper bound for p(antes) - p(depois): -0,0253151Test for p(antes) - p(depois) = 0 (vs < 0): Z = -1,87
P-Value = 0,031
Rejeita-se H0
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)148
<Stat><Basic Statistics> <1 Sample Z>
Selecione Resistencia
Sigma=1 (isso geralmente não é fornecido)
Test mean= 90
<Options>
Alternative= Greater than
<Graphs...>
Individual plot
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)149
One-Sample Z: Resistencia
Test of mu = 90 vs mu > 90
The assumed sigma = 1
Variable N Mean StDev SE MeanResistencia 15 91,111 0,834 0,258
Variable 95,0% Lower Bound Z PResistencia 90,686 4,30 0,000
H0 H1
Rejeita-se H0Região Crítica
Valor dentro da Região Crítica
Uma boa regra:
Se P-Value < α, rejeita-se Ho
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)150
A especificação da Largura da Flange das latas para a inspeção final é definida como 0.082’’+/- 0.010’’ e obedece a uma distribuição normal. As medidas da Largura da Flange para uma determinada linha/turno estão dadas na planilha.
Teste a Hipótese de que as medidas da Largura da Flange estão dentro do limite de especificação. (Prove que os valores são em média maiores que 0,072” e menores que 0,092”)
Gere: N(0.0835; 0.00345)
Teste de média t para 1 amostra
Exemplo 1t
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)151
<Stat><Basic Statistics> <1 Sample t>
Selecione Largura Flange
Test mean= 0,092
<Options>
Alternative= Less than
<Graphs...>
Histogram of data
<Stat><Basic Statistics> <1 Sample t>
Selecione Largura Flange
Test mean= 0,072
<Options>
Alternative= Greater than
<Graphs...>
Histogram of data
Teste 1 (Para provar que os valores são menores que 0,092)
Teste 2 (Para provar que os valores são maiores que 0,072)
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)152
01
00
:H
:H
µ<µ
µ≥µ
01
00
:H
:H
µ>µ
µ≤µ
01
00
:H
:H
µ≠µ
µ=µ
Teste de Hipótese para Médias – Uma amostra
T.U.E BilateralT.U.D
nXZ
/0
0 σµ−
=nS
XT/
0µ−=Teste Z: Teste T:
1Z e 1t
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)153
211
210
:
:
µµ
µµ
<
≥
H
H
211
210
:
:
µµ
µµ
>
≤
H
H
211
210
:
:
µµ
µµ
≠
=
H
H
Teste de Hipótese para Médias – Duas amostras
T.U.E BilateralT.U.D
( )
2
22
1
21
21210
nn
XXZ
σσ
µµ
+
−−−=
Variâncias Conhecidas
( )
21
2121
111nnS
XXT
p
+
−−−=
µµVariâncias Desconhecidas
2Z e 2t
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)154
Estimador Combinado
( ) ( )( ) ( )11
11
21
222
2112
−+−−+−
=nn
SnSnS p
: :
: :
21
22
21
nn
SS Variância Amostral Grupo 1 Variância Amostral Grupo 2
Tamanho do Grupo 1 Tamanho do Grupo 2
2t – Cálculo da Variância
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)155
22
12
1
22
12
0
:
:
σσ
σσ
<
≥
H
H
TH p/ Variâncias
T.U.E BilateralT.U.D
22
21
0 SSF =Estatística de Teste:
22
12
1
22
12
0
:
:
σσ
σσ
>
≤
H
H
22
12
1
22
12
0
:
:
σσ
σσ
≠
=
H
H
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)156
ExemploDois tipos de Bico de Aplicação de verniz (Tipo I e Tipo II) foram avaliados. Deseja-se investigar o efeito desses dois Bicos com relação ao Peso do Verniz (em mg) medido após o processo. Tais medidas são dadas na planilha ao lado.
As variâncias são iguais? (Teste a Hipótese nula de que os dois bicos produzem um peso de Verniz com mesma variância.)
Peso_Verniz.MTW
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)157
Obs.: Teste o Procedimento Stack Columns
Para usar Samples in one column
<Stat><Basic Statistics> <2 Variances>
Selecione Samples in different columns
First= Verniz_tipo1
Second= Verniz_tipo2
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)158
95% Bonferroni Confidence Intervals for StDevs
Verniz_tipo2
Verniz_tipo1
1,21,00,80,60,40,2
Data
Verniz_tipo2
Verniz_tipo1
112,5112,0111,5111,0110,5110,0
F-Test
0,236
Test Statistic 2,74P-Value 0,150
Levene's Test
Test Statistic 1,51P-Value
Test for Equal Variances for Verniz_tipo1; Verniz_tipo2
Prefira sempre, pois independe da distribuição dos dados.
As variâncias são iguais!
Levene’s Test
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)159
Bonferroni confidence intervals for standard deviations
Lower Sigma Upper N Factor Levels
0.358564 0.548160 1.10380 10 Verniz_tipo1
0.216713 0.331303 0.66713 10 Verniz_tipo2
F-Test (normal distribution)
Test Statistic: 2.738
P-Value : 0.150
Levene's Test (any continuous distribution)
Test Statistic: 1.505
P-Value : 0.236 (variâncias iguais)
Após empilhamento dos dados faça: <Anova> <test for equal variances>
Esse método é melhor, pois pode testar mais que dois conjuntos de dados.
Test for Equal Variances
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)160
Exemplo: Em relação ao problema anterior, teste se as médias são diferentes. (Peso_Verniz.MTW)
<Stat><Basic Statistics> <2 Sample t>
Selecione Samples in different columns
First= Verniz_tipo1
Second= Verniz_tipo2
Selecione: Assume equal variances
<Options>
Test mean= 0
Alternative= not equal
<Graphs>
Selecione Boxplots of data
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)161
Two-Sample T-Test and CI: Verniz_tipo1, Verniz_tipo2Two-sample T for Verniz_tipo1 vs Verniz_tipo2
N Mean StDev SE Mean
Verniz_t 10 110.792 0.548 0.17
Verniz_t 10 112.205 0.331 0.10
Difference = mu Verniz_tipo1 - mu Verniz_tipo2
Estimate for difference: -1.413
95% CI for difference: (-1.838, -0.987)
T-Test of difference = 0 (vs not =): T-Value = -6.97
P-Value = 0.000 DF = 18 Both use Pooled StDev = 0.453
Médias diferentes
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)162
Dat
a
Verniz_tipo2Verniz_tipo1
112,5
112,0
111,5
111,0
110,5
110,0
Boxplot of Verniz_tipo1; Verniz_tipo2
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)163
Observações Emparelhadas
0:
0:
2101
2100
≠−=∆
=−=∆
µµ
µµ
H
H
0:
0:
2101
2100
<−=∆
≥−=∆
µµ
µµ
H
H
0:
0:
2101
2100
>−=∆
≤−=∆
µµ
µµ
H
H
nSDT
D /0
0∆−
=Diferença Amostral
Média
Desvio Padrão das diferenças entre 1 e 2
Paired t
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)164
• Consiste em dois testes (um antes e outro depois) com a mesma unidade experimental (amostra).
Ex.: O peso de pessoas antes e depois de um tratamento.
• Em geral, as unidades experimentais são heterogêneas (σ grande) e exibem alta correlação positiva.
Paired t - Características
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)165
Suspeita-se que dois funcionários estão monitorando o manômetro de um processo de uma forma desigual. Para diferentes pressões foram lidas (de uma forma emparelhada) os resultados da planilha ao lado.
Teste a Hipótese de que os dois operadores tem o mesmo desempenho.
Exemplo - Paired t
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)166
Paired t
<Stat><Basic Statistics> <Paired t>
Selecione Samples in columns
First sample= Operador 1
Second sample= Operador 2
<Options>
Test mean= 0
Alternative= not equal
<Graphs>
Individual value plot
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)167
Paired T-Test and CI: Operador 1, Operador 2Paired T for Operador 1 - Operador 2
N Mean StDev SE Mean
Operador 1 10 194 428 135
Operador 2 10 196 428 135
Difference 10 -2.400 1.075 0.340
95% CI for mean difference: (-3.169, -1.631)
T-Test of mean difference = 0 (vs not = 0): T-Value = -7.06 P-Value = 0.000
Médias diferentes
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)168
Tamanho de Amostras em Testes de Hipóteses
Power Sample Size
Fatores determinantes do Tamanho da Amostra (n) Fonte Efeito sobre “n”
1 Desvio Padrão dos dados Deve ser estimado. Quando o Desvio Padrão diminui, n cresce.
2 Nível de Significância (α) Em geral, 0.05. Se α diminui, n cresce.
3 Diferença a ser detectada (d)
Você decide o tamanho adequado.
Quanto menor for a diferença desejada, maior
n.
4
Poder do Teste: (1-β) Probabilidade de detectar uma diferença quando ela
realmente existir.
Usualmente, 90% Se o poder do teste cresce, n cresce.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)169
•Exemplo
Uma equipe de melhoria desenvolveu um novo procedimento de manutenção. Espera-se que o tempo de manutenção diminua com a utilização do novo procedimento. Para identificar se as mudanças foram eficazes, a equipe decide coletar amostras dos dois processos: o novo e o antigo.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)170
Questão 1: Qual o teste de Hipóteses adequado para esta situação?
• 2 Sample-t (média de dois grupos)
Questão 2: Que Informações são necessárias para se determinar o tamanho de amostra necessária ao teste?
• Uma estimativa do desvio padrão do tempo de manutenção;• A diferença que deve ser detectada entre os tempos médios dos dois processos;• A probabilidade de detectar esta diferença (Geralmente 90%);• O nível de significância desejado (Geralmente5%);
Questionamentos
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)171
Questão 3:Que suposições a equipe está fazendo?
• Que o processo é estável;• Que os dados são Normais.
Questão 4:Como estas suposições podem ser verificadas?
• Carta de Controle;• Teste de Normalidade.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)172
0 10 20 30 40
50
60
70
80
90
100
110
120
Tim
e (m
inut
es)
X=87
UCL=118
LCL=56
Examinando-se a carta de controle, verifica-se:
O processo é estável e a média atual é 87 minutos
•Exemplo – Verificação
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)173
0 10 20 30 40
50
60
70
80
90
100
110
120
Tim
e (m
inut
es)
X=87
UCL=118
LCL=56
10.3 656181
6LCLUCL
=−
=−
10.3 656181
6LCLUCL
=−
=−
10.1 387181
3AvgUCL
=−
=−
10.1 387181
3AvgUCL
=−
=−
Portanto, pode-se adotar um desvio padrão de 10.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)174
Se a equipe deseja provar que o tempo médio de manutenção
utilizando-se o novo procedimento é de 75 minutos, e se considerarem a probabilidade de 90% de chance de detecção desta diferença (12 minutos),
com um nível de significância de 0,05, qual será o tamanho da
amostra necessária?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)175
<Stat > <Power and Sample Size> <2 Sample t>Differences= 12Power values= 0,9Sigma= 10<Options>
Selecione Not equal como Alternative Hypothesis
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)176
2-Sample t Test
Testing mean 1 = mean 2 (versus not =)
Calculating power for mean 1 = mean 2 + difference
Alpha = 0,05 Sigma = 10
Sample Target Actual
Difference Size Power Power
12 16 0,9000 0,9072
Tamanho de amostra necessária.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)
5– ANÁLISE DE VARIÂNCIA (ANOVA)
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)178
• As bases da Análise de Variância• Um fator (One-way)• Dois fatores (Two-way)• Análise de Médias (ANOM)• Balanced ANOVA
ANOVA é um Teste para Comparar Médias
(O nome é enganoso!)
ANOVA
Análise de Variância
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)179
Entendendo o significado da
ANOVA...
ANOVA - Visualmente
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)180
Tratamentos
RespostaA B C5 9 104 1 56 8 87 11 78 6 10
Somatório 30 35 40Médias 6 7 8
As médias são realmente diferentesou tudo não passa de casualidade?
negadoser vai sinais dos um menos Pelo::
1
0
===
HH CBA µµµ
As Bases da ANOVA
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)181
Passo 1: Cálculo da Variação Total
5 5-7=-2 44 4-7=-3 9
Etc. Etc. Etc7 0 0
10 3 9105 0 96
iX ii xXX =− 2ix
( A, B
e C
)
∑VT - Variação Total
Como VT>0 érazoável imaginar que ela se compõe de variações que ocorrem Dentro dos Grupos (VD - Within) e Entre os tratamentos (VE - Between)
Foram considerados 15 observações: Glib=14
Média geral
Algoritmo: Variação Total
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)182
5 5-6=-1 14 -2 46 0 07 1 18 2 4
10
Passo 2: Cálculo da Variação Dentro do Grupo - Within
AA XX − 2)( AA XX −AX 2)( BB XX − 2)( CC XX −
58 18
VD=10+58+18=86 Foram considerados 5 observações em cada caso: Glib=12
Algoritmo: Variação Within
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)183
6 -1 16 -1 16 -1 16 -1 16 -1 1
5
Passo 3: Cálculo da Variação Entre Tratamentos (Between)
XX A − 2)( XX A −AX
0 5
VE=5+0+5=10
2)( XX B − 2)( XX C −
Foram considerados 3 observações : Glib=2
Algoritmo: Variação Between
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)184
VT=VD+VE ! 96=86+10
Graus de Liberdade:
A VT possui (15-1)=14 GLIB
(3 Tratamentos) (5 Observ/Trat)
A VD possui (5-1)(3)=12 GLIB
(5 Observ/Amostra)(3 Amostras)
A VE possui (3-1)=2 GLIB
(3 Tratamentos -1)
A B C5 9 104 1 56 8 87 11 78 6 10
GLIBVT=GLIBVD+GLIBVE ! 14=12+02
Algoritmo: Graus de Liberdade
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)185
VT=VD+VE ! 96=86+10
GLIBVT=GLIBVD+GLIBVE ! 14=12+02
VD/GLIBVD = 86/12 = 7,17
VE/GLIBVE= 10/2 = 5
Estimativas de Variâncias:
F0= 5/7,17=0,70
Fcrítico= 3,89 (em função dos GLIBVE GLIBVD e alfa=5%
F0<Fcrítico Não se Rejeita Ho
Algoritmo: Teste de Fisher para Médias
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)186
Fonte de Variação
Própria Variação GLIB Variância
Estimada F0
VE 10 2 10/2=5 5/7,17=0,70
VD 86 12 86/12=7,17
VT 96 14
Quadro Resumo Básico
Algoritmo: Quadro resumo
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)187
One-way ANOVA: A; B; C (use unstacked)
Analysis of Variance
Source DF SS MS F P
Factor 2 10,00 5,00 0,70 0,517
Error 12 86,00 7,17
Total 14 96,00
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev ----+---------+---------+---------+--
A 5 6,000 1,581 (------------*------------)
B 5 7,000 3,808 (------------*------------)
C 5 8,000 2,121 (------------*------------)
----+---------+---------+---------+--
Pooled StDev = 2,677 4,0 6,0 8,0 10,0
Minitab <ANOVA>One-Way Unstacked
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)188
Exemplo Na definição do Setup dos fatores para o processo Inside Spray quatro conjuntos de níveis para os parâmetros de Temperatura foram avaliados. Deseja-se investigar o efeito desses quatro Setups com relação a Distribuição do Verniz interno no fundo para cerveja medidas em mg/pol2 após o processo. Tais medidas são dadas na planilha ao lado.
One-Way ANOVA
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)189
Usar o Procedimento Stack Columns para executar o Teste ANOVA One-Way (preferível pois faz a análise de resíduos!!)
ANOVA One-Way (Unstacked)
ANOVA One-Way (Unstacked)
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)190
As médias são diferentes
ANOVA One-Way: Resultados
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)191
Setu
p1
Setu
p2
Setu
p3
Setu
p4
4.5
5.5
6.5
7.5
8.5
Boxplots of Setup1 - Setup4(means are indicated by solid circles)
ANOVA One-Way: Boxplots
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)192
6.0 6.5 7.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
Fitted Value
Res
idua
l
Residuals Versus the Fitted Values(response is mg)
ANOVA One-Way: Residuals x Fitted
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)193
Exemplo
No processo Bodymaker deseja-se investigar a Profundidade do Dome em função de 3 conjuntos de parâmetros (envolvendo pressão, Temperatura Vazão, etc...) e também em dois turnos de operação. Foram então colhidas amostras da Profundidade do Dome (em polegadas) para diferentes Turnos e diferentes Conjuntos de Parâmetros. Anova_2.MTW
Two-Way ANOVA
Processo de fabricação de latas
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)194
ANOVA Two-Way: Follow along
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)195
Diferentes
Iguais
ANOVA Two-Way: Resultados
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)196
Exemplo 3
Foram avaliados três níveis de pressões de ar draw pad (em psi) e também três níveis de pressões de ar blow off (em psi) na influência de problemas visuais após o processo Minster. O número de defeitos visuais (Riscos, Abaulamento, orelhas, rebarbas, rugas e ovalização) está mostrado na planilha ao lado. Anova_3.MTW
ANOM
Análise de Médias
ANOM: Para identificar qual média é diferente e avaliar a Interação!
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)197
ANOM
Isso é melhor estudado em DOE!
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)198
Não há interação entre as pressões Blow e Draw. O Efeito de
Blow é significativo!
ANOM: Gráficos
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)199
A Pressão Blow afeta mais a
média
3,0 e 8,83 são valores distantes
de 6,22
Draw
Blow
ANOM: Resultados
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)200
Exemplo 5
Deseja-se avaliar o tempo gasto (em minutos) por seis funcionários para ajustar o Setup de dois processos (I e II) usando dois diferentes procedimentos (um novo e um antigo). A planilha seguinte mostra os resultados obtidos.
Anova_5.MTW
Balanced Anova
Processo de fabricação de latas
Isso é a base para DOE - Delineamento
de Experimentos!
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)201
Balanced ANOVA
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)202
Diferentes
Balanced ANOVA: Resultados
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)203
TWO-WAY
Ex.6: An engineer suspects that the surface finish of metal parts is influenced by paint used and the drying time.
Using a 5% significance level, test the influence of these two factors as also its interaction.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)204
TWO-WAY
Drying Time (min)
Paint 20 25 30 Total(yi..)
1 74 64 50 188 73 61 44 178 78 85 92 255 621
2 92 86 68 246 98 73 88 259 66 45 85 196 701
Total:(y.j.) 434 437 451 1322
(y…)
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)205
TWO-WAY
Ex.7: Am experiment describes na investigation about the effect of glass type and phosphor type on the brigtness of a television tube. The response is the current (mA) necessary to obtain a specified brightness level.
Using a 5% significance level, test the influence of these two factors as also its interaction.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)
6 – CORRELAÇÃO E REGRESSÃO
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)207
• Correlação• Procedimentos Gerais Y=f(X)• Regressão linear• Ajuste da Regressão• Regressão linear Múltipla• Best Subsets
A análise de regressão é uma técnica estatística usada para modelar e investigar a relação entre duas ou mais variáveis. O modelo é freqüentemente usado para previsões.
Regressão é um teste de hipótese Ha: O modelo permite significativamente prever a resposta.
Análise de Regressão
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)208
Coeficiente de Correlação
Ex.: Suponha que o nosso desejo seja o de quantificar a associabilidade entre duas variáveis relacionadas a cinco agentes de uma seguradora. Assim, temos:X≡ Anos de experiência do agente.Y ≡ Número de clientes do agente.
8765432
70
60
50
ExperiênciaAnos de
Clie
ntes
Agente x yA 2 48B 4 56C 5 64D 6 60E 8 72
(x, y) é um par aleatório – Dados emparelhados
Diagrama de Dispersão
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)209
y
x x x−
y y−
x xs
zx
x−
=
yy
zs
yy=
−
r=Correlação de Pearson
Série de dados originais (x e y) são valores quantitativos.
O conjunto de pontos é deslocado, tendo agora como centro, os valores médios.
A escala de x e y éagora padronizada. Isso torna os valores independente da sua unidade.
∑=
==n
iyx ii
zzn
YXr1
1),(Corr
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)210
Agente x y zx zy zx . zy
A 2 48 -3 -12 -1.5 -1.5 2,25B 4 56 -1 -4 -0.5 -0.5 0,25C 5 64 0 4 0 0.5 0D 6 60 1 0 0.5 0 0E 8 72 3 12 1.5 1.5 2,25
Total 25 300 0 0 0 0 4,75
x x− y y−
Coeficiente de Correlação
x = 5Sx = 2
y = 60S y = 8 %9595,0
575,4),( ===YXr = Correlação
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)211
r X Yn
z zn
x xs
y ysx y
i
ni
x
i
yi
n
i i= = =
−⎛
⎝⎜
⎞
⎠⎟
−⎛
⎝⎜
⎞
⎠⎟
= =∑ ∑Corr ( , )
1 11 1
( )( )r
nx x y y
s sX Y
s si i
x y x y
=− −
⋅=
⋅∑1 Covariância ( , ) − ≤ ≤1 1r
A correlação apresentada aqui é linear. Existem outros tipos de correlação!
P_value p/ Correlação
Agente x y
A 2 48
B 4 56
C 5 64
D 6 60
E 8 72
Pearson correlation of Anos Exp and Clientes = 0,950
P-Value = 0,013
Ex.: Cálculo da correlação da tabela ao lado
Forte Correlação pois P-Value <0,05
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)212
Faça a análise de Correlação dasvariáveis ao lado na planilhaBidimensional.mtw
Correlação no Minitab
O Coeficiente de Correlação étambém chamado de Coeficiente de Pearson.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)213
A) Uma medida de Correlação fornece dois tipos de informações a respeito do relacionamento de duas variáveis. Quais são elas?
B) Qual coeficiente de correlação abaixo indica o mais forte relacionamento?
a) 0.70 b) 0.03 c)-0.77 d) 0.10
C) Se a correlação Rxy=0.45, então Ryx=
D) Qual o valor do coeficiente de correlação melhor descreve os seguintes valores das variáveis X e Y, relacionadas abaixo:
X: 20 30 40 50 60
Y: 40 30 20 10 0
a) -1.0
b) 0.0
c) 0.5
d) 1.0
E) Qual a correlação do gráfico abaixo?
Algumas questões sobre Correlação:
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)214
F) Se um coeficiente de correlação for de +1.4, o que ocorre?
a) O Relacionamento é extremamente forte
b) O Relacionamento é positivo
c) As respostas acima estão corretas
d) Um erro computacional foi cometido
G) Um coeficiente de Pearson de -0.5 entre os valores de Leitura (X) e o número de dias ausentes da escola (Y) indica que:
a) Metade dos valores de Leitura são menos do que o número de dias ausentes da escola
b) Maiores valores de Leitura são associados com menor ausência da escola
c)A soma do produto XY é igual a -0.5
d) Quase não existe relacionamento entre X e Y
Algumas questões sobre Correlação:
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)215
É comum associar-se um defeito com uma variável que está sempre presente quando ele ocorre (é o caso do operador que é culpado, pois quando ele executa a operação ocorre um defeito – Toda operação geralmente tem um operador).
© 1995 Six Sigma Academy Inc.
Dia Fator 1 Fator 2 Resultado1 Água Whisky Ficou Bêbado2 Água Vodka Ficou Bêbado3 Água Rum Ficou Bêbado4 Água Bourbon Ficou Bêbado
Conclusão: a água embebeda
Variável Comum
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)216
Se a história servisse de base, os Republicanos deveriam estar vestindo a camisa dos Yankees e dando uma força para o New York vencer o campeonato. Desde a Segunda Guerra Mundial, toda vez que os Yanks venceram em um ano de eleição, o Partido Republicano assumiu a Casa Branca.
Yankees RepublicanosGANHARAM PERDERAM GANHARAM PERDERAM
1976
1964
1960
1956
1952
As “armadilhas”: correlações casuais
Variável Comum
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)217
As “armadilhas”: causa reversa
Um fator “X” tem influência sobre um “Y” quando, na verdade, o que ele está vendo é a conseqüência do “Y” .
Um exemplo deste caso é o do Departamento de Vendas que insatisfeito com as Vendas resolve dar uma série de descontos e faz promoções para atrair os clientes . Só que a verdadeira causa do problema é o Serviço de Atendimento ao Cliente .
Com os novos descontos e a nova promoção fica mais difícilainda administrar o Serviço de Atendimento ao Cliente, ocasionando num aumento da insatisfação do cliente e diminuindo mais ainda as vendas (“o tiro saiu pela culatra”) .
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)218
As “armadilhas”: fatores omitidos
Pesquisas continuamente demonstram que a medida que o tamanho dos hospitais aumenta, a taxa de mortalidade dos pacientes aumenta dramaticamente. Portanto, deveríamos evitar hospitais grandes?
Esta análise é enganadora, pois omite um segundo X2 (fator) importante -- a gravidade da condição do paciente quando é admitido ao hospital. Os casos mais sérios tendem a ser levados aos hospitais maiores!
Fumar cigarros causa câncer? E se eu dissesse que ... (1) Médicos franceses não encontram esta correlação;(2) O tabaco dos EUA geralmente é exposto a pesticidas, fertilizantes e preservativos contendo substâncias conhecidamente cancerígenas, e;(3) O tabaco francês raramente entra em contato com tais substâncias químicas.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)219
Em 1950, um fazendeiro afirmou que suas árvores frutíferas estavam sendo prejudicadas pelas ondas de rádio de uma estação local próxima. Ele colocou uma tela de arame ao redor de algumas das árvores para “protegê-las” destas ondas de rádio e, realmente, as árvores protegidas se recuperaram rapidamente, enquanto que as desprotegidas ainda sofriam.
Na mesma época, muitas árvores cítricas em todo país foram ameaçadas por uma doença chamada de “folha pequena”. Alguns fazendeiros Texanos descobriram que uma solução de sulfato de ferro curava a doença. No entanto, nem sempre funcionava no Texas, e praticamente nunca funcionava na Flórida ou na Califórnia.
O mistério foi desvendado quando o problema verdadeiro foi revelado -- deficiência de zinco no solo. A cerca do fazendeiro Radiofóbico era de tela galvanizada, sendo que traços do zinco da galvanização eram levados da tela para o solo.
O sulfato de ferro nada tinham a ver com a cura, mas sim os baldes de ferro galvanizados usados para espalhar a substância! Em outras regiões, onde outros tipos de baldes eram usados, as árvores continuaram doentes.
Em 1950, um fazendeiro afirmou que suas árvores frutíferas estavam sendo prejudicadas pelas ondas de rádio de uma estação local próxima. Ele colocou uma tela de arame ao redor de algumas das árvores para “protegê-las” destas ondas de rádio e, realmente, as árvores protegidas se recuperaram rapidamente, enquanto que as desprotegidas ainda sofriam.
Na mesma época, muitas árvores cítricas em todo país foram ameaçadas por uma doença chamada de “folha pequena”. Alguns fazendeiros Texanos descobriram que uma solução de sulfato de ferro curava a doença. No entanto, nem sempre funcionava no Texas, e praticamente nunca funcionava na Flórida ou na Califórnia.
O mistério foi desvendado quando o problema verdadeiro foi revelado -- deficiência de zinco no solo. A cerca do fazendeiro Radiofóbico era de tela galvanizada, sendo que traços do zinco da galvanização eram levados da tela para o solo.
O sulfato de ferro nada tinham a ver com a cura, mas sim os baldes de ferro galvanizados usados para espalhar a substância! Em outras regiões, onde outros tipos de baldes eram usados, as árvores continuaram doentes.
O Fazendeiro Radiofóbico
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)220
As “armadilhas”: multicolinearidade
É difícil saber o quê causa o quê, quando alguns fatores [X’s] tendem a ocorrer juntos regularmente.
• “Tenho visto uma redução dramática nas perdas desde que comecei a implementar as ferramentas estatísticas na fábrica!” No entanto, foi exatamente na mesma época em que o RH introduziu seu novo sistema de recompensa e reconhecimento. O que ocasionou a melhoria?
• Em 1967, um artigo rotulou um determinado tipo de carro como sendo inseguro. O modelo em questão era um carro pequeno esportivo de alto desempenho. Mas que tipo de motorista seria atraído a tal carro? E se eu dissesse que a maioria dos proprietários deste carro tendiam a ser motoristas jovens menores de 25 anos com novas idéias. Esta faixa etária não paga prêmios de seguro mais elevados devido a maior incidência de acidentes?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)221
y
x
Linha de Regressão A variável X é dita variável independente (ou exógena), enquanto Y é dita variável dependente (ou endógena).
•Y=f(x) Simples
•Y=f(x,y,z...) Múltipla
Y=f(x)
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)222
Variáveis Indicativas (para Xs Discretos)
xx
xx
x
x
x
x
x x
xx
x
xx
Xi
Y
Xa
Xb
Xc
Curvilínea (Um X)
X
Y
Linear Simples (Um X)
X
Y
Múltipla (Dois ou mais Xs)
Y
X 2
X1
Logística (Ys Discretos)1
0
% y
es
X
Curvilínear (Dois ou mais Xs)
Y
X1
X 2
Regressão
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)223
xy βα +=y
x x1 x2 x3
,ˆ bxay +=
Uma importante condição para o uso de regressão simples é que os resíduos (e) sejam independentes de x. Porque?
Curva de Resíduos (e)
Resíduos
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)224
x
y
757065605550
8
7
6
5
4
3
2
eiei2
1 ini e=Σ
bxay +=ˆ
( ) ( )21
21
21 ˆ ii
niii
nii
ni bxayminyyminemin −−Σ=−Σ=Σ ===
Regressão Linear Simples
iy
iy
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)225
21 i
ni e=Σ bxay +=ˆ
( ) ( )21
21
21 ˆ ii
niii
nii
ni bxayminyyminemin −−Σ=−Σ=Σ ===
.0 e 01
21
2 == ∑∑ ==
n
i in
i i db
da ∂
∂∂∂
∑∑
=
=
=−−−
=−−−n
i iii
n
i ii
bxayx
bxay
1
1
,0)(2
,0)(2
A matemática da Regressão Linear
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)226
⎪⎩
⎪⎨
⎧
−=
=−
−=
∑∑
=
=
,
,)(
)(
12
1
xbyaSS
xx
yxxb
xx
xyn
i i
n
i ii
⎪⎩
⎪⎨⎧
+==+=
∑ ∑∑∑ ∑
= ==
=n
i
n
i
n
i iii
n
i
nii
ixbxayx
i xbnay
1 12
1
1,1
Ufa!
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)227
Ex.: Obter a equação da reta (chamada de reta dos mínimos quadrados) para os seguintes pontos experimentais:
x 1 2 3 4 5 6 7 8y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0
Traçar a reta no diagrama de dispersão. Calcular o coeficiente de correlação linear.
Qual o valor previsto para x=9?Qual a Tolerância de X para 1<Y<1.5?
Exemplo
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)228
.421622048
)36(204
,1,94,415,508
2,9365,502
=−=−=
=−=⋅
−=
xx
xy
S
S
Regressão: By Hand
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)229
.421622048
)36(204
,1,94,415,508
2,9365,502
=−=−=
=−=⋅
−=
xx
xy
S
S
.174,0976,0150,18
36217,082,9
,217,042
1,9
=−=⋅−≅−=
≅==
xbya
SS
bxx
xy
xy 217,0174,0ˆ +=
Regressão: Cálculos
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)230
Regressão: Gráfico
x
y
876543210
2,00
1,75
1,50
1,25
1,00
0,75
0,50
S 0,121335R-Sq 95,7%R-Sq(adj) 95,0%
Fitted Line Ploty = 0,1750 + 0,2167 x
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)231
98,006,242
1,9
,06,258,1064,128
)2,9(64,122
≅⋅
==
∴=−=−=
yyxx
xy
yy
SSS
r
S
Relembre Correlação!
Regressão: Correlação
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)232
Regressão linear simples no Minitab
Previsão
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)233
Ajuste da Regressão
Linear R-quadrado é a porcentagem da variação explicada pelo seu modelo.
R-quadrado (ajustado) é a porcentagem da variação explicada pelo seu modelo, ajustada para o número de termos em seu modelo e o número de pontos de dados.
O “valor-p” para a regressão é para ver se o modelo de regressão inteiro é significativo.
—Ha: O modelo permite significativamente prever a resposta.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)234
Quadrático
Ajuste Quadrático
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)235
Cúbico
Ajuste Cúbico
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)236
Intervalos de confiança e de previsão Uma faixa (ou intervalo) de confiança é uma medida da certeza da forma da linha de regressão ajustada. Em geral, uma faixa de 95% implica em uma chance de 95% de que as linha verdadeira fique dentro da faixa. [Linhas vermelhas]
Uma faixa (ou intervalo) de previsão é uma medida da certeza da dispersão dos pontos individuais em torno da linha de regressão. Em geral, 95% dos pontos individuais (da população em que a linha de regressão se baseia) estarão contidos dentro da faixa. [Linhas azuis]
Ajuste da Regressão
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)237
CTQ
1
2
Estreitando Tolerâncias
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)238
CTQ
1 1’
2’ 2
Estreitando Tolerâncias
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)239
Pratique Regressão Linear Simples
Determine a função de transferência entre o Número de Setups e o Tempo de Ciclo para diversas operações em uma certa empresa. Use a planilha cycletime.mtw.
Faça a análise de Resíduos.
Qual a previsão do Tempo de Ciclo para uma operação que consiste em 10 Setups de equipamento?
A equação final é adequada? Se não for, como melhorá-la?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)240
Uma reação Química foi realizada sob seis pares de diferentes condições de pressão e temperatura. Em cada caso foi medido o tempo necessário para que a reação se completasse. Obter a equação de regressão do tempo em relação a pressão e temperatura.
Regressão Múltipla
Regressão.mtw
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)241
Menores que 0,05
Maior melhor
Regressão Múltipla: Resultados
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)242
92 estudantes americanos participam de um simples experimento. Cada estudante registra o seu peso, altura, gênero, pulso e se é fumante ou não. Todos eles jogam uma moeda e sorteiam se vão dar uma corrida (cara) ou não por um minuto. Após a corrida, todos os alunos registram o seu pulso novamente. Um aluno sugere que seja inserida a seguinte “importante”consideração: Se a pessoa pinta o cabelo ou não.
Deseja-se fazer uma regressão do segundo pulso em relação a todas as outras variáveis.
Regressão.mtw
Best Subsets
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)243
Equação de regressão inicial. Muito complexa
Correlação muito alta. Quem pinta cabelo é“geralmente” mulher
Best Subsets: Resultados
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)244
Melhor ajuste
Best Subsets: Resultados
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)245
30 40 50
-3
-2
-1
0
1
2
3
Pred. Y
Residual
0 50 100
-3
-2
-1
0
1
2
3
Pred. Y
Residual
0 50 100
-3
-2
-1
0
1
2
3
Time Order
Residual
0 50 100
-3
-2
-1
0
1
2
3
Time Order
Residual
3 4 5 6 7 8 9 10 11 12
-3
-2
-1
0
1
2
3
X
Residual
10 20 30
-3
-2
-1
0
1
2
3
X
Residual
-3 -2 -1 0 1 2 3
-3
-2
-1
0
1
2
3
Residual
Nscore
-1 0 1 2 3 4
-3
-2
-1
0
1
2
3
Residual
Nscore
Bom Ruim
Nos casos ruins tente uma transformação
em X,em Y ou ambos. Use Box-Cox
Transformation
Considere a possibilidade da
existência de variáveis ocultas que
não foram consideradas no
modelo (Lurking)
Residuals vs Each X
Time Plot of Residuals
Residuals vs Predicted Y (Fits)
Normal Probability Plot of Residuals
Análise de Resíduos
Entenda que X e Y não precisam ser normalmente distribuídos. Os resíduos, contudo, deveriam ser.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)246
Regressão Curvilínea
200 250 300 350 400
1900
1950
2000
2050
2100
Temperature
Seal Strength(g/cm2)
Um laboratório está fazendo testes em adesivos em função da temperatura. Quando a temperatura aumenta a força do contato entre duas superfícies aumenta Em um determinado ponto, contudo a força desse contato começa a diminuir em função de propriedades térmicas do adesivo. Qual o modelo empírico da força (Seal Strength) em função da temperatura?
Curve.mtw
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)247
Termo quadrático
Observe resíduos
VIF
Armazena resíduos
Função quadrática
Deve-se criar a variável quadrática e em seguida rodar o modelo em Regression
Termo quadrático da regressão
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)248
Regressão Curvilínea
XX2
The regression equation isSealStrength = 923 + 7.45 Temperature - 0.0125 TempSqrd
Predictor Coef StDev T P VIFConstant 922.98 72.33 12.76 0.000Temperat 7.4469 0.5033 14.80 0.000 132.9TempSqrd -0.0124596 0.0008499 -14.66 0.000 132.9
S = 25.18 R-Sq = 69.4% R-Sq(adj) = 68.7%
Analysis of Variance
Source DF SS MS F PRegression 2 139321 69661 109.87 0.000Residual Error 97 61498 634Total 99 200819
Source DF Seq SSTemperat 1 3051TempSqrd 1 136270
X e X2 são fortemente correlacionados. Nenhuma surpresa
Conclusão: Existe uma curvatura significativa
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)249
PORTFÓLIO
n PREÇO VENDAS
1 5,5 4202 6,0 3803 6,5 3504 6,0 4005 5,0 4406 6,5 3807 4,5 4508 5,0 420
Ex.1: De acordo com os dados da tabela ao lado, há correlação entre o preço de um produto e o respectivo volume de vendas?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)250
PORTFÓLIO
n Price Sales1 19,2 25,42 20,5 14,73 19,7 18,64 21,3 12,45 20,8 11,16 19,9 15,77 17,8 29,28 17,2 35,2
Exercício 2:
A liquor wholesaler is interested in assessing the effect of the price of a whiskey on the quantity sold. The results in table represent the price (US$) and the respective eight weeks of sales. What are your conclusions?
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)251
PORTFÓLIO
n Dosage Recovery Time
1 1,2 252 1,0 403 1,5 104 1,2 275 1,4 16
Exercício 3:
Doctors are interested in the relationship between the dosage of a medicine and the time required for a patient’s recovery. Based on the following data, verify if the variables are correlated.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)252
PORTFÓLIO
n x y1 3,6 242 3,3 213 2,8 224 2,6 225 2,7 186 2,9 137 2,0 98 2,6 6
Exercício 4:
The table shows, for eight vintages of select wine, purchase per buyer (y) and the wine buyer’s rating in a year (x).
Are the variables correlated?
* Vintage: safra de vinho
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)253
Exemplo: Determine a correlação entre o tempo de experiência e o salário anual do funcionário e se existe diferença significativa entre os salários dos homens e das mulheres. (Use Anova e 2-sample t)
Mulheres
Salário ($) 36730 40650 46820 50149 59679 67360
Experiência 5 7 9 10 14 17
Homens
Salário ($) 51535 62289 72486 75022 93379 105979
Experiência 5 7 9 10 14 17
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)254
Exercício 6:
Determinar a composição ótima da seguinte carteira:
PORTFÓLIO
A B
Retorno: 0,15 0,20
D.P. : 0,20 0,30
Variância: 0,04 0,09
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)255
PORTFÓLIO
n ATIVO 1 ATIVO 2
1 0,15 0,122 0,17 0,133 0,04 0,094 -0,08 0,075 0,15 0,096 0,22 0,117 0,03 0,098 -0,14 0,069 0,02 0,08
10 0,15 0,10
Exercício 7:
Determinar a composição ótima da carteira formada pelos ativos a seguir, considerando-se um retorno mínimo de 9%.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)
7 – TESTES DE INDEPENDÊNCIA ( )2χ
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)257
Suponha que uma amostra com n observações possa ser classificada em uma tabela cruzada, formada por um fator de linha e um de coluna.
Se a hipótese nula puder ser escrita como:
H0: Não há associação entre os dois atributos.
Então a freqüência esperada dentro de cada célula será:
nCR
E jiij =
Onde: Ri = total da linha i; Cj = total da coluna j
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)258
A rejeição da hipótese nula se dará se:
( ) 2),1)(1(
1 1
22
αχχ −−= =∑∑ >
−= cr
r
i
c
j ij
ijijT E
EO
O teste é baseado na magnitude da discrepância entre as quantidades observadas e esperadas.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)259
Método H M Total
Agência 256 (233,5) 74 (96,5) 330Internet 41 (58,7) 42 (24,3) 83Toll-free 66 (70,8) 34 (29,2) 100Total: 363 150 513
Ex.1: De acordo com os dados da tabela abaixo, avalie se existe relação entre o método de reserva de passagens e o sexo do passageiro.
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)260
A rejeição da hipótese nula se dará se:
( ) ( ) ( ) 8,262,29
2,2934...5,96
5,96745,233
5,233256 2222 =
−++
−+
−=Tχ
O valor crítico do teste será:
99,5205.0,2
2),1)(1( ==−− χχ αcr
Como o valor de teste é maior que o valor crítico, rejeita H0. Logo, o tipo de reserva está relacionado ao sexo do passageiro. O indício da diferença está no maior .2
celχ
Estatística Aplicada
Balestrassi – Paiva – Ferreira (UNIFEI – IEPG)261
GenderTotal
Candidate Male FemaleA 150 130 280B 100 120 220
Total 250 250 500
Ex.2: Following a presidential debate, people were asked how they might vote in the forth coming election. Is there any association between one’s gender and choice of a candidate?