Upload
letram
View
214
Download
0
Embed Size (px)
Citation preview
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Prof. Cezar Augusto Cerqueira – UPE/UNICAP
CURSO DE PROBABILIDADE E
ESTATÍSTICA BÁSICA
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
ESTATÍSTICA: UMA VISÃO GERAL
ESTATÍSTICA
Ciência que nos ajuda a tomar decisões na presença de variabilidade e/ou incerteza.
Coleta, apresentação, processamento, análise e interpretação de dados.
Desenvolver e/ou aperfeiçoar produtos e/ou processos.
ENGENHEIRO
Resolve problemas de interesse geral por meio de métodos científicos.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Descrição clara
Identificar Fatores Importantes
Propor um Modelo
Ajustar o Modelo Solução
Realizar Experimentos
Conlusões e Recomendações
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Métodos Estatísticos: Importância - profissional
Ferramenta fundamental no processo de solução de problemas
Gestores modernos lidam com grande quantidade de informação.
Auxílio na determinação de planos de ação para resolução de problemas
Tomada de decisões “bem informadas“ Apresentar e descrever de forma apropriada as
informações
Tirar conclusões sobre grandes populações com base em amostras
Melhorar processos
Obter previsões confiáveis
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Métodos Estatísticos: Importância - empresa
Aumento na competitividade
Eliminação de desperdícios
Redução na necessidade de inspeção
Aumento no grau de satisfação dos clientes
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
ANÁLISE EXPLORATÓRIA/DESCRITIVA DE DADOS
Organização/apresentação e cálculo de indicadores e medidas descritivas.
PROBABILIDADE
Teoria matemática utilizada para se estudar a incerteza, oriunda de fenômenos de caráter aleatório.
INFERÊNCIA ESTATÍSTICA
Trata da análise e interpretação de dados amostrais
O principio básico é tirar conclusões sobre a população a partir de uma amostra de dados obtida da mesma.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Coleta de dados
Dados: base para tomada de decisões
Dados Observados (análise exploratória)
Informação (Modelos Probab - Inferencia))
Conhecimento (Tomada de decisão)
Inteligência (Projetos)
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Indivíduo e Variável
Indivíduos: objetos descritos por um conjunto de dados (pessoas, empresas, municípios, animais, ações, tempo, etc)
Variáveis: qualquer característica de um indivíduo, podendo assumir diferentes valores, de acordo com o indivíduo a que se refere.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
OBSERVAÇÃO versus EXPERIMENTO
Estudo observacional
Investiga indivíduos e mede variáveis de interesse, sem influenciar as respostas
Experimento
Impõe algum tipo de tratamento sobre os indivíduos, a fim de observar suas respostas
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
TIPOS DE DADOS: VARIÁVEIS
QUALITATIVAS
Nominais (sexo, região...)
Ordinais (grau de instrução)
QUANTITATIVAS
Discretas (contagens)
Ex: número de itens defeituosos; número de arranhões em certa peça; número de acidentes de trabalho no mês.
Contínuas (mensurações em escala contínua)
Diâmetro de uma peça; rendimento de uma reação química; tempo gasto na execução de uma tarefa; espessura de uma peça.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
O Banco de Dados
Nome Idade Sexo Renda (Sal. Min) Instrução
José 27 Masc 5,32 Superior
Catarina 30 Fem 6,43 2 Grau
Pedro 21 Masc 1,20 1 Grau
Cibele 22 Fem 2,33 2 Grau
Helena 25 Fem 3,56 2 Grau
Marta 20 Fem 1,70 1 Grau
Carolina 35 Fem 4,50 Técnica
Juan 45 Masc 8,00 Superior
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Levantamentos amostrais
População
Grupo inteiro de indivíduos sobre o qual se deseja informações
Amostra
Parte da população da qual se coletam de fato informações, utilizadas para se tirarem conclusões sobre o todo.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Organização e Análise de dados
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
FERRAMENTAS GRÁFICAS SIMPLES: VARIÁVEIS CONTÍNUAS
o
o o o o o
3 4 5 6 7 8
Diagrama de Pontos
Considere os dados: 3 4 4,5 4,5 6 8
Exibem: Dispersão, conglomerados de pontos, lacunas, outliers, comparações
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
GRÁFICOS SIMPLES: VARIÁVEIS CONTÍNUAS : Gráfico Ramo-e-Folhas
Exemplo: Considere os dados abaixo representando a resistência à compressão de
uma amostra de 80 corpos de prova de liga de alumínio:
105 221 183 186 121 181 180 143
97 154 153 174 120 168 167 141
245 228 174 199 181 158 176 110
163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123
134 178 76 167 184 135 229 146
218 157 101 171 165 172 158 169
199 151 142 163 145 171 148 158
160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149
Ramo Folha Frequencia
7 6 1
8 7 1
9 7 1
10 51 2
11 580 3
12 103 3
13 413535 6
14 29583169 8
15 471340886808 12
16 3073050879 10
17 8544162106 10
18 361410 7
19 960934 6
20 7108 4
21 8 1
22 189 3
23 7 1
24 5 1
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Apresentação de Dados Distribuições de frequências: caso nominal
Tabela 2.1
Empregados do setor de produção, segundo o grau de instrução, 2005.
GRAU DE INSTRUÇÃO Freqüência (fi)
Primeiro Grau 15 Segundo Grau 25 Superior 10 TOTAL 50
FONTE: Pesquisa direta
Empregados do Setor de Produção, segundo grau de
instrução - 2000
30%
50%
20%
Primeiro Grau
Segundo Grau
Superior
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Gráfico de Sequencias no tempo
100
120
140
160
180
200
220
240
260
280
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Os dados representam a resistencia à compressão de uma amostra de 20 conectores plásticos:
241 194 190 209
258 225 250 212
237 190 240 123
210 250 190 178
189 220 180 190
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
HISTOGRAMA
Distribuição: modelo estatístico para o padrão de ocorrencia dos valores de determinada população
O histograma é um gráfico de barras no qual o eixo horizontal é subdividido em vários pequenos intervalos, sendo construída uma barra vertical, de área proporcional ao número de observações na amostra cujos valores pertencem ao intervalo correspondente.
As informações são dispostas de modo a permitir a possível visualização da forma da distribuição dos dados e a percepção do valor central e da dispersão em torno desta valor central.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Distribuições de frequência: Caso contínuo - Histograma
As distribuições podem diferir em:
Locação (centralidade, média, mediana)
Variabilidade (desvio padrão, variância)
Forma (assimetria)
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Um procedimento para construção de um Histograma (variáveis contínuas)
Coletar “n” observações Escolher o número de intervalos (k) Calcular a amplitude total dos dados (R)
R = Max - Min
Calcular o comprimento de cada intervalo (amplitude de classe, h) h=R/k
Arredondar convenientemente h Calcular os limites de cada intervalo Construir a tabela de frequencias, que deve conter:
Limites de cada intervalo; ponto médio; frequencia simples (fi); frequencia relativa; frequencia acumulada (simples e relativa)
Desenhar o Histograma
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Distribuições de frequência variável contínua: Histograma
Dados relativos ao comprimento de uma amostra de 100 parafusos
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Distribuições de frequência: Caso discreto
Peças
0 35
1 40
2 7
3 5
4 2
5 1
Total 90
0
5
10
15
20
25
30
35
40
45
0 1 2 3 4 5
Dados referentes ao número de defeitos encontrados em uma amostra de 90 chapas de aço
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Tipos de Histogramas: simétrico
Valor médio no centro
Frequencia mais alta no centro diminuindo gradualmente de forma simétrica em direção aos extremos
0
20
40
60
80
100
Média=mediana=moda
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Tipos de Histogramas: assimétrico positivo
freqüência decresce bruscamente em um dos lados e de forma gradual no outro
Média fora do centro do histograma
cauda mais longa em um dos lados
0
10
20
30
40
50
60
70
80
90
Média>mediana; média>moda
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Tipos de Histogramas: dois picos
Mistura de dados com médias diferentes
Dados de 2 máquinas ou 2 turnos, etc
0
20
40
60
80
100
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Gráfico de Pareto
Princípio de Pareto (80/20)
Em torno de 80% dos problemas vem de 20% das causas
Atacar 1/5 das causas solucionaria 4/5 dos problemas
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Distribuições de frequência: Gráfico de Pareto
Tabela 2.4 – Defeitos encontrados em uma amostra de lentes fabricadas pela indústria
Tipo de Defeito Freqüência de defeitos
Total Acumulado
Freqüência relativa (%)
Percentual Acumulado
Revest. Inadequado 55 55 43,3 43,3
Trinca 41 96 32,3 75,6
Arranhão 12 108 9,4 85,0
Espessura inadequada 11 119 8,7 93,7
Mal-acabada 5 124 3,9 97,6
outros 3 127 2,4 100,0
Total 127 - 100,0 -
FONTE: Indústria de lentes
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Resumindo dados: análise descritiva e exploratória
“Um estatístico é um sujeito que se está com a cabeça num forno e os pés enterrados no gelo, ainda diz que na média a temperatura está ótima”.( K. Dunnigan)
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
RESUMO NUMÉRICO DE DADOS QUANTITATIVOS: LOCALIZAÇÃO DO
CENTRO DOS DADOS
Média Aritmética
Mediana Valor do meio em uma sequencia ordenada de dados
Moda Valor mais frequente de uma série de dados
n
Xi
X
n
i
1
n
fX
X
k
i
ii 1Dados brutos
Dados agrupados
2
)1]2/([)2/(
nn
e
XXM “n” ímpar “n” par
cf
FnLiMe
Me
ant .])5,0[(
Dados agrupados
)2
1(nX
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
OUTRAS MEDIDAS DE LOCAÇÃO: Quartis
Primeiro Quartil
25% das observações são menores e 75% maiores
Segundo Quartil (Mediana)
Terceiro Quartil
)4
1(
1 nXQ
)4
)1(3(
3 nXQ
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
VARIABILIDADE
Medidas de tendência central podem mascarar importantes aspectos em uma série de dados
Um processo de produção de bens e fornecimento de serviços sempre apresenta variabilidade
A variabilidade é resultado de uma série de alterações nas condições sob as quais as observações são tomadas.
matérias-primas, condições de equipamentos, métodos de
trabalho, condições ambientais e operadores
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
VARIABILIDADE: Problematizando
Os dados abaixo referem-se a notas obtidas em 3 turmas de 5 alunos cada:
Turma A: 3 4 5 6 7
Turma B: 1 3 5 7 9
Turma C: 5 5 5 5 5
Em termos de tendência central como podemos analisar os grupos ?
E em termos de dispersão? Qual deles parece mais disperso? E qual deles apresenta maior variabilidade?
Façamos uma investigação gráfica do fenômeno.
Como obter uma medida de variabilidade média para os grupos?
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
MEDINDO A VARIABILIDADE
Variância Populacional
Variância Amostral
Desvio Padrão
Corresponde à raiz quadrada da variância
])(
[1
2
22
n
XX
n
i
i
])(
[1
12
22
n
XX
ns
i
i
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
MEDINDO A VARIABILIDADE: outras medidas
Amplitude Total Xmax-Xmin
Amplitude Interquartil J = Q3–Q1
Coeficiente de variação
Comparação de grupos muito diferentes
Comparação de dispersão com escalas diferentes
X
S
média
padrãoDesvioCV
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
ESTUDO DA FORMA: ASSIMETRIA
Curva Simétrica
Distribuição dos salários dos empregados do setor de produção da
Companhia A
0
5
10
15
20
25
30
6 10 14 18 22
sal.min.
fre
q.
sim
ple
s
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
ESTUDO DA FORMA: ASSIMETRIA
Assimetria Negativa Assimetria Positiva Simetria
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Gráfico Box-Plot
Juntas: Q1,Q2,Q3
Extremos: E1 e E2
E1 Q1 Me Q3 E2
REGIAO
COSULSENENO
IDH
MU
N
1.0
.9
.8
.7
.6
.5
.4
Índice de Desenvolvimento Humano no Brasil, por Região - 2000
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Explorando a relação entre variáveis
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
EXPLORANDO A RELAÇÃO ENTRE VARIÁVEIS
Mensurar o tipo e grau de associação entre duas ou mais variáveis.
Foco inicial: duas variáveis quantitativas
Etapas:
Abordagem gráfica: diagrama de dispersão
Cálculo do coeficiente de correlação linear de Pearson,
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Diagrama de dispersão
Gráfico utilizado para a visualização do tipo de relacionamento entre 2 variáveis quantitativas
Este entendimento contribui para aumentar a eficiencia dos métodos de controle de um processo
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Construção do diagrama de dispersão
1. Coletar ao menos 30 pares de observações (x,y) das variáveis a serem estudadas;
2. Registrar os dados em uma tabela;
3. Escolher uma variável a ser representada no eixo „x‟ (preditora) e outra variável em „y‟ (dependente);
4. Determinar os valores máximo e mínimo para cada variável;
5. Escolher as escalas para „x‟ e „y‟
6. Representar no gráfico os pares de observações (x,y).
7. Registrar informações importantes que devem constar no gráfico: título, legendas, unidades de medidas, etc
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Interpretação de diagramas de dispersão
Correlação positiva: à medida que x aumenta, y também aumenta.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Interpretação de diagramas de dispersão
Moderada correlação positiva: y tende a aumentar com x, porém com elevada variabilidade.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Interpretação de diagramas de dispersão
Ausência de correlação: os valores das variáveis não estão relacionados.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Interpretação de diagramas de dispersão
Moderada correlação negativa: y tende a diminuir com o aumento de x.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Interpretação de diagramas de dispersão
Forte correlação negativa: à medida que x aumenta, y diminui.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Outliers: São
observações extremas
não condizentes com
o restante dos
dados.
Interpretação de diagramas de dispersão
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Interpretação de diagramas de dispersão
Exemplo: O diagrama
ao lado mostra forte
correlação negativa
entre as variáveis
Tensão e Variação
no Corte.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Estratificação de Diagramas de Dispersão
Em muitos casos a estratificação de
um diagrama de dispersão permite a
descoberta da causa de um problema.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
RELAÇÕES ENTRE VARIÁVEIS: QUANTITATIVAS X QUALITATIVAS
Comparação do Comportamento de uma Variável Contínua por Grupos
Captar diferenças: i)nos níveis médios, ii)em variabilidade, iii)na forma da distribuição, iv)detalhes individuais. Via:
Diagrama de Pontos
Gráficos tipo Box-Plot
Gráfico Ramo-e-Folhas
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS
Tabela de contingência a 2 fatores
Variável dependente e explicativa
Medir associações
Encontrar distribuições percentuais
Distribuições marginais
Distribuições condicionais
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Noções de Probabilidade e Inferência: mensurando a incerteza... O Acaso existe? “ O acaso não existe: tudo é provação, ou punição, ou recompensa, ou previdencia”. (Voltaire) “O acaso é a causa ignorada de um efeito conhecido” (Voltaire)
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
NOÇÕES DE PROBABILIDADE
Aleatoriedade
Experimentos aleatórios
Resultados imprevisíveis
regularidade
Probabilidade
chance de ocorrência de um evento aleatório.
idealização do que aconteceria se feita uma sequencia longa de repetições
Proporção de vezes em quem um evento ocorre em uma sequencia longa de repetições do experimento
Independencia
Resultado de uma tentativa não deve influenciar o resultado de outra
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Modelos Probabilísticos para variáveis Discretas: Distribuição
Binomial Considera n repetições independentes de um
experimento de Bernoulli.
Exemplos:
Jogue uma moeda 10 vezes. Seja X=nº de caras obtido
Uma máquina produz 1% de peças defeituosas. Seja X=nº de peças defeituosas nas próximas 25 produzidas.
Nos próximos 30 nascimentos em uma maternidade, seja X=nº de meninas observado.
Seja a VA X=nº de sucessos obtidos. Portanto:
E(X)=np e V(X)=np(1-p)
nkppkXP knkn
k ,.....,1,0,)1()(
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Modelos Probabilísticos para variáveis Discretas: Distribuição de
Poisson Largamente empregada quando se deseja contar o
número de eventos de certo tio que ocorrem em um intervalo de tempo, superfície ou volume.
Exemplos:
Fórmula:
Número de chamadas telefônicas recebidas em uma central em um intervalo de tempo.
Número de falhas em um computador em um dia de operação.
Número de defeitos em uma chapa de metal de 1 m2 produzida.
!
)()(
k
tekXP
Kt
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Modelos Probabilísticos para variáveis contínuas: Distribuição Normal
Representação Gráfica:
A distribuição Normal é um modelo estatístico que fornece uma base teórica para o estudo do padrão de ocorrência dos elementos de várias populações de interesse.
µ é a média da distribuição (centro)
ơ é o desvio padrão da distribuição (dispersão)
+ -
68%
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Curva Normal
Para calcular probabilidades associadas a uma variável Normal de média µ e desvio padrão ơ, (N(µ,ơ)), deve ser utilizada a variável Normal padronizada ou reduzida:
A média de Z é zero e seu desvio padrão é 1.
Xz
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
µ µ+2ơ µ+3ơ µ+ơ µ-ơ µ-2ơ µ-3ơ
0 1 3 2 -1 -2 -3
X
z
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Distribuição Normal: uso da tabela
0 z
Xz
0 1
P(0<Z<1)
1
P(Z>1)
0,3413
0,5-0,3413
-1 0
P(Z<-1)
0,5+0,3413
z=1,64
0 z
5%
Uso inverso da Tabela
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Curva Normal
Propriedades: 1) A área sob a curva é igual a 1.
2) A curva é simétrica em relação à sua média.
3) f(x) tende para 0 quando X tende para +/-
4) A curva possui um ponto máximo em x = .
Intervalo Probabilidade (Área)
Interna Externa
(µ±ơ) 68,3% 31,7%
(µ±2ơ) 95,5% 4,5%
(µ±3ơ) 99,73% 0,27
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
DISTRIBUIÇÕES AMOSTRAIS
Lei dos grandes números – Extraia observações
aleatórias e independentes de uma população de média
À medida que o número de observações aumenta, a média amostral aproxima-se cada vez mais da média da população .
Características de uma população podem ser descritas pelos parâmetros.
Os parâmetros são quantidades desconhecidas, a serem estimadas via amostra.
As distribuições amostrais podem ser vistas como:
Distribuição de probabilidades de uma estatística amostral
Indicam como variam as estatísticas devido a variações no processo de amostragem.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS
Obtida a partir da média aritmética de uma série de amostras de tamanho n, extraída de uma população que tem média e desvio padrão .
A média da distribuição amostral de médias é igual à média populacional
O desvio-padrão da distribuição amostral de médias é dada por:
A distribuição amostral de médias é aproximadamente normal, para n grande.
A estatística correspondente à equação abaixo é aproximadamente N(0,1).
n
nxZ
)(
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
DISTRIBUIÇÃO AMOSTRAL DE PROPORÇÕES
Obtida a partir da proporção de elementos em uma amostra que possuem certa característica de interesse.
A média da distribuição amostral da proporção é igual à proporção populacional.
O desvio-padrão da distribuição amostral da proporção é dado por:
A distribuição amostral da proporção é aproximadamente normal, para n grande.
A estatística correspondente à equação abaixo é aproximadamente N(0,1).
n
ppp
)1(
n
PP
Ppz a
)1(
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
ESTIMAÇÃO: NOÇÕES GERAIS
Inferência: campo da estatística no qual são tomadas decisões sobre populações, com base na informação extraída de uma amostra.
Estimativas sobre os parâmetros populacionais
Estimativas pontuais
Estimativas por intervalos
Formulação de testes de hipóteses sobre os mesmos
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
INTERVALO DE CONFIANÇA PARA A MÉDIA – com desvio padrão conhecido
Objetivo do IC: estimar um parâmetro desconhecido com uma indicação da precisão da estimativa.
Formato: estimativa +/- margem de erro
Nível de confiança: probabilidade de que o método forneça uma resposta correta.
A média amostral varia de amostra para amostra
Para levar em consideração esta fato devemos construir um intervalo de confiança para a verdadeira média populacional, com base na média amostral.
Tal intervalo tem uma probabilidade (nível de confiança) de estar estimando corretamente (conter) o parâmetro.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
INTERVALO DE CONFIANÇA PARA A MÉDIA – com desvio padrão conhecido
O intervalo para a média, com desvio-padrão conhecido, pode ser representado pela expressão:
nZx
2
normaltabelanaobtidovalorZ 2
adotadociasignificandenível
médiadaamostralãodistribuiçdapadrãoerron
amostralmédiax
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
INTERVALO DE CONFIANÇA PARA A PROPORÇÃO
O intervalo para uma proporção pode ser representado pela expressão:
normaltabelanaobtidovalorZ 2
adotadociasignificandenível
amostralproporçãopa
n
ppzp aa
a
)1(
2
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
TESTES DE HIPÓTESES
Constituem uma outra face do trabalho de inferência
estatística e também fazendo uso da informação amostral.
Uma hipótese estatística: afirmação sobre parâmetros populacionais.
Teste de hipóteses: processo de decisão relativo a uma hipótese particular.
A informação de uma amostra é utilizada para avaliar a plausibilidade da hipótese formulada
Se tal informação for consistente com a hipótese tenderemos a concluir que não há evidências que favoreçam sua rejeição.
O fato de utilizar apenas uma amostra não nos permite concluir com certeza sobre a veracidade ou não de uma hipótese formulada.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
TESTES DE HIPÓTESES: exemplo com desvio-padrão conhecido
Uma empresa produtora de detergente deseja avaliar se a máquina que enche as garrafas plásticas está adequadamente regulada, para o valor especificado de 5 litros, por garrafa. O desvio padrão do processo é da ordem de 0,5 litros.
Caso a máquina esteja devidamente regulada, espera-se que o valor médio de uma amostra de garrafas concorde com um valor médio de 5 litros.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
TESTES DE HIPÓTESES
Hipóteses envolvidas:
H0: hipótese nula
H1: hipótese alternativa
A hipótese nula (H0) é a que é sempre testada.
A hipótese alternativa: oposto de H0.
H0 se refere a um valor especificado para um parâmetro da população.
H0 geralmente contém um sinal de igualdade.
H1 nunca contém sinal de igualdade, pode ser representada por: , < ou >.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
TESTES DE HIPÓTESES: exemplo com desvio-padrão conhecido
Formula-se então a chamada hipótese nula (H0) como sendo:
H0: = 5, indicando que a máquina está regulada.
No caso, suponha que a hipótese alternativa seja definida como:
H1: 5.
Caso a hipótese nula seja verdadeira espera-se que a amostra forneça um valor médio próximo do especificado pela mesma.
Porém, devido às variações decorrentes do processo amostral, mesmo que a hipótese nula seja verdadeira, é possível que valores diferentes da mesma sejam obtidos.
A metodologia dos testes de hipóteses nos vai fornecer elementos claros para melhor avaliar essas diferenças e tomar uma decisão, com base em critérios probabilísticos.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
TESTES DE HIPÓTESES
Erros envolvidos:
SITUAÇÃO REAL
CONCLUSÃO DO TESTE
H0 VERDADE
H0 FALSA
Não Rejeitar H0
Certo
Erro tipo II ( )
Rejeitar H0
Erro tipo I ( )
Certo
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
TESTES DE HIPÓTESES
Um teste de hipóteses nos auxilia a
responder a questão:
A diferença entre o valor
amostral e o parâmetro é
devida apenas ao acaso?
(variação amostral)
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
TESTES DE HIPÓTESES
Resultado
amostral
Significativo
Rejeição de
H0
Variação
não casual
Não
significativo
Variação
casual
Não se
rejeita H0
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
TESTES DE HIPÓTESES: as etapas
Formulação das hipóteses nula e alternativa
Escolha do nível de significância
Escolha do tamanho da amostra
Determinação da técnica apropriada e estatística do teste
Determinação dos valores críticos (região de rejeição/regra de decisão)
Coleta de dados e cálculo da estatística do teste.
Decisão
Expressar a decisão no contexto do problema.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
TESTES DE HIPÓTESES: aplicação
Formulação das hipóteses nula e alternativa H0: = 5
H1: 5
Escolha do nível de significância
=0,05 (5%)
Escolha do tamanho da amostra
Vamos tomar uma amostra de n=25 caixas.
Determinação da técnica apropriada e estatística do teste
Determinação dos valores críticos (região de rejeição/regra de decisão)
Se z>1,96 ou z<-1,96, rejeitamos H0.
nxZ
)(
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
TESTES DE HIPÓTESES: aplicação
Coleta de dados e cálculo da estatística do teste.
Supondo que a média amostral foi de 4,75 l, tem-se que:
Decisão
Como o valor de Z=-2,5<-1,96, não existem evidências que favoreçam a hipótese nula. (rejeitamos H0)
Expressar a decisão no contexto do problema.
Concluímos que a máquina está mal regulada e, portanto, requer uma intervenção no processo para sanar o problema.
5,205,0
25)575,4()( 0
nxZ cal
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
TESTES DE HIPÓTESES: o método do valor-p
Supondo H0 verdade, o valor-p ou nível de significância do teste, representa a probabilidade de se obter, para uma amostra n observações, um valor amostral tão ou mais discrepante que a média observada.
Se tal probabilidade for muito pequena, a média amostral observada não é compatível com a hipótese H0 e a hipótese formulada tende a ser rejeitada.
No exemplo em questão, o teste é bi-lateral, logo a probabilidade de que seja tão extrema é dada por:
Como tal valor-p é menor que o especificado (5%), concluímos pela não aceitação de H0, como anteriormente.
%)24,10124,00062,00062,0)5.2()5,2( ZPouZP
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Teste de hipóteses para duas populações: amostras independentes
Problema: Dois catalizadores estão sendo testados para se determinar como afetam um processo químico. O catalisador 1 é o que está sendo usado atualmente. Como o catalisador 2 tem menor custo, ele poderia ser adotado, desde que não alterasse o rendimento do processo. Um experimento foi realizado e os rendimentos dos 2 catalisadores foi medido. Os dados são apresentados a seguir. Poderemos afirmar que o rendimento dos 2 catalisadores é o mesmo, ao nível de 5% de significância?
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Dados dos rendimentos para as amostras dos 2 catalisadores.
Catalisador 1 Catalisador 2
1 91,5 89,19
2 94,18 90,95
3 92,18 90,46
4 95,39 63,21
5 91,79 97,19
6 89,97 97,04
7 94,72 91,07
8 89,21 92,75
Observação
Rendimento
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Estatísticas descritivas dos rendimentos dos catalisadores
Média 92 Média 89
Erro padrão 0,8 Erro padrão 3,8
Mediana 92 Mediana 91
Desvio padrão 2,2 Desvio padrão 11
Variância da amostra 5 Variância da amostra 117
Curtose -1,3 Curtose 6,3
Assimetria 0 Assimetria -2,4
Intervalo 6,2 Intervalo 34
Mínimo 89 Mínimo 63
Máximo 95 Máximo 97
Soma 739 Soma 712
Contagem 8 Contagem 8
Catalisador 1 Catalisador 2
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Resultados teste-t
Teste-t: duas amostras presumindo variâncias diferentes
Catalisador 1 Catalisador 2
Média 92,3675 88,9825
Variância 4,970564286 117,3081357
Observações 8 8
Hipótese da diferença de média 0
gl 8
Stat t 0,865821289
P(T<=t) uni-caudal 0,205899958
t crítico uni-caudal 1,859548038
P(T<=t) bi-caudal 0,411799916
t crítico bi-caudal 2,306004135
210 : H
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Concluindo o problema dos catalisadores
Como o valor-p foi da ordem de 0,412 ele supera o valor de 0,05 e portanto o teste conclui pela aceitação da hipótese de igualdade nos rendimentos dos 2 catalisadores, assim o catalisador 2, de menor custo deve ser preferido.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Teste t para 2 amostras: emparelhamento
Situação tipo Antes X Depois ou
Duas medições feitas em cada elemento
Formação de pares de observações
Utilização de indivíduos gêmeos
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Teste t para 2 amostras: emparelhamento
Suponha que estamos interessados em testar 2 tipos de ponteira em uma máquina de teste de dureza. A máquina pressiona com certa força a ponteira sobre o material metálico, medindo-se a profundidade da depressão causada. Amostras independentes poderiam causar resultados enganosos nesse caso, devido a possível falta de uniformidade das placas metálicas a serem testadas, em virtudes de fatores externos ao experimento.
Nesse caso o ideal seria perfurar cada placa metálica com 2 furos, um com cada ponteira.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Teste t para 2 amostras: emparelhamento
Um artigo do Journal of strain analysis (v.18,n2) compara vários métodos para prever a resistencia ao cisalhamento de vigas planas de aço. Dados para 2 desses métodos, Karlsuhe e Lehigh, foram obtidos para uma amostra de 9 vigas e são apresentado a seguir:
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Teste t para 2 amostras: emparelhamento
Método de Karlsuhe Método de Lehigh
1 1,186 1,061 0,125
2 1,151 0,992 0,159
3 1,322 1,063 0,259
4 1,339 1,062 0,277
5 1,2 1,065 0,135
6 1,402 1,178 0,224
7 1,365 1,037 0,328
8 1,537 1,086 0,451
9 1,559 1,052 0,507
Viga
Previsão da resistência (carga
prevista/carga observada)
Diferença
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Teste t para 2 amostras: emparelhamento
Método de
Karlsuhe
Método de
Lehigh
Média 1,3401 1,0662
Variância 0,0213 0,0024
Observações 9 9
Correlação de Pearson 0,3822
Hipótese da diferença de média 0
gl 8
Stat t 6,0819
P(T<=t) uni-caudal 0,0001
t crítico uni-caudal 1,8595
P(T<=t) bi-caudal 0,0003
t crítico bi-caudal 2,3060
Conclusão: Uma vez que o valor-p=0,001<0,05, rejeita-se a hipótese
de igualdade dos métodos, concluindo-se que o Método de Karlsuhe
produz previsões maiores que o método de Lehigh.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
TESTES DE HIPÓTESES: outros testes
Testes para a média com desvio-padrão desconhecido
Testes para proporções
Testes para diferenças de médias (amostras independentes)
Variâncias conhecidas
Variâncias desconhecidas e iguais
Variâncias desconhecidas e diferentes
Testes para diferenças de médias (amostras pareadas ou relacionadas)
Testes para diferenças de proporções
Testes tipo qui-quadrado
Testes não-paramétricos
Análise de variância (comparações múltiplas)
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
EXPLORANDO A RELAÇÃO ENTRE VARIÁVEIS
Mensurar o tipo e grau de associação entre duas ou mais variáveis.
Foco inicial: duas variáveis quantitativas
Etapas:
Abordagem gráfica: diagrama de dispersão
Cálculo do coeficiente de correlação linear de Pearson,
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Diagrama de dispersão
Gráfico utilizado para a visualização do tipo de relacionamento entre 2 variáveis quantitativas
Este entendimento contribui para aumentar a eficiencia dos métodos de controle de um processo
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Construção do diagrama de dispersão
1. Coletar ao menos 30 pares de observações (x,y) das variáveis a serem estudadas;
2. Registrar os dados em uma tabela;
3. Escolher uma variável a ser representada no eixo „x‟ (preditora) e outra variável em „y‟ (dependente);
4. Determinar os valores máximo e mínimo para cada variável;
5. Escolher as escalas para „x‟ e „y‟
6. Representar no gráfico os pares de observações (x,y).
7. Registrar informações importantes que devem constar no gráfico: título, legendas, unidades de medidas, etc
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Interpretação de diagramas de dispersão
Correlação positiva: à medida que x aumenta, y também aumenta.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Interpretação de diagramas
de dispersão
Moderada correlação positiva: y tende a aumentar com x, porém com elevada variabilidade.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Interpretação de diagramas
de dispersão
Ausência de correlação: os valores das variáveis não estão relacionados.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Interpretação de diagramas
de dispersão
Moderada correlação negativa: y tende a diminuir com o aumento de x.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Interpretação de diagramas
de dispersão
Forte correlação negativa: à medida que x aumenta, y diminui.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Outliers: São
observações extremas
não condizentes com
o restante dos
dados.
Interpretação de diagramas
de dispersão
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
CORRELAÇÃO Quando as variáveis crescem no mesmo
sentido temos o caso de correlação positiva.
Quando as variáveis crescem em sentidos opostos temos uma correlação negativa.
Se os dados estão perfeitamente alinhados sobre uma reta temos uma correlação perfeita.
Quando o crescimento de uma variável é acompanhado de variações casuais da outra variável a correlação é nula.
Cálculo da correlação: coeficiente de correlação linear de Pearson (rxy) – função correl no Excel.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Relação entre 2 variáveis quantitativas: exemplo A corrosão em barras de aço é o problema de
durabilidade mais importante em estruturas de concreto.
A carbonação do concreto resulta de uma reação química que reduz o nível de PH para iniciar a corrosão do concreto armado.
Os dados a seguir representam uma amostra de espécimes retirados de um prédio, sendo:
X = nível de carbonação (em mm) e
Y = resistência em Mpa.
Coeficiente de correlação rxy=-0,935, indicando uma forte correlação negativa entre as variáveis, ou seja, quanto maior os nívels de carbonação menor a resistência do concreto.
X 8 15 17 28 30 35 45 50 55
Y 23 27 24 19 16 20 13 11 10
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Modelos de regressão: relações entre variáveis
Em muitos problemas 2 ou mais variáveis estão relacionadas
Interessa modelar e explorar esta relação
Obter o grau de relacionamento (correlação)
Modelar a relação
Obter previsão de uma variável em função da(s) outra(s)
Relações determinísticas ou não-determinísticas.
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira
Modelos de regressão: relações entre variáveis
Exemplo de uma relação determinística:
Suponha que o aluguel de um carro custe
$ 25 mais 0,30 por Km rodado.
Seja Y=valor do aluguel e X=número de kilometros rodados.
Portanto Y=25+0,3X
O custo para rodar 100 km será
Y=25+0,3(100)= $ 55