102
ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Prof. Cezar Augusto Cerqueira – UPE/UNICAP CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICA

CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

  • Upload
    letram

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Page 1: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Prof. Cezar Augusto Cerqueira – UPE/UNICAP

CURSO DE PROBABILIDADE E

ESTATÍSTICA BÁSICA

Page 2: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

ESTATÍSTICA: UMA VISÃO GERAL

ESTATÍSTICA

Ciência que nos ajuda a tomar decisões na presença de variabilidade e/ou incerteza.

Coleta, apresentação, processamento, análise e interpretação de dados.

Desenvolver e/ou aperfeiçoar produtos e/ou processos.

ENGENHEIRO

Resolve problemas de interesse geral por meio de métodos científicos.

Page 3: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Descrição clara

Identificar Fatores Importantes

Propor um Modelo

Ajustar o Modelo Solução

Realizar Experimentos

Conlusões e Recomendações

Page 4: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Métodos Estatísticos: Importância - profissional

Ferramenta fundamental no processo de solução de problemas

Gestores modernos lidam com grande quantidade de informação.

Auxílio na determinação de planos de ação para resolução de problemas

Tomada de decisões “bem informadas“ Apresentar e descrever de forma apropriada as

informações

Tirar conclusões sobre grandes populações com base em amostras

Melhorar processos

Obter previsões confiáveis

Page 5: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Métodos Estatísticos: Importância - empresa

Aumento na competitividade

Eliminação de desperdícios

Redução na necessidade de inspeção

Aumento no grau de satisfação dos clientes

Page 6: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

ANÁLISE EXPLORATÓRIA/DESCRITIVA DE DADOS

Organização/apresentação e cálculo de indicadores e medidas descritivas.

PROBABILIDADE

Teoria matemática utilizada para se estudar a incerteza, oriunda de fenômenos de caráter aleatório.

INFERÊNCIA ESTATÍSTICA

Trata da análise e interpretação de dados amostrais

O principio básico é tirar conclusões sobre a população a partir de uma amostra de dados obtida da mesma.

Page 7: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Coleta de dados

Dados: base para tomada de decisões

Dados Observados (análise exploratória)

Informação (Modelos Probab - Inferencia))

Conhecimento (Tomada de decisão)

Inteligência (Projetos)

Page 8: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Indivíduo e Variável

Indivíduos: objetos descritos por um conjunto de dados (pessoas, empresas, municípios, animais, ações, tempo, etc)

Variáveis: qualquer característica de um indivíduo, podendo assumir diferentes valores, de acordo com o indivíduo a que se refere.

Page 9: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

OBSERVAÇÃO versus EXPERIMENTO

Estudo observacional

Investiga indivíduos e mede variáveis de interesse, sem influenciar as respostas

Experimento

Impõe algum tipo de tratamento sobre os indivíduos, a fim de observar suas respostas

Page 10: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

TIPOS DE DADOS: VARIÁVEIS

QUALITATIVAS

Nominais (sexo, região...)

Ordinais (grau de instrução)

QUANTITATIVAS

Discretas (contagens)

Ex: número de itens defeituosos; número de arranhões em certa peça; número de acidentes de trabalho no mês.

Contínuas (mensurações em escala contínua)

Diâmetro de uma peça; rendimento de uma reação química; tempo gasto na execução de uma tarefa; espessura de uma peça.

Page 11: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

O Banco de Dados

Nome Idade Sexo Renda (Sal. Min) Instrução

José 27 Masc 5,32 Superior

Catarina 30 Fem 6,43 2 Grau

Pedro 21 Masc 1,20 1 Grau

Cibele 22 Fem 2,33 2 Grau

Helena 25 Fem 3,56 2 Grau

Marta 20 Fem 1,70 1 Grau

Carolina 35 Fem 4,50 Técnica

Juan 45 Masc 8,00 Superior

Page 12: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Levantamentos amostrais

População

Grupo inteiro de indivíduos sobre o qual se deseja informações

Amostra

Parte da população da qual se coletam de fato informações, utilizadas para se tirarem conclusões sobre o todo.

Page 13: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Organização e Análise de dados

Page 14: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

FERRAMENTAS GRÁFICAS SIMPLES: VARIÁVEIS CONTÍNUAS

o

o o o o o

3 4 5 6 7 8

Diagrama de Pontos

Considere os dados: 3 4 4,5 4,5 6 8

Exibem: Dispersão, conglomerados de pontos, lacunas, outliers, comparações

Page 15: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

GRÁFICOS SIMPLES: VARIÁVEIS CONTÍNUAS : Gráfico Ramo-e-Folhas

Exemplo: Considere os dados abaixo representando a resistência à compressão de

uma amostra de 80 corpos de prova de liga de alumínio:

105 221 183 186 121 181 180 143

97 154 153 174 120 168 167 141

245 228 174 199 181 158 176 110

163 131 154 115 160 208 158 133

207 180 190 193 194 133 156 123

134 178 76 167 184 135 229 146

218 157 101 171 165 172 158 169

199 151 142 163 145 171 148 158

160 175 149 87 160 237 150 135

196 201 200 176 150 170 118 149

Ramo Folha Frequencia

7 6 1

8 7 1

9 7 1

10 51 2

11 580 3

12 103 3

13 413535 6

14 29583169 8

15 471340886808 12

16 3073050879 10

17 8544162106 10

18 361410 7

19 960934 6

20 7108 4

21 8 1

22 189 3

23 7 1

24 5 1

Page 16: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Apresentação de Dados Distribuições de frequências: caso nominal

Tabela 2.1

Empregados do setor de produção, segundo o grau de instrução, 2005.

GRAU DE INSTRUÇÃO Freqüência (fi)

Primeiro Grau 15 Segundo Grau 25 Superior 10 TOTAL 50

FONTE: Pesquisa direta

Empregados do Setor de Produção, segundo grau de

instrução - 2000

30%

50%

20%

Primeiro Grau

Segundo Grau

Superior

Page 17: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Gráfico de Sequencias no tempo

100

120

140

160

180

200

220

240

260

280

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Os dados representam a resistencia à compressão de uma amostra de 20 conectores plásticos:

241 194 190 209

258 225 250 212

237 190 240 123

210 250 190 178

189 220 180 190

Page 18: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

HISTOGRAMA

Distribuição: modelo estatístico para o padrão de ocorrencia dos valores de determinada população

O histograma é um gráfico de barras no qual o eixo horizontal é subdividido em vários pequenos intervalos, sendo construída uma barra vertical, de área proporcional ao número de observações na amostra cujos valores pertencem ao intervalo correspondente.

As informações são dispostas de modo a permitir a possível visualização da forma da distribuição dos dados e a percepção do valor central e da dispersão em torno desta valor central.

Page 19: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Distribuições de frequência: Caso contínuo - Histograma

As distribuições podem diferir em:

Locação (centralidade, média, mediana)

Variabilidade (desvio padrão, variância)

Forma (assimetria)

Page 20: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Um procedimento para construção de um Histograma (variáveis contínuas)

Coletar “n” observações Escolher o número de intervalos (k) Calcular a amplitude total dos dados (R)

R = Max - Min

Calcular o comprimento de cada intervalo (amplitude de classe, h) h=R/k

Arredondar convenientemente h Calcular os limites de cada intervalo Construir a tabela de frequencias, que deve conter:

Limites de cada intervalo; ponto médio; frequencia simples (fi); frequencia relativa; frequencia acumulada (simples e relativa)

Desenhar o Histograma

Page 21: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Distribuições de frequência variável contínua: Histograma

Dados relativos ao comprimento de uma amostra de 100 parafusos

Page 22: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Distribuições de frequência: Caso discreto

Peças

0 35

1 40

2 7

3 5

4 2

5 1

Total 90

0

5

10

15

20

25

30

35

40

45

0 1 2 3 4 5

Dados referentes ao número de defeitos encontrados em uma amostra de 90 chapas de aço

Page 23: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Tipos de Histogramas: simétrico

Valor médio no centro

Frequencia mais alta no centro diminuindo gradualmente de forma simétrica em direção aos extremos

0

20

40

60

80

100

Média=mediana=moda

Page 24: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Tipos de Histogramas: assimétrico positivo

freqüência decresce bruscamente em um dos lados e de forma gradual no outro

Média fora do centro do histograma

cauda mais longa em um dos lados

0

10

20

30

40

50

60

70

80

90

Média>mediana; média>moda

Page 25: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Tipos de Histogramas: dois picos

Mistura de dados com médias diferentes

Dados de 2 máquinas ou 2 turnos, etc

0

20

40

60

80

100

Page 26: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Gráfico de Pareto

Princípio de Pareto (80/20)

Em torno de 80% dos problemas vem de 20% das causas

Atacar 1/5 das causas solucionaria 4/5 dos problemas

Page 27: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Distribuições de frequência: Gráfico de Pareto

Tabela 2.4 – Defeitos encontrados em uma amostra de lentes fabricadas pela indústria

Tipo de Defeito Freqüência de defeitos

Total Acumulado

Freqüência relativa (%)

Percentual Acumulado

Revest. Inadequado 55 55 43,3 43,3

Trinca 41 96 32,3 75,6

Arranhão 12 108 9,4 85,0

Espessura inadequada 11 119 8,7 93,7

Mal-acabada 5 124 3,9 97,6

outros 3 127 2,4 100,0

Total 127 - 100,0 -

FONTE: Indústria de lentes

Page 28: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Resumindo dados: análise descritiva e exploratória

“Um estatístico é um sujeito que se está com a cabeça num forno e os pés enterrados no gelo, ainda diz que na média a temperatura está ótima”.( K. Dunnigan)

Page 29: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

RESUMO NUMÉRICO DE DADOS QUANTITATIVOS: LOCALIZAÇÃO DO

CENTRO DOS DADOS

Média Aritmética

Mediana Valor do meio em uma sequencia ordenada de dados

Moda Valor mais frequente de uma série de dados

n

Xi

X

n

i

1

n

fX

X

k

i

ii 1Dados brutos

Dados agrupados

2

)1]2/([)2/(

nn

e

XXM “n” ímpar “n” par

cf

FnLiMe

Me

ant .])5,0[(

Dados agrupados

)2

1(nX

Page 30: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

OUTRAS MEDIDAS DE LOCAÇÃO: Quartis

Primeiro Quartil

25% das observações são menores e 75% maiores

Segundo Quartil (Mediana)

Terceiro Quartil

)4

1(

1 nXQ

)4

)1(3(

3 nXQ

Page 31: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

VARIABILIDADE

Medidas de tendência central podem mascarar importantes aspectos em uma série de dados

Um processo de produção de bens e fornecimento de serviços sempre apresenta variabilidade

A variabilidade é resultado de uma série de alterações nas condições sob as quais as observações são tomadas.

matérias-primas, condições de equipamentos, métodos de

trabalho, condições ambientais e operadores

Page 32: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

VARIABILIDADE: Problematizando

Os dados abaixo referem-se a notas obtidas em 3 turmas de 5 alunos cada:

Turma A: 3 4 5 6 7

Turma B: 1 3 5 7 9

Turma C: 5 5 5 5 5

Em termos de tendência central como podemos analisar os grupos ?

E em termos de dispersão? Qual deles parece mais disperso? E qual deles apresenta maior variabilidade?

Façamos uma investigação gráfica do fenômeno.

Como obter uma medida de variabilidade média para os grupos?

Page 33: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

MEDINDO A VARIABILIDADE

Variância Populacional

Variância Amostral

Desvio Padrão

Corresponde à raiz quadrada da variância

])(

[1

2

22

n

XX

n

i

i

])(

[1

12

22

n

XX

ns

i

i

Page 34: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

MEDINDO A VARIABILIDADE: outras medidas

Amplitude Total Xmax-Xmin

Amplitude Interquartil J = Q3–Q1

Coeficiente de variação

Comparação de grupos muito diferentes

Comparação de dispersão com escalas diferentes

X

S

média

padrãoDesvioCV

Page 35: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

ESTUDO DA FORMA: ASSIMETRIA

Curva Simétrica

Distribuição dos salários dos empregados do setor de produção da

Companhia A

0

5

10

15

20

25

30

6 10 14 18 22

sal.min.

fre

q.

sim

ple

s

Page 36: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

ESTUDO DA FORMA: ASSIMETRIA

Assimetria Negativa Assimetria Positiva Simetria

Page 37: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Gráfico Box-Plot

Juntas: Q1,Q2,Q3

Extremos: E1 e E2

E1 Q1 Me Q3 E2

REGIAO

COSULSENENO

IDH

MU

N

1.0

.9

.8

.7

.6

.5

.4

Índice de Desenvolvimento Humano no Brasil, por Região - 2000

Page 38: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Explorando a relação entre variáveis

Page 39: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

EXPLORANDO A RELAÇÃO ENTRE VARIÁVEIS

Mensurar o tipo e grau de associação entre duas ou mais variáveis.

Foco inicial: duas variáveis quantitativas

Etapas:

Abordagem gráfica: diagrama de dispersão

Cálculo do coeficiente de correlação linear de Pearson,

Page 40: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Diagrama de dispersão

Gráfico utilizado para a visualização do tipo de relacionamento entre 2 variáveis quantitativas

Este entendimento contribui para aumentar a eficiencia dos métodos de controle de um processo

Page 41: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Construção do diagrama de dispersão

1. Coletar ao menos 30 pares de observações (x,y) das variáveis a serem estudadas;

2. Registrar os dados em uma tabela;

3. Escolher uma variável a ser representada no eixo „x‟ (preditora) e outra variável em „y‟ (dependente);

4. Determinar os valores máximo e mínimo para cada variável;

5. Escolher as escalas para „x‟ e „y‟

6. Representar no gráfico os pares de observações (x,y).

7. Registrar informações importantes que devem constar no gráfico: título, legendas, unidades de medidas, etc

Page 42: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Interpretação de diagramas de dispersão

Correlação positiva: à medida que x aumenta, y também aumenta.

Page 43: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Interpretação de diagramas de dispersão

Moderada correlação positiva: y tende a aumentar com x, porém com elevada variabilidade.

Page 44: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Interpretação de diagramas de dispersão

Ausência de correlação: os valores das variáveis não estão relacionados.

Page 45: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Interpretação de diagramas de dispersão

Moderada correlação negativa: y tende a diminuir com o aumento de x.

Page 46: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Interpretação de diagramas de dispersão

Forte correlação negativa: à medida que x aumenta, y diminui.

Page 47: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Outliers: São

observações extremas

não condizentes com

o restante dos

dados.

Interpretação de diagramas de dispersão

Page 48: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Interpretação de diagramas de dispersão

Exemplo: O diagrama

ao lado mostra forte

correlação negativa

entre as variáveis

Tensão e Variação

no Corte.

Page 49: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Estratificação de Diagramas de Dispersão

Em muitos casos a estratificação de

um diagrama de dispersão permite a

descoberta da causa de um problema.

Page 50: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

RELAÇÕES ENTRE VARIÁVEIS: QUANTITATIVAS X QUALITATIVAS

Comparação do Comportamento de uma Variável Contínua por Grupos

Captar diferenças: i)nos níveis médios, ii)em variabilidade, iii)na forma da distribuição, iv)detalhes individuais. Via:

Diagrama de Pontos

Gráficos tipo Box-Plot

Gráfico Ramo-e-Folhas

Page 51: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS

Tabela de contingência a 2 fatores

Variável dependente e explicativa

Medir associações

Encontrar distribuições percentuais

Distribuições marginais

Distribuições condicionais

Page 52: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Noções de Probabilidade e Inferência: mensurando a incerteza... O Acaso existe? “ O acaso não existe: tudo é provação, ou punição, ou recompensa, ou previdencia”. (Voltaire) “O acaso é a causa ignorada de um efeito conhecido” (Voltaire)

Page 53: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

NOÇÕES DE PROBABILIDADE

Aleatoriedade

Experimentos aleatórios

Resultados imprevisíveis

regularidade

Probabilidade

chance de ocorrência de um evento aleatório.

idealização do que aconteceria se feita uma sequencia longa de repetições

Proporção de vezes em quem um evento ocorre em uma sequencia longa de repetições do experimento

Independencia

Resultado de uma tentativa não deve influenciar o resultado de outra

Page 54: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Modelos Probabilísticos para variáveis Discretas: Distribuição

Binomial Considera n repetições independentes de um

experimento de Bernoulli.

Exemplos:

Jogue uma moeda 10 vezes. Seja X=nº de caras obtido

Uma máquina produz 1% de peças defeituosas. Seja X=nº de peças defeituosas nas próximas 25 produzidas.

Nos próximos 30 nascimentos em uma maternidade, seja X=nº de meninas observado.

Seja a VA X=nº de sucessos obtidos. Portanto:

E(X)=np e V(X)=np(1-p)

nkppkXP knkn

k ,.....,1,0,)1()(

Page 55: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Modelos Probabilísticos para variáveis Discretas: Distribuição de

Poisson Largamente empregada quando se deseja contar o

número de eventos de certo tio que ocorrem em um intervalo de tempo, superfície ou volume.

Exemplos:

Fórmula:

Número de chamadas telefônicas recebidas em uma central em um intervalo de tempo.

Número de falhas em um computador em um dia de operação.

Número de defeitos em uma chapa de metal de 1 m2 produzida.

!

)()(

k

tekXP

Kt

Page 56: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Modelos Probabilísticos para variáveis contínuas: Distribuição Normal

Representação Gráfica:

A distribuição Normal é um modelo estatístico que fornece uma base teórica para o estudo do padrão de ocorrência dos elementos de várias populações de interesse.

µ é a média da distribuição (centro)

ơ é o desvio padrão da distribuição (dispersão)

+ -

68%

Page 57: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Curva Normal

Para calcular probabilidades associadas a uma variável Normal de média µ e desvio padrão ơ, (N(µ,ơ)), deve ser utilizada a variável Normal padronizada ou reduzida:

A média de Z é zero e seu desvio padrão é 1.

Xz

Page 58: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

µ µ+2ơ µ+3ơ µ+ơ µ-ơ µ-2ơ µ-3ơ

0 1 3 2 -1 -2 -3

X

z

Page 59: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Distribuição Normal: uso da tabela

0 z

Xz

0 1

P(0<Z<1)

1

P(Z>1)

0,3413

0,5-0,3413

-1 0

P(Z<-1)

0,5+0,3413

z=1,64

0 z

5%

Uso inverso da Tabela

Page 60: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Curva Normal

Propriedades: 1) A área sob a curva é igual a 1.

2) A curva é simétrica em relação à sua média.

3) f(x) tende para 0 quando X tende para +/-

4) A curva possui um ponto máximo em x = .

Intervalo Probabilidade (Área)

Interna Externa

(µ±ơ) 68,3% 31,7%

(µ±2ơ) 95,5% 4,5%

(µ±3ơ) 99,73% 0,27

Page 61: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

DISTRIBUIÇÕES AMOSTRAIS

Lei dos grandes números – Extraia observações

aleatórias e independentes de uma população de média

À medida que o número de observações aumenta, a média amostral aproxima-se cada vez mais da média da população .

Características de uma população podem ser descritas pelos parâmetros.

Os parâmetros são quantidades desconhecidas, a serem estimadas via amostra.

As distribuições amostrais podem ser vistas como:

Distribuição de probabilidades de uma estatística amostral

Indicam como variam as estatísticas devido a variações no processo de amostragem.

Page 62: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS

Obtida a partir da média aritmética de uma série de amostras de tamanho n, extraída de uma população que tem média e desvio padrão .

A média da distribuição amostral de médias é igual à média populacional

O desvio-padrão da distribuição amostral de médias é dada por:

A distribuição amostral de médias é aproximadamente normal, para n grande.

A estatística correspondente à equação abaixo é aproximadamente N(0,1).

n

nxZ

)(

Page 63: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

DISTRIBUIÇÃO AMOSTRAL DE PROPORÇÕES

Obtida a partir da proporção de elementos em uma amostra que possuem certa característica de interesse.

A média da distribuição amostral da proporção é igual à proporção populacional.

O desvio-padrão da distribuição amostral da proporção é dado por:

A distribuição amostral da proporção é aproximadamente normal, para n grande.

A estatística correspondente à equação abaixo é aproximadamente N(0,1).

n

ppp

)1(

n

PP

Ppz a

)1(

Page 64: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

ESTIMAÇÃO: NOÇÕES GERAIS

Inferência: campo da estatística no qual são tomadas decisões sobre populações, com base na informação extraída de uma amostra.

Estimativas sobre os parâmetros populacionais

Estimativas pontuais

Estimativas por intervalos

Formulação de testes de hipóteses sobre os mesmos

Page 65: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

INTERVALO DE CONFIANÇA PARA A MÉDIA – com desvio padrão conhecido

Objetivo do IC: estimar um parâmetro desconhecido com uma indicação da precisão da estimativa.

Formato: estimativa +/- margem de erro

Nível de confiança: probabilidade de que o método forneça uma resposta correta.

A média amostral varia de amostra para amostra

Para levar em consideração esta fato devemos construir um intervalo de confiança para a verdadeira média populacional, com base na média amostral.

Tal intervalo tem uma probabilidade (nível de confiança) de estar estimando corretamente (conter) o parâmetro.

Page 66: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

INTERVALO DE CONFIANÇA PARA A MÉDIA – com desvio padrão conhecido

O intervalo para a média, com desvio-padrão conhecido, pode ser representado pela expressão:

nZx

2

normaltabelanaobtidovalorZ 2

adotadociasignificandenível

médiadaamostralãodistribuiçdapadrãoerron

amostralmédiax

Page 67: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

INTERVALO DE CONFIANÇA PARA A PROPORÇÃO

O intervalo para uma proporção pode ser representado pela expressão:

normaltabelanaobtidovalorZ 2

adotadociasignificandenível

amostralproporçãopa

n

ppzp aa

a

)1(

2

Page 68: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

TESTES DE HIPÓTESES

Constituem uma outra face do trabalho de inferência

estatística e também fazendo uso da informação amostral.

Uma hipótese estatística: afirmação sobre parâmetros populacionais.

Teste de hipóteses: processo de decisão relativo a uma hipótese particular.

A informação de uma amostra é utilizada para avaliar a plausibilidade da hipótese formulada

Se tal informação for consistente com a hipótese tenderemos a concluir que não há evidências que favoreçam sua rejeição.

O fato de utilizar apenas uma amostra não nos permite concluir com certeza sobre a veracidade ou não de uma hipótese formulada.

Page 69: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

TESTES DE HIPÓTESES: exemplo com desvio-padrão conhecido

Uma empresa produtora de detergente deseja avaliar se a máquina que enche as garrafas plásticas está adequadamente regulada, para o valor especificado de 5 litros, por garrafa. O desvio padrão do processo é da ordem de 0,5 litros.

Caso a máquina esteja devidamente regulada, espera-se que o valor médio de uma amostra de garrafas concorde com um valor médio de 5 litros.

Page 70: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

TESTES DE HIPÓTESES

Hipóteses envolvidas:

H0: hipótese nula

H1: hipótese alternativa

A hipótese nula (H0) é a que é sempre testada.

A hipótese alternativa: oposto de H0.

H0 se refere a um valor especificado para um parâmetro da população.

H0 geralmente contém um sinal de igualdade.

H1 nunca contém sinal de igualdade, pode ser representada por: , < ou >.

Page 71: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

TESTES DE HIPÓTESES: exemplo com desvio-padrão conhecido

Formula-se então a chamada hipótese nula (H0) como sendo:

H0: = 5, indicando que a máquina está regulada.

No caso, suponha que a hipótese alternativa seja definida como:

H1: 5.

Caso a hipótese nula seja verdadeira espera-se que a amostra forneça um valor médio próximo do especificado pela mesma.

Porém, devido às variações decorrentes do processo amostral, mesmo que a hipótese nula seja verdadeira, é possível que valores diferentes da mesma sejam obtidos.

A metodologia dos testes de hipóteses nos vai fornecer elementos claros para melhor avaliar essas diferenças e tomar uma decisão, com base em critérios probabilísticos.

Page 72: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

TESTES DE HIPÓTESES

Erros envolvidos:

SITUAÇÃO REAL

CONCLUSÃO DO TESTE

H0 VERDADE

H0 FALSA

Não Rejeitar H0

Certo

Erro tipo II ( )

Rejeitar H0

Erro tipo I ( )

Certo

Page 73: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

TESTES DE HIPÓTESES

Um teste de hipóteses nos auxilia a

responder a questão:

A diferença entre o valor

amostral e o parâmetro é

devida apenas ao acaso?

(variação amostral)

Page 74: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

TESTES DE HIPÓTESES

Resultado

amostral

Significativo

Rejeição de

H0

Variação

não casual

Não

significativo

Variação

casual

Não se

rejeita H0

Page 75: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

TESTES DE HIPÓTESES: as etapas

Formulação das hipóteses nula e alternativa

Escolha do nível de significância

Escolha do tamanho da amostra

Determinação da técnica apropriada e estatística do teste

Determinação dos valores críticos (região de rejeição/regra de decisão)

Coleta de dados e cálculo da estatística do teste.

Decisão

Expressar a decisão no contexto do problema.

Page 76: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

TESTES DE HIPÓTESES: aplicação

Formulação das hipóteses nula e alternativa H0: = 5

H1: 5

Escolha do nível de significância

=0,05 (5%)

Escolha do tamanho da amostra

Vamos tomar uma amostra de n=25 caixas.

Determinação da técnica apropriada e estatística do teste

Determinação dos valores críticos (região de rejeição/regra de decisão)

Se z>1,96 ou z<-1,96, rejeitamos H0.

nxZ

)(

Page 77: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

TESTES DE HIPÓTESES: aplicação

Coleta de dados e cálculo da estatística do teste.

Supondo que a média amostral foi de 4,75 l, tem-se que:

Decisão

Como o valor de Z=-2,5<-1,96, não existem evidências que favoreçam a hipótese nula. (rejeitamos H0)

Expressar a decisão no contexto do problema.

Concluímos que a máquina está mal regulada e, portanto, requer uma intervenção no processo para sanar o problema.

5,205,0

25)575,4()( 0

nxZ cal

Page 78: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

TESTES DE HIPÓTESES: o método do valor-p

Supondo H0 verdade, o valor-p ou nível de significância do teste, representa a probabilidade de se obter, para uma amostra n observações, um valor amostral tão ou mais discrepante que a média observada.

Se tal probabilidade for muito pequena, a média amostral observada não é compatível com a hipótese H0 e a hipótese formulada tende a ser rejeitada.

No exemplo em questão, o teste é bi-lateral, logo a probabilidade de que seja tão extrema é dada por:

Como tal valor-p é menor que o especificado (5%), concluímos pela não aceitação de H0, como anteriormente.

%)24,10124,00062,00062,0)5.2()5,2( ZPouZP

Page 79: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Teste de hipóteses para duas populações: amostras independentes

Problema: Dois catalizadores estão sendo testados para se determinar como afetam um processo químico. O catalisador 1 é o que está sendo usado atualmente. Como o catalisador 2 tem menor custo, ele poderia ser adotado, desde que não alterasse o rendimento do processo. Um experimento foi realizado e os rendimentos dos 2 catalisadores foi medido. Os dados são apresentados a seguir. Poderemos afirmar que o rendimento dos 2 catalisadores é o mesmo, ao nível de 5% de significância?

Page 80: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Dados dos rendimentos para as amostras dos 2 catalisadores.

Catalisador 1 Catalisador 2

1 91,5 89,19

2 94,18 90,95

3 92,18 90,46

4 95,39 63,21

5 91,79 97,19

6 89,97 97,04

7 94,72 91,07

8 89,21 92,75

Observação

Rendimento

Page 81: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Estatísticas descritivas dos rendimentos dos catalisadores

Média 92 Média 89

Erro padrão 0,8 Erro padrão 3,8

Mediana 92 Mediana 91

Desvio padrão 2,2 Desvio padrão 11

Variância da amostra 5 Variância da amostra 117

Curtose -1,3 Curtose 6,3

Assimetria 0 Assimetria -2,4

Intervalo 6,2 Intervalo 34

Mínimo 89 Mínimo 63

Máximo 95 Máximo 97

Soma 739 Soma 712

Contagem 8 Contagem 8

Catalisador 1 Catalisador 2

Page 82: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Resultados teste-t

Teste-t: duas amostras presumindo variâncias diferentes

Catalisador 1 Catalisador 2

Média 92,3675 88,9825

Variância 4,970564286 117,3081357

Observações 8 8

Hipótese da diferença de média 0

gl 8

Stat t 0,865821289

P(T<=t) uni-caudal 0,205899958

t crítico uni-caudal 1,859548038

P(T<=t) bi-caudal 0,411799916

t crítico bi-caudal 2,306004135

210 : H

Page 83: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Concluindo o problema dos catalisadores

Como o valor-p foi da ordem de 0,412 ele supera o valor de 0,05 e portanto o teste conclui pela aceitação da hipótese de igualdade nos rendimentos dos 2 catalisadores, assim o catalisador 2, de menor custo deve ser preferido.

Page 84: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Teste t para 2 amostras: emparelhamento

Situação tipo Antes X Depois ou

Duas medições feitas em cada elemento

Formação de pares de observações

Utilização de indivíduos gêmeos

Page 85: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Teste t para 2 amostras: emparelhamento

Suponha que estamos interessados em testar 2 tipos de ponteira em uma máquina de teste de dureza. A máquina pressiona com certa força a ponteira sobre o material metálico, medindo-se a profundidade da depressão causada. Amostras independentes poderiam causar resultados enganosos nesse caso, devido a possível falta de uniformidade das placas metálicas a serem testadas, em virtudes de fatores externos ao experimento.

Nesse caso o ideal seria perfurar cada placa metálica com 2 furos, um com cada ponteira.

Page 86: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Teste t para 2 amostras: emparelhamento

Um artigo do Journal of strain analysis (v.18,n2) compara vários métodos para prever a resistencia ao cisalhamento de vigas planas de aço. Dados para 2 desses métodos, Karlsuhe e Lehigh, foram obtidos para uma amostra de 9 vigas e são apresentado a seguir:

Page 87: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Teste t para 2 amostras: emparelhamento

Método de Karlsuhe Método de Lehigh

1 1,186 1,061 0,125

2 1,151 0,992 0,159

3 1,322 1,063 0,259

4 1,339 1,062 0,277

5 1,2 1,065 0,135

6 1,402 1,178 0,224

7 1,365 1,037 0,328

8 1,537 1,086 0,451

9 1,559 1,052 0,507

Viga

Previsão da resistência (carga

prevista/carga observada)

Diferença

Page 88: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Teste t para 2 amostras: emparelhamento

Método de

Karlsuhe

Método de

Lehigh

Média 1,3401 1,0662

Variância 0,0213 0,0024

Observações 9 9

Correlação de Pearson 0,3822

Hipótese da diferença de média 0

gl 8

Stat t 6,0819

P(T<=t) uni-caudal 0,0001

t crítico uni-caudal 1,8595

P(T<=t) bi-caudal 0,0003

t crítico bi-caudal 2,3060

Conclusão: Uma vez que o valor-p=0,001<0,05, rejeita-se a hipótese

de igualdade dos métodos, concluindo-se que o Método de Karlsuhe

produz previsões maiores que o método de Lehigh.

Page 89: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

TESTES DE HIPÓTESES: outros testes

Testes para a média com desvio-padrão desconhecido

Testes para proporções

Testes para diferenças de médias (amostras independentes)

Variâncias conhecidas

Variâncias desconhecidas e iguais

Variâncias desconhecidas e diferentes

Testes para diferenças de médias (amostras pareadas ou relacionadas)

Testes para diferenças de proporções

Testes tipo qui-quadrado

Testes não-paramétricos

Análise de variância (comparações múltiplas)

Page 90: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

EXPLORANDO A RELAÇÃO ENTRE VARIÁVEIS

Mensurar o tipo e grau de associação entre duas ou mais variáveis.

Foco inicial: duas variáveis quantitativas

Etapas:

Abordagem gráfica: diagrama de dispersão

Cálculo do coeficiente de correlação linear de Pearson,

Page 91: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Diagrama de dispersão

Gráfico utilizado para a visualização do tipo de relacionamento entre 2 variáveis quantitativas

Este entendimento contribui para aumentar a eficiencia dos métodos de controle de um processo

Page 92: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Construção do diagrama de dispersão

1. Coletar ao menos 30 pares de observações (x,y) das variáveis a serem estudadas;

2. Registrar os dados em uma tabela;

3. Escolher uma variável a ser representada no eixo „x‟ (preditora) e outra variável em „y‟ (dependente);

4. Determinar os valores máximo e mínimo para cada variável;

5. Escolher as escalas para „x‟ e „y‟

6. Representar no gráfico os pares de observações (x,y).

7. Registrar informações importantes que devem constar no gráfico: título, legendas, unidades de medidas, etc

Page 93: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Interpretação de diagramas de dispersão

Correlação positiva: à medida que x aumenta, y também aumenta.

Page 94: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Interpretação de diagramas

de dispersão

Moderada correlação positiva: y tende a aumentar com x, porém com elevada variabilidade.

Page 95: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Interpretação de diagramas

de dispersão

Ausência de correlação: os valores das variáveis não estão relacionados.

Page 96: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Interpretação de diagramas

de dispersão

Moderada correlação negativa: y tende a diminuir com o aumento de x.

Page 97: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Interpretação de diagramas

de dispersão

Forte correlação negativa: à medida que x aumenta, y diminui.

Page 98: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Outliers: São

observações extremas

não condizentes com

o restante dos

dados.

Interpretação de diagramas

de dispersão

Page 99: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

CORRELAÇÃO Quando as variáveis crescem no mesmo

sentido temos o caso de correlação positiva.

Quando as variáveis crescem em sentidos opostos temos uma correlação negativa.

Se os dados estão perfeitamente alinhados sobre uma reta temos uma correlação perfeita.

Quando o crescimento de uma variável é acompanhado de variações casuais da outra variável a correlação é nula.

Cálculo da correlação: coeficiente de correlação linear de Pearson (rxy) – função correl no Excel.

Page 100: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Relação entre 2 variáveis quantitativas: exemplo A corrosão em barras de aço é o problema de

durabilidade mais importante em estruturas de concreto.

A carbonação do concreto resulta de uma reação química que reduz o nível de PH para iniciar a corrosão do concreto armado.

Os dados a seguir representam uma amostra de espécimes retirados de um prédio, sendo:

X = nível de carbonação (em mm) e

Y = resistência em Mpa.

Coeficiente de correlação rxy=-0,935, indicando uma forte correlação negativa entre as variáveis, ou seja, quanto maior os nívels de carbonação menor a resistência do concreto.

X 8 15 17 28 30 35 45 50 55

Y 23 27 24 19 16 20 13 11 10

Page 101: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Modelos de regressão: relações entre variáveis

Em muitos problemas 2 ou mais variáveis estão relacionadas

Interessa modelar e explorar esta relação

Obter o grau de relacionamento (correlação)

Modelar a relação

Obter previsão de uma variável em função da(s) outra(s)

Relações determinísticas ou não-determinísticas.

Page 102: CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICAestprob.pbworks.com/w/file/fetch/119376996/curso_probab_estat_comp.pdf · Exemplo: Considere os dados abaixo representando a resistência

ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Modelos de regressão: relações entre variáveis

Exemplo de uma relação determinística:

Suponha que o aluguel de um carro custe

$ 25 mais 0,30 por Km rodado.

Seja Y=valor do aluguel e X=número de kilometros rodados.

Portanto Y=25+0,3X

O custo para rodar 100 km será

Y=25+0,3(100)= $ 55