79
Professor: João Maria Filgueira, MSc ([email protected]) Probabilidade Estatística

Slides de Estatística Descritiva e Probabilidade

Embed Size (px)

Citation preview

Page 1: Slides de Estatística Descritiva e Probabilidade

Professor: João Maria Filgueira, MSc([email protected])

Probabilidade Estatística

Page 2: Slides de Estatística Descritiva e Probabilidade

Plano de Ensino

Objetivo

Conteúdo

Metodologia

Avaliação

BIbliografia

Page 3: Slides de Estatística Descritiva e Probabilidade

Método EstatísticoA Ciência Estatística

Termos Estatísticos relevantes

Fases do Trabalho Estatístico

Exemplo para discussão

Page 4: Slides de Estatística Descritiva e Probabilidade

A Ciência Estatística

Estatística tem sua origem em Dados Estatais - Governamentais

A partir do século XVI surgem análises de nascimentos, de óbitos, de matrimônios, riquezas

No século XVIII surge, dessas análises, a Ciência Estatística

Dimensões: Descritiva, Probabilística, Inferencial

Page 5: Slides de Estatística Descritiva e Probabilidade

Termos Estatísticos relevantes

População: universo a ser estudado

Amostra: subconjunto da População

Variáveis: Qualitativas, Quantitativas

Variáveis Quantitativas: Discretas e Contínuas

Dados Estatísticos: valores das Variáveis

Page 6: Slides de Estatística Descritiva e Probabilidade

Fases do Trabalho Estatístico

2 - Planejamento

SoftwareEstatístico

3 – Coleta de dados

5 – Análise de dados

1 – Definição do Problema

6 – Apresentaçãode resultados

4 – Organizaçãode dados

Lista deReferências

Base deDados

Page 7: Slides de Estatística Descritiva e Probabilidade

Exemplo para discussãoEstudo para avaliar a Evasão Escolar em seu Município.

Como Planejar esse Estudo?

Quais as fases desse Trabalho Estatístico?

Quais as principais variáveis? E os principais desafios?

Page 8: Slides de Estatística Descritiva e Probabilidade

Estatística DescritivaDistribuição de frequências

Medidas de posição

Medidas de variabilidade

Medidas Separatrizes

Assimetria

Apresentação gráfica

Page 9: Slides de Estatística Descritiva e Probabilidade

Distribuição de FrequênciaRol: conjunto ordenado dos dados

Amplitude Total: AT = MAIOR - MENOR

Classes: Onde n é a quantidade de dados

Amplitude de classe: a = AT / c

Frequência: ocorrência do Rol nas classes

.25 n dados de número o se , n

25; n dados de número o se 5,

Page 10: Slides de Estatística Descritiva e Probabilidade

Distribuição Frequência

Exemplo

Considere os dados a seguir referentes a tempo de processamento de uma rotina computacional, implementada por diferentes Programadores. Obtenha a distribuição de frequência. Comente o resultado.

Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20

Page 11: Slides de Estatística Descritiva e Probabilidade

MédiaValor médio dos dados

Dados não agrupados:

Onde X é o conjunto valores; n é a quantidade de dados.

Dados agrupados:

Onde X é o ponto médio; f é a frequência da classe;

f

XfX

)*(

n

XX

Page 12: Slides de Estatística Descritiva e Probabilidade

MedianaValor central dos dados

Dados não agrupados: , quando n for ímpar

, quando n for par

Onde x(n+1)/2 representa o valor da posição (n+1)/2

xn/2 representa o valor da posição n/2

x(n/2+1) representa o valor da posição (n/2+1)

)/2 X (XX

XX

1) (n/2n/2

1n

~

~2/)(

Page 13: Slides de Estatística Descritiva e Probabilidade

Mediana

Valor central dos dados

Dados agrupados:

É preciso obter a primeira classe com 50% dos dados. Esta é a classe mediana.

Onde L é o limite inferior da classe mediana; Sant é a soma das frequências anteriores; f é a frequência da classe mediana; a é a amplitude de classe.

a*f

Sant2f

LX

~

Page 14: Slides de Estatística Descritiva e Probabilidade

Moda

Valor de maior frequência

Dados agrupados:

É preciso obter a classe com maior frequência.

Onde L é o limite inferior da classe; Da = maior frequência - anterior; Dp = maior frequência - posterior; a é a amplitude de classe.

a*DpDa

DaLX

ˆ

Page 15: Slides de Estatística Descritiva e Probabilidade

Medidas de posição

Exemplo

Considere a distribuição de frequência obtida anteriormente com os dados a seguir. Obtenha média, moda e mediana. Comente o resultado.

Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20

Page 16: Slides de Estatística Descritiva e Probabilidade

Variância

X

1)(

)(* 22

f

XXfS

1

)( 22

n

XXS

Variação dos dados em relação à média

Dados não agrupados: Onde X o conjunto valores; n é número de dados; é a média.

Dados agrupados: Onde X é o ponto médio; f é a frequência da classe; é média.X

Page 17: Slides de Estatística Descritiva e Probabilidade

Desvio padrão

Variação dos dados em relação à média

Onde S2 é a variância

2SS

Page 18: Slides de Estatística Descritiva e Probabilidade

Coeficiente de variaçãoVariação dos dados em relação à média

Onde:S é o Desvio padrãoe é a Média

Quanto menor Cv, melhor a representatividade da média X.

100*X

SCv

X

Page 19: Slides de Estatística Descritiva e Probabilidade

Medidas de variação

Exemplo

Considere a distribuição de frequência obtida anteriormente com os dados a seguir, bem como a média, moda e mediana. Obtenha variância, desvio padrão e coeficiente de variação. Comente o resultado.

Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20

Page 20: Slides de Estatística Descritiva e Probabilidade

Medidas SeparatrizesOrganizam os dados em grupos percentualmente iguais Quartis – 25% Q1 25% Q2 25% Q3 25%

Decis – 10% D1 10% D2 ...... 10% D8 10% D9 10%

Percentis – 1% P1 1% P2 ...... 1% P98 1% P99 1%

a*f

Sant4f

*i

LQ i

a*f

Sant10f

*i

LDi

a*f

Sant100f

*i

LPi

Page 21: Slides de Estatística Descritiva e Probabilidade

Medidas Separatrizes

Exemplo

Considere a distribuição de frequência obtida anteriormente com os dados a seguir. Obtenha o valor abaixo do qual há 75% dos dados, e o valor abaixo do qual há 10% dos dados . Comente os resultados.

Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20

Page 22: Slides de Estatística Descritiva e Probabilidade

AssimetriaQuantifica o deslocamento/afastamento da distribuição em relação a medidas centrais

é a Média é a Moda S é o Desvio padrão

S

XXAss

ˆ

XX̂

Page 23: Slides de Estatística Descritiva e Probabilidade

AssimetriaSituações que a literatura apresenta

Ass > 0

Ass < 0

Ass = 0

Page 24: Slides de Estatística Descritiva e Probabilidade

Assimetria

Exemplo

Considere a distribuição de frequência obtida anteriormente com os dados a seguir, bem como a média, moda e desvio padrão. Obtenha a Assimetria. Comente o resultado.

Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20

Page 25: Slides de Estatística Descritiva e Probabilidade

Apresentação gráfica

Histograma

Gráfico de barra de classes e porcentagens

Polígono de frequência

Gráfico de linha de pontos médios e porcentagens

Page 26: Slides de Estatística Descritiva e Probabilidade

Apresentação gráfica

Exemplo

Considere a distribuição de frequência obtida anteriormente com os dados a seguir. Obtenha histograma e polígono de frequência. Comente o resultado.

Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20

Page 27: Slides de Estatística Descritiva e Probabilidade

Diagrama de Pareto Gráfico de barra, por ordem de ocorrência

Frequência em ordem decrescente

Frequencia acumulada à direita

Page 28: Slides de Estatística Descritiva e Probabilidade

Diagrama em setores

Gráfico em forma de círculo: partes em um total

Recomenda-se um máximo de 7 partes

R e c e i t a d o M u n i c í p i o X ( 1 9 7 5 - 1 9 7 7 )

2 5 %3 3 , 3 %

4 1 , 7 %

1976 19771975

Page 29: Slides de Estatística Descritiva e Probabilidade

Probabilidade Significado

Axiomas de Probabilidade

Probabilidade condicional

Distribuição de Probabilidade

Valor Esperado

Variância

Distribuições Discretas

Distribuições Contínuas

Page 30: Slides de Estatística Descritiva e Probabilidade

Significado

Experimento aleatório

Espaço amostral - S

Eventos - E

Probabilidade Clássica P(E) = n(E)/n(S)

Page 31: Slides de Estatística Descritiva e Probabilidade

Axiomas

(1) Se Ø é um Evento vazio (evento

impossível), então P(Ø)=0

(2) Se Ac é o complemento do

evento A, então P(Ac) = 1 – P(A)

(3) Se A e B são dois eventos quaisquer, então: P(A B) = P (A) + P (B) – P (A B)

Page 32: Slides de Estatística Descritiva e Probabilidade

Exemplo

Em um lançamento de um dado, qual é probabilidade de se obter a FACE 4?

Experimento – lançar um dadoEspaço amostral – S={1,2,3,4,5,6}Evento – FACE 4; E = {4}P(E) = 1/6

Page 33: Slides de Estatística Descritiva e Probabilidade

Exemplo

Em um grupo de alunos do Curso de Análise de Sistemas, há 10 alunos que pagam Estatística, 5 que pagam Programação e 3 que pagam essas duas Disciplinas. Um aluno foi selecionado, qual é probabilidade dele pagar Estatística ou Programação?

Page 34: Slides de Estatística Descritiva e Probabilidade

Probabilidade condicional Para dois eventos E1 e E2, a

Probabilidade de E2 ocorrer, sabendo que E1 já havia ocorrido é dada por:

P(E2/E1) = P(E1 E2)/ P(E1), onde:

P(E1) é probabilidade de E1 ocorrer (só, sem E2)

P (E1E2) é a probabilidade dos dois ocorrerem juntos.

Page 35: Slides de Estatística Descritiva e Probabilidade

Exemplo

Em um lote de lâmpadas, há 8 boas, 2 com pequenos defeitos e 2 com grandes defeitos. Desse lote,são retiradas 2 lâmpadas, uma após a outra sem reposição. Qual a probabilidade de que ambas sejam defeituosas?Sabe-se que P(E2/E1) = P(E1 E2)/ P(E1) , logo tem-se:

P(E1 E2)= P(E1)* P(E2/E1)P(E1 E2)= (4/12)* P(E2/E1) P(E1 E2)= (4/12)* (3/11) P(E1 E2)= (4*3)/(12*11) P(E1 E2)= 12/132 = 0,0909

Page 36: Slides de Estatística Descritiva e Probabilidade

Distribuição de Probabilidade

Variável aleatória

Valores possíveis para Variável

Probabilidade de cada valor

Soma das Probabilidades igual a 1

Page 37: Slides de Estatística Descritiva e Probabilidade

Exemplo Em um lançamento de um dado,

construa a Distribuição de Probabilidade da face obtida em cada lançamento.Experimento – lançar um dado

Valores possíveis – S={1,2,3,4,5,6}P(1) = 1/6, P(2) = 1/6, P(3) = 1/6,

P(4) = 1/6, P(5) = 1/6, P(6) = 1/6X 1 2 3 4 5 6 SOMA

P(X) 1/6 1/6 1/6 1/6 1/6 1/6 6/6=1

Page 38: Slides de Estatística Descritiva e Probabilidade

Valor Esperado É o valor esperado para o experimento. Por exemplo, quando lança-se um dado, espera-se que ocorra a face ...

X é a variável em questãox é cada valor que X pode assumir p(x) é cada probabilidade de x

)()( xpxXE

Page 39: Slides de Estatística Descritiva e Probabilidade

Exemplo Em um lançamento de um dado, a

partir da Distribuição de Probabilidade da face obtida em cada lançamento, obter o Valor Esperado.

E(X) = 1*1/6+2*1/6+3*1/6+4*1/6+5*1/6+6*1/6

E(X) = (1+2+3+4+5+6)/6 = 21/6 = 3,5

Portanto ao lançar-se um dado espera-se que ocorra as faces 3 e 4.

X 1 2 3 4 5 6 SOMA

P(X) 1/6 1/6 1/6 1/6 1/6 1/6 6/6=1

Page 40: Slides de Estatística Descritiva e Probabilidade

Variância

)()( 22 xpxXE

É uma medida de dispersão.

V(X) = E(X2) – [E(X)]2, onde:

X é a variável em questãox é cada valor que X pode assumir p(x) é cada probabilidade de x

)()( xpxXE

Page 41: Slides de Estatística Descritiva e Probabilidade

Exemplo Em um lançamento de um dado, a

partir da Distribuição de Probabilidade da face obtida em cada lançamento, obter a Variância.

E(X2) = 12*1/6+22*1/6+32*1/6+42*1/6+52*1/6+62*1/6

E(X2) = (1+4+9+16+25+36)/6 = 91/6 = 15,17 E(X) = 3,5 V(X) = 15,17 – (3,5)2 = 2,92

X 1 2 3 4 5 6 SOMA

P(X) 1/6 1/6 1/6 1/6 1/6 1/6 6/6=1

Page 42: Slides de Estatística Descritiva e Probabilidade

Distribuições discretasVariável aleatória discreta assume valores inteiros, geralmente tipo 0,1,2, ..., n>=0

X - gols em uma partida de futebolX - votos de determinado candidatoX - lâmpadas queimadas em uma indústriaX - clientes em débito com determinada empresa

Uma variável aleatória é caracterizada pelo valor esperado E(X) e variância V(X), e possuideterminada distribuição de probabilidade

Page 43: Slides de Estatística Descritiva e Probabilidade

Distribuições Binomial

Variável aleatória discreta que pode assumir apenasdois valores, um de sucesso ou outro de fracasso, tipo 0,1.X – alunos aprovados;X – acertos em uma prova

n – repetições do experimento p – probabilidade de sucessoq – probabilidade de fracasso, q=1-px – valor de ocorrência de sucessoE(X) = n*p ; V(X) = n*p*q

xnxqpx

nxXP

)(

)!(!

!

xnx

n

x

n

Page 44: Slides de Estatística Descritiva e Probabilidade

Exemplo Em oito lançamentos de uma moeda,

qual é a probabilidade de se obter 3 caras? Calcular o Valor Esperado e a Variância?X-número de caras em lançamentos da moeda

X~B(n,x,p)n=8 repetições, x=3 caras, p=½ probabilidade de cara (sucesso)X~B(8,3,1/2)P(X=3) = C8,3*(1/2)3*(1-1/2)8-3

P(X=3) = 56*0,125*0,03125 = 0,21875 E(X) = n*p = 8*(1/2) = 4 caras V(X) = n*p*q = 8*(1/2)*(1-1/2)=8*(1/2)*(1/2) = 2

Page 45: Slides de Estatística Descritiva e Probabilidade

Distribuições Poisson

Variável aleatória discreta que pode assumir valores de sucesso em determinado intervalo. Este intervalo pode ser de tempo, de área, de volume.X – veículos que passam em uma rua por hora X – erros ortográficos em uma página de texto

t – taxa histórica de sucessox – valor de ocorrência de sucessoE(X) = t; V(X) = t

!

.)(

x

texXP

xt

Page 46: Slides de Estatística Descritiva e Probabilidade

Exemplo Qual é a probabilidade de se obter 1

chamada em 90 minutos, em um telefone que recebe em média 2 chamadas por hora?

X-número de chamadas telefônica por hora

X~P(x,t)x=1 chamada, t: 2 chamadas em 60 minutos

t chamadas em 90 minutost = 2*90/60 = 3X~P(1,3)

149361,01

3*049787,0

!1

3.)1(

13

e

XP

Page 47: Slides de Estatística Descritiva e Probabilidade

Distribuições contínuasVariável aleatória contínua assume valores reais, não determinados.

X – altura de alunosX – valor de compras de clientesX – tempo de vida de lâmpadasX – pesos de componentes eletrônicos

Uma variável aleatória é caracterizada pelo valor esperado E(X) e variância V(X), e possuideterminada distribuição de probabilidade. Há váriasdistribuições contínuas, vamos abordar a principal delas, que é a Distribuição Normal.

Page 48: Slides de Estatística Descritiva e Probabilidade

Distribuições Normal

Variável aleatória contínua, simétrica em torno damédia: com alta frequência em torno da média, com pequena frequência de valores altos e com pequena frequência de valores baixos.

E(X) = ; V(X) = 2

xx

xf ,2

exp2

1)(

2

2

Page 49: Slides de Estatística Descritiva e Probabilidade

Distribuições Normal

Como é possível observar é preciso integrar a funçãof(x) da Distribuição Normal, para poder obter o valorda probabilidade desejada. E isto é bastante difícil. O que fazer então? Gauss, que criou a Normal, propôs aseguinte Transformação Linear

Essa variável Z tem distribuição Normal com Média 0e variância 1. E, na maioria das vezes, -4<z<4, que éum intervalo bastante controlado.

X

Z

Page 50: Slides de Estatística Descritiva e Probabilidade

Distribuições NormalAssim, se X~( ; ) então Z~( 0 ; 1 ). Há váriastabelas Z que permitem calcular probabilidades entreintervalos de valores de z.

Por exemplo, é possível calcular a probabilidadeP(-1,45 < Z < 2,33), utilizando-se dessas tabelas Z.

Para utilizar essas tabelas Z, é preciso inicialmenterealizar a transformação

e utilizar as tabelas Z existentes.

X

Z

Page 51: Slides de Estatística Descritiva e Probabilidade

Exemplo Sabe-se que as notas de Informática seguem uma

distribuição normal, X~( =6,55; =2,01). Calcule a

probabilidade de um aluno obter nota entre 5,0 e 7,5.

P(5,0 < X < 7,5)=? Deve-se aplicar a transformação Z.

P [ (5,0-6,55)/2,01 <(X-6,55)/2,01<

(7,5-6,55)/2,01 ] P [ -0,77 <Z< 0,47 ]

Agora é só aplicar uma tabela Z.

X

Z

Page 52: Slides de Estatística Descritiva e Probabilidade

Análise de Correlação

Significado

Diagrama de Dispersão

Correlação Linear

Grau de explicação

Page 53: Slides de Estatística Descritiva e Probabilidade

Significado

Relação entre variáveis: duas

Existência de associação entre elas

Quantificação da associação

Predição de uma variável, em função da outra

Gráfico dos valores das variáveis

Page 54: Slides de Estatística Descritiva e Probabilidade

Diagrama de dispersão

Gráfico de pontos, tipo (X, Y)

Variável independente - X

Variável dependente - Y

Page 55: Slides de Estatística Descritiva e Probabilidade

Situações Possíveis

y’

x’

y’

x’

y’

x’

y’

x’

Ausência associação linear

Associação linear positiva

Associação linear negativa

y’

x’

y’

x’

Page 56: Slides de Estatística Descritiva e Probabilidade

Correlação Linear

Análise do relacionamento entre duas variáveis

Sinal do grau de relacionamento linear

Page 57: Slides de Estatística Descritiva e Probabilidade

Coeficiente de Correlação Linear

Equação

Onde n é a quantidade de pares (X,Y)

Valores do coeficiente: –1 r +1

r = n.x.y) - (x).(y)

n.x2) - (x)2 n.y2) - (y)2r =

n.x.y) - (x).(y)

n.x2) - (x)2 n.y2) - (y)2r =

n.x.y) - (x).(y)

n.x2) - (x)2 n.y2) - (y)2r =

n.x.y) - (x).(y)

n.x2) - (x)2 n.y2) - (y)2r =

n.x.y) - (x).(y)

n.x2) - (x)2 n.y2) - (y)2

Valores Análise0,00 a 0,19 Correlação bem fraca

0,20 a 0,39 Correlação fraca

0,40 a 0,69 Correlação moderada

0,70 a 0,89 Correlação forte

0,90 a 1,00 Correlação muito forte

Page 58: Slides de Estatística Descritiva e Probabilidade

Valores possíveis

r = 0,4 r = 0,7 r = 1,0

r = -0,3 r = -0,6 r = -0,9

Page 59: Slides de Estatística Descritiva e Probabilidade

Exemplo

Construa diagrama de dispersão e obtenha Coeficiente de Correlação Linear

Y = valor do faturamento (R$)X = horas de Programação

DADOS:

MÊS FATURAMENTO HORAS 1 2001 804 2 2048 829 3 1998 797 4 2030 815 5 1992 805 6 2013 811

Page 60: Slides de Estatística Descritiva e Probabilidade

Grau de explicação

Variação explicada pela Correlação

Quanto maior a explicação, melhor a Correlação

É a explicação que dá qualidade a Correlação

Quando a explicação é baixa, outros fatores afetam a Correlação

Page 61: Slides de Estatística Descritiva e Probabilidade

Equação da ExplicaçãoE = r2*100 Onde r é o Coeficiente de Correlação Linear

Situações

r = 0,9 => 81% da variação é explicada

r = 0,7 => 49% da variação é explicada

Page 62: Slides de Estatística Descritiva e Probabilidade

Exercícios

Obtenha dados reais, de sua área funcional, para fazer uma análise de Correlação Linear.

Comente os resultados, do ponto de vista prático.

Page 63: Slides de Estatística Descritiva e Probabilidade

Análise de Regressão

Significado

Modelo de Regressão

Parâmetros de Regressão

Erro padrão de estimativa

Page 64: Slides de Estatística Descritiva e Probabilidade

SignificadoDescrever funcionalmente a relação entre X e Y: y = f(x)

Obter uma função que forneça pequenos desvios entre valores reais e os por ela gerados

O grau de explicação, previamente obtido, precisa ser alto

Page 65: Slides de Estatística Descritiva e Probabilidade

Aplicação prática

Predizer o valor de uma variável, a partirde um valor de outra variável

As variáveis não precisam ter as mesmas unidades de medidas

No caso de duas variáveis, a função é afim, y = a + bx.

Page 66: Slides de Estatística Descritiva e Probabilidade

Quando a função é uma reta

Considere os pares (10, 50) e (14, 40). Qual reta passa entre eles?

35

40

45

50

55

10 11 12 13 14 15

Page 67: Slides de Estatística Descritiva e Probabilidade

Equação de uma reta: y = a + bx

35

40

45

50

55

10 11 12 13 14 15

Inclinação da reta: b = (40 – 50) / (14 - 10) = -2,5

Intercepto: a = 50 – (-2,5)*10 = 75

y = 75 -2,5x

Page 68: Slides de Estatística Descritiva e Probabilidade

Modelo de Regressão

Função: y = a + bx

Desvio

Visão analítica

Page 69: Slides de Estatística Descritiva e Probabilidade

Modelo de RegressãoRegressão Linear: y = a + bx

Onde: a é o valor do intercepto da reta com o eixo Y;

b é o valor da inclinação da reta.

Considerações Matemáticas: para y = a + bx

(i) y = n.a - b x , e

(ii) xy = a x - b x² ,

onde n é o número de pares (X,Y)

Page 70: Slides de Estatística Descritiva e Probabilidade

Parâmetros da Regressão

Finalmente, com o método de desvios mínimos quadrados, e as duas equações (i) e (ii), tem-se

é a média de Y; é média de X

n é número de pares (X,Y).

n.x.y) - (x).(y)

n.x2) - (x)2b =

XbYa *

n

yY

n

xX

Page 71: Slides de Estatística Descritiva e Probabilidade

Calculando previsões

Pode-se calcular valores previstos para Y a partir de um valor de X.

O mesmo vale para valores de X a partir de valores de Y.

Para isto, basta substituir o valor conhecido na reta e obter o valor desejado

Page 72: Slides de Estatística Descritiva e Probabilidade

Calculando previsõesA soma das previsões de Y para cada valor original de X, é igual à soma dos valores originais de Y:

yp = y

Isto prova a consistência do modelo de regressão, caso o grau de explicação seja aceitável.

Page 73: Slides de Estatística Descritiva e Probabilidade

Exemplo

Obtenha a reta de regressão e calcule quantas horas precisariam ser programadas para obter-se um faturamento de R$ 1500

Y = valor do faturamento (R$)X = horas de Programação

DADOS:

MÊS FATURAMENTO HORAS 1 2001 804 2 2048 829 3 1998 797 4 2030 815 5 1992 805 6 2013 811

Page 74: Slides de Estatística Descritiva e Probabilidade

Erro padrão de estimativa

Como foi verificado há desvios, embora mínimos, na regressão.

Logo, também haverá nos valores previstos, calculados a partir da reta de regressão.

É preciso, portanto, quantificar esse erro de previsão.

Page 75: Slides de Estatística Descritiva e Probabilidade

Erro padrão de estimativa A equação que quantifica o erro padrão é:

Onde: Yp são os valores previstos de Y para cada valor original de X;

Y são os valores originais da variável Y;

n é o número de pares (X,Y).

Cada previsão estará sujeita a este erro, para mais ou para menos.

2

2

n

YpYSe

Page 76: Slides de Estatística Descritiva e Probabilidade

Exercícios

Obtenha dados reais, de sua área funcional, para fazer uma análise de Regressão Linear.

Comente os resultados, do ponto de vista prático.

Page 77: Slides de Estatística Descritiva e Probabilidade

Transformações Lineares

Quando a relação entre (X,Y) não é linear, é possível aplicar uma transformação nos valores de X, de Y, ou de ambos

É preciso marcar um diagrama de dispersão, avaliar qual transformação aplicar, aplicá-la e realizar a análise de regressão

Para realizar alguma previsão é preciso aplicar o inverso da transformação, para manter a consistência dos valores

Page 78: Slides de Estatística Descritiva e Probabilidade

Transformações Lineares Uma das tranformações muito aplicadas é a função LOGARÍTMICA: y = axb

Ou seja, log (y) = log ( axb), mas

log (axb) = log (a) + log (xb), e log (xb) = b log (x)

Portanto, a função será: log (y) = log (a) + b log (x)

Page 79: Slides de Estatística Descritiva e Probabilidade

Transformações Lineares

Outras tranformações aplicadas são:

a função POTÊNCIA

e a função EXPONENCIAL

Os procedimentos são os mesmos da função LOGARÍTMICA: transforma os dados, realiza a análise; e inverte a transformação para calcular previsões.