Slides de Estatística Descritiva e Probabilidade

Preview:

Citation preview

Professor: João Maria Filgueira, MSc(jmfilgueira@cefetrn.br)

Probabilidade Estatística

Plano de Ensino

Objetivo

Conteúdo

Metodologia

Avaliação

BIbliografia

Método EstatísticoA Ciência Estatística

Termos Estatísticos relevantes

Fases do Trabalho Estatístico

Exemplo para discussão

A Ciência Estatística

Estatística tem sua origem em Dados Estatais - Governamentais

A partir do século XVI surgem análises de nascimentos, de óbitos, de matrimônios, riquezas

No século XVIII surge, dessas análises, a Ciência Estatística

Dimensões: Descritiva, Probabilística, Inferencial

Termos Estatísticos relevantes

População: universo a ser estudado

Amostra: subconjunto da População

Variáveis: Qualitativas, Quantitativas

Variáveis Quantitativas: Discretas e Contínuas

Dados Estatísticos: valores das Variáveis

Fases do Trabalho Estatístico

2 - Planejamento

SoftwareEstatístico

3 – Coleta de dados

5 – Análise de dados

1 – Definição do Problema

6 – Apresentaçãode resultados

4 – Organizaçãode dados

Lista deReferências

Base deDados

Exemplo para discussãoEstudo para avaliar a Evasão Escolar em seu Município.

Como Planejar esse Estudo?

Quais as fases desse Trabalho Estatístico?

Quais as principais variáveis? E os principais desafios?

Estatística DescritivaDistribuição de frequências

Medidas de posição

Medidas de variabilidade

Medidas Separatrizes

Assimetria

Apresentação gráfica

Distribuição de FrequênciaRol: conjunto ordenado dos dados

Amplitude Total: AT = MAIOR - MENOR

Classes: Onde n é a quantidade de dados

Amplitude de classe: a = AT / c

Frequência: ocorrência do Rol nas classes

.25 n dados de número o se , n

25; n dados de número o se 5,

Distribuição Frequência

Exemplo

Considere os dados a seguir referentes a tempo de processamento de uma rotina computacional, implementada por diferentes Programadores. Obtenha a distribuição de frequência. Comente o resultado.

Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20

MédiaValor médio dos dados

Dados não agrupados:

Onde X é o conjunto valores; n é a quantidade de dados.

Dados agrupados:

Onde X é o ponto médio; f é a frequência da classe;

f

XfX

)*(

n

XX

MedianaValor central dos dados

Dados não agrupados: , quando n for ímpar

, quando n for par

Onde x(n+1)/2 representa o valor da posição (n+1)/2

xn/2 representa o valor da posição n/2

x(n/2+1) representa o valor da posição (n/2+1)

)/2 X (XX

XX

1) (n/2n/2

1n

~

~2/)(

Mediana

Valor central dos dados

Dados agrupados:

É preciso obter a primeira classe com 50% dos dados. Esta é a classe mediana.

Onde L é o limite inferior da classe mediana; Sant é a soma das frequências anteriores; f é a frequência da classe mediana; a é a amplitude de classe.

a*f

Sant2f

LX

~

Moda

Valor de maior frequência

Dados agrupados:

É preciso obter a classe com maior frequência.

Onde L é o limite inferior da classe; Da = maior frequência - anterior; Dp = maior frequência - posterior; a é a amplitude de classe.

a*DpDa

DaLX

ˆ

Medidas de posição

Exemplo

Considere a distribuição de frequência obtida anteriormente com os dados a seguir. Obtenha média, moda e mediana. Comente o resultado.

Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20

Variância

X

1)(

)(* 22

f

XXfS

1

)( 22

n

XXS

Variação dos dados em relação à média

Dados não agrupados: Onde X o conjunto valores; n é número de dados; é a média.

Dados agrupados: Onde X é o ponto médio; f é a frequência da classe; é média.X

Desvio padrão

Variação dos dados em relação à média

Onde S2 é a variância

2SS

Coeficiente de variaçãoVariação dos dados em relação à média

Onde:S é o Desvio padrãoe é a Média

Quanto menor Cv, melhor a representatividade da média X.

100*X

SCv

X

Medidas de variação

Exemplo

Considere a distribuição de frequência obtida anteriormente com os dados a seguir, bem como a média, moda e mediana. Obtenha variância, desvio padrão e coeficiente de variação. Comente o resultado.

Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20

Medidas SeparatrizesOrganizam os dados em grupos percentualmente iguais Quartis – 25% Q1 25% Q2 25% Q3 25%

Decis – 10% D1 10% D2 ...... 10% D8 10% D9 10%

Percentis – 1% P1 1% P2 ...... 1% P98 1% P99 1%

a*f

Sant4f

*i

LQ i

a*f

Sant10f

*i

LDi

a*f

Sant100f

*i

LPi

Medidas Separatrizes

Exemplo

Considere a distribuição de frequência obtida anteriormente com os dados a seguir. Obtenha o valor abaixo do qual há 75% dos dados, e o valor abaixo do qual há 10% dos dados . Comente os resultados.

Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20

AssimetriaQuantifica o deslocamento/afastamento da distribuição em relação a medidas centrais

é a Média é a Moda S é o Desvio padrão

S

XXAss

ˆ

XX̂

AssimetriaSituações que a literatura apresenta

Ass > 0

Ass < 0

Ass = 0

Assimetria

Exemplo

Considere a distribuição de frequência obtida anteriormente com os dados a seguir, bem como a média, moda e desvio padrão. Obtenha a Assimetria. Comente o resultado.

Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20

Apresentação gráfica

Histograma

Gráfico de barra de classes e porcentagens

Polígono de frequência

Gráfico de linha de pontos médios e porcentagens

Apresentação gráfica

Exemplo

Considere a distribuição de frequência obtida anteriormente com os dados a seguir. Obtenha histograma e polígono de frequência. Comente o resultado.

Tempo de processamento (s) 18 18 17 16 19 19 17 18 20 20 22 25 23 22 21 21 19 17 18 16 15 20

Diagrama de Pareto Gráfico de barra, por ordem de ocorrência

Frequência em ordem decrescente

Frequencia acumulada à direita

Diagrama em setores

Gráfico em forma de círculo: partes em um total

Recomenda-se um máximo de 7 partes

R e c e i t a d o M u n i c í p i o X ( 1 9 7 5 - 1 9 7 7 )

2 5 %3 3 , 3 %

4 1 , 7 %

1976 19771975

Probabilidade Significado

Axiomas de Probabilidade

Probabilidade condicional

Distribuição de Probabilidade

Valor Esperado

Variância

Distribuições Discretas

Distribuições Contínuas

Significado

Experimento aleatório

Espaço amostral - S

Eventos - E

Probabilidade Clássica P(E) = n(E)/n(S)

Axiomas

(1) Se Ø é um Evento vazio (evento

impossível), então P(Ø)=0

(2) Se Ac é o complemento do

evento A, então P(Ac) = 1 – P(A)

(3) Se A e B são dois eventos quaisquer, então: P(A B) = P (A) + P (B) – P (A B)

Exemplo

Em um lançamento de um dado, qual é probabilidade de se obter a FACE 4?

Experimento – lançar um dadoEspaço amostral – S={1,2,3,4,5,6}Evento – FACE 4; E = {4}P(E) = 1/6

Exemplo

Em um grupo de alunos do Curso de Análise de Sistemas, há 10 alunos que pagam Estatística, 5 que pagam Programação e 3 que pagam essas duas Disciplinas. Um aluno foi selecionado, qual é probabilidade dele pagar Estatística ou Programação?

Probabilidade condicional Para dois eventos E1 e E2, a

Probabilidade de E2 ocorrer, sabendo que E1 já havia ocorrido é dada por:

P(E2/E1) = P(E1 E2)/ P(E1), onde:

P(E1) é probabilidade de E1 ocorrer (só, sem E2)

P (E1E2) é a probabilidade dos dois ocorrerem juntos.

Exemplo

Em um lote de lâmpadas, há 8 boas, 2 com pequenos defeitos e 2 com grandes defeitos. Desse lote,são retiradas 2 lâmpadas, uma após a outra sem reposição. Qual a probabilidade de que ambas sejam defeituosas?Sabe-se que P(E2/E1) = P(E1 E2)/ P(E1) , logo tem-se:

P(E1 E2)= P(E1)* P(E2/E1)P(E1 E2)= (4/12)* P(E2/E1) P(E1 E2)= (4/12)* (3/11) P(E1 E2)= (4*3)/(12*11) P(E1 E2)= 12/132 = 0,0909

Distribuição de Probabilidade

Variável aleatória

Valores possíveis para Variável

Probabilidade de cada valor

Soma das Probabilidades igual a 1

Exemplo Em um lançamento de um dado,

construa a Distribuição de Probabilidade da face obtida em cada lançamento.Experimento – lançar um dado

Valores possíveis – S={1,2,3,4,5,6}P(1) = 1/6, P(2) = 1/6, P(3) = 1/6,

P(4) = 1/6, P(5) = 1/6, P(6) = 1/6X 1 2 3 4 5 6 SOMA

P(X) 1/6 1/6 1/6 1/6 1/6 1/6 6/6=1

Valor Esperado É o valor esperado para o experimento. Por exemplo, quando lança-se um dado, espera-se que ocorra a face ...

X é a variável em questãox é cada valor que X pode assumir p(x) é cada probabilidade de x

)()( xpxXE

Exemplo Em um lançamento de um dado, a

partir da Distribuição de Probabilidade da face obtida em cada lançamento, obter o Valor Esperado.

E(X) = 1*1/6+2*1/6+3*1/6+4*1/6+5*1/6+6*1/6

E(X) = (1+2+3+4+5+6)/6 = 21/6 = 3,5

Portanto ao lançar-se um dado espera-se que ocorra as faces 3 e 4.

X 1 2 3 4 5 6 SOMA

P(X) 1/6 1/6 1/6 1/6 1/6 1/6 6/6=1

Variância

)()( 22 xpxXE

É uma medida de dispersão.

V(X) = E(X2) – [E(X)]2, onde:

X é a variável em questãox é cada valor que X pode assumir p(x) é cada probabilidade de x

)()( xpxXE

Exemplo Em um lançamento de um dado, a

partir da Distribuição de Probabilidade da face obtida em cada lançamento, obter a Variância.

E(X2) = 12*1/6+22*1/6+32*1/6+42*1/6+52*1/6+62*1/6

E(X2) = (1+4+9+16+25+36)/6 = 91/6 = 15,17 E(X) = 3,5 V(X) = 15,17 – (3,5)2 = 2,92

X 1 2 3 4 5 6 SOMA

P(X) 1/6 1/6 1/6 1/6 1/6 1/6 6/6=1

Distribuições discretasVariável aleatória discreta assume valores inteiros, geralmente tipo 0,1,2, ..., n>=0

X - gols em uma partida de futebolX - votos de determinado candidatoX - lâmpadas queimadas em uma indústriaX - clientes em débito com determinada empresa

Uma variável aleatória é caracterizada pelo valor esperado E(X) e variância V(X), e possuideterminada distribuição de probabilidade

Distribuições Binomial

Variável aleatória discreta que pode assumir apenasdois valores, um de sucesso ou outro de fracasso, tipo 0,1.X – alunos aprovados;X – acertos em uma prova

n – repetições do experimento p – probabilidade de sucessoq – probabilidade de fracasso, q=1-px – valor de ocorrência de sucessoE(X) = n*p ; V(X) = n*p*q

xnxqpx

nxXP

)(

)!(!

!

xnx

n

x

n

Exemplo Em oito lançamentos de uma moeda,

qual é a probabilidade de se obter 3 caras? Calcular o Valor Esperado e a Variância?X-número de caras em lançamentos da moeda

X~B(n,x,p)n=8 repetições, x=3 caras, p=½ probabilidade de cara (sucesso)X~B(8,3,1/2)P(X=3) = C8,3*(1/2)3*(1-1/2)8-3

P(X=3) = 56*0,125*0,03125 = 0,21875 E(X) = n*p = 8*(1/2) = 4 caras V(X) = n*p*q = 8*(1/2)*(1-1/2)=8*(1/2)*(1/2) = 2

Distribuições Poisson

Variável aleatória discreta que pode assumir valores de sucesso em determinado intervalo. Este intervalo pode ser de tempo, de área, de volume.X – veículos que passam em uma rua por hora X – erros ortográficos em uma página de texto

t – taxa histórica de sucessox – valor de ocorrência de sucessoE(X) = t; V(X) = t

!

.)(

x

texXP

xt

Exemplo Qual é a probabilidade de se obter 1

chamada em 90 minutos, em um telefone que recebe em média 2 chamadas por hora?

X-número de chamadas telefônica por hora

X~P(x,t)x=1 chamada, t: 2 chamadas em 60 minutos

t chamadas em 90 minutost = 2*90/60 = 3X~P(1,3)

149361,01

3*049787,0

!1

3.)1(

13

e

XP

Distribuições contínuasVariável aleatória contínua assume valores reais, não determinados.

X – altura de alunosX – valor de compras de clientesX – tempo de vida de lâmpadasX – pesos de componentes eletrônicos

Uma variável aleatória é caracterizada pelo valor esperado E(X) e variância V(X), e possuideterminada distribuição de probabilidade. Há váriasdistribuições contínuas, vamos abordar a principal delas, que é a Distribuição Normal.

Distribuições Normal

Variável aleatória contínua, simétrica em torno damédia: com alta frequência em torno da média, com pequena frequência de valores altos e com pequena frequência de valores baixos.

E(X) = ; V(X) = 2

xx

xf ,2

exp2

1)(

2

2

Distribuições Normal

Como é possível observar é preciso integrar a funçãof(x) da Distribuição Normal, para poder obter o valorda probabilidade desejada. E isto é bastante difícil. O que fazer então? Gauss, que criou a Normal, propôs aseguinte Transformação Linear

Essa variável Z tem distribuição Normal com Média 0e variância 1. E, na maioria das vezes, -4<z<4, que éum intervalo bastante controlado.

X

Z

Distribuições NormalAssim, se X~( ; ) então Z~( 0 ; 1 ). Há váriastabelas Z que permitem calcular probabilidades entreintervalos de valores de z.

Por exemplo, é possível calcular a probabilidadeP(-1,45 < Z < 2,33), utilizando-se dessas tabelas Z.

Para utilizar essas tabelas Z, é preciso inicialmenterealizar a transformação

e utilizar as tabelas Z existentes.

X

Z

Exemplo Sabe-se que as notas de Informática seguem uma

distribuição normal, X~( =6,55; =2,01). Calcule a

probabilidade de um aluno obter nota entre 5,0 e 7,5.

P(5,0 < X < 7,5)=? Deve-se aplicar a transformação Z.

P [ (5,0-6,55)/2,01 <(X-6,55)/2,01<

(7,5-6,55)/2,01 ] P [ -0,77 <Z< 0,47 ]

Agora é só aplicar uma tabela Z.

X

Z

Análise de Correlação

Significado

Diagrama de Dispersão

Correlação Linear

Grau de explicação

Significado

Relação entre variáveis: duas

Existência de associação entre elas

Quantificação da associação

Predição de uma variável, em função da outra

Gráfico dos valores das variáveis

Diagrama de dispersão

Gráfico de pontos, tipo (X, Y)

Variável independente - X

Variável dependente - Y

Situações Possíveis

y’

x’

y’

x’

y’

x’

y’

x’

Ausência associação linear

Associação linear positiva

Associação linear negativa

y’

x’

y’

x’

Correlação Linear

Análise do relacionamento entre duas variáveis

Sinal do grau de relacionamento linear

Coeficiente de Correlação Linear

Equação

Onde n é a quantidade de pares (X,Y)

Valores do coeficiente: –1 r +1

r = n.x.y) - (x).(y)

n.x2) - (x)2 n.y2) - (y)2r =

n.x.y) - (x).(y)

n.x2) - (x)2 n.y2) - (y)2r =

n.x.y) - (x).(y)

n.x2) - (x)2 n.y2) - (y)2r =

n.x.y) - (x).(y)

n.x2) - (x)2 n.y2) - (y)2r =

n.x.y) - (x).(y)

n.x2) - (x)2 n.y2) - (y)2

Valores Análise0,00 a 0,19 Correlação bem fraca

0,20 a 0,39 Correlação fraca

0,40 a 0,69 Correlação moderada

0,70 a 0,89 Correlação forte

0,90 a 1,00 Correlação muito forte

Valores possíveis

r = 0,4 r = 0,7 r = 1,0

r = -0,3 r = -0,6 r = -0,9

Exemplo

Construa diagrama de dispersão e obtenha Coeficiente de Correlação Linear

Y = valor do faturamento (R$)X = horas de Programação

DADOS:

MÊS FATURAMENTO HORAS 1 2001 804 2 2048 829 3 1998 797 4 2030 815 5 1992 805 6 2013 811

Grau de explicação

Variação explicada pela Correlação

Quanto maior a explicação, melhor a Correlação

É a explicação que dá qualidade a Correlação

Quando a explicação é baixa, outros fatores afetam a Correlação

Equação da ExplicaçãoE = r2*100 Onde r é o Coeficiente de Correlação Linear

Situações

r = 0,9 => 81% da variação é explicada

r = 0,7 => 49% da variação é explicada

Exercícios

Obtenha dados reais, de sua área funcional, para fazer uma análise de Correlação Linear.

Comente os resultados, do ponto de vista prático.

Análise de Regressão

Significado

Modelo de Regressão

Parâmetros de Regressão

Erro padrão de estimativa

SignificadoDescrever funcionalmente a relação entre X e Y: y = f(x)

Obter uma função que forneça pequenos desvios entre valores reais e os por ela gerados

O grau de explicação, previamente obtido, precisa ser alto

Aplicação prática

Predizer o valor de uma variável, a partirde um valor de outra variável

As variáveis não precisam ter as mesmas unidades de medidas

No caso de duas variáveis, a função é afim, y = a + bx.

Quando a função é uma reta

Considere os pares (10, 50) e (14, 40). Qual reta passa entre eles?

35

40

45

50

55

10 11 12 13 14 15

Equação de uma reta: y = a + bx

35

40

45

50

55

10 11 12 13 14 15

Inclinação da reta: b = (40 – 50) / (14 - 10) = -2,5

Intercepto: a = 50 – (-2,5)*10 = 75

y = 75 -2,5x

Modelo de Regressão

Função: y = a + bx

Desvio

Visão analítica

Modelo de RegressãoRegressão Linear: y = a + bx

Onde: a é o valor do intercepto da reta com o eixo Y;

b é o valor da inclinação da reta.

Considerações Matemáticas: para y = a + bx

(i) y = n.a - b x , e

(ii) xy = a x - b x² ,

onde n é o número de pares (X,Y)

Parâmetros da Regressão

Finalmente, com o método de desvios mínimos quadrados, e as duas equações (i) e (ii), tem-se

é a média de Y; é média de X

n é número de pares (X,Y).

n.x.y) - (x).(y)

n.x2) - (x)2b =

XbYa *

n

yY

n

xX

Calculando previsões

Pode-se calcular valores previstos para Y a partir de um valor de X.

O mesmo vale para valores de X a partir de valores de Y.

Para isto, basta substituir o valor conhecido na reta e obter o valor desejado

Calculando previsõesA soma das previsões de Y para cada valor original de X, é igual à soma dos valores originais de Y:

yp = y

Isto prova a consistência do modelo de regressão, caso o grau de explicação seja aceitável.

Exemplo

Obtenha a reta de regressão e calcule quantas horas precisariam ser programadas para obter-se um faturamento de R$ 1500

Y = valor do faturamento (R$)X = horas de Programação

DADOS:

MÊS FATURAMENTO HORAS 1 2001 804 2 2048 829 3 1998 797 4 2030 815 5 1992 805 6 2013 811

Erro padrão de estimativa

Como foi verificado há desvios, embora mínimos, na regressão.

Logo, também haverá nos valores previstos, calculados a partir da reta de regressão.

É preciso, portanto, quantificar esse erro de previsão.

Erro padrão de estimativa A equação que quantifica o erro padrão é:

Onde: Yp são os valores previstos de Y para cada valor original de X;

Y são os valores originais da variável Y;

n é o número de pares (X,Y).

Cada previsão estará sujeita a este erro, para mais ou para menos.

2

2

n

YpYSe

Exercícios

Obtenha dados reais, de sua área funcional, para fazer uma análise de Regressão Linear.

Comente os resultados, do ponto de vista prático.

Transformações Lineares

Quando a relação entre (X,Y) não é linear, é possível aplicar uma transformação nos valores de X, de Y, ou de ambos

É preciso marcar um diagrama de dispersão, avaliar qual transformação aplicar, aplicá-la e realizar a análise de regressão

Para realizar alguma previsão é preciso aplicar o inverso da transformação, para manter a consistência dos valores

Transformações Lineares Uma das tranformações muito aplicadas é a função LOGARÍTMICA: y = axb

Ou seja, log (y) = log ( axb), mas

log (axb) = log (a) + log (xb), e log (xb) = b log (x)

Portanto, a função será: log (y) = log (a) + b log (x)

Transformações Lineares

Outras tranformações aplicadas são:

a função POTÊNCIA

e a função EXPONENCIAL

Os procedimentos são os mesmos da função LOGARÍTMICA: transforma os dados, realiza a análise; e inverte a transformação para calcular previsões.

Recommended