43
Estatística básica Estatística é a ciência dos dados, envolvendo o desenvolvimento de processos, métodos e técnicas de coleta, classificação, organização, resumo, análise e interpretação de dados sobre uma população, e os métodos de tirar conclusões ou fazer predições com base nesses dados. Aulas de Matemática / Física / Química Contato: Horacimar (21) 9-8126-2831 [email protected]

Estatística básica

Embed Size (px)

DESCRIPTION

Aula de matemática Estatística Básica

Citation preview

Page 1: Estatística básica

Estatística básica Estatística é a ciência dos dados, envolvendo o desenvolvimento de processos, métodos e técnicas de coleta, classificação, organização, resumo, análise e interpretação de dados sobre uma população, e os métodos de tirar conclusões ou fazer predições com base nesses dados.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 2: Estatística básica

Estatística básica

Estatística

Descritiva

Organização e descrição

dos dados

Cálculo de médias, variâncias, estudo de gráficos, tabelas, etc.

Indutiva

(Inferencial)

Estimação de parâmetros, teste de

hipóteses, etc.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 3: Estatística básica

Estatística básica • A estatística tem a capacidade de sintetizar os dados; • A amostragem é o ponto de partida (na prática) para todo um Estudo Estatístico. É através da amostragem que obtemos os dados da medição de determinada característica ou propriedade de um objeto, pessoa ou coisa;

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 4: Estatística básica

Estatística básica • População: é a coleção de todas as observações potenciais sobre determinado fenômeno; •Amostra: é o conjunto de dados efetivamente observados, ou extraídos;

População

Amostras

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 5: Estatística básica

Estatística básica Cada observação individual ou item é denominada como unidade elementar, que pode estar composta por um ou mais itens medidos, propriedades, atributos, etc, denominados como variáveis.

Variável é uma característica, propriedade ou atributo de uma unidade da população, cujo valor pode variar entre as unidades da população.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 6: Estatística básica

Estatística básica Exemplo:

Nome Idade Cargo Sexo Peso Escolaridade

João 27 Supervisor M 62 kg 2º grau

Alex 38 Chefe M 78 kg 1º grau

Ana 32 Secretária F 58 kg 3º grau

Unidade elementar

Variáveis

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 7: Estatística básica

Estatística básica •Tipos de variáveis

Variável

Qualitativa

Nominal

Ordinal

Quantitativa

Discreta

Contínua

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 8: Estatística básica

Estatística básica • Exemplo: Para uma população de peças produzidos em um

processo, poderíamos ter:

Variável Tipo

Estado: Perfeita ou defeituosa Qualitativa Nominal

Qualidade: 1ª, 2ª ou 3ª categoria Qualitativa Ordinal

Número de peças defeituosas Quantitativa Discreta

Diâmetro das peças Quantitativa Contínua

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 9: Estatística básica

Estatística básica Agrupamento de dados e distribuição de frequências

• Quando vamos fazer um levantamento de uma população, um dos passos é retirar uma amostra dessa população e obter dados relativos à variável desejada nessa amostra; • Cabe à Estatística sintetizar tais dados na forma de tabela e gráficos que contenham, além dos valores das variáveis, o número de elementos correspondentes a cada variável;

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 10: Estatística básica

Estatística básica Agrupamento de dados e distribuição de frequências

• A esse procedimento está associado o conceito de: • Dados brutos: é o conjunto de dados numéricos obtidos que ainda não foram organizados; • Rol: é o arranjo dos dados brutos em ordem crescente (ou decrescente); • Amplitude (H): é a diferença entre o maior e o menor dos valores observados; •Frequência absoluta (ni): é o número de vezes que um elemento aparece na amostra;

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 11: Estatística básica

Estatística básica Agrupamento de dados e distribuição de frequências

• n : número total de dados da amostra • k : número de valores diferentes na amostra • Frequência relativa (fi): • Frequência absoluta acumulada (Ni): é a soma da frequência absoluta do valor da variável i com todas as frequências absolutas anteriores; • Frequência relativa acumulada (Fi):

n

nf i

i 11

k

i

if

nnk

i

i 1

n

NF i

i

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 12: Estatística básica

Estatística básica Agrupamento de dados e distribuição de frequências

• Exemplo: Os seguintes dados foram amostrados do números de negócios efetuados diariamente por um operador financeiro:

População: Número de negócios efetuados diariamente Dados brutos: {14, 12, 13, 11, 12, 13, 16, 14, 14, 15, 17, 14, 11, 13, 14, 15, 13, 12, 14, 13, 14, 13, 15, 16, 12, 12} Rol: {11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14,14, 15,15,15, 16,16, 17} Amplitude: 17 – 11 = 6 n = 26 observações

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 13: Estatística básica

Estatística básica Número de Operações

fechadas por dia

Freq. Absoluta

Freq. Relativa

Freq. Absoluta

Acumulada

Freq. Acumulada

11 2 7,69% 2 7,69%

12 5 19,23% 7 26,92%

13 6 23,08% 13 50,00%

14 7 26,92% 20 76,92%

15 3 11,54% 23 88,46%

16 2 7,69% 25 96,15%

17 1 3,85% 26 100,00%

Total 26 100,00%

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 14: Estatística básica

Estatística básica

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 15: Estatística básica

Estatística básica Classes • As classes são um artifício para condensar o número de elementos diferentes de uma amostra. Imagine construir uma tabela para 200 valores diferentes, nos moldes do problema anterior. • Os principais pré-requisitos para uma boa definição de classes em um conjunto de dados são: •a) as classes devem abranger todas as observações; •b) o extremo superior de uma classe é o extremo inferior da classe subsequente (simbologia: |, intervalo fechado à esquerda e aberto à direita); •c) cada valor absoluto deve enquadrar-se em apenas uma classe; •d) k 25, de modo geral, sendo k o número de classes; •e) As unidades das classes devem ser as mesmas dos dados.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 16: Estatística básica

Estatística básica Classes • Cálculo de k (Formas de calcular) :

(Fórmula de Sturges) Obs.: N é o número de elementos diferentes da amostra e, muitas vezes, pode ser considerado N = n (no. de observações). • Intervalo da classe (h): h H/k • Ponto médio da classe (xi) : Ponto médio entre o limite inferior e o limite superior de cada classe.

Nk 2log1

Nk

2ln

ln22

nknn kk

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 17: Estatística básica

Estatística básica • Exemplo: Utilizando os dados do exemplo anterior, temos:

32ln

ln

47log1

37

2

Nk

k

k

23

6

6

h

H

Faixa de negócios

Xi

Freq. Absoluta

Freq. Relativa

Freq. Absoluta Acumulada

Freq. Acumulad

a

11|13 12 7 26,92% 7 26,92%

13|15 14 13 50,00% 20 76,92%

15|17 16 6 23,08% 26 100,00%

Total 26 100,00% Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 18: Estatística básica

Estatística básica Medidas de Posição

n

x

n

xxxxxx

n

i

i

n

14321 ...

n

i

i

i

n

i

i

n

nn

p

px

pppp

pxpxpxpxx

1

1

321

332211

.

...

.......

• Mostram o valor representativo em torno do qual os dados tendem a agrupar-se com maior ou menor frequência.

• Média aritmética:

• Média aritmética ponderada:

pi : peso da amostra xi

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 19: Estatística básica

Estatística básica Medidas de Posição

• Exemplo: Os dados {11, 13, 15, 17, 19} apresenta a seguinte média (n=5, pois temos cinco números) : • Se um aluno obteve as notas {7, 10, 6, 8} com pesos {1, 2, 2, 3}, qual será a nota final do aluno:

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

155

1917151311

x

875,78

63

3221

3.82.62.101.7

x

Page 20: Estatística básica

Estatística básica Medidas de Posição

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

PROPRIEDADE

• A soma dos desvios é sempre igual a zero

•A soma dos quadrados dos desvios das observações de uma série é sempre um valor mínimo

Page 21: Estatística básica

Estatística básica Medidas de Posição

n

i

i

i

n

i

i

n

nn

n

nx

nnnn

nxnxnxnxx

1

1

321

332211

.

...

.......

n

i

inn1 n

nf i

i

i

n

i

inn fxfxfxfxfxx

1

332211 ........

• Média aritmética ponderada para dados agrupados em classes: • Sabendo que: • fi : Frequência de ocorrência da amostra xi

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 22: Estatística básica

Estatística básica Medidas de Posição

• Exemplo: Qual a média do número de operações fechadas por dia:

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 23: Estatística básica

Estatística básica Medidas de Posição

• A média pela frequência absoluta é: • A média pela frequência relativa é:

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

54,1326

352

1237652

1.172.163.157.146.135.122.11

x

x

54,13

%85,3.17%69,7.16%54,11.15%92,26.14

%08,23.13%23,19.12%69,7.11

x

x

Page 24: Estatística básica

Estatística básica Medidas de Posição

• Exemplo: Calcule a média da tabela abaixo:

•Observe que o resultado apresentou uma pequena diferença do anterior (2,8% maior que 13,54 ). A precisão dos dados na tabela em classes diminuiu pouco em relação aos dados originais.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

92,1326

362

6137

6.1613.147.12

x

Valor médio da

classe

Page 25: Estatística básica

Estatística básica Medidas de Posição

termon

x

o

2

1~

2

122~

termon

termon

x

oo

Se n é impar

Se n é par

• Mediana: É o valor do meio de um conjunto de dados, quando os dados estão dispostos em ordem crescente ou decrescente, ou seja, o Rol de Dados.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 26: Estatística básica

Estatística básica Medidas de Posição

Exemplo: Qual a mediana dos dados abaixo:

Dados brutos: {14, 12, 13, 11, 12, 13, 16, 14, 14, 15, 17, 14, 11, 13, 14, 15, 13, 12, 14, 13, 14, 13, 15, 16, 12, 12} Rol: {11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14,14, 15,15,15, 16,16, 17} n = 26 observações (par) A mediana dos dados é 13,5.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

5,132

1413

2

1413

2

12

26

2

26~

termotermo

termotermo

xoo

oo

Page 27: Estatística básica

Estatística básica Medidas de Posição

• Exemplo: Calcule a mediana dos dados abaixo:

• A mediana estará na faixa de 13 a 15, pois temos no total 26 observações e mediana encontra-se no meio (13º termo) (aqui não iremos calcular a média entre o 13º e o 14º - Verique !).

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

92,13720

713

1315

13

13

~13

~

x

x

Page 28: Estatística básica

Estatística básica Medidas de Posição

• Moda ou classe modal (mo): É o valor que representa a maior frequência em um conjunto de observações individuais. Em alguns casos, pode haver mais de uma moda.

X Xi ni

0| 3 1,5 7

3| 6 4,5 13

6| 9 7,5 6

9| 12 10,5 2

Classe modal

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 29: Estatística básica

Estatística básica Medidas de Posição

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Média

• Sensível a valores extremos de um conjunto de observações

• Usa todos os dados disponíveis

Mediana

• “Robusta” : Não sofre muito com a presença de alguns valores muito altos ou muito baixos

• Não usa todos os dados disponíveis

Moda

• Não é afetada por valores extremos

• Não usa todos os dados disponíveis

Page 30: Estatística básica

Estatística básica Medidas de Posição

• Percentil: De forma geral, o percentil de um conjunto de valores postos em ordem crescente é um valor que contém p% das observações abaixo dele. Os percentis de ordem 25, 50 e 75 são chamados de quartis. Os decis são os percentis de ordem 10, 20, ..., 90.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

x

p

1 n

1

1

0100

0

n

xp

1

1.100

n

xp

Page 31: Estatística básica

Estatística básica Medidas de Posição

• Calcular o percentil de ordem 50 (2º Quartil). Q50 = mediana (são 50 dados o Q50 está no 25º termo)

X ni Acum.

1,810| 1,822 7 7

1,822| 1,834 14 21

1,834| 1,846 18 39

1,846| 1,858 7 46

1,858| 1,870 4 50

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

2139

2125

834,1846,1

834,1~

x

18

4

012,0

834,1~

x

837,1~

x

Page 32: Estatística básica

As medidas de dispersão possuem a finalidade de verificar quanto os valores da série estão distantes da média da série. O principal meio de calcular a variabilidade é através da variância, que é calculada pela fórmula abaixo: Onde n é o número de observações, é a média e xi são os valores individuais. Esta fórmula é valida para população. Para amostra deve-se considerar n-1 ao invés de n.

Estatística básica Medidas de Dispersão ou Variabilidade

2

1

2

1

2

2 xn

x

n

xx

s

n

i

i

n

i

i

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

x

Page 33: Estatística básica

Estatística básica Medidas de Dispersão ou Variabilidade

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Exemplo: Os dados {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} apresentam qual média, variância e desvio padrão ? A sequência apresenta n=10 números. A média é igual a soma dos valores dividido pelo número de elementos. A variância e desvio padrão são calculados na sequência:

87,225,8

25,85,510

385

385109...21

2

221

2

2

2222

1

2

ss

xn

x

s

x

n

i

i

n

i

i

5,510

55x

Page 34: Estatística básica

Para calcular a variância quando os dados estiverem dispostos em classes deve-se utilizar a seguinte fórmula: k é o número de classes, ni é a frequência absoluta, n o número de observações e fi a frequência relativa;

•Quando extraímos a raiz quadrada da variância, obtemos o desvio padrão (s). • Uma observação importante é que a variância possui as unidades dos dados individuais elevado ao quadrado, enquanto que o desvio padrão e média possuem mesma unidade.

Estatística básica Medidas de Dispersão ou Variabilidade

k

i

ii

k

i

ii

fxxn

nxx

s1

21

2

2 .

.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Page 35: Estatística básica

Estatística básica Medidas de Dispersão ou Variabilidade

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Exemplo: Calcular a variância e desvio padrão dos dados abaixo:

X Freq.

Absoluta

1,810|1,822 7

1,822|1,834 14

1,834|1,846 18

1,846|1,858 7

1,858|1,870 4

Iremos realizar os cálculos na forma de tabela, porque os dados ficam mais organizados e os cálculos mais fáceis de serem entendidos.

n

nxx

s

k

i

ii

1

2

2

.

Verifique que as colunas serão organizadas de acordo com a fórmula para calcular a variância.

Page 36: Estatística básica

Estatística básica Medidas de Dispersão ou Variabilidade

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

x xi ni xi-xm (xi-xm)2 (xi-xm)2.ni

1,810|1,822 1,816 7 -0,0024 0,00058 0,0040

1,822|1,834 1,828 14 -0,012 0,00014 0,0020

1,834|1,846 1,840 18 0,000 0,00000 0,0000

1,846|1,858 1,852 7 0,012 0,00014 0,0010

1,858|1,870 1,864 4 0,024 0,00058 0,0023

Soma 9,200 Soma 0,00936

Média (xm) 1,840 s2 0,00187

%4,2%100.840,1

043,0%100.

043,0

00187,02

xsCV

s

s

Page 37: Estatística básica

Estatística básica Medidas de Dispersão ou Variabilidade

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Outra forma de expressar a dispersão dos dados é através do Coeficiente de Variação (CV), que é dado pela fórmula: onde s é o desvio padrão, e é a média. • O Coeficiente de Variação dá uma indicação de quanto os dados estão dispersos em torno da média. Quanto maior o valor de CV, maior a dispersão.

%100.x

sCV

x

Page 38: Estatística básica

Estatística básica Medidas de Dispersão ou Variabilidade

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Exemplo: No exemplo de cálculo de variância e desvio padrão, obtivemos os valores 8,25 e 2,87 respectivamente. A média tinha resultado em 5,5 O valor do Coeficiente de Variação será: Um valor de 52% indica que os dados estão muito dispersos com relação a média. Por exemplo, os dados {5,1; 5,2; 5,3; 5,4; 5,5; 5,6; 5,7; 5,8; 5,9; 6,0} apresentam média: 5,55; desvio-padrão: 0,29 e CV = 5% (Confira!)

%52%100.5,5

87,2%100.

x

sCV

Page 39: Estatística básica

Estatística básica

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Covariância: Mede a correlação (dependência) linear entre duas variáveis x e y. É calculada como: A covariância entre as mesmas variáveis, isto é, Cov(x, x) por exemplo, é igual a própria variância Var(x) = s2.

yxyx

n

yyxx

yxCov

n

i

ii

..

.

),( 1

Page 40: Estatística básica

Estatística básica

21 )(

.

),( sxVarn

xxxx

xxCov

n

i

ii

0),( yxCov

0),( yxCov

0),( yxCov

Variáveis independentes

Correlação linear positiva

Correlação linear negativa

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

• Os seguintes valores de covariância dão uma indicação se os valores são independentes, ou possuem correlação positiva ou negativa.

Page 41: Estatística básica

Estatística básica 0),( yxCov0),( yxCov 0),( yxCov

Variáveis independentes

Correlação linear positiva

Correlação linear negativa

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

• Na prática quando as variáveis são independentes o valor da covariância resulta em um valor próximo de 0 (entre -3 a 3), mas não sendo estes valores fixos e, portanto, é sempre recomendável considerar o gráfico das variáveis x e y para uma avaliação conjunta.

Page 42: Estatística básica

Estatística básica

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Exemplo: Calcular a covariância dos dados abaixo, e verifique se a correlação é positiva ou negativa.

X Y

10 21

15 15

18 12

12 18

9 20

Page 43: Estatística básica

Estatística básica

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]

Solução: Sempre esboce o gráfico das variáveis X e Y para confirmar!

X Y X.Y

10 21 210

15 15 225

18 12 216

12 18 216

9 20 180

Média 12,8 17,2 209,4

76,10

2,17.8,124,209

..),(

yxyxyxCov

A covariância resultou em um valor negativo, indicando uma correlação linear negativa que podemos confirmar pelo gráfico.