Estatística básica

Preview:

DESCRIPTION

Aula de matemática Estatística Básica

Citation preview

Estatística básica Estatística é a ciência dos dados, envolvendo o desenvolvimento de processos, métodos e técnicas de coleta, classificação, organização, resumo, análise e interpretação de dados sobre uma população, e os métodos de tirar conclusões ou fazer predições com base nesses dados.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica

Estatística

Descritiva

Organização e descrição

dos dados

Cálculo de médias, variâncias, estudo de gráficos, tabelas, etc.

Indutiva

(Inferencial)

Estimação de parâmetros, teste de

hipóteses, etc.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica • A estatística tem a capacidade de sintetizar os dados; • A amostragem é o ponto de partida (na prática) para todo um Estudo Estatístico. É através da amostragem que obtemos os dados da medição de determinada característica ou propriedade de um objeto, pessoa ou coisa;

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica • População: é a coleção de todas as observações potenciais sobre determinado fenômeno; •Amostra: é o conjunto de dados efetivamente observados, ou extraídos;

População

Amostras

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Cada observação individual ou item é denominada como unidade elementar, que pode estar composta por um ou mais itens medidos, propriedades, atributos, etc, denominados como variáveis.

Variável é uma característica, propriedade ou atributo de uma unidade da população, cujo valor pode variar entre as unidades da população.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Exemplo:

Nome Idade Cargo Sexo Peso Escolaridade

João 27 Supervisor M 62 kg 2º grau

Alex 38 Chefe M 78 kg 1º grau

Ana 32 Secretária F 58 kg 3º grau

Unidade elementar

Variáveis

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica •Tipos de variáveis

Variável

Qualitativa

Nominal

Ordinal

Quantitativa

Discreta

Contínua

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica • Exemplo: Para uma população de peças produzidos em um

processo, poderíamos ter:

Variável Tipo

Estado: Perfeita ou defeituosa Qualitativa Nominal

Qualidade: 1ª, 2ª ou 3ª categoria Qualitativa Ordinal

Número de peças defeituosas Quantitativa Discreta

Diâmetro das peças Quantitativa Contínua

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Agrupamento de dados e distribuição de frequências

• Quando vamos fazer um levantamento de uma população, um dos passos é retirar uma amostra dessa população e obter dados relativos à variável desejada nessa amostra; • Cabe à Estatística sintetizar tais dados na forma de tabela e gráficos que contenham, além dos valores das variáveis, o número de elementos correspondentes a cada variável;

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Agrupamento de dados e distribuição de frequências

• A esse procedimento está associado o conceito de: • Dados brutos: é o conjunto de dados numéricos obtidos que ainda não foram organizados; • Rol: é o arranjo dos dados brutos em ordem crescente (ou decrescente); • Amplitude (H): é a diferença entre o maior e o menor dos valores observados; •Frequência absoluta (ni): é o número de vezes que um elemento aparece na amostra;

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Agrupamento de dados e distribuição de frequências

• n : número total de dados da amostra • k : número de valores diferentes na amostra • Frequência relativa (fi): • Frequência absoluta acumulada (Ni): é a soma da frequência absoluta do valor da variável i com todas as frequências absolutas anteriores; • Frequência relativa acumulada (Fi):

n

nf i

i 11

k

i

if

nnk

i

i 1

n

NF i

i

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Agrupamento de dados e distribuição de frequências

• Exemplo: Os seguintes dados foram amostrados do números de negócios efetuados diariamente por um operador financeiro:

População: Número de negócios efetuados diariamente Dados brutos: {14, 12, 13, 11, 12, 13, 16, 14, 14, 15, 17, 14, 11, 13, 14, 15, 13, 12, 14, 13, 14, 13, 15, 16, 12, 12} Rol: {11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14,14, 15,15,15, 16,16, 17} Amplitude: 17 – 11 = 6 n = 26 observações

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Número de Operações

fechadas por dia

Freq. Absoluta

Freq. Relativa

Freq. Absoluta

Acumulada

Freq. Acumulada

11 2 7,69% 2 7,69%

12 5 19,23% 7 26,92%

13 6 23,08% 13 50,00%

14 7 26,92% 20 76,92%

15 3 11,54% 23 88,46%

16 2 7,69% 25 96,15%

17 1 3,85% 26 100,00%

Total 26 100,00%

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Classes • As classes são um artifício para condensar o número de elementos diferentes de uma amostra. Imagine construir uma tabela para 200 valores diferentes, nos moldes do problema anterior. • Os principais pré-requisitos para uma boa definição de classes em um conjunto de dados são: •a) as classes devem abranger todas as observações; •b) o extremo superior de uma classe é o extremo inferior da classe subsequente (simbologia: |, intervalo fechado à esquerda e aberto à direita); •c) cada valor absoluto deve enquadrar-se em apenas uma classe; •d) k 25, de modo geral, sendo k o número de classes; •e) As unidades das classes devem ser as mesmas dos dados.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Classes • Cálculo de k (Formas de calcular) :

(Fórmula de Sturges) Obs.: N é o número de elementos diferentes da amostra e, muitas vezes, pode ser considerado N = n (no. de observações). • Intervalo da classe (h): h H/k • Ponto médio da classe (xi) : Ponto médio entre o limite inferior e o limite superior de cada classe.

Nk 2log1

Nk

2ln

ln22

nknn kk

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica • Exemplo: Utilizando os dados do exemplo anterior, temos:

32ln

ln

47log1

37

2

Nk

k

k

23

6

6

h

H

Faixa de negócios

Xi

Freq. Absoluta

Freq. Relativa

Freq. Absoluta Acumulada

Freq. Acumulad

a

11|13 12 7 26,92% 7 26,92%

13|15 14 13 50,00% 20 76,92%

15|17 16 6 23,08% 26 100,00%

Total 26 100,00% Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Medidas de Posição

n

x

n

xxxxxx

n

i

i

n

14321 ...

n

i

i

i

n

i

i

n

nn

p

px

pppp

pxpxpxpxx

1

1

321

332211

.

...

.......

• Mostram o valor representativo em torno do qual os dados tendem a agrupar-se com maior ou menor frequência.

• Média aritmética:

• Média aritmética ponderada:

pi : peso da amostra xi

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Medidas de Posição

• Exemplo: Os dados {11, 13, 15, 17, 19} apresenta a seguinte média (n=5, pois temos cinco números) : • Se um aluno obteve as notas {7, 10, 6, 8} com pesos {1, 2, 2, 3}, qual será a nota final do aluno:

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

155

1917151311

x

875,78

63

3221

3.82.62.101.7

x

Estatística básica Medidas de Posição

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

PROPRIEDADE

• A soma dos desvios é sempre igual a zero

•A soma dos quadrados dos desvios das observações de uma série é sempre um valor mínimo

Estatística básica Medidas de Posição

n

i

i

i

n

i

i

n

nn

n

nx

nnnn

nxnxnxnxx

1

1

321

332211

.

...

.......

n

i

inn1 n

nf i

i

i

n

i

inn fxfxfxfxfxx

1

332211 ........

• Média aritmética ponderada para dados agrupados em classes: • Sabendo que: • fi : Frequência de ocorrência da amostra xi

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Medidas de Posição

• Exemplo: Qual a média do número de operações fechadas por dia:

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Medidas de Posição

• A média pela frequência absoluta é: • A média pela frequência relativa é:

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

54,1326

352

1237652

1.172.163.157.146.135.122.11

x

x

54,13

%85,3.17%69,7.16%54,11.15%92,26.14

%08,23.13%23,19.12%69,7.11

x

x

Estatística básica Medidas de Posição

• Exemplo: Calcule a média da tabela abaixo:

•Observe que o resultado apresentou uma pequena diferença do anterior (2,8% maior que 13,54 ). A precisão dos dados na tabela em classes diminuiu pouco em relação aos dados originais.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

92,1326

362

6137

6.1613.147.12

x

Valor médio da

classe

Estatística básica Medidas de Posição

termon

x

o

2

1~

2

122~

termon

termon

x

oo

Se n é impar

Se n é par

• Mediana: É o valor do meio de um conjunto de dados, quando os dados estão dispostos em ordem crescente ou decrescente, ou seja, o Rol de Dados.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Medidas de Posição

Exemplo: Qual a mediana dos dados abaixo:

Dados brutos: {14, 12, 13, 11, 12, 13, 16, 14, 14, 15, 17, 14, 11, 13, 14, 15, 13, 12, 14, 13, 14, 13, 15, 16, 12, 12} Rol: {11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14,14, 15,15,15, 16,16, 17} n = 26 observações (par) A mediana dos dados é 13,5.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

5,132

1413

2

1413

2

12

26

2

26~

termotermo

termotermo

xoo

oo

Estatística básica Medidas de Posição

• Exemplo: Calcule a mediana dos dados abaixo:

• A mediana estará na faixa de 13 a 15, pois temos no total 26 observações e mediana encontra-se no meio (13º termo) (aqui não iremos calcular a média entre o 13º e o 14º - Verique !).

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

92,13720

713

1315

13

13

~13

~

x

x

Estatística básica Medidas de Posição

• Moda ou classe modal (mo): É o valor que representa a maior frequência em um conjunto de observações individuais. Em alguns casos, pode haver mais de uma moda.

X Xi ni

0| 3 1,5 7

3| 6 4,5 13

6| 9 7,5 6

9| 12 10,5 2

Classe modal

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Medidas de Posição

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Média

• Sensível a valores extremos de um conjunto de observações

• Usa todos os dados disponíveis

Mediana

• “Robusta” : Não sofre muito com a presença de alguns valores muito altos ou muito baixos

• Não usa todos os dados disponíveis

Moda

• Não é afetada por valores extremos

• Não usa todos os dados disponíveis

Estatística básica Medidas de Posição

• Percentil: De forma geral, o percentil de um conjunto de valores postos em ordem crescente é um valor que contém p% das observações abaixo dele. Os percentis de ordem 25, 50 e 75 são chamados de quartis. Os decis são os percentis de ordem 10, 20, ..., 90.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

x

p

1 n

1

1

0100

0

n

xp

1

1.100

n

xp

Estatística básica Medidas de Posição

• Calcular o percentil de ordem 50 (2º Quartil). Q50 = mediana (são 50 dados o Q50 está no 25º termo)

X ni Acum.

1,810| 1,822 7 7

1,822| 1,834 14 21

1,834| 1,846 18 39

1,846| 1,858 7 46

1,858| 1,870 4 50

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

2139

2125

834,1846,1

834,1~

x

18

4

012,0

834,1~

x

837,1~

x

As medidas de dispersão possuem a finalidade de verificar quanto os valores da série estão distantes da média da série. O principal meio de calcular a variabilidade é através da variância, que é calculada pela fórmula abaixo: Onde n é o número de observações, é a média e xi são os valores individuais. Esta fórmula é valida para população. Para amostra deve-se considerar n-1 ao invés de n.

Estatística básica Medidas de Dispersão ou Variabilidade

2

1

2

1

2

2 xn

x

n

xx

s

n

i

i

n

i

i

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

x

Estatística básica Medidas de Dispersão ou Variabilidade

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Exemplo: Os dados {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} apresentam qual média, variância e desvio padrão ? A sequência apresenta n=10 números. A média é igual a soma dos valores dividido pelo número de elementos. A variância e desvio padrão são calculados na sequência:

87,225,8

25,85,510

385

385109...21

2

221

2

2

2222

1

2

ss

xn

x

s

x

n

i

i

n

i

i

5,510

55x

Para calcular a variância quando os dados estiverem dispostos em classes deve-se utilizar a seguinte fórmula: k é o número de classes, ni é a frequência absoluta, n o número de observações e fi a frequência relativa;

•Quando extraímos a raiz quadrada da variância, obtemos o desvio padrão (s). • Uma observação importante é que a variância possui as unidades dos dados individuais elevado ao quadrado, enquanto que o desvio padrão e média possuem mesma unidade.

Estatística básica Medidas de Dispersão ou Variabilidade

k

i

ii

k

i

ii

fxxn

nxx

s1

21

2

2 .

.

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Estatística básica Medidas de Dispersão ou Variabilidade

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Exemplo: Calcular a variância e desvio padrão dos dados abaixo:

X Freq.

Absoluta

1,810|1,822 7

1,822|1,834 14

1,834|1,846 18

1,846|1,858 7

1,858|1,870 4

Iremos realizar os cálculos na forma de tabela, porque os dados ficam mais organizados e os cálculos mais fáceis de serem entendidos.

n

nxx

s

k

i

ii

1

2

2

.

Verifique que as colunas serão organizadas de acordo com a fórmula para calcular a variância.

Estatística básica Medidas de Dispersão ou Variabilidade

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

x xi ni xi-xm (xi-xm)2 (xi-xm)2.ni

1,810|1,822 1,816 7 -0,0024 0,00058 0,0040

1,822|1,834 1,828 14 -0,012 0,00014 0,0020

1,834|1,846 1,840 18 0,000 0,00000 0,0000

1,846|1,858 1,852 7 0,012 0,00014 0,0010

1,858|1,870 1,864 4 0,024 0,00058 0,0023

Soma 9,200 Soma 0,00936

Média (xm) 1,840 s2 0,00187

%4,2%100.840,1

043,0%100.

043,0

00187,02

xsCV

s

s

Estatística básica Medidas de Dispersão ou Variabilidade

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Outra forma de expressar a dispersão dos dados é através do Coeficiente de Variação (CV), que é dado pela fórmula: onde s é o desvio padrão, e é a média. • O Coeficiente de Variação dá uma indicação de quanto os dados estão dispersos em torno da média. Quanto maior o valor de CV, maior a dispersão.

%100.x

sCV

x

Estatística básica Medidas de Dispersão ou Variabilidade

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Exemplo: No exemplo de cálculo de variância e desvio padrão, obtivemos os valores 8,25 e 2,87 respectivamente. A média tinha resultado em 5,5 O valor do Coeficiente de Variação será: Um valor de 52% indica que os dados estão muito dispersos com relação a média. Por exemplo, os dados {5,1; 5,2; 5,3; 5,4; 5,5; 5,6; 5,7; 5,8; 5,9; 6,0} apresentam média: 5,55; desvio-padrão: 0,29 e CV = 5% (Confira!)

%52%100.5,5

87,2%100.

x

sCV

Estatística básica

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Covariância: Mede a correlação (dependência) linear entre duas variáveis x e y. É calculada como: A covariância entre as mesmas variáveis, isto é, Cov(x, x) por exemplo, é igual a própria variância Var(x) = s2.

yxyx

n

yyxx

yxCov

n

i

ii

..

.

),( 1

Estatística básica

21 )(

.

),( sxVarn

xxxx

xxCov

n

i

ii

0),( yxCov

0),( yxCov

0),( yxCov

Variáveis independentes

Correlação linear positiva

Correlação linear negativa

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

• Os seguintes valores de covariância dão uma indicação se os valores são independentes, ou possuem correlação positiva ou negativa.

Estatística básica 0),( yxCov0),( yxCov 0),( yxCov

Variáveis independentes

Correlação linear positiva

Correlação linear negativa

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

• Na prática quando as variáveis são independentes o valor da covariância resulta em um valor próximo de 0 (entre -3 a 3), mas não sendo estes valores fixos e, portanto, é sempre recomendável considerar o gráfico das variáveis x e y para uma avaliação conjunta.

Estatística básica

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Exemplo: Calcular a covariância dos dados abaixo, e verifique se a correlação é positiva ou negativa.

X Y

10 21

15 15

18 12

12 18

9 20

Estatística básica

Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 horacimar@gmail.com

Solução: Sempre esboce o gráfico das variáveis X e Y para confirmar!

X Y X.Y

10 21 210

15 15 225

18 12 216

12 18 216

9 20 180

Média 12,8 17,2 209,4

76,10

2,17.8,124,209

..),(

yxyxyxCov

A covariância resultou em um valor negativo, indicando uma correlação linear negativa que podemos confirmar pelo gráfico.