Upload
horacimar-cotrim
View
741
Download
3
Embed Size (px)
DESCRIPTION
Aula de matemática Estatística Básica
Citation preview
Estatística básica Estatística é a ciência dos dados, envolvendo o desenvolvimento de processos, métodos e técnicas de coleta, classificação, organização, resumo, análise e interpretação de dados sobre uma população, e os métodos de tirar conclusões ou fazer predições com base nesses dados.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica
Estatística
Descritiva
Organização e descrição
dos dados
Cálculo de médias, variâncias, estudo de gráficos, tabelas, etc.
Indutiva
(Inferencial)
Estimação de parâmetros, teste de
hipóteses, etc.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica • A estatística tem a capacidade de sintetizar os dados; • A amostragem é o ponto de partida (na prática) para todo um Estudo Estatístico. É através da amostragem que obtemos os dados da medição de determinada característica ou propriedade de um objeto, pessoa ou coisa;
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica • População: é a coleção de todas as observações potenciais sobre determinado fenômeno; •Amostra: é o conjunto de dados efetivamente observados, ou extraídos;
População
Amostras
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Cada observação individual ou item é denominada como unidade elementar, que pode estar composta por um ou mais itens medidos, propriedades, atributos, etc, denominados como variáveis.
Variável é uma característica, propriedade ou atributo de uma unidade da população, cujo valor pode variar entre as unidades da população.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Exemplo:
Nome Idade Cargo Sexo Peso Escolaridade
João 27 Supervisor M 62 kg 2º grau
Alex 38 Chefe M 78 kg 1º grau
Ana 32 Secretária F 58 kg 3º grau
Unidade elementar
Variáveis
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica •Tipos de variáveis
Variável
Qualitativa
Nominal
Ordinal
Quantitativa
Discreta
Contínua
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica • Exemplo: Para uma população de peças produzidos em um
processo, poderíamos ter:
Variável Tipo
Estado: Perfeita ou defeituosa Qualitativa Nominal
Qualidade: 1ª, 2ª ou 3ª categoria Qualitativa Ordinal
Número de peças defeituosas Quantitativa Discreta
Diâmetro das peças Quantitativa Contínua
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Agrupamento de dados e distribuição de frequências
• Quando vamos fazer um levantamento de uma população, um dos passos é retirar uma amostra dessa população e obter dados relativos à variável desejada nessa amostra; • Cabe à Estatística sintetizar tais dados na forma de tabela e gráficos que contenham, além dos valores das variáveis, o número de elementos correspondentes a cada variável;
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Agrupamento de dados e distribuição de frequências
• A esse procedimento está associado o conceito de: • Dados brutos: é o conjunto de dados numéricos obtidos que ainda não foram organizados; • Rol: é o arranjo dos dados brutos em ordem crescente (ou decrescente); • Amplitude (H): é a diferença entre o maior e o menor dos valores observados; •Frequência absoluta (ni): é o número de vezes que um elemento aparece na amostra;
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Agrupamento de dados e distribuição de frequências
• n : número total de dados da amostra • k : número de valores diferentes na amostra • Frequência relativa (fi): • Frequência absoluta acumulada (Ni): é a soma da frequência absoluta do valor da variável i com todas as frequências absolutas anteriores; • Frequência relativa acumulada (Fi):
n
nf i
i 11
k
i
if
nnk
i
i 1
n
NF i
i
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Agrupamento de dados e distribuição de frequências
• Exemplo: Os seguintes dados foram amostrados do números de negócios efetuados diariamente por um operador financeiro:
População: Número de negócios efetuados diariamente Dados brutos: {14, 12, 13, 11, 12, 13, 16, 14, 14, 15, 17, 14, 11, 13, 14, 15, 13, 12, 14, 13, 14, 13, 15, 16, 12, 12} Rol: {11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14,14, 15,15,15, 16,16, 17} Amplitude: 17 – 11 = 6 n = 26 observações
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Número de Operações
fechadas por dia
Freq. Absoluta
Freq. Relativa
Freq. Absoluta
Acumulada
Freq. Acumulada
11 2 7,69% 2 7,69%
12 5 19,23% 7 26,92%
13 6 23,08% 13 50,00%
14 7 26,92% 20 76,92%
15 3 11,54% 23 88,46%
16 2 7,69% 25 96,15%
17 1 3,85% 26 100,00%
Total 26 100,00%
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Classes • As classes são um artifício para condensar o número de elementos diferentes de uma amostra. Imagine construir uma tabela para 200 valores diferentes, nos moldes do problema anterior. • Os principais pré-requisitos para uma boa definição de classes em um conjunto de dados são: •a) as classes devem abranger todas as observações; •b) o extremo superior de uma classe é o extremo inferior da classe subsequente (simbologia: |, intervalo fechado à esquerda e aberto à direita); •c) cada valor absoluto deve enquadrar-se em apenas uma classe; •d) k 25, de modo geral, sendo k o número de classes; •e) As unidades das classes devem ser as mesmas dos dados.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Classes • Cálculo de k (Formas de calcular) :
(Fórmula de Sturges) Obs.: N é o número de elementos diferentes da amostra e, muitas vezes, pode ser considerado N = n (no. de observações). • Intervalo da classe (h): h H/k • Ponto médio da classe (xi) : Ponto médio entre o limite inferior e o limite superior de cada classe.
Nk 2log1
Nk
2ln
ln22
nknn kk
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica • Exemplo: Utilizando os dados do exemplo anterior, temos:
32ln
ln
47log1
37
2
Nk
k
k
23
6
6
h
H
Faixa de negócios
Xi
Freq. Absoluta
Freq. Relativa
Freq. Absoluta Acumulada
Freq. Acumulad
a
11|13 12 7 26,92% 7 26,92%
13|15 14 13 50,00% 20 76,92%
15|17 16 6 23,08% 26 100,00%
Total 26 100,00% Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Medidas de Posição
n
x
n
xxxxxx
n
i
i
n
14321 ...
n
i
i
i
n
i
i
n
nn
p
px
pppp
pxpxpxpxx
1
1
321
332211
.
...
.......
• Mostram o valor representativo em torno do qual os dados tendem a agrupar-se com maior ou menor frequência.
• Média aritmética:
• Média aritmética ponderada:
pi : peso da amostra xi
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Medidas de Posição
• Exemplo: Os dados {11, 13, 15, 17, 19} apresenta a seguinte média (n=5, pois temos cinco números) : • Se um aluno obteve as notas {7, 10, 6, 8} com pesos {1, 2, 2, 3}, qual será a nota final do aluno:
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
155
1917151311
x
875,78
63
3221
3.82.62.101.7
x
Estatística básica Medidas de Posição
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
PROPRIEDADE
• A soma dos desvios é sempre igual a zero
•A soma dos quadrados dos desvios das observações de uma série é sempre um valor mínimo
Estatística básica Medidas de Posição
n
i
i
i
n
i
i
n
nn
n
nx
nnnn
nxnxnxnxx
1
1
321
332211
.
...
.......
n
i
inn1 n
nf i
i
i
n
i
inn fxfxfxfxfxx
1
332211 ........
• Média aritmética ponderada para dados agrupados em classes: • Sabendo que: • fi : Frequência de ocorrência da amostra xi
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Medidas de Posição
• Exemplo: Qual a média do número de operações fechadas por dia:
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Medidas de Posição
• A média pela frequência absoluta é: • A média pela frequência relativa é:
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
54,1326
352
1237652
1.172.163.157.146.135.122.11
x
x
54,13
%85,3.17%69,7.16%54,11.15%92,26.14
%08,23.13%23,19.12%69,7.11
x
x
Estatística básica Medidas de Posição
• Exemplo: Calcule a média da tabela abaixo:
•Observe que o resultado apresentou uma pequena diferença do anterior (2,8% maior que 13,54 ). A precisão dos dados na tabela em classes diminuiu pouco em relação aos dados originais.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
92,1326
362
6137
6.1613.147.12
x
Valor médio da
classe
Estatística básica Medidas de Posição
termon
x
o
2
1~
2
122~
termon
termon
x
oo
Se n é impar
Se n é par
• Mediana: É o valor do meio de um conjunto de dados, quando os dados estão dispostos em ordem crescente ou decrescente, ou seja, o Rol de Dados.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Medidas de Posição
Exemplo: Qual a mediana dos dados abaixo:
Dados brutos: {14, 12, 13, 11, 12, 13, 16, 14, 14, 15, 17, 14, 11, 13, 14, 15, 13, 12, 14, 13, 14, 13, 15, 16, 12, 12} Rol: {11, 11, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14,14, 15,15,15, 16,16, 17} n = 26 observações (par) A mediana dos dados é 13,5.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
5,132
1413
2
1413
2
12
26
2
26~
termotermo
termotermo
xoo
oo
Estatística básica Medidas de Posição
• Exemplo: Calcule a mediana dos dados abaixo:
• A mediana estará na faixa de 13 a 15, pois temos no total 26 observações e mediana encontra-se no meio (13º termo) (aqui não iremos calcular a média entre o 13º e o 14º - Verique !).
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
92,13720
713
1315
13
13
~13
~
x
x
Estatística básica Medidas de Posição
• Moda ou classe modal (mo): É o valor que representa a maior frequência em um conjunto de observações individuais. Em alguns casos, pode haver mais de uma moda.
X Xi ni
0| 3 1,5 7
3| 6 4,5 13
6| 9 7,5 6
9| 12 10,5 2
Classe modal
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Medidas de Posição
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Média
• Sensível a valores extremos de um conjunto de observações
• Usa todos os dados disponíveis
Mediana
• “Robusta” : Não sofre muito com a presença de alguns valores muito altos ou muito baixos
• Não usa todos os dados disponíveis
Moda
• Não é afetada por valores extremos
• Não usa todos os dados disponíveis
Estatística básica Medidas de Posição
• Percentil: De forma geral, o percentil de um conjunto de valores postos em ordem crescente é um valor que contém p% das observações abaixo dele. Os percentis de ordem 25, 50 e 75 são chamados de quartis. Os decis são os percentis de ordem 10, 20, ..., 90.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
x
p
1 n
1
1
0100
0
n
xp
1
1.100
n
xp
Estatística básica Medidas de Posição
• Calcular o percentil de ordem 50 (2º Quartil). Q50 = mediana (são 50 dados o Q50 está no 25º termo)
X ni Acum.
1,810| 1,822 7 7
1,822| 1,834 14 21
1,834| 1,846 18 39
1,846| 1,858 7 46
1,858| 1,870 4 50
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
2139
2125
834,1846,1
834,1~
x
18
4
012,0
834,1~
x
837,1~
x
As medidas de dispersão possuem a finalidade de verificar quanto os valores da série estão distantes da média da série. O principal meio de calcular a variabilidade é através da variância, que é calculada pela fórmula abaixo: Onde n é o número de observações, é a média e xi são os valores individuais. Esta fórmula é valida para população. Para amostra deve-se considerar n-1 ao invés de n.
Estatística básica Medidas de Dispersão ou Variabilidade
2
1
2
1
2
2 xn
x
n
xx
s
n
i
i
n
i
i
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
x
Estatística básica Medidas de Dispersão ou Variabilidade
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Exemplo: Os dados {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} apresentam qual média, variância e desvio padrão ? A sequência apresenta n=10 números. A média é igual a soma dos valores dividido pelo número de elementos. A variância e desvio padrão são calculados na sequência:
87,225,8
25,85,510
385
385109...21
2
221
2
2
2222
1
2
ss
xn
x
s
x
n
i
i
n
i
i
5,510
55x
Para calcular a variância quando os dados estiverem dispostos em classes deve-se utilizar a seguinte fórmula: k é o número de classes, ni é a frequência absoluta, n o número de observações e fi a frequência relativa;
•Quando extraímos a raiz quadrada da variância, obtemos o desvio padrão (s). • Uma observação importante é que a variância possui as unidades dos dados individuais elevado ao quadrado, enquanto que o desvio padrão e média possuem mesma unidade.
Estatística básica Medidas de Dispersão ou Variabilidade
k
i
ii
k
i
ii
fxxn
nxx
s1
21
2
2 .
.
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Estatística básica Medidas de Dispersão ou Variabilidade
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Exemplo: Calcular a variância e desvio padrão dos dados abaixo:
X Freq.
Absoluta
1,810|1,822 7
1,822|1,834 14
1,834|1,846 18
1,846|1,858 7
1,858|1,870 4
Iremos realizar os cálculos na forma de tabela, porque os dados ficam mais organizados e os cálculos mais fáceis de serem entendidos.
n
nxx
s
k
i
ii
1
2
2
.
Verifique que as colunas serão organizadas de acordo com a fórmula para calcular a variância.
Estatística básica Medidas de Dispersão ou Variabilidade
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
x xi ni xi-xm (xi-xm)2 (xi-xm)2.ni
1,810|1,822 1,816 7 -0,0024 0,00058 0,0040
1,822|1,834 1,828 14 -0,012 0,00014 0,0020
1,834|1,846 1,840 18 0,000 0,00000 0,0000
1,846|1,858 1,852 7 0,012 0,00014 0,0010
1,858|1,870 1,864 4 0,024 0,00058 0,0023
Soma 9,200 Soma 0,00936
Média (xm) 1,840 s2 0,00187
%4,2%100.840,1
043,0%100.
043,0
00187,02
xsCV
s
s
Estatística básica Medidas de Dispersão ou Variabilidade
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Outra forma de expressar a dispersão dos dados é através do Coeficiente de Variação (CV), que é dado pela fórmula: onde s é o desvio padrão, e é a média. • O Coeficiente de Variação dá uma indicação de quanto os dados estão dispersos em torno da média. Quanto maior o valor de CV, maior a dispersão.
%100.x
sCV
x
Estatística básica Medidas de Dispersão ou Variabilidade
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Exemplo: No exemplo de cálculo de variância e desvio padrão, obtivemos os valores 8,25 e 2,87 respectivamente. A média tinha resultado em 5,5 O valor do Coeficiente de Variação será: Um valor de 52% indica que os dados estão muito dispersos com relação a média. Por exemplo, os dados {5,1; 5,2; 5,3; 5,4; 5,5; 5,6; 5,7; 5,8; 5,9; 6,0} apresentam média: 5,55; desvio-padrão: 0,29 e CV = 5% (Confira!)
%52%100.5,5
87,2%100.
x
sCV
Estatística básica
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Covariância: Mede a correlação (dependência) linear entre duas variáveis x e y. É calculada como: A covariância entre as mesmas variáveis, isto é, Cov(x, x) por exemplo, é igual a própria variância Var(x) = s2.
yxyx
n
yyxx
yxCov
n
i
ii
..
.
),( 1
Estatística básica
21 )(
.
),( sxVarn
xxxx
xxCov
n
i
ii
0),( yxCov
0),( yxCov
0),( yxCov
Variáveis independentes
Correlação linear positiva
Correlação linear negativa
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
• Os seguintes valores de covariância dão uma indicação se os valores são independentes, ou possuem correlação positiva ou negativa.
Estatística básica 0),( yxCov0),( yxCov 0),( yxCov
Variáveis independentes
Correlação linear positiva
Correlação linear negativa
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
• Na prática quando as variáveis são independentes o valor da covariância resulta em um valor próximo de 0 (entre -3 a 3), mas não sendo estes valores fixos e, portanto, é sempre recomendável considerar o gráfico das variáveis x e y para uma avaliação conjunta.
Estatística básica
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Exemplo: Calcular a covariância dos dados abaixo, e verifique se a correlação é positiva ou negativa.
X Y
10 21
15 15
18 12
12 18
9 20
Estatística básica
Aulas de Matemática / Física / Química – Contato: Horacimar (21) 9-8126-2831 [email protected]
Solução: Sempre esboce o gráfico das variáveis X e Y para confirmar!
X Y X.Y
10 21 210
15 15 225
18 12 216
12 18 216
9 20 180
Média 12,8 17,2 209,4
76,10
2,17.8,124,209
..),(
yxyxyxCov
A covariância resultou em um valor negativo, indicando uma correlação linear negativa que podemos confirmar pelo gráfico.