37
Estatística 4º Período ADS Prof. Aristóteles Meneses Lima

Estatística parte2

Embed Size (px)

Citation preview

Page 1: Estatística parte2

Estatística

4º Período ADS

Prof. Aristóteles Meneses Lima

Page 2: Estatística parte2

Frequência e Histogramas

• Imagine que você estava lendo uma revista para descobrir o melhor lugar para se comer algo;

• Imagine que você goste de Lámen, com isso, você faz uma tabela de preços.

• Como será essa tabela?

Page 3: Estatística parte2

PREÇOS DE LÁMEN NOS 50 MELHORES RESTAURANTES

RESTAURANTE PREÇO RESTAURANTE PREÇO

1 700 26 780

2 850 27 590

3 600 28 650

4 650 29 580

5 980 30 750

6 750 31 800

7 500 32 550

8 890 33 750

9 880 34 700

10 700 35 600

11 890 36 800

12 720 37 800

13 680 38 880

14 650 39 790

15 790 40 790

16 670 41 780

17 680 42 600

18 900 43 670

19 880 44 680

20 720 45 650

21 850 46 890

22 700 47 930

23 780 48 650

24 850 49 777

25 750 50 700

Page 4: Estatística parte2

Como podemos tornar essa tabela mais significativa?

• Transformá-la em um gráfico; • Para fazer um gráfico primeiro temos que dividir os

preços em grupos. • Vamos supor que....• Há um shopping center gigante composto de 50

restaurantes de Lámen...e somente restaurantes de Lámen!

• Cada restaurante serve apenas um tipo de Lámen, e os restaurante são distribuídos em diferentes pisos de acordo com o preço do Lámen.

• Essa divisão de grupos é chamada de classe em Estatística.

Page 5: Estatística parte2

Piso (Classe)Igual ou Maior que/Menor que

5P900-1000

5 18 47

4P800-900

37 38 462 8 9 11 19 21 24 31 36

3P700-800

26 30 33 34 39 40 41 49 50 1 6 10 12 15 20 22 23 25

4P600-700

43 44 45 483 4 13 14 16 17 28 35 42

1P500-600

7 27 29 32

Page 6: Estatística parte2

GUIA DE PISOS

PISO NOME DO RESTAURANTE MÉDIA DA CLASSE

>= <

5P900-1000

XXX 950

4P800-900

XXXXXXXXXXXX

850

3P700-800

XXXXXXXXXXXXXXXXXX

750

2P600-700

XXXXXXXXXXXXX

650

1P500-600

XXXX 550

• EM CADA PISO, UMA PLACA INDICA O PREÇO CENTRAL DE CADA CLASSE.

• O SEGUNDO PISO É A CLASSE DO INTERVALO ENTRE 600 E 700, ONDE SE TEM UMA LOJA COM UMA PLACA DE 650.

• ISSO RECEBE O NOME PONTO MÉDIO DA CLASSE.

Page 7: Estatística parte2

• Uma vez que este shopping center distribui cada loja em um piso diferente de acordo com o preço, o número de lojas em cada piso varia.

• O número de restaurantes em cada piso recebe o nome de frequência.

• Agora, tente calcular a frequência relativa de restaurantes no terceiro piso.

• Frequência Relativa é parecido com porcentagem, é a proporção em relação ao total, quando o total é considerado como 1.

Page 8: Estatística parte2
Page 9: Estatística parte2

TABELA DE FREQUÊNCIA DOS 50 MELHORES RESTAURANTES DE LÁMEN

CLASSE MÉDIA DA CLASSE FREQUÊNCIA FREQUÊNCIARELATIVA

500-600 550 4 0,08

600-700 650 13 0,26

700-800 750 18 0,36

800-900 850 12 0,24

900-1000 950 3 0,06

SOMA 50 1,00

Page 10: Estatística parte2

• Agora se descrevermos tudo isso usando um gráfico de barras chamado HISTOGRAMA...

0

5

10

15

20

550 650 750 850 950

HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA)

HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA)

Page 11: Estatística parte2

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

550 650 750 850 950

HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA RELATIVA)

HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA RELATIVA)

Page 12: Estatística parte2
Page 13: Estatística parte2
Page 14: Estatística parte2
Page 15: Estatística parte2
Page 16: Estatística parte2
Page 17: Estatística parte2

Média (Valor Médio)

• Observe a tabela:

• Você sabe o que é Valor Médio?

RESULTADO DO TORNEIO DE BOLICHE

EQUIPE A EQUIPE B EQUIPE C

Jogadora Pontuação Jogadora Pontuação Jogadora Pontuação

LUY-LUY 86 KIMIKO 84 SHINOBU 229

JUN 73 MEGUME 71 YUKA 77

YUMI 124 YOSHIMI 103 SAKURA 59

SHIZUKA 111 MEI 85 KANAKO 95

TOUKO 90 KAORI 90 KUMIKO 70

KAEDE 38 YUKIKO 89 HIRONO 88

Page 18: Estatística parte2
Page 19: Estatística parte2

• O Valor Médio é chamado de Média em Estatística. E a média em questão agora é o que chamamos de MÉDIA ARITMÉTICA, para ser exato.

• Há outros tipos de Média, como MÉDIA GEOMÉTRICA e MÉDIA HARMÔNICA, você não precisa aprender as fórmulas agora, mas sugiro que se lembre desses nomes.

Page 20: Estatística parte2

Mediana

RESULTADO DO TORNEIO DE BOLICHE

EQUIPE A EQUIPE B EQUIPE C

Jogadora Pontuação Jogadora Pontuação Jogadora Pontuação

LUY-LUY 86 KIMIKO 84 SHINOBU 229

JUN 73 MEGUME 71 YUKA 77

YUMI 124 YOSHIMI 103 SAKURA 59

SHIZUKA 111 MEI 85 KANAKO 95

TOUKO 90 KAORI 90 KUMIKO 70

KAEDE 38 YUKIKO 89 HIRONO 88

• VAMOS DEIXAR DE LADO AS EQUIPES A E B E PRESTAR ATENÇÃO À EQUIPE C.

Page 21: Estatística parte2

• A Mediana é o valos central quando se coloca os valores em ordem do menor ao maior.

• Primeiro organizamos as pontuações de cada equipe.

Equipe A

38 73 86 90 111 124

Equipe B

71 84 85 89 90 103

Equipe C

59 70 77 88 95 229

Page 22: Estatística parte2

Dedução

• Número de Valores = Ímpar

• Número de Valores=Par

-1041,6 -39,0 -5,7 60,4 77,3

MEDIANA

-0,4 35,2 37,8 42,2 46,1 910,3

A MEDIANA É O VALOR MÉDIO DESSES DOIS VALORES

Page 23: Estatística parte2

Com isso....

Page 24: Estatística parte2

Imagine

• Então, você já deve se perguntar porque a “Poupança Média” anunciada nos jornais e na tv é tão alta.

• A média é alta por causa de alguns milionários.

• Nesses casos, a Mediana está bem mais próxima das pessoas comuns.

Page 25: Estatística parte2

Desvio-Padrão

• Equipes A e B

• Desenhe uma reta numérica e escreva os nomes dos jogadores de acordo com suas pontuações.

EQUIPE A

0 50 100

MÉDIA

KAEDE JUN TOUKO SHIZUKA

YUMI

LUY-LUY

Page 26: Estatística parte2

EQUIPE B

0 50 100

MEGUMI

YUKIKO

MEI

KIMIKO

YOSHIMI

KAORI

MÉDIA

Page 27: Estatística parte2

• Apesar de a pontuação média de cada equipe ser de 87....

• As tendências descritas pelas linhas numéricas são bem diferentes.

• O Desvio-Padrão é usado para descrever essa dispersão dos dados.

• Em resumo, Desvio-Padrão é um indicador que mostra a diferença da média de cada valor nesse conjunto.

Page 28: Estatística parte2

• O desvio-padrão mínimo é o zero, e na medida que a “dispersão dos dados” aumenta, o mesmo ocorre com o desvio-padrão.

0 (mínimo)

Sem dispersão

(todos os valores dispersos

são iguais)

Page 29: Estatística parte2

Agora responda...

Page 30: Estatística parte2

Calculando...

Page 31: Estatística parte2
Page 32: Estatística parte2

De uma maneira geral...

• A primeira fórmula é aplicada quando se calcula o Desvio-padrão de uma população inteira.

• A segunda fórmula é usada quando se calcula o Desvio-padrão de uma amostra.

Page 33: Estatística parte2

Recapitulando....

• Se você acha que algo não ficou claro em “Tabelas de distribuição de frequência e histogramas”. Vamos rever uma tabela apresentada.

TABELA DE FREQUÊNCIA DOS 50 MELHORES RESTAURANTES DE LÁMEN

CLASSE MÉDIA DA CLASSE FREQUÊNCIA FREQUÊNCIARELATIVA

500-600 550 4 0,08

600-700 650 13 0,26

700-800 750 18 0,36

800-900 850 12 0,24

900-1000 950 3 0,06

SOMA 50 1,00

Page 34: Estatística parte2

• Como você pode ver, o intervalo de classe nessa tabela é 100.

• O intervalo não foi determinado de acordo com nenhum tipo padrão matemático – foi definido de forma subjetiva. Determinar o intervalo de classe cabe a quem está analisando os dados.

• Há um jeito de definir o intervalo de classe matematicamente.

• Usa-se a Regra de Sturges.

Page 35: Estatística parte2
Page 36: Estatística parte2

Exercício

• A tabela seguinte é o registro de corrida de 100m de várias meninas.

• Atleta Corrida de 100m • A 16,3• B 22,4• C 18,5• D 18,7• E 20,11. Qual o valor médio?2. Qual a mediana?3. Qual é o desvio-padrão?

Page 37: Estatística parte2

Resumo• Para visualizar o panorama geral dos dados

intuitivamente, crie uma tabela de frequência ou desenhe um histograma;

• Ao fazer uma tabela de frequência, o intervalo de classe pode ser determinado pela regra de Sturges;

• Para visualizar os dados matematicamente, calcule a média, mediana e o desvio-padrão;

• Quando há um valor muito grande ou pequeno no conjunto de dados, é mais adequado utilizar a mediana que a média aritmética.

• Desvio-padrão é um índice para descrever “o grau de dispersão” dos dados.