Estatística parte2

Estatística

4º Período ADS

Prof. Aristóteles Meneses Lima

Frequência e Histogramas

• Imagine que você estava lendo uma revista para descobrir o melhor lugar para se comer algo;

• Imagine que você goste de Lámen, com isso, você faz uma tabela de preços.

• Como será essa tabela?

PREÇOS DE LÁMEN NOS 50 MELHORES RESTAURANTES

RESTAURANTE PREÇO RESTAURANTE PREÇO

1 700 26 780

2 850 27 590

3 600 28 650

4 650 29 580

5 980 30 750

6 750 31 800

7 500 32 550

8 890 33 750

9 880 34 700

10 700 35 600

11 890 36 800

12 720 37 800

13 680 38 880

14 650 39 790

15 790 40 790

16 670 41 780

17 680 42 600

18 900 43 670

19 880 44 680

20 720 45 650

21 850 46 890

22 700 47 930

23 780 48 650

24 850 49 777

25 750 50 700

Como podemos tornar essa tabela mais significativa?

• Transformá-la em um gráfico; • Para fazer um gráfico primeiro temos que dividir os

preços em grupos. • Vamos supor que....• Há um shopping center gigante composto de 50

restaurantes de Lámen...e somente restaurantes de Lámen!

• Cada restaurante serve apenas um tipo de Lámen, e os restaurante são distribuídos em diferentes pisos de acordo com o preço do Lámen.

• Essa divisão de grupos é chamada de classe em Estatística.

Piso (Classe)Igual ou Maior que/Menor que

5P900-1000

5 18 47

4P800-900

37 38 462 8 9 11 19 21 24 31 36

3P700-800

26 30 33 34 39 40 41 49 50 1 6 10 12 15 20 22 23 25

4P600-700

43 44 45 483 4 13 14 16 17 28 35 42

1P500-600

7 27 29 32

GUIA DE PISOS

PISO NOME DO RESTAURANTE MÉDIA DA CLASSE

>= <

5P900-1000

XXX 950

4P800-900

XXXXXXXXXXXX

850

3P700-800

XXXXXXXXXXXXXXXXXX

750

2P600-700

XXXXXXXXXXXXX

650

1P500-600

XXXX 550

• EM CADA PISO, UMA PLACA INDICA O PREÇO CENTRAL DE CADA CLASSE.

• O SEGUNDO PISO É A CLASSE DO INTERVALO ENTRE 600 E 700, ONDE SE TEM UMA LOJA COM UMA PLACA DE 650.

• ISSO RECEBE O NOME PONTO MÉDIO DA CLASSE.

• Uma vez que este shopping center distribui cada loja em um piso diferente de acordo com o preço, o número de lojas em cada piso varia.

• O número de restaurantes em cada piso recebe o nome de frequência.

• Agora, tente calcular a frequência relativa de restaurantes no terceiro piso.

• Frequência Relativa é parecido com porcentagem, é a proporção em relação ao total, quando o total é considerado como 1.

TABELA DE FREQUÊNCIA DOS 50 MELHORES RESTAURANTES DE LÁMEN

CLASSE MÉDIA DA CLASSE FREQUÊNCIA FREQUÊNCIARELATIVA

500-600 550 4 0,08

600-700 650 13 0,26

700-800 750 18 0,36

800-900 850 12 0,24

900-1000 950 3 0,06

SOMA 50 1,00

• Agora se descrevermos tudo isso usando um gráfico de barras chamado HISTOGRAMA...

0

5

10

15

20

550 650 750 850 950

HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA)

HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA)

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

550 650 750 850 950

HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA RELATIVA)

HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA RELATIVA)

Média (Valor Médio)

• Observe a tabela:

• Você sabe o que é Valor Médio?

RESULTADO DO TORNEIO DE BOLICHE

EQUIPE A EQUIPE B EQUIPE C

Jogadora Pontuação Jogadora Pontuação Jogadora Pontuação

LUY-LUY 86 KIMIKO 84 SHINOBU 229

JUN 73 MEGUME 71 YUKA 77

YUMI 124 YOSHIMI 103 SAKURA 59

SHIZUKA 111 MEI 85 KANAKO 95

TOUKO 90 KAORI 90 KUMIKO 70

KAEDE 38 YUKIKO 89 HIRONO 88

• O Valor Médio é chamado de Média em Estatística. E a média em questão agora é o que chamamos de MÉDIA ARITMÉTICA, para ser exato.

• Há outros tipos de Média, como MÉDIA GEOMÉTRICA e MÉDIA HARMÔNICA, você não precisa aprender as fórmulas agora, mas sugiro que se lembre desses nomes.

Mediana

RESULTADO DO TORNEIO DE BOLICHE

EQUIPE A EQUIPE B EQUIPE C

Jogadora Pontuação Jogadora Pontuação Jogadora Pontuação

LUY-LUY 86 KIMIKO 84 SHINOBU 229

JUN 73 MEGUME 71 YUKA 77

YUMI 124 YOSHIMI 103 SAKURA 59

SHIZUKA 111 MEI 85 KANAKO 95

TOUKO 90 KAORI 90 KUMIKO 70

KAEDE 38 YUKIKO 89 HIRONO 88

• VAMOS DEIXAR DE LADO AS EQUIPES A E B E PRESTAR ATENÇÃO À EQUIPE C.

• A Mediana é o valos central quando se coloca os valores em ordem do menor ao maior.

• Primeiro organizamos as pontuações de cada equipe.

Equipe A

38 73 86 90 111 124

Equipe B

71 84 85 89 90 103

Equipe C

59 70 77 88 95 229

Dedução

• Número de Valores = Ímpar

• Número de Valores=Par

-1041,6 -39,0 -5,7 60,4 77,3

MEDIANA

-0,4 35,2 37,8 42,2 46,1 910,3

A MEDIANA É O VALOR MÉDIO DESSES DOIS VALORES

Com isso....

Imagine

• Então, você já deve se perguntar porque a “Poupança Média” anunciada nos jornais e na tv é tão alta.

• A média é alta por causa de alguns milionários.

• Nesses casos, a Mediana está bem mais próxima das pessoas comuns.

Desvio-Padrão

• Equipes A e B

• Desenhe uma reta numérica e escreva os nomes dos jogadores de acordo com suas pontuações.

EQUIPE A

0 50 100

MÉDIA

KAEDE JUN TOUKO SHIZUKA

YUMI

LUY-LUY

EQUIPE B

0 50 100

MEGUMI

YUKIKO

MEI

KIMIKO

YOSHIMI

KAORI

MÉDIA

• Apesar de a pontuação média de cada equipe ser de 87....

• As tendências descritas pelas linhas numéricas são bem diferentes.

• O Desvio-Padrão é usado para descrever essa dispersão dos dados.

• Em resumo, Desvio-Padrão é um indicador que mostra a diferença da média de cada valor nesse conjunto.

• O desvio-padrão mínimo é o zero, e na medida que a “dispersão dos dados” aumenta, o mesmo ocorre com o desvio-padrão.

0 (mínimo)

Sem dispersão

(todos os valores dispersos

são iguais)

Agora responda...

Calculando...

De uma maneira geral...

• A primeira fórmula é aplicada quando se calcula o Desvio-padrão de uma população inteira.

• A segunda fórmula é usada quando se calcula o Desvio-padrão de uma amostra.

Recapitulando....

• Se você acha que algo não ficou claro em “Tabelas de distribuição de frequência e histogramas”. Vamos rever uma tabela apresentada.

TABELA DE FREQUÊNCIA DOS 50 MELHORES RESTAURANTES DE LÁMEN

CLASSE MÉDIA DA CLASSE FREQUÊNCIA FREQUÊNCIARELATIVA

500-600 550 4 0,08

600-700 650 13 0,26

700-800 750 18 0,36

800-900 850 12 0,24

900-1000 950 3 0,06

SOMA 50 1,00

• Como você pode ver, o intervalo de classe nessa tabela é 100.

• O intervalo não foi determinado de acordo com nenhum tipo padrão matemático – foi definido de forma subjetiva. Determinar o intervalo de classe cabe a quem está analisando os dados.

• Há um jeito de definir o intervalo de classe matematicamente.

• Usa-se a Regra de Sturges.

Exercício

• A tabela seguinte é o registro de corrida de 100m de várias meninas.

• Atleta Corrida de 100m • A 16,3• B 22,4• C 18,5• D 18,7• E 20,11. Qual o valor médio?2. Qual a mediana?3. Qual é o desvio-padrão?

Resumo• Para visualizar o panorama geral dos dados

intuitivamente, crie uma tabela de frequência ou desenhe um histograma;

• Ao fazer uma tabela de frequência, o intervalo de classe pode ser determinado pela regra de Sturges;

• Para visualizar os dados matematicamente, calcule a média, mediana e o desvio-padrão;

• Quando há um valor muito grande ou pequeno no conjunto de dados, é mais adequado utilizar a mediana que a média aritmética.

• Desvio-padrão é um índice para descrever “o grau de dispersão” dos dados.

Documents

Estatística parte2