27
TIPOS BÁSICOS DE DADOS Alexandre Duarte - http://alexandre.ci.ufpb.br/ensino/iad

Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

Embed Size (px)

DESCRIPTION

Material de aulas da disciplina "Introdução à Análise da Dados" do Centro de Informática da UFPB. Assunto: Tipos Básicos de Dados

Citation preview

Page 1: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

TIPOS BÁSICOS DE DADOSAlexandre Duarte - http://alexandre.ci.ufpb.br/ensino/iad

Page 2: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

OBJETIVOS DA AULA

• Descrever os diferentes tipos básicos de dados

• Entender para que cada um destes tipos serve

• Ser capaz de escolher o tipo adequado para uma determinada necessidade

Page 3: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

ESCALAS DE MEDIÇÃO

• Nominal

• Ordinal

• Intervalo

• Razão

Page 4: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

ESCALA NOMINAL• Você está no supermercado coletando itens em

diferentes seções

• Na medida em que você anda pelos corredores vai coletando itens nas seções de frutas, verduras, laticínios e grãos e colocando em seu carrinho

• Uma listagem contendo o nome da seção de cada um dos itens em seu carrinho utilizaria uma escala nominal

Page 5: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

ESCALA NOMINAL

Podemos contar e calcular percentuais utilizando dados nominais

!Não podemos calcular médias ou outras medidas similares utilizando dados nominais

9%

18%

27%

45%

Frutas VerdurasLatícinios Grãos

Page 6: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

ESCALA ORDINAL

• Na hora de pagar pelas compras você decide que quer sair o mais rápido possível do supermercado

• Sem efetivamente contar, você classifica as filas para os caixas em pequenas, médias e longas

• Este tipo de classificação permite uma ordenação natural das categorias, dai o nome de escala ordinal

Page 7: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

ESCALA ORDINAL

• Questões que solicitam que o participante escolha uma opção entre “concorda fortemente”, “concorda”, “neutro" , “discorda" e “discorda fortemente” são exemplos de coleta de dados ordinais

• Categorias em uma escala ordinal não têm um valor matemático intrínseco mas podem ser mapeadas em números para facilitar a análise

Page 8: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

4 Discorda fortemente

ESCALA ORDINAL

1 Concorda fortemente

3 Concorda

2 Neutro

5 Discorda

5 Discorda fortemente

1 Concorda fortemente

2 Concorda

3 Neutro

4 Discorda

1 Discorda fortemente

5 Concorda fortemente

4 Concorda

3 Neutro

2 Discorda

Page 9: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

ESCALA ORDINAL

Assim como ocorre com dados nominais, podemos contar dados ordinais e calcular porcentagens !Porém, há uma diferença em relação ao cálculo de médias e de outras medidas!

9%9%

18%

27%

36%

Concorda fortementeConcordaNeutroDiscordaDiscorda fortemente

Page 10: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

ESCALA ORDINAL• Em algumas áreas de estudo considera-se normal calcular médias entre valores

atribuídos a categorias em uma escala ordinal, desde que:

1. As diferenças entre categorias consecutivas sejam as mesmas

• Exemplo: A diferença entre “Concorda fortemente” e “Concorda" e entre “Discorda" e “Discorda fortemente” são iguais

2. Sejam utilizados números consecutivos para representar cada categoria

• Em outras áreas essa prática é fortemente desencorajada.

• Importante consultar trabalhos relacionados na área para identificar qual o o seu posicionamento!

Page 11: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

ESCALA ORDINAL: EXEMPLO• O supermercado onde você está tem 30 caixas e você utilizou a

seguinte escala ordinal para classificar as filas de cada um deles: "Muito longa”, “Longa”, “Média”, “Curta" e “Muito curta”, atribuindo valores de 1 até 5 para cada categoria respectivamente.

• De acordo com sua classificação existem 5 filas “Muito longas”, 7 filas “Longas”, 5 filas “Médias”, 10 filas “Curtas" e 3 filas “Muito curtas”

• Qual categoria melhor representa o conjunto de todas as filas do supermercado?

Page 12: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

ESCALA DE INTERVALO• Após finalmente escolher uma das filas para os caixas, você começou a

aguardar sua vez para ser atendido

• Você entrou na fila às 11:15 e agora são 11:30

• Períodos de tempo sãos dados classificados como intervalares, recebendo esta denominação porque os valores obtidos entre quaisquer dois pontos consecutivos de medição são sempre iguais

• Uma vez que cada minuto tem exatamente 60 segundos, a diferença entre 11:15 e 11:30 vale o mesmo que a diferença entre 12:20 e 12:35.

Page 13: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

ESCALA DE INTERVALO• Dados intervalares são tipos numéricos, podendo ser utilizados

em qualquer operação matemática

• A principal característica desta escala é não possuir um significado específico para o valor 0

• O 0 não indica a ausência de algo que você está medindo.

• Um valor 0 para tempo não significa a ausência de tempo

• Um valor 0 para temperatura não significa a ausência de calor

Page 14: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

ESCALA DE RAZÃO • Vendo que agora são 11:30 você logo conclui “Já estou na fila há 15

minutos!”

• Quando começamos a pensar no tempo desta maneira passamos a utilizar dados segundo uma escala de razão e não mais de intervalo

• A escala de razão é muito semelhante à escala de intervalos porém apresenta uma diferença fundamental: o 0 tem um significado intrínseco!

• 0 minutos, 0 pessoas na fila, 0 produtos no carrinho de compras, etc

• Em todos estes casos o 0 significa a ausência de algo

Page 15: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

DISCRETO VS CONTÍNUO

• Tanto a escala de intervalos quanto a escala de razão podem ser compostas por valores contínuos ou discretos

• Uma escala discreta indica que existe um conjunto de valores específicos para o que se quer medir (geralmente números inteiros) e nenhum valor entre duas medidas consecutivas

• Não é possível observar 2 pessoas e meia em uma fila!

Page 16: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

DISCRETO VS CONTÍNUO

• Uma escala contínua significa que os dados podem assumir qualquer valor no domínio (mas não qualquer valor!).

• É possível comprar 1,5 KG de queijo ou esperar na fila por 0,5 horas.

• É impossível comprar uma quantidade negativa de queijo ou esperar por uma quantidade negativa de tempo na fila.

Page 17: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

RESUMINDOItem Seção Corredo

rQuantidade Preco (R$)

Laranja (KG) Frutas 4 2 6.60Maçã (KG) Frutas 4 1 4.50Queijo (KG) Laticínios 7 1.5 9.90Leite (LT) Laticínios 7 2 4.50Feijão (KG) Grãos 8 3 3.89Pimentão (KG) Verduras 15 0.5 2.99Arroz (KG) Grãos 8 2 3.12Cebola (KG) Verduras 15 1 8.90Cenoura (KG) Verduras 15 0.7 7.10

Page 18: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

VARIÁVEL VS DADOS• Geralmente encontramos na literatura variáveis

descritas como sendo de um determinado tipo de dado

• É importante considerar que muitas vezes uma variável pertence a mais de um tipo de dado

• O que geralmente determina o tipo de uma variável é a forma como os dados são coletados

Page 19: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

VARIÁVEL VS DADOS• Considere, por exemplo, a variável idade

• Idade é uma variável comumente associada a uma escala de razão

• Porém, dependendo do mecanismo de coleta, a idade pode acabar assumindo uma escala ordinal

• “A que grupo etário você pertence?”

Page 20: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

VARIÁVEL VS DADOS• A regra geral é que sempre é possível descer na escalas de

medição mas não é possível subir.

• Se é possível coletar uma variável utilizando uma escala de intervalo ou razão sempre será possível coletá-la também com uma escala ordinal ou nominal

• Porém, se uma variável é inerentemente nominal (seção no supermercado) não é possível coletá-la com escalas ordinal, de intervalo ou de razão.

Page 21: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

VARIÁVEL VS DADOS

Variável Ordinal

Medida Intervalar ou de Razão correspondente

Exemplo

Classificação Medida na qual a classificação é baseada

Armazenar o tempo de corrida de cada maratonista ao invés de sua

posição de chegada

Escala agrupada

A medida propriamente dita

Armazenar a idade exata ao invés de uma faixa etária

Escala alternativa

Medida original a partir da qual a escala foi criada

Armazenar as notas exatas das provas ao invés de conceitos (A, B, etc)

Page 22: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

– Alexandre Duarte

“Você pode descer, mas não pode subir.”

Page 23: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

DADOS CATEGÓRICOS

• Já vimos que escalas nominais e ordinais são utilizadas para dividir os dados em categorias

• Alguns autores consideram dados nominais ou ordinais simplesmente como dados categóricos

Page 24: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

DADOS QUALITATIVOS E QUANTITATIVOS

• Dados qualitativos, grosseiramente falando, se referem a dados não numéricos enquanto que dados quantitativos se referem a dados numéricos (quantificáveis)

• Certos dados são sempre qualitativos pois requerem pré-processamento ou diferentes métodos de análise

• Da mesma forma, dados intervales ou de razão são sempre quantitativos

Page 25: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

DADOS QUALITATIVOS E QUANTITATIVOS

• Porém, não há consenso em relação a dados nominais e ordinais

• Alguns os consideram qualitativos ou vez que suas categorias representam uma descrição e não são verdadeiramente numéricas

• Outros os consideram quantitativos uma vez que podem ser contados e utilizados para calcular porcentagens (e até mesmo médias)

Page 26: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

DADOS QUALITATIVOS E QUANTITATIVOS

• Para evitar confusão, utilizaremos apenas as 4 escalas de medição apresentadas nesta aula ao longo deste curso.

Page 27: Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados

REFERÊNCIAS

• Data + Design: A simple introduction to preparing an visualizing information, Tina Chiasson et al