38
Introdução à análise exploratória de dados Wagner H. Bonat Elias T. Krainski Fernando P. Mayer Universidade Federal do Paraná Departamento de Estatística Laboratório de Estatística e Geoinformação 23/02/2018 WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 1 / 34

WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

  • Upload
    doxuyen

  • View
    225

  • Download
    0

Embed Size (px)

Citation preview

Page 1: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Introdução à análise exploratória de dados

Wagner H. BonatElias T. KrainskiFernando P. Mayer

Universidade Federal do ParanáDepartamento de Estatística

Laboratório de Estatística e Geoinformação

23/02/2018

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 1 / 34

Page 2: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Informações gerais

Sumário

1 Informações gerais

O que é estatística?

2 Análise exploratória de dados

Organização de Dados

Tabelas de frequência

Representação gráfica

3 Exercícios recomendados

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 2 / 34

Page 3: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Informações gerais

Referência bibliográfica

Livro-texto:

Marcos Nascimento Magalhães e Antonio Carlos Pedroso de Lima.Noções de Probabilidade e Estatística. Editora: EDUSP.

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 3 / 34

Page 4: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Informações gerais

Tópicos do curso

1. Análise exploratória de dados.2. Probabilidades.3. Variáveis aleatórias discretas.4. Medidas resumo.5. Variáveis bidimensionais.6. Variáveis aleatórias contínuas.7. Inferência estatística - Estimação.8. Inferência estatística - Testes de hipóteses.9. Tópicos especiais.

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 4 / 34

Page 5: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Informações gerais O que é estatística?

O que é estatística?

Estatística é um conjunto de técnicas para, sistematicamente:

planejar a coleta de dados oriundos de estudos ou experimentos,realizados em qualquer área do conhecimento.descrever, analisar e interpretar dadosextrair informações para subsidiar decisões ou conclusões

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 5 / 34

Page 6: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Informações gerais O que é estatística?

Tópicos de estatística básica

Conceitos essenciais em Estatística:

Estatística descritiva.Probabilidade.Inferência estatística.

Conceitos fundamentais:

População: Conjunto de todos os elementos sob investigação.Amostra: Subconjunto da população.Variável de interesse: característica a ser observada em cada indivíduoda amostra

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 6 / 34

Page 7: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Informações gerais O que é estatística?

População e amostra

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 7 / 34

Page 8: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Informações gerais O que é estatística?

Etapas da análise estatística

Definição do método de coleta de dados

estabelecer os objetivos (questões) de pesquisadefinir critérios objetivos de como e quais dados coletarpostular a análise estatística a ser utilizada

Estatística Descritiva

depende do tipo de dado coletadodeve ser racionalizadarelacionada com os objetivos da pesquisa

Inferência estatística

depende do objetivo da pesquisa

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 8 / 34

Page 9: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Informações gerais O que é estatística?

Etapas da análise estatística

Definição do método de coleta de dados

estabelecer os objetivos (questões) de pesquisadefinir critérios objetivos de como e quais dados coletarpostular a análise estatística a ser utilizada

Estatística Descritiva

depende do tipo de dado coletadodeve ser racionalizadarelacionada com os objetivos da pesquisa

Inferência estatística

depende do objetivo da pesquisa

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 8 / 34

Page 10: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Informações gerais O que é estatística?

Etapas da análise estatística

Definição do método de coleta de dados

estabelecer os objetivos (questões) de pesquisadefinir critérios objetivos de como e quais dados coletarpostular a análise estatística a ser utilizada

Estatística Descritiva

depende do tipo de dado coletadodeve ser racionalizadarelacionada com os objetivos da pesquisa

Inferência estatística

depende do objetivo da pesquisa

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 8 / 34

Page 11: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Informações gerais O que é estatística?

Planejamento da coleta de dados

Definição do experimentovariáveis respostasvariáveis de controledesenho do experimento e randomização

Coleta de dados por amostragemdefinição da população e característica de interessedefinição do plano amostral

Aleatória simples (com ou sem reposição) ou sistemáticaEstratificada, por estratos da população (segundo uma característica)Conglomerados, por grupos de indivíduos da população (subpopulações)Amostragem complexa (combina anteriores)

Coleta de dados observacionais. Exemplos:população de plantaspresença de seres vivos num ambientefenômenos climáticos

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 9 / 34

Page 12: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Informações gerais O que é estatística?

Planejamento da coleta de dados

Definição do experimentovariáveis respostasvariáveis de controledesenho do experimento e randomização

Coleta de dados por amostragemdefinição da população e característica de interessedefinição do plano amostral

Aleatória simples (com ou sem reposição) ou sistemáticaEstratificada, por estratos da população (segundo uma característica)Conglomerados, por grupos de indivíduos da população (subpopulações)Amostragem complexa (combina anteriores)

Coleta de dados observacionais. Exemplos:população de plantaspresença de seres vivos num ambientefenômenos climáticos

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 9 / 34

Page 13: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Informações gerais O que é estatística?

Planejamento da coleta de dados

Definição do experimentovariáveis respostasvariáveis de controledesenho do experimento e randomização

Coleta de dados por amostragemdefinição da população e característica de interessedefinição do plano amostral

Aleatória simples (com ou sem reposição) ou sistemáticaEstratificada, por estratos da população (segundo uma característica)Conglomerados, por grupos de indivíduos da população (subpopulações)Amostragem complexa (combina anteriores)

Coleta de dados observacionais. Exemplos:população de plantaspresença de seres vivos num ambientefenômenos climáticos

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 9 / 34

Page 14: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Informações gerais O que é estatística?

Análise estatística

Estatística Descritiva

consistência e interpretações iniciaisvisualização dos dados e relações entre variáveis

Inferência estatística

estimação de quantidades desconhecidasformulação e teste de hipótesesextrapolar para a população, se os dados são de uma amostra.

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 10 / 34

Page 15: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Informações gerais O que é estatística?

Etapas da análise estatística

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 11 / 34

Page 16: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados

Sumário

1 Informações gerais

O que é estatística?

2 Análise exploratória de dados

Organização de Dados

Tabelas de frequência

Representação gráfica

3 Exercícios recomendados

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 12 / 34

Page 17: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados

Exemplo

Pesquisa foi realizada com alunos. Variáveis:

Id: identificação do aluno; Turma: A ou BSexo: feminino (F) ou masculino (M)Idade: em anos; Alt: altura em metrosPeso: em quilogramas; Filhos: nº de filhos na famíliaFuma: hábito de fumar: sim (S) ou não (N)Toler: tolerância ao cigarro: (I) indiferente; (P) incomoda pouco; (M)incomoda muitoExerc.: horas de atividade física, por semanaCine: nº. de vezes que vai ao cinema por semanaOpCine: opinião a respeito das salas de cinema na cidade: (B) regulara boa; (M) muito boaTV: horas gastas assistindo TV, por semanaOpTV: opinião a respeito da qualidade da programação na TV: (R)ruim; (M) média; (B) boa; (N) não sabe.

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 13 / 34

Page 18: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Organização de Dados

Organização de Dados

A partir de um conjunto de dados coletado, a questão é:

Como extrair informações a respeito de uma ou mais características deinteresse?

Basicamente temos duas opções:

Tabelas de frequênciaGráficos

O importante é levar em consideração a natureza dos dados.

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 14 / 34

Page 19: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Organização de Dados

Organização de Dados

Uma típica tabela de dados brutos contém:Variáveis (características, medições, etc) nas colunasSujeito (indivíduo, objetos, etc) nas linhas

Id Turma Sexo Idade Alt Peso Filhos Fuma Toler Exerc Cine OpCine TV OpTV1 A F 17 1.60 60.5 2 NAO P 0 1 B 16 R2 A F 18 1.69 55.0 1 NAO M 0 1 B 7 R3 A M 18 1.85 72.8 2 NAO P 5 2 M 15 R4 A M 25 1.85 80.9 2 NAO P 5 2 B 20 R5 A F 19 1.58 55.0 1 NAO M 2 2 B 5 R6 A M 19 1.76 60.0 3 NAO M 2 1 B 2 R

Tipos de variáveis:Qualitativa nominal: Turma, Sexo, Fuma,Qualitativa ordinal: Toler, OpCine, OpTV.Quantitativa discreta: Idade, Filh, Exer, Cine, TV.Quantitativa contínua: Alt, Peso.

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 15 / 34

Page 20: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Organização de Dados

Tipos de variáveis

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 16 / 34

Page 21: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Tabelas de frequência

Tabelas de frequência

A tabela de dados brutos pode ser muito longa, portanto será difícilextrair alguma informaçãoAs tabelas de frequência ajudam a resumir a informação da variávelde interesseVamos usar 3 tipos de frequência:

Frequência absoluta: contagem de cada valor observado. Representadopor ni o número de valores i , e n o número totalFrequência relativa: número de valores i dividido pelo total n, ou sejafi =

nin

Frequência acumulada: frequência (absoluta ou relativa) acumulada atéum certo valor, obtida pela soma das frequências de todos os valores davariável, menores ou iguais ao valor considerado

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 17 / 34

Page 22: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Tabelas de frequência

Tabela de frequência - qualitativa nominal

Considerando a variável Sexo

ni fiF 37 0.74M 13 0.26

Sum 50 1.00

Não faz sentido usar frequência acumulada

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 18 / 34

Page 23: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Tabelas de frequência

Tabela de frequência - quantitativa discreta

Considerando a variável Idade

ni fi fac17 9 0.18 0.1818 22 0.44 0.6219 7 0.14 0.7620 4 0.08 0.8421 3 0.06 0.9022 0 0.00 0.9023 2 0.04 0.9424 1 0.02 0.9625 2 0.04 1.00

Sum 50 1.00

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 19 / 34

Page 24: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Tabelas de frequência

Tabela de frequência - qualitativa ordinal

Considerando a variável OpTV

ni fi facR 39 0.78 0.78M 1 0.02 0.80B 3 0.06 0.86N 7 0.14 1.00

Sum 50 1.00

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 20 / 34

Page 25: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Tabelas de frequência

Tabela de frequência - quantitativa contínua

No caso de quantitativas contínuas não faz sentido contar cada valorpois podem existir muitosA solução é criar classes ou faixas de valores, e contar o número deocorrências dentro destas classes.Para definir as classes:1. Defina a amplitude da classe, de maneira que se obtenham de 5 a 8

classes (de mesma amplitude)2. Identifique os valores máximo e mínimo da variável e construa as classes

de maneira que inclua todos os valores

As classes de valores podem seguir um dos formatos:

Classe Notação Denominação Resultado

[a, b) a ` b Fechado em a, aberto em b Inclui a, não inclui b(a, b] a a b Aberto em a, fechado em b Não inclui a, inclui b

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 21 / 34

Page 26: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Tabelas de frequência

Tabela de frequência - quantitativa contínua

Considerando a variável Peso

Foram construídas 6 classes de amplitude 10As classes são do tipo [a, b) ou a ` b

ni fi fac[40, 50) 8 0.16 0.16[50, 60) 22 0.44 0.60[60, 70) 8 0.16 0.76[70, 80) 6 0.12 0.88[80, 90) 5 0.10 0.98

[90, 100) 1 0.02 1.00Sum 50 1.00

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 22 / 34

Page 27: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Tabelas de frequência

Tabela de frequência - quantitativa discreta (muitos valores)

Considerando a variável TVApesar de ser discreta, a amplitude de valores é muito grande e nãoseria viável contar as frequências de cada valorNesse caso, utiliza-se o mesmo procedimento para quantitativascontínuas

Foram construídas 6 classes de amplitude 61

As classes são do tipo [a, b) ou a ` b

ni fi fac[0, 6) 14 0.28 0.28

[6, 12) 17 0.34 0.62[12, 18) 11 0.22 0.84[18, 24) 4 0.08 0.92[24, 30) 3 0.06 0.98[30, 36) 1 0.02 1.00

Sum 50 1.00

1Obs.: no livro a tabela tem 5 classes, pois a última tem comprimento 12.WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 23 / 34

Page 28: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Representação gráfica

Representação gráfica

As informações contidas nas tabelas podem ser visualizadas através degráficosAssim como nas tabelas, existe um tipo de gráfico adequado para cadatipo de variávelCuidado deve ser tomado com representações visuais pois um gráficodesproporcional pode gerar interpretações distorcidasOs principais são:

Diagrama circular (setores ou “pizza”)Gráfico de barrasHistogramaBoxplot

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 24 / 34

Page 29: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Representação gráfica

Diagrama circular

Adequado para variáveis qualitativas nominal e ordinal.

F

M

Sexo

IM

P

Toler

O uso deste tipo de gráfico deve ser evitado, pois pode ser de difícilinterpretação

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 25 / 34

Page 30: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Representação gráfica

Gráfico de barras

Adequado para variáveis qualitativas nominal/ordinal e quantitativadiscreta.Podem ser usadas as frequências absolutas ou relativas

17 19 21 24

Idade

Fre

quên

cia

05

1015

20

17 19 21 24

Idade

Fre

quên

cia

rela

tiva

0.0

0.1

0.2

0.3

0.4

1 2 3 4 7

Filhos

Fre

quên

cia

05

1015

2025

1 2 3 4 7

Filhos

Fre

quên

cia

rela

tiva

0.0

0.1

0.2

0.3

0.4

0.5

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 26 / 34

Page 31: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Representação gráfica

Histograma

Adequado para quantitativa contínua.

Peso

Den

sida

de

40 50 60 70 80 90

0.00

0.01

0.02

0.03

0.04

0.05

Altura

Den

sida

de

1.5 1.6 1.7 1.80

12

34

Altura de cada retângulo é a densidade definida pelo quociente da áreapela amplitude da faixa, h = fi

AMP .

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 27 / 34

Page 32: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Representação gráfica

Mediana e quartis

Mediana: valor da variável que divide o conjunto de dados ordenadosem dois subgrupos de mesmo tamanho.Quartis: valores da variável que divide o conjunto de dados ordenadosem quatro subgrupos de mesmo tamanho.Posição dos quartis:

Q1 = 0.25 · (N + 1) e arredonde.Q2 = média dos valores nas posições (N/2) e (N/2) + 1 se N par eQ2 = (N + 1)/2 se N ímpar.Q3 = 0.75 · (N + 1) e arredonde.

Exemplo: Conside o conjunto de dados: 8.43(1), 8.65(2), 9.96(3),10.91(4), 10.46(5) e 10.83(6).

Q1 = 0.25 · 7 = 1.75 ≈ 2, ou seja 8.65.Q2 = média dos valores nas posições 3 e 4, ou seja,(9.96+ 10.91)/2 = 10.43.Q3 = 0.75 · 7 = 5.25 ≈ 5, ou seja, 10.46.

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 28 / 34

Page 33: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Representação gráfica

Boxplots

Adequado para quantitativa contínua.

F M

5070

90

Sexo

Pes

o

F M

1.5

1.6

1.7

1.8

Sexo

Altu

ra

NAO SIM

5070

90

Fumante

Pes

o

NAO SIM

1.5

1.6

1.7

1.8

Fumante

Altu

ra

Excelente para explorar relações entre variáveis quantitativas equalitativas.

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 29 / 34

Page 34: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Representação gráfica

Tipos de simetria

Assimétrico à esquerda Simétrico

Fre

quen

cy

Assimétrico à direita

Fre

quen

cy

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 30 / 34

Page 35: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Representação gráfica

Diagrama de dispersão

Adequado para verificar relação entre variáveis quantitativas.

1.5 1.6 1.7 1.8

5060

7080

90

Altura

Pes

o

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 31 / 34

Page 36: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Análise exploratória de dados Representação gráfica

Gráfico de mosaico

Adequado para verificar relação entre variáveis qualitativas (nominais ouordinais).

Sexo

Fum

a

F M

NA

OS

IM

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 32 / 34

Page 37: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Exercícios recomendados

Sumário

1 Informações gerais

O que é estatística?

2 Análise exploratória de dados

Organização de Dados

Tabelas de frequência

Representação gráfica

3 Exercícios recomendados

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 33 / 34

Page 38: WagnerH.Bonat EliasT.Krainski FernandoPcursos.leg.ufpr.br/ce001/slides/01_Analise_Exploratoria.pdf · Informaçõesgerais Referênciabibliográfica Livro-texto: MarcosNascimentoMagalhãeseAntonioCarlosPedrosodeLima

Exercícios recomendados

Exercícios recomendados

Seção 1.1: Ex. 1, 2 e 3.Seção 1.2: Ex. 1 e 4.Seção 1.4: Ex. 1, 3, 5 (troque diagrama circular pro gráfico de barras),8, 9, 12, 18 e 20.

WB, EK, FM ( LEG/DEST/UFPR ) Análise exploratória 2018/1 34 / 34