40
Estatística: Conceitos e Organização de Dados Introdução Conceitos Método Estatístico Dados Estatísticos Tabulação de Dados Gráficos Disciplina: Estatística Básica Professor: Fabrício Bueno

Estatística: Conceitos e Organização de Dados · Planejamento - conjunto apropriado de instrumentos ... Pode-se utilizar tabela de números aleatórios para grandes amostras População,

  • Upload
    lytuyen

  • View
    217

  • Download
    0

Embed Size (px)

Citation preview

Estatística: Conceitos e Organização de Dados

IntroduçãoConceitosMétodo EstatísticoDados EstatísticosTabulação de DadosGráficos

Disciplina: Estatística Básica

Professor: Fabrício Bueno

Introdução

O que é Estatística?

– É a parte da matemática aplicada que se ocupa em obter conclusões a partir de dados observados

– É uma metodologia ou conjunto de técnicas que utiliza: Coleta de dadosColeta de dados Classificação de dados Classificação de dados Apresentação ou representação dos dadosApresentação ou representação dos dados Análise e interpretaçãoAnálise e interpretação

Introdução

Por que estudar?– Entender grandes volumes de informação (pesquisas

de mercado, índices populacionais, acessos a sites)– Qualidade de processos (CEP)– Previsões confiáveis (projeções financeiras e

populacionais, vida útil de equipamentos)– Planejamento (coleta de dados, definição de

amostras, planos de contingência)

Ramos da Estatística

Descritiva ou Dedutiva– Descreve e analisa grupos de observações

(amostras)– Uso de medidas e formas de representação (tabelas,

gráficos, curvas, ...)

Inferencial ou Indutiva

– Processo de generalização a partir da análise e interpretação de dados amostrais

Ramos da Estatística

Probabilidade

– Parte da Estatística que utiliza métodos e técnicas apropriadas para o estudo de processos com margem de incerteza

Pesquisa Social

A importância da pesquisa social

– Explicar e predizer o comportamento humano

– Examinar características do comportamento humano chamadas variáveis

➢ Variáveis: características que diferem ou variam de um indivíduo para o outro ou de um instante para o outro no decorrer do tempo

Variáveis

As variáveis são, basicamente:

– Dependentes (efeito)– Independentes (causa)

A relação entre variáveis dependentes e independentes se dá por testes de hipóteses

➢ Exemplo: Identificar a relação entre anos de estudo e número de dependentes químicos; Índice de delinquência e número de pais

Variáveis: outras classificações

Qualitativas ou nominais– valores expressos por atributos não numéricos (Ex:

cor, forma, profissão, ...)

Quantitativas– Valores expresso por números (Ex: resistência, peso,

idade, ...)

Conceitos

As variáveis quantitativas se dividem:

– Contínuas – variáveis podem assumir infinitos valores num intervalo (Ex: peso de uma pessoa, tamanho do pé de uma pessoa)

– Discretas – variáveis só podem finitos valores num intervalo (Ex: número de alunos numa sala, tamanho do calçado de uma pessoa)

Formas de Pesquisa

Experimento– Grau de controle; Manipulação de variáveis

independentes (grupo experimental e de controle)

Survey– Relatórios verbais; Questionários; Entrevistas; ....

Análise de conteúdo– Jornais, livros, cartas, desenhos, músicas, revistas,...

Observação participativa Análise secundária

– Dados preexistentes

Etapas do Método Estatístico

Definição do problema - hipótese passível de teste Planejamento - conjunto apropriado de instrumentos Coleta de Dados Apuração dos Dados Apresentação dos Dados Análise e interpretação

Coleta direta– Contínua– Periódica– Ocasional

Coleta indireta (inferência a partir da coleta direta)

Exemplo: Coleta de média de reprovação do ensino médio a partir da coleta dos registros

diários de frequência

Coleta de dados

Dados Estatísticos

O método estatístico é análogo à lapidação e polimento de pedras preciosas

Dados brutos numerosos/ matéria bruta com alta rugosidadeTabulação de dados /redução de rugosidadeAnálise estatística para obter informações desejadas/

lapidação para obter a forma desejadaApresentação gráfica/ polimento para obtenção de brilho

Dados Estatísticos

Organização

– Brutos – dados não organizados

– Rol – dados organizados em ordem crescente ou decrescente

Organização de Dados

Distribuição de frequências/Tabela de frequências Absoluta

– Frequência simples Relativa (%)

Absoluta

– Frequência Acumulada Relativa (%)

14,5 10 9,1% 10 9,1%

24,5 20 18,2% 30 27,3%

34,5 50 45,4% 80 72,7%

44,5 20 18,2% 100 90,9%

54,5 10 9,1% 110 100,0%

Custo de produção (em

m ilhões)

Frequência sim ples absoluta

Frequência sim ples relativa

Frequência acum ulada

absoluta

Frequência acum ulada

relativa

Organização de Dados

Intervalos de Classe– Forma de categorizar dados– Permite agrupar grandes volumes de dados– Auxilia na detecção de padrões– Mínimo recomendável: 4 classes– Máximo recomendável:20 classes

Tabela de frequência em classes

Organização de Dados

Você consegue enxergar um padrão nestes dados?

Medidas de uma peça na linha de produção

8,60 9,05 9,76 11,09 9,02 11,07 9,08 10,60 8,70 8,90 8,7011,01 10,04 9,02 10,00 11,08 11,07 12,01 11,07 11,10 8,03 8,079,07 9,10 10,04 11,02 8,90 10,04 12,01 11,04 12,05 8,70 9,8011,04 10,80 12,05 10,01 10,06 9,54 8,60 12,06 9,70 10,04 11,0911,04 9,70 9,09 10,60 12,09 11,10 8,90 8,02 12,05 11,09 12,0911,03 10,02 8,05 9,02 9,06 11,09 11,09 10,01 12,01 10,04 12,089,80 10,07 11,07 8,06 8,91 11,05 11,01 8,08 8,00 12,04 12,049,80 12,01 9,04 9,06 10,05 10,08 11,05 9,02 8,04 11,06 10,0410,00 8,90 12,01 12,04 8,02 9,60 8,02 9,05 11,05 9,02 12,1010,04 11,06 9,02 10,08 8,04 9,02 12,10 11,08 9,56 8,09 9,0411,08 9,60 8,01 9,04 8,03 8,76 12,00 10,80 11,00 12,08 9,059,70 10,05 12,00 10,00 9,03 11,10 10,00 12,07 10,03 12,08 10,909,70 10,04 9,02 9,09 12,03 9,80 11,04 12,01 8,90 9,70 9,708,80 10,70 10,07 9,55 8,02 9,03 9,70 9,10 9,03 8,08 12,0310,07 9,05 10,06 8,03 12,05 12,06 11,08 11,07 9,09 9,00 8,069,80 10,01 11,04 11,06 12,09 11,03 8,01 9,88 8,09 9,09 9,029,80 10,70 10,01 9,90 8,80 12,01 10,07 9,06 10,04 8,03 10,0711,04 10,05 10,05 9,00 9,00 10,00 11,02 10,00 10,80 8,03 10,708,01 9,60 9,05 9,01 9,04 10,00 8,08 10,70 10,80 10,80 8,559,70 8,70 9,87 9,07 9,70 11,01 8,05 11,02 9,04 10,04 8,90

Organização de Dados

Dicas para criar uma tabela de frequência

– O número de classes pode ser estimado pela fórmula

O intervalo de classe pode ser estimado pela fórmula

– Tradicionalmente, o limite inferior do intervalo de classe é múltiplo de seu tamanho

k= n

I=MAX −MIN

k

Organização de Dados

Seguindo as estimativas anteriores:– K=14,83– I=0,28– Classes:

8 |—8,28

8,28 |— 8,42

8,42 |— 8,70

.

.

.

Outra alternativa– K=8– I=0,5– Classes:

8 |—8,5

8,5 |— 9

9 |— 9,5

9,5 |— 10,0

10,0|— 10,5

10,5|— 11,0

11,0|— 11,5

11,5|—

Às vezes o bom senso pode ser

preferível, porém podem haver

perdas

Não há bom padrão visual,

embora estatisticamente

correto

Organização de Dados

Calcule as demais frequências!

8,0 8,50 258,5 9,00 179,0 9,50 389,5 10,00 25

10,0 10,50 3610,5 11,00 1211,0 11,50 3811,5 12,00 29

ClassesFrequência

SimplesAbsoluta

Frequência SimplesRelativa

Frequência Acumulada

Absoluta

Frequência Acumulada

Relativa|―|―|―|―|―|―|―|―

Organização de Dados

8,0 8,50 25 11,36% 25 11,36%8,5 9,00 17 7,73% 42 19,09%9,0 9,50 38 17,27% 80 36,36%9,5 10,00 25 11,36% 105 47,73%

10,0 10,50 36 16,36% 141 64,09%10,5 11,00 12 5,45% 153 69,55%11,0 11,50 38 17,27% 191 86,82%11,5 12,00 29 13,18% 220 100,00%

ClassesFrequência

SimplesAbsoluta

Frequência SimplesRelativa

Frequência Acumulada

Absoluta

Frequência Acumulada

Relativa|―|―|―|―|―|―|―|―

Outras formas de tabela

Pesquise– Componentes de uma tabela e suas funções

– Tabelas com séries históricas, geográficas, específicas e conjugadas (dê exemplos)

– Normas para confecção de tabelas

Organização de Dados

Índices: razões entre duas grandezas diferentes

Coeficientes:razão entre o número de ocorrências e o total

Taxas: Coeficientes multiplicados por uma potência de dez para facilitar leitura

renda per capta=renda

populacao

coeficientede inadinplência=inadinplentesclientes

taxa de inadinplência=coeficientede inadinplência∗100

Representação Gráfica

Gráficos estatísticos são formas de apresentação de dados com o objetivo de facilitar o entendimento dos fenômenos em estudo

A seguir são apresentados alguns tipos de gráficos

Representação Gráfica

Gráfico de Colunas – ideal para comparar dados agrupados em classes ou dados nominais

0

20

40

60

80

100

Abril Maio Junho Julho

Representação Gráfica

Gráfico de Barras – ideal para comparar dados com rótulos longos agrupados em classes ou dados nominais

20,4

50

20

80

0 20 40 60 80 100

Lazer

Saúde

Educação

Alimentação

Representação Gráfica

8,0 |― 8,50

8,5 |― 9,00

9,0 |― 9,50

9,5 |― 10,00

10,0 |― 10,50

10,5 |― 11,00

11,0 |― 11,50

11,5 |― 12,00

0 5 10 15 20 25 30 35 40

Medidas de peças em uma linha de produção

Distribuição de Frequências

Frequências

Ca

teg

ori

as

de

Me

did

a

Representação Gráfica

Gráfico de Linhas – ideal para indicar variações e tendências de valores de um determinado fenômeno

7568

20

110

0

20

40

60

80

100

120

1998 1999 2000 2001

Representação Gráfica

Gráfico em Setores ou Pizza – ideal para dados que representam quantidades ou percentuais

20%

15%

5%

60%

Saúde

Educação

Defesa

Administração

Representação Gráfica

Gráfico de Dispersão – ideal comparar pares de valores e distribuição de dados

20

5

6160

14

5047

50

20

5

6160

14

5047

27

0

10

20

30

40

50

60

70

0 1 2 3 4 5

Representação Gráfica

Pictograma – gráficos ilustrados de fácil entendimento, voltados para público em geral

Exemplo

Complete a tabela e construa os gráficos solicitados

Distribuição de alunos em faixas de peso

UFFS - 2010

Identifique nesta tabela os componentes: corpo, cabeçalho, coluna indicadora e título

Faixa de Peso

40 |– 60 40

60 |– 80 95

80 |– 100 60

100 |– 110 10

110 |– 8

Freqüência simples absoluta

Freqüência simples relativa

Freqüência acumulada

absoluta

Freqüência acumulada

relativa

População, amostra e amostragem População

– Maior conjunto tomado como referência na observação de um fenômeno

– Conjunto de entes portadores de, pelo menos, uma característica em comum

Amostra– Subconjunto não vazio da população– Excetuando-se a própria população– Seu uso gera economia e rapidez dos resultados– Deve ser representativa da população, ou seja, deve

possuir as mesmas características básicas da população

População, amostra e amostragem

Amostragem – Técnica para escolher amostras que garanta

o acaso na escolha

– Ou seja, qualquer elemento da população tem a mesma probabilidade de ser escolhido

– Uma boa técnica de amostragem garante representatividade da amostra

Tipos de amostragem:– Amostragem casual ou aleatória

Técnica de amostragem onde cada elemento da população tem a mesma probabilidade de ser incluído na amostra

Exemplo: sorteiosPode-se utilizar tabela de números aleatórios para

grandes amostras

População, amostra e amostragem

Tipos de amostragem:– Amostragem proporcional estratificada

Grupos heterogêneos entre si, mas homogêneos internamente

Quando a população é dividida em estratos e a amostragem é proporcional a eles

Ex: Uma amostra de 10% de alunos em uma classe de 40 homens e 60 mulheres, consistirá na escolha aleatória de 4 homens e 6 mulheres

População, amostra e amostragem

População, amostra e amostragem

Tipos de amostragem– Amostragem sistemática

Quando os elementos da população já estão ordenados, faz-se uma amostragem sistemática

Ex: Para se obter uma amostra de 50 elementos em 15 lotes de 100 produtos, temos os passos a seguir:

Exercício

Suponha uma linha de produção que produz, diariamente, 15 lotes de 100 produtos cada.

Faça uma amostragem sistemática de 10% da produção.

1) 15 X 100 = 1500 produtos

2)1500 X 10%= 150

3) 1500/150 = 10, logo será selecionado um produto a cada 10

unidades

4) Um número de 1 a 10 é escolhido aleatoriamente (por

exemplo, o número 7)

5) Serão escolhidos os produtos 7, 17, 27, 37, 47, ...

Atividade Prática

O formulário Pesquisa Estudantil, baseado em Levin & Fox (2004), trata-se de uma pesquisa sobre tabagismo

Obtenha uma amostra e colete os dados Organize-os em tabelas e gere os gráficos que

julgarem pertinentes

Estes dados serão utilizados para nos estudos de medidas de posição e dispersão