View
212
Download
0
Embed Size (px)
Sintetizando dados qualitativos equantitativosUniversidade Estadual de Santa Cruz
Ivan Bezerra Allaman
Cronograma
1. Dados qualitativos
2. Dados quantitativos
2/48
INTRODUO
Para sintetizarmos as informaes provenientes de dados qualitativos podem serutilizados tanto mtodos tabulares quanto mtodos grficos.
Com relao ao mtodo tabular utiliza-se a distribuio de frequncia.
Uma distribuio de frequncia um sumrio tabular de dados que mostra o nmero(frequncia) de itens em cada uma das diversas classes no sobrepostas.
4/48
Itens de uma tabela de distribuio de frequncias
Categoria ou classe no qual se est estudando;
Frequncia absoluta: corresponde ao nmero de itens de cada categoria estudada;
Frequncia acumulada: corresponde a frequncia acumulada na classe anterior mais afrequncia absoluta da classe atual;
5/48
Frequncia relativa: equivale a frao ou proporo dos itens pertencentes aquela classe
Frequncia relativa (%): a frequncia relativa multiplicada por 100;
Frequncia acumulada (%): a frequncia relativa acumulada multiplicada por 100;
Frequncia relativa- =Frequncia absoluta
n
6/48
Classes Freq.absoluta
Freq.relativa
Freq.relativa(%)
Freq.acumulada
Freq.acumulada(%)
Visualizando-a:
7/48
SINTETIZANDO DADOS QUALITATIVOS
Aplicao
1. Uma pesquisa foi realizada com o intuito delevantar conhecimentos sobre o nvel deinstruo do chefe da casa, nas famliasresidentes no bairro Saco Grande II,Florianpolis - SC (Barbetta, 2012). Os dados seencontram no linkhttp://nbcgib.uesc.br/lec/download/R/dados/barbetta.txt
9/48
http://nbcgib.uesc.br/lec/download/R/dados/barbetta.txtClasse Freq.absoluta
Freq.relativa
Freq.relativa(%)
Freq.acumulada
Freq.acumulada(%)
Usa 78 0.65 65 78 65
Nousa
42 0.35 35 120 100
Percebam que nesta base de dados h duasvariveis qualitativas: p.a.p (programa dealimentao popular) e instr. (grau deinstruo).
A varivel p.a.p est na escala nominal einstr. na escala ordinal.
Logo, a tabela de distribuio defrequncias se resume a:
10/48
Classe Freq.absoluta
Freq.relativa
Freq.relativa(%)
Freq.acumulada
Freq.acumulada(%)
nenhum 38 0.3167 31.67 38 31.67
prgrau 38 0.3167 31.67 76 63.33
seggrau 44 0.367 36.67 120 100.00
Quando a varivel est na escala ordinal, coerente que as classes sejam apresentadasem sua ordem natural.
No caso da varivel grau de escolaridadetem-se:
11/48
APRESENTAO GRFICA
Dentre os diversos tipos de grficos existentes, ser abordado apenas os mais utilizadose, cujo as inforaes advm de uma tabela de distribuio de frequncias.
Logo, sero apresentados os seguintes grficos: o grfico de barras, de setores, de pontose o grfico de pareto.
13/48
Grfico de barras
Normalmente utilizado para variveis qualitativas.
A altura da coluna pode corresponder a frequncia absoluta, frequncia relativa oufrequncia percentual.
A disposio das colunas pode ser tanto no sentido horizontal quanto vertical.
14/48
Aplicao
2. Aproveitando os dados da aplicao 1 elabore umgrfico de barras para a varivel "p.a.p.".
Segue o grfico.
15/48
Grfico de setores
um tipo de grfico til quando se tem poucas categorias. Em geral, quando o nmerode categorias ultrapassa 6 a visualizao das categorias se torna difcil.
A confeco do grfico manualmente nos dias atuais invivel devido a grandequantidade de recursos computacionais. No entanto, caso deseje fazer manualmente,dever ter o auxlio de um transferidor. O ngulo de cada setor, calculadomultiplicando a frequncia relativa por 360.
16/48
Aplicao
3. Utilizando ainda os dados da aplicao 1,elabore um grfico de setores para a varivel"grau de instruo".
17/48
Grfico de pontos (Dot Chart)
um tipo de grfico pouco conhecido e consequentemente pouco utilizado.
No entanto, embora visualmente seja simples, extremamente til e eficaz quandocomparado aos grficos tradicionais de barra e de setores.
18/48
Aplicao
4. Considerando ainda a aplicao 1, elabore ogrfico de pontos para a varivel "p.a.p.".
19/48
Grfico de pareto
uma juno entre os grficos de barra e um grfico de linhas correspondente afrequncia acumulada. Neste caso, as categorias devem ser colocados em ordemdecrescente pela frequncia (absoluta ou relativa).
muito utilizado em situaes que envolve controle de qualidade cujo o intuito apriorizao dos problemas.
Segundo Pareto, 80% das consequncias advm de 20% das causas, ou seja, h muitosproblemas sem importncia diante de outros mais graves.
20/48
Aplicao
5. Em uma determinada fbrica de brinquedos foifeito um levantamento durante uma semana a cercade um mesmo tipo de briquedo com o intuito deverificar quais eram os principais defeitos queocorriam durante a fabricao. Os dados seencontram no seguinte link:http://nbcgib.uesc.br/lec/download/R/dados/salvendy.txt. Elabore umgrfico de pareto.
21/48
http://nbcgib.uesc.br/lec/download/R/dados/salvendy.txt22/48
SNTESE DE DADOS QUANTITATIVOS
No caso de variveis discretas, h duas possibilidades de apresentao tabular.
Do mesmo modo de variveis qualitativas,
Utilizando a tcnica para variveis contnuas,
-
-
Quando h muitas categorias, a apresentao tabular do mesmo modo que variveisqualitativas no ser muito til, j que, o objetivo sintetizar, como podemos observarno exemplo a seguir:
24/48
Categoria Freq. absoluta Freq. relativa Freq. relativa(%) Freq. acumulada Freq. acumulada (%)
11 1 0.02 2 1 2
13 3 0.06 6 4 8
16 4 0.08 8 8 16
17 6 0.12 12 14 28
18 7 0.14 14 21 42
19 2 0.04 4 23 46
20 1 0.02 2 24 48
21 5 0.10 10 29 58
22 6 0.12 12 35 70
23 5 0.10 10 40 80
24 3 0.06 6 43 86
25 3 0.06 6 46 92
26 2 0.04 4 48 96
27 1 0.02 2 49 98
28 1 0.02 2 50 100
25/48
No caso de variveis contnuas, so necessrios alguns passos para elaborar a tabela dedistribuio de frequncias:
Ordenar os dados em ordem crescente
Determinar a amplitude dos dados
-
-
A = Xn X1
Determinar o nmero de classes da tabela (k). As metodologias so:-
Critrio de Sturges: , em que n o tamanho da amostra.- k = 1 + nlog2
26/48
- Critrio de Scott:
, em que a amplitude da classe (maior valor menos o menor) e o desviopadro.
Critrio de Freedman-Diaconis:
, em que a amplitude inter-quartlica (3 quartil menos o 1 quartil)
-
k =A
3.49 s n1/3
A s
-
k =A
2 IQR n1/3
IQR
27/48
- Determinar o limite inferior da primeira classe:
- Determinar o limite superior da ltima classe:
- Determinar o comprimento das classes:
Li = | |/100X1 X1
Ls = + | |/100Xn Xn
h = (Ls Li)/k
O pacote fdth (Faria et al. 2014) elabora uma tabela de distribuio de frequnciasutilizando a teoria abordada anteriormente.
28/48
http://cran.r-project.org/web/packages/fdth/index.htmlAplicao
6. Uma caracterstica importante da qualidade dagua a concentrao de material slidosuspenso. A seguir, esto 20 medies de slidossuspensos de um certo lago. Construa uma tabelade distribuio de frequncias. 42,4 65,7 29,858,7 52,1 55,8 57,0 68,7 67,3 67,3 54,3 54,073,1 81,3 59,9 56,9 62,2 69,9 66,9 59,0
29.8 42.4 52.1 54.0 54.3 55.8 56.9 57.0 58.7 59.0
59.9 62.2 65.7 66.9 67.3 67.3 68.7 69.9 73.1 81.3
Ordenando os dados de modo crescente.
29/48
Determinando o nmero de classes pelo critriode Sturges.
n = 20k = 1 + (n)log2k = 5, 32 6
Determinando os limites inferior e superior.
Li = 29, 8 = 29, 5029, 8
100
Ls = 81, 3 + = 82, 1181, 3
100
30/48
Intervalode classes
Freq.absoluta
Freq.relativa
Freq.relativa(%)
Freq.acumulada
Freq.acumulada(%)
[29.5,38.27) 1 0.05 5 1 5
[38.27,47.04) 1 0.05 5 2 10
[47.04,55.81) 4 0.20 20 6 30
[55.81,64.58) 6 0.30 30 12 60
[64.58,73.34) 7 0.35 35 19 95
[73.34,82.11) 1 0.05 5 20 100
Determinando o comprimento de cada classe.
h = = 8, 7782, 11 29, 5
6
Portanto teremos a seguinte tabela:
31/48
APRESENTAO GRFICA
Dentre os grficos existentes para variveis contnuas ser apresentado os maisimportantes que so o histograma, o polgono de frequncias e a ogiva.
33/48
Histograma
O histograma um grfico utilizado para plotar as frequncias absolutas em funo dasclasses provenientes de uma tabela de distribuio de frequncias.
O histograma tambm um estimador da distribuio de probabilidade da varivel emestudo. Neste caso, utiliza-se a densidade ao invs da frequncia absoluta ou relativa,uma vez que, a rea correspondente aos retngulos devem somar um, que o espaoamostral.
A densidade calculada como: densidade = frequncia relativa h-
34/48
Neste grfico, as barras so justapostas. Destaca-se:
A forma da varivel, ou seja, sua distribuio de probabilidade.
O grau de simetria da varivel, que pode ser classificada em simtrica, assimtrica direita ou assimtrica esquerda.
-
-
35/48
Aplicao
7. Aproveitando os dados da aplicao 6 elabore umhistograma.
Percebamos que na varivel sp a distribuio classificada como assimtric