Sintetizando dados qualitativos e - .sobreposição de histogramas. ... Vamos agora colocar os polígonos

  • View
    212

  • Download
    0

Embed Size (px)

Text of Sintetizando dados qualitativos e - .sobreposição de histogramas. ... Vamos agora colocar os...

  • Sintetizando dados qualitativos equantitativosUniversidade Estadual de Santa Cruz

    Ivan Bezerra Allaman

  • Cronograma

    1. Dados qualitativos

    2. Dados quantitativos

    2/48

  • INTRODUO

  • Para sintetizarmos as informaes provenientes de dados qualitativos podem serutilizados tanto mtodos tabulares quanto mtodos grficos.

    Com relao ao mtodo tabular utiliza-se a distribuio de frequncia.

    Uma distribuio de frequncia um sumrio tabular de dados que mostra o nmero(frequncia) de itens em cada uma das diversas classes no sobrepostas.

    4/48

  • Itens de uma tabela de distribuio de frequncias

    Categoria ou classe no qual se est estudando;

    Frequncia absoluta: corresponde ao nmero de itens de cada categoria estudada;

    Frequncia acumulada: corresponde a frequncia acumulada na classe anterior mais afrequncia absoluta da classe atual;

    5/48

  • Frequncia relativa: equivale a frao ou proporo dos itens pertencentes aquela classe

    Frequncia relativa (%): a frequncia relativa multiplicada por 100;

    Frequncia acumulada (%): a frequncia relativa acumulada multiplicada por 100;

    Frequncia relativa- =Frequncia absoluta

    n

    6/48

  • Classes Freq.absoluta

    Freq.relativa

    Freq.relativa(%)

    Freq.acumulada

    Freq.acumulada(%)

    Visualizando-a:

    7/48

  • SINTETIZANDO DADOS QUALITATIVOS

  • Aplicao

    1. Uma pesquisa foi realizada com o intuito delevantar conhecimentos sobre o nvel deinstruo do chefe da casa, nas famliasresidentes no bairro Saco Grande II,Florianpolis - SC (Barbetta, 2012). Os dados seencontram no linkhttp://nbcgib.uesc.br/lec/download/R/dados/barbetta.txt

    9/48

    http://nbcgib.uesc.br/lec/download/R/dados/barbetta.txt
  • Classe Freq.absoluta

    Freq.relativa

    Freq.relativa(%)

    Freq.acumulada

    Freq.acumulada(%)

    Usa 78 0.65 65 78 65

    Nousa

    42 0.35 35 120 100

    Percebam que nesta base de dados h duasvariveis qualitativas: p.a.p (programa dealimentao popular) e instr. (grau deinstruo).

    A varivel p.a.p est na escala nominal einstr. na escala ordinal.

    Logo, a tabela de distribuio defrequncias se resume a:

    10/48

  • Classe Freq.absoluta

    Freq.relativa

    Freq.relativa(%)

    Freq.acumulada

    Freq.acumulada(%)

    nenhum 38 0.3167 31.67 38 31.67

    prgrau 38 0.3167 31.67 76 63.33

    seggrau 44 0.367 36.67 120 100.00

    Quando a varivel est na escala ordinal, coerente que as classes sejam apresentadasem sua ordem natural.

    No caso da varivel grau de escolaridadetem-se:

    11/48

  • APRESENTAO GRFICA

  • Dentre os diversos tipos de grficos existentes, ser abordado apenas os mais utilizadose, cujo as inforaes advm de uma tabela de distribuio de frequncias.

    Logo, sero apresentados os seguintes grficos: o grfico de barras, de setores, de pontose o grfico de pareto.

    13/48

  • Grfico de barras

    Normalmente utilizado para variveis qualitativas.

    A altura da coluna pode corresponder a frequncia absoluta, frequncia relativa oufrequncia percentual.

    A disposio das colunas pode ser tanto no sentido horizontal quanto vertical.

    14/48

  • Aplicao

    2. Aproveitando os dados da aplicao 1 elabore umgrfico de barras para a varivel "p.a.p.".

    Segue o grfico.

    15/48

  • Grfico de setores

    um tipo de grfico til quando se tem poucas categorias. Em geral, quando o nmerode categorias ultrapassa 6 a visualizao das categorias se torna difcil.

    A confeco do grfico manualmente nos dias atuais invivel devido a grandequantidade de recursos computacionais. No entanto, caso deseje fazer manualmente,dever ter o auxlio de um transferidor. O ngulo de cada setor, calculadomultiplicando a frequncia relativa por 360.

    16/48

  • Aplicao

    3. Utilizando ainda os dados da aplicao 1,elabore um grfico de setores para a varivel"grau de instruo".

    17/48

  • Grfico de pontos (Dot Chart)

    um tipo de grfico pouco conhecido e consequentemente pouco utilizado.

    No entanto, embora visualmente seja simples, extremamente til e eficaz quandocomparado aos grficos tradicionais de barra e de setores.

    18/48

  • Aplicao

    4. Considerando ainda a aplicao 1, elabore ogrfico de pontos para a varivel "p.a.p.".

    19/48

  • Grfico de pareto

    uma juno entre os grficos de barra e um grfico de linhas correspondente afrequncia acumulada. Neste caso, as categorias devem ser colocados em ordemdecrescente pela frequncia (absoluta ou relativa).

    muito utilizado em situaes que envolve controle de qualidade cujo o intuito apriorizao dos problemas.

    Segundo Pareto, 80% das consequncias advm de 20% das causas, ou seja, h muitosproblemas sem importncia diante de outros mais graves.

    20/48

  • Aplicao

    5. Em uma determinada fbrica de brinquedos foifeito um levantamento durante uma semana a cercade um mesmo tipo de briquedo com o intuito deverificar quais eram os principais defeitos queocorriam durante a fabricao. Os dados seencontram no seguinte link:http://nbcgib.uesc.br/lec/download/R/dados/salvendy.txt. Elabore umgrfico de pareto.

    21/48

    http://nbcgib.uesc.br/lec/download/R/dados/salvendy.txt
  • 22/48

  • SNTESE DE DADOS QUANTITATIVOS

  • No caso de variveis discretas, h duas possibilidades de apresentao tabular.

    Do mesmo modo de variveis qualitativas,

    Utilizando a tcnica para variveis contnuas,

    -

    -

    Quando h muitas categorias, a apresentao tabular do mesmo modo que variveisqualitativas no ser muito til, j que, o objetivo sintetizar, como podemos observarno exemplo a seguir:

    24/48

  • Categoria Freq. absoluta Freq. relativa Freq. relativa(%) Freq. acumulada Freq. acumulada (%)

    11 1 0.02 2 1 2

    13 3 0.06 6 4 8

    16 4 0.08 8 8 16

    17 6 0.12 12 14 28

    18 7 0.14 14 21 42

    19 2 0.04 4 23 46

    20 1 0.02 2 24 48

    21 5 0.10 10 29 58

    22 6 0.12 12 35 70

    23 5 0.10 10 40 80

    24 3 0.06 6 43 86

    25 3 0.06 6 46 92

    26 2 0.04 4 48 96

    27 1 0.02 2 49 98

    28 1 0.02 2 50 100

    25/48

  • No caso de variveis contnuas, so necessrios alguns passos para elaborar a tabela dedistribuio de frequncias:

    Ordenar os dados em ordem crescente

    Determinar a amplitude dos dados

    -

    -

    A = Xn X1

    Determinar o nmero de classes da tabela (k). As metodologias so:-

    Critrio de Sturges: , em que n o tamanho da amostra.- k = 1 + nlog2

    26/48

  • - Critrio de Scott:

    , em que a amplitude da classe (maior valor menos o menor) e o desviopadro.

    Critrio de Freedman-Diaconis:

    , em que a amplitude inter-quartlica (3 quartil menos o 1 quartil)

    -

    k =A

    3.49 s n1/3

    A s

    -

    k =A

    2 IQR n1/3

    IQR

    27/48

  • - Determinar o limite inferior da primeira classe:

    - Determinar o limite superior da ltima classe:

    - Determinar o comprimento das classes:

    Li = | |/100X1 X1

    Ls = + | |/100Xn Xn

    h = (Ls Li)/k

    O pacote fdth (Faria et al. 2014) elabora uma tabela de distribuio de frequnciasutilizando a teoria abordada anteriormente.

    28/48

    http://cran.r-project.org/web/packages/fdth/index.html
  • Aplicao

    6. Uma caracterstica importante da qualidade dagua a concentrao de material slidosuspenso. A seguir, esto 20 medies de slidossuspensos de um certo lago. Construa uma tabelade distribuio de frequncias. 42,4 65,7 29,858,7 52,1 55,8 57,0 68,7 67,3 67,3 54,3 54,073,1 81,3 59,9 56,9 62,2 69,9 66,9 59,0

    29.8 42.4 52.1 54.0 54.3 55.8 56.9 57.0 58.7 59.0

    59.9 62.2 65.7 66.9 67.3 67.3 68.7 69.9 73.1 81.3

    Ordenando os dados de modo crescente.

    29/48

  • Determinando o nmero de classes pelo critriode Sturges.

    n = 20k = 1 + (n)log2k = 5, 32 6

    Determinando os limites inferior e superior.

    Li = 29, 8 = 29, 5029, 8

    100

    Ls = 81, 3 + = 82, 1181, 3

    100

    30/48

  • Intervalode classes

    Freq.absoluta

    Freq.relativa

    Freq.relativa(%)

    Freq.acumulada

    Freq.acumulada(%)

    [29.5,38.27) 1 0.05 5 1 5

    [38.27,47.04) 1 0.05 5 2 10

    [47.04,55.81) 4 0.20 20 6 30

    [55.81,64.58) 6 0.30 30 12 60

    [64.58,73.34) 7 0.35 35 19 95

    [73.34,82.11) 1 0.05 5 20 100

    Determinando o comprimento de cada classe.

    h = = 8, 7782, 11 29, 5

    6

    Portanto teremos a seguinte tabela:

    31/48

  • APRESENTAO GRFICA

  • Dentre os grficos existentes para variveis contnuas ser apresentado os maisimportantes que so o histograma, o polgono de frequncias e a ogiva.

    33/48

  • Histograma

    O histograma um grfico utilizado para plotar as frequncias absolutas em funo dasclasses provenientes de uma tabela de distribuio de frequncias.

    O histograma tambm um estimador da distribuio de probabilidade da varivel emestudo. Neste caso, utiliza-se a densidade ao invs da frequncia absoluta ou relativa,uma vez que, a rea correspondente aos retngulos devem somar um, que o espaoamostral.

    A densidade calculada como: densidade = frequncia relativa h-

    34/48

  • Neste grfico, as barras so justapostas. Destaca-se:

    A forma da varivel, ou seja, sua distribuio de probabilidade.

    O grau de simetria da varivel, que pode ser classificada em simtrica, assimtrica direita ou assimtrica esquerda.

    -

    -

    35/48

  • Aplicao

    7. Aproveitando os dados da aplicao 6 elabore umhistograma.

    Percebamos que na varivel sp a distribuio classificada como assimtric