Exercicio resolvidos

Embed Size (px)

Text of Exercicio resolvidos

  • Anlise da Informao Econmica e Empresarial Pg. 1

    Caderno de Exerccios Resolvidos

    Estatstica Descritiva

    Exerccio 1.

    A figura seguinte representa, atravs de um polgono integral, a distribuio do rendimento nas famlias dos alunos de duas turmas.

    Distribuio do rendimento Frequncias relativas acumuladas

    0,000,06

    0,34

    0,72

    0,00

    0,26

    0,60

    0,84

    1,00

    0,00

    0,25

    0,50

    0,75

    1,00

    0 100 200 300 400 500 600

    Contos/ms

    Turma BTurma A

    Calcule o ndice de Gini correspondente turma A.

    Classes Pmi fi fi*Pmi Fi ti Ti Fi - Ti0-100 50 0,0600 3 0,0600 0,0113 0,0113 0,0487

    100 - 200 150 0,2800 42 0,3400 0,1579 0,1692 0,1708200 - 300 250 0,3800 95 0,7200 0,3571 0,5263 0,1937300 - 600 450 0,2800 126 1,0000 0,4737 1,0000 0,0000

    Total (mdia aritm.) 266

    1,1200 0,4132

    0,3690

    1

    1

    n

    ii

    F

    =

    =1

    1( )

    n

    i ii

    F T

    =

    =1

    11

    1

    ( )n

    i ii

    n

    ii

    F T

    F

    =

    =

    =

  • Anlise da Informao Econmica e Empresarial Pg. 2

    Exerccio 2.

    Considere o quadro seguinte com as frequncias relativas simples associadas s distribuies A, B e C.

    Classe A B C

    0-50 0 0 0

    50-100 30 25 20

    100-150 50 40 60

    150-200 20 35 20

    200-250 0 0 0

    a) Represente as distribuies A, B, e C utilizando um histograma. Atravs da anlise das figuras, considera possvel indicar qual a que tem uma moda mais baixa? Em caso

    afirmativo, faa-o. Em caso negativo, explicite que elemento(s) lhe falta(m).

    0

    0,1

    0,2

    0,3

    0,4

    0,5

    0,6

    0 50 100 150 200 250 0

    0,1

    0,2

    0,3

    0,4

    0,5

    0,6

    0 50 100 150 200 250 0

    0,1

    0,2

    0,3

    0,4

    0,5

    0,6

    0 50 100 150 200 250 Em rigor quando temos dados classificados no sabemos qual , ou se existe a moda. A conveno que se faz a de admitir que a moda se encontra na classe modal e que a sua localizao dentro desta proporcional diferena entre a respectiva frequncia e as frequncias das classes adjacentes, estando a moda mais perto da classe que tem maior frequncia. No caso deste exerccio, verifica-se que a classe modal a mesma nas trs distribuies consideradas. Mas na distribuio A que a classe anterior apresenta a maior frequncia relativamente classe que se segue classe modal. Desta forma claro que essa distribuio A que apresenta a moda mais baixa.

    b) Considerando os valores apresentados qual a distribuio cujo valor para a mediana o mais baixo. Justifique utilizando o polgono integral de frequncias.

    0,00

    0,25

    0,50

    0,75

    1,00

    0 50 100 150 200

    AB

    C

    Mediana A =

  • Anlise da Informao Econmica e Empresarial Pg. 3

    A partir da anlise do polgono integral evidente que a distribuio A que tem a mediana mais baixa. Quando as distribuies no so muito assimtricas a moda, a mediana e a mdia esto relativamente prximas. Quando so simtricas as trs medidas coincidem: esse o caso da distribuio C onde a mdia est no centro do intervalo de variao e no centro da classe modal (125). Por outro lado a mdia o centro de gravidade da distribuio e a simples observao dos histogramas representados na alnea anterior permitiria dizer (i) que B tem uma mdia mais alta do que C (porque o peso da classe com valores mais elevados muito superior) e que (ii) a mdia de C necessariamente mais alta do que a mdia de A. Em distribuies regulares como estas a mediana est sempre entre a mdia e a moda. Isso permitiria dizer que tambm no caso da mediana a distribuio A que apresenta o valor mais baixo. Nota: Com base nos elementos fornecidos seria possvel calcular analiticamente o valor da mediana das diversas distribuies mas no era isso que se pedia no enunciado.

    c) Compare, apresentando e justificando todos os clculos, a disperso associada s trs distribuies. Na primeira (Distribuio A), a mdia de 120 e o desvio padro de 41,13;

    na segunda (Distribuio B), a mdia de 130 e o desvio padro de 39,52.

    A comparao da disperso das diversas distribuies deve fazer-se com base no coeficiente de variao. Para isso torna-se necessrio calcular a mdia e o desvio padro da distribuio C:

    Classes iPM if .i if PM 2( )i if PM x

    50 - 100 75 0,20 15 500 100 - 150 125 0,60 75 0 150 - 200 175 0,20 35 500

    Total (mdia aritm.) 125 Total (varincia) 1000 Desvio padro 31,6228

    A B C Desvio-padro 41,13 39,52 36,62 Mdia 120 130 125 Coef. Variao 34,3% 30,4% 29,3%

    V-se assim que a a distribuio C que apresenta a menor disperso tanto em termos absolutos (desvio padro) como relativos (coeficiente de variao).

    Exerccio 3.

    Considere o quadro seguinte onde se resume a estrutura etria da populao de uma regio de acordo com os censos de 1960 e 2001

    Escalo de idade 1960 2001

    0 10 19,7 12

    10 25 25,7 24,3

    25 40 21,5 21,1

    40 60 21,3 23,6

    60 80 11,8 19

    Total 100 100

  • Anlise da Informao Econmica e Empresarial Pg. 4

    a) Compare as duas distribuies no que respeita mdia e mediana, e discuta at que

    ponto h sinais de envelhecimento da populao.

    1960

    Classes iPM if .i if PM ( )iX PM ( )2iX PM ( )2.i iX PMf iF 0 - 10 5 0,197 0,9850 26,38 695,9044 137,0932 0,197

    10 - 25 17,5 0,257 4,4975 13,88 192,6544 49,5122 0,454 25 - 40 32,5 0,215 6,9875 -1,12 1,2544 0,2697 0,669 40 - 60 50 0,213 10,6500 -18,62 346,7044 73,8480 0,882 60 - 80 70 0,118 8,2600 -38,62 1491,5044 175,9975 1,000

    1 31,3800 436,7206 Mdia Aritm. 31,38 Varincia 436,7206 Desvio padro 20,90 Coef. Variao 66,6%

    2001

    Classes iPM if .i if PM ( )iX PM ( )2iX PM ( )2.i iX PMf iF 0 - 10 5 0,120 0,6000 31,81 1011,8761 121,4251 0,120

    10 - 25 17,5 0,243 4,2525 19,31 372,8761 90,6089 0,363 25 - 40 32,5 0,211 6,8575 4,31 18,5761 3,9196 0,574 40 - 60 50 0,236 11,8000 -13,19 173,9761 41,0584 0,810 60 - 80 70 0,190 13,3000 -33,19 1101,5761 209,2995 1,000

    Total 1 36,8100 9,05 2678,8805 466,3114 Mdia Aritm. 36,81 Varincia 466,3114 Desvio padro 21,59 Coef. Variao 58,7%

    Clculo da mediana

    11 1

    1

    0,5.( )gme g g g

    g

    FX L L L

    f

    = +

    1960 0,5 0,45625 .(40 25)0,215me

    X = + = 28,07

    2001 0,5 0,36325 .(40 25)0,211me

    X = + = 34,74

    A mdia e a mediana so medidas de localizao de tendncia central, que descrevem a

    distribuio de frequncias. O facto de ambas aumentarem de valor de forma significativa

    representa uma deslocao para a direita da distribuio de frequncias que traduz um claro

    envelhecimento da populao.

    b) Compare a disperso das duas distribuies com base num indicador de disperso relativo.

    A medida de disperso relativa mais habitual o coeficiente de variao que relaciona o

    desvio padro com a mdia. A importncia da distino entre disperso absoluta e relativa

    est bem ilustrada neste exemplo. De facto entre 1960 e 2001 o desvio padro das idades

  • Anlise da Informao Econmica e Empresarial Pg. 5

    passa de 20,9 anos para 22,6 anos (NB: importante notar que o desvio padro se

    expressa nas mesmas unidades da varivel original). Mas o aumento da disperso absoluta

    no acompanhado pelo aumento da disperso relativa, porque a mdia aritmtica (que

    est no denominador do coeficiente de variao) aumenta mais do que o desvio padro. Isto

    , relativamente, (ao valor da mdia) verifica-se uma diminuio da disperso das idades: o

    C.V passa de 67% para 59% .

    Uma medida alternativa de disperso relativa o quociente entre a amplitude do intervalo

    interquartil (AIQ) que , em si, uma medida de disperso absoluta e a mediana. Os

    clculos que a seguir se apresentam confirmam as concluses anteriores: aumenta a

    disperso absoluta e diminui a disperso relativa.

    1960

    1

    0, 25 0,19710 .(25 10) 13,090,257

    Q = + = 196030,75 0,66940 .(60 40) 47,61

    0,213Q = + =

    2001

    1

    0, 25 0,12010 .(25 10) 18,020,243

    Q = + = 200130,75 0,57440 .(60 40) 54,92

    0,236Q = + =

    Medida de disperso absoluta: Amplitude do intervalo interquartil (AIQ)

    1960 1960 19603 1

    2001 2001 20013 1

    AIQ 47,61 13,09 34,52

    AIQ 54,92 18,02 36,02

    Q Q

    Q Q

    = = =

    = = =

    Medida de disperso relativa: AIQ

    Mediana

    1960

    2001

    34,52 1,2328,07

    36,02 1,0634,74

    me

    me

    AIQX

    AIQX

    = =

    = =

    c) Elabore um polgono integral de frequncias para as duas distribuies e compare a situao a nvel de primeiro, segundo e terceiro quartil, deduzidos graficamente.

    O polgono integral de frequncias construdo com base nas frequncias acumuladas, que

    esto na ltima coluna dos quadros onde se apresentam os clculos. A sua grande

    vantagem permitir uma estimativa rpida dos quartis (incluindo a mediana que o segundo

    quartil). Note-se igualmente como a deslocao do polgono para a direita traduz o

    envelhecimento da populao. Admitindo que a populao era colocada por ordem de idades

    a uma dada percentagem da populao em 1960 corresponde em 2001, uma idade mais

    avanada. E isto acontece qualquer que seja a percentagem escolhida como referncia: as

    duas curvas nunca se cruzam.

  • Anlise da Informao Econmica e Empresarial Pg. 6

    0

    0,25

    0,5

    0,75

    1

    0 10 20 30 40 50 60 70 80

    19602001

    Q11960 Q12001 Q32001Q31960Mediana

    2001Mediana

    1960

    d) Elabore o diagrama