50
Estatística Prof.R.Dyodi Rua Basílio da Gama, 98 (próximo ao metrô República) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 1 Sumário Introdução .................................................................................................................................... 2 Capítulo 1 - Estatística Descritiva ............................................................................................ 4 1.1. Frequências ..................................................................................................................... 4 1.2. A “chave do sucesso”: saber diferenciar o tipo de exercício ................................... 5 1.3. Medidas de Posição ou Medidas de Tendência Central para dados em rol ......... 7 1.4. Medidas de Dispersão ................................................................................................. 17 1.5. Propriedades das medidas de posição e de dispersão .......................................... 23 1.6. Medidas de Posição ou Medidas de Tendência Central para dados agrupados 28 1.7. Ramo e folhas ............................................................................................................... 39 1.7. Quantis e Box-Plot ........................................................................................................ 41 1.8. Variância Conjunta ....................................................................................................... 46 1.9. Média Conjunta ............................................................................................................. 49

Estatística Descritiva

Embed Size (px)

DESCRIPTION

Robson Dyodi

Citation preview

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 1

    Sumrio Introduo .................................................................................................................................... 2

    Captulo 1 - Estatstica Descritiva ............................................................................................ 4

    1.1. Frequncias ..................................................................................................................... 4

    1.2. A chave do sucesso: saber diferenciar o tipo de exerccio ................................... 5

    1.3. Medidas de Posio ou Medidas de Tendncia Central para dados em rol ......... 7

    1.4. Medidas de Disperso ................................................................................................. 17

    1.5. Propriedades das medidas de posio e de disperso .......................................... 23

    1.6. Medidas de Posio ou Medidas de Tendncia Central para dados agrupados 28

    1.7. Ramo e folhas ............................................................................................................... 39

    1.7. Quantis e Box-Plot ........................................................................................................ 41

    1.8. Varincia Conjunta ....................................................................................................... 46

    1.9. Mdia Conjunta ............................................................................................................. 49

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 2

    Introduo

    Ol caros colegas concurseiros, Meu nome Robson Dyodi e terei o prazer de auxili-los neste estudo de estatstica.

    Para quem no me conhece, sou bacharel em Cincias Econmicas formado pela Escola de Economia de So Paulo (EESP FGV). Anteriormente, cheguei a cursar 3 anos de engenharia na Escola Politcnica (POLI USP), mas decidi abandonar o barco por no me identificar com a rea. A minha trajetria com concursos iniciou-se em meados de 2009, quando decidi largar o emprego no mercado financeiro para buscar o meu ingresso no setor pblico. Fui aprovado neste mesmo ano no concurso para o cargo de Oficial de Justia (OJ TJSP) e continuei estudando para o meu objetivo maior: rea fiscal. Graas a Deus, consegui ser aprovado para os 2 ltimos concursos de auditor que ocorreram no Estado de So Paulo: ISS-SP 2012 e ICMS-SP 2013. Agora, tenho o desejo de ajudar todos aqueles que querem ingressar em algum fisco do pas. Atualmente, estou lecionando no curso Uniequipe em So Paulo.

    Como vocs podem perceber, eu no sou formado em estatstica! Apesar disso,

    sempre tive facilidade com nmeros e, como fui professor particular durante muitos anos, aprendi a observar as principais dificuldades dos alunos nas matrias de exatas. Quero ser sincero com vocs: no conheo toda a matria de estatstica e se o seu objetivo exigir conhecimentos mais profundos da matria, no sou a pessoa indicada. No entanto, se o seu objetivo for a rea fiscal, pode ter certeza de que estou apto a auxili-lo nesta jornada!

    Feita a minha apresentao, gostaria de bater um pequeno papo com vocs...Eu sei

    que estatstica no a matria preferida da maioria dos candidatos. Na verdade, diria que a matria mais odiada de todas. Para comear a nossa conversa, vamos aos fatos:

    ICMS-SP 2006: massacre na P1

    ICMS-SP 2009: massacre na P1

    ISS-SP 2012: massacre na P1 (o estrago s no foi maior porque tinham 30 questes de Direito Tributrio para pontuar facilmente)

    ICMS-SP 2013: massacre na P1

    Com a Internet a favor dos candidatos, no difcil de obter estes dados. Tambm no difcil perceber que as provas de portugus para a rea fiscal so de outro nvel. Sabendo disso, creio que deixar 10-15 pontos de lado algo muito arriscado a se fazer. Ao invs de considerar a estatstica como uma inimiga, por que no transform-la em aliada? Assim, se a prova se mostrar de um jeito diferente do esperado, bom ter um plano B na manga. Algumas questes de estatstica podem contribuir para que voc atinja o mnimo na P1 ou pontue mais do que a maioria dos concorrentes. Tentarei mostrar que a matria em questo no nenhum bicho de sete cabeas e que, diferentemente do que muitos comentam, as questes so relativamente rpidas de serem respondidas.

    As provas esto cada vez mais difceis, mas as notas de corte permanecem em nvel elevado. Em outras palavras, os candidatos esto se preparando melhor! Atualmente, temos vrios cursos em .pdf e em vdeo circulando na internet. Material de qualidade o que no falta. Assim, cabe a voc acompanhar essa evoluo. Todos querem passar, mas como dizem por a: passar exceo. Alm do desejo, devemos ter a atitude de buscar o nosso merecimento, de modo que a aprovao ser uma consequncia disso. Creio que o merecimento engloba estudar todas as matrias, mesmo aquelas das quais no gostamos!

    Dito isto, vamos iniciar nossos estudos. A estatstica pode ser dividida em 3 grupos:

    Estatstica descritiva

    Probabilidade

    Inferncia Estatstica

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 3

    Saber diferenciar estes 3 grupos de extrema importncia para o sucesso na questo. Na maioria das vezes, o candidato no consegue resolver a questo porque no sabe por onde comear. Segregando os ramos da estatstica, conseguimos buscar a soluo do problema mais rapidamente.

    A estatstica descritiva consiste basicamente no resumo de dados. No importa se os

    dados se originem de uma amostra ou de uma populao (temas estudados na inferncia estatstica), o objetivo apenas resumi-los.

    A probabilidade consiste em quantificar a chance de ocorrer determinado evento, ou

    seja, definir um valor para a chance de o evento ocorrer. A inferncia estatstica consiste em tirar uma concluso sobre uma populao atravs

    dos dados de uma amostra. Muitas vezes difcil analisar a populao inteira, ento colhida uma amostra e a partir dela conclui-se algo sobre a populao.

    Iniciaremos agora nossos estudos sobre estatstica descritiva.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 4

    Captulo 1 - Estatstica Descritiva Suponha que seu chefe lhe entregue as seguintes informaes num pedao de papel e pea para voc analis-las: 6 9 10 11 5 7 Difcil, no? O que ele quer que eu faa?!

    Agora suponha que no pedao de papel estava escrito o seguinte: nmero de processos analisados nos ltimos seis meses: 6 9 10 11 5 7 Agora a tarefa ficou mais simples. Basta ir at a sala do chefe e dizer: Chefinho, nos ltimos seis meses, a mdia de processos analisados foi de 8 processos por ms. O estudo da estatstica descritiva muito parecido com o exemplo acima. Dado uma varivel (idade, altura, salrio,...) e um conjunto de dados relativos a esta varivel, devemos buscar um meio de resumir todos estes dados, como por exemplo, a mdia. Mas este resumo no se limita ao clculo da mdia, existem vrias outras medidas-resumo que so cobradas em provas de concurso pblico. Estudaremos cada uma delas. Mas, antes de iniciar os estudos sobre medidas-resumo, devemos entender o que frequncia. 1.1. Frequncias Saber o que frequncia e quais so os seus tipos fundamental para o estudo de qualquer dos ramos da estatstica, pois elas sempre so utilizadas. Dificilmente elas sero cobradas de forma direta, mas o conhecimento deste assunto pr-requisito para a resoluo das provas. Mas o que frequncia na estatstica?

    Na estatstica, frequncia possui o mesmo significado que utilizamos no dia a dia. Com que frequncia voc vai ao cinema por ms? Com que frequncia voc estuda contabilidade por semana? Com que frequncia voc come junk food por semana? Frequncia est relacionada a quantas vezes. Simples assim.

    Observe o seguinte conjunto de dados: 1 1 1 1 2 2 3 Podemos dizer que o nmero 1 possui frequncia igual a 4, ou seja, aparece quatro

    vezes neste conjunto de dados. Do mesmo modo, podemos dizer que o nmero 2 possui frequncia igual a 2 e o nmero 3 possui frequncia igual a 1.

    Comearemos com um exemplo. Imagine que um questionrio sobre remunerao seja

    feito para todos os 50 funcionrios de uma empresa e que o resultado tenha sido o seguinte:

    Salrios N de funcionrios

    R$2000 10

    R$3000 25

    R$4000 15

    Total = 50 funcionrios

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 5

    De acordo com a tabela acima, correto dizer que 10 funcionrios recebem o valor de dois mil reais, 25 funcionrios recebem o valor de trs mil reais e 15 funcionrios recebem o valor de quatro mil reais.

    As frequncias so teis para mostrar a proporo de elementos em cada classe, qual a classe com mais elementos, etc. As frequncias simples so designadas pela letra f e as frequncias acumuladas pela letra F. Observe a seguinte tabela:

    N de

    funcionrios

    Frequncia

    simples

    absoluta (f)

    Frequncia

    simples

    relativa (f)

    Frequncia

    acumulada

    absoluta (F)

    Frequncia

    acumulada

    relativa (F)

    R$2000 10 10 10/50 = 20% 10 10/50 = 20%

    R$3000 25 25 25/50 = 50% 35 35/50 = 70%

    R$4000 15 15 15/50 = 30% 50

    50/50 =

    100% = 1

    Total = 50

    funcionrios

    Total = 50

    funcionrios

    Total = 100%

    = 1

    A frequncia simples absoluta indica quantos elementos do conjunto existem em cada classe. A frequncia simples relativa indica, em cada classe, a proporo de elementos em relao ao total. A frequncia acumulada absoluta indica quantos elementos existem at aquela classe. Assim, no exemplo acima, existem 35 indivduos que recebem at trs mil reais. A frequncia acumulada relativa indica a proporo de elementos em relao ao total que esto dentro da classe ou abaixo dela. Assim, 70% dos indivduos recebem no mximo at trs mil reais. Dica1: Sempre que aparecer a palavra relativa, estamos tratando de uma proporo, ou seja, devemos dividir pelo total. Sempre que aparecer a palavra acumulada, estamos tratando dos elementos que esto na classe ou abaixo dela, ou seja, devemos somar todos os elementos at aquela classe. Dica2: Observe que a soma das frequncias relativas sempre ser igual a 1. Esta informao ser necessria em alguns tipos de exerccio. Observao 1: note que para utilizarmos as frequncias acumuladas (absoluta ou relativa), as classes devem estar ordenadas em ordem crescente.

    1.2. A chave do sucesso: saber diferenciar o tipo de exerccio

    Assim como em todas as disciplinas do seu concurso, em estatstica de extrema

    importncia que voc saiba o que fazer para resolver o exerccio assim que bater o olho na questo. Muitos candidatos perdem um tempo precioso lendo e relendo o enunciado vrias vezes para descobrir como solucionar o problema.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 6

    Sendo assim, sempre que possvel, tentarei mostrar como identificar cada tipo de exerccio. Em questes que cobram estatstica descritiva, a chave do sucesso saber identificar e diferenciar os dois tipos de dados abaixo:

    Qual a diferena entre as duas tabelas acima? Na tabela localizada esquerda, sabemos exatamente quantos processos foram analisados por dia. Dos 250 dias em anlise, em 20 dias somente um processo por dia foi analisado. Em 30 dias, foram analisados dois processos por dia, e assim por diante. Na tabela localizada direita, sabemos que 10 funcionrios recebem um salrio maior ou igual a R$1500 e menor que R$2500, mas no sabemos dizer quanto exatamente cada um deles recebe. Note que, se quisermos realizar algum clculo com os dados da tabela direita, devemos fazer algum tipo de suposio, pois no temos os dados exatos. Por outro lado, na tabela esquerda, no ser necessrio fazer suposies. Os dados esquerda so chamados de dados em rol e os dados direita so chamados de dados agrupados. Para lembrar isso, note que os dados direita esto agrupados em intervalos de valores. importante saber que os mesmo dados utilizados acima podem ser representados de maneira grfica. Observe o caso dos dados em rol, de modo que a tabela e o grfico significam a mesma coisa:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 7

    Agora, observe o caso dos dados agrupados, de modo que a tabela e o grfico representam a mesma coisa:

    Perceberam a diferena nos grficos? Eles so muito parecidos, mas note que, quando trabalhamos com dados em rol, as colunas possuem um espaamento entre elas. Por outro lado, quando trabalhamos com dados agrupados, as colunas no possuem espaamento. Assimiladas estas informaes, podemos avanar na matria.

    1.3. Medidas de Posio ou Medidas de Tendncia Central para dados em rol

    Tratam-se das medidas que buscam resumir, simplificar, todo o conjunto de dados. As principais medidas so: mdia aritmtica, moda e mediana.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 8

    Imagine que 5 lutadores foram pesados para uma competio e os dados obtidos foram os seguintes: Lutador 1: 70 kg Lutador 2: 80 kg

    Lutador 3: 90 kg Lutador 4: 90 kg Lutador 5: 100 kg A mdia aritmtica a soma de todos os dados dividida pelo nmero de observaes.

    Em termos algbricos:

    No nosso exemplo, a mdia igual a

    Repetindo: para calcular a mdia aritmtica, devemos sempre somar todos os valores

    do conjunto de dados e dividir pelo tamanho do conjunto de dados. A moda representa o valor que aparece com mais frequncia no conjunto de dados. No

    nosso exemplo, temos que o valor da moda igual a 90 kg (aparece duas vezes). Observao 1: no exemplo acima, temos apenas um valor da moda. Dizemos ento que o conjunto de dados unimodal. Se houvessem 2 valores da moda, nosso conjunto de dados seria bimodal, e assim por diante. Ex: 1 2 2 3 3 3 4 4 4 5 6. A moda representada pelos nmeros 3 e 4 (aparecem trs vezes).

    A mediana representa o valor que ocupa a posio central do conjunto de dados, ou seja, divide o conjunto de dados em partes iguais. No nosso exemplo, o valor da mediana igual a 90 kg (3 posio). Cabe ressaltar que, para obtermos a mediana, os valores devem estar ordenados.

    Uma observao deve ser feita: no exemplo acima, temos 5 observaes, logo a mediana representada pelo valor que ocupa a 3 posio (temos 2 valores direita e 2 valores esquerda). No entanto, o que acontece se o nmero de observaes for par? Vamos analisar o seguinte conjunto de dados:

    1 2 3 4 5 6

    A mediana no pode ser igual a 3, pois neste caso teramos dois valores esquerda e trs valores direita. Da mesma forma, a mediana no pode ser igual a 4, pois teramos trs valores esquerda e dois valores direita. E agora, o que fazer?

    Quando estivermos trabalhando com dados em rol e o nmero de observaes for um nmero par, devemos pegar os dois elementos centrais e fazer a mdia entre eles. Assim, no nosso exemplo, a mediana ser igual mdia entre 3 e 4, ou seja, ser igual a 3,5.

    Resumindo: A mdia obtida somando-se todos os valores e dividindo o resultado pelo tamanho do banco de dados. Moda o valor com maior frequncia (aquele que mais se repete). Mediana o elemento central do banco de dados, quando eles estiverem ordenados.

    Exerccio Resolvido sobre medidas de posio:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 9

    (ESAF - 2009 - Sefaz SP APOF) Determine a mediana das seguintes observaes: 17, 12, 9, 23, 14, 6, 3, 18, 42, 25, 18, 12, 34, 5, 17, 20, 7, 8, 21, 13, 31, 24, 9. a) 13,5 b) 14 c) 17 d) 15,5 e) 14,5 Letra C Resoluo: Como dissemos na explicao terica, para obtermos a mediana os dados devem estar ordenados. Assim, teremos o seguinte:

    3, 5, 6, 7, 8, 9, 9, 12, 12, 13, 14, 17, 17, 18, 18, 20, 21, 23, 24, 25, 31, 34, 42.

    11 elementos 11 elementos

    Como temos 23 observaes, a mediana o valor que ocupa a 12 posio, de modo que existem 11 elementos sua esquerda e 11 elementos sua direita. Portanto, a mediana igual a 17.

    O exerccio no cobra a moda, mas, aproveitando a questo, podemos dizer que o

    conjunto de observaes tetramodal, pois apresenta 4 valores para a moda: 9, 12, 17 e 18.

    Exerccio resolvido sobre medidas de posio: (ESAF - 2009 - Receita Federal Auditor) Considere a seguinte amostra aleatria das idades em anos completos dos alunos em um curso preparatrio. Com relao a essa amostra, marque a nica opo correta: 29, 27, 25, 39, 29, 27, 41, 31, 25, 33, 27, 25, 25, 23, 27, 27, 32, 26, 24, 36, 32, 26, 28, 24, 28, 27, 24, 26, 30, 26, 35, 26, 28, 34, 29, 23, 28. a) A mdia e a mediana das idades so iguais a 27. b) A moda e a mdia das idades so iguais a 27. c) A mediana das idades 27 e a mdia 26,08. d) A mdia das idades 27 e o desvio-padro 1,074. e) A moda e a mediana das idades so iguais a 27. Letra E Resoluo: Como o clculo da mediana faz parte da questo, a 1 coisa a ser feita ordenar os dados. Assim:

    23, 23, 24, 24, 24, 25, 25, 25, 25, 26, 26, 26, 26, 26, 27, 27, 27, 27, 27, 27, 28, 28, 28, 28, 29,

    29, 29, 30, 31, 32, 32, 33, 34, 35, 36, 39, 41. Temos 37 observaes e a mediana ser igual ao valor da 19 observao (existem 18 elementos esquerda e 18 elementos direita). Portanto, a mediana igual a 27.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 10

    O valor que aparece com mais frequncia igual a 27 (aparece 6 vezes no conjunto de dados). Ento, a moda tambm igual a 27. Sem precisar fazer mais contas, sabemos que a letra E est correta. Isso fica como dica para a hora da prova: calcule sempre a moda e a mediana em 1 lugar. A mdia s deve ser calculada se no for possvel resolver a questo s com as informaes da moda e da mediana.

    Exerccio resolvido sobre medidas de posio: (FCC - 2010 - Dnocs Administrador) Determinada carreira profissional, em um rgo pblico, apresenta 5 nveis de salrios com uma distribuio demonstrada no quadro abaixo.

    Se, com relao aos salrios desta carreira profissional, Me a mdia aritmtica, Md a mediana e Mo a moda correspondentes, tem-se que: (A) Me = Mo = Md (B) Me > Md e Mo > Md (C) Me > Mo e Mo = Md (D) Me < Md e Mo > Md (E) Me < Mo e Md = Mo Letra E Resoluo: Observando a tabela, percebemos que estamos diante de dados em rol. Alm disso, vemos que as alternativas tratam de mdia, moda e mediana. Em outras palavras, estamos diante de uma questo de estatstica descritiva. Devemos sempre encontrar o valor da moda e mediana em 1 lugar, pois mais rpido que o clculo da mdia. Moda: o valor que mais se repete. Assim sendo, percebemos que a moda igual a 2500, pois o valor com a maior frequncia. Mediana: o elemento central do conjunto de dados. Como o nmero total de elementos igual a 75, basta encontrarmos o elemento central, ou seja, o elemento na 38 posio. Ento, a mediana igual a 2500 tambm. Dyodi, como eu fao pra saber rapidamente qual o elemento central? Se o nmero total de elementos mpar, voc faz o seguinte: pegue o total de elementos (75) e some 1. Depois, divida por 2. sempre assim quando trabalhamos com dados em rol e o total de elementos impar. Conhecendo os valores da moda e mediana, conseguimos eliminar as alternativas B e D. Mas, para chegar na resposta, infelizmente teremos que calcular a mdia. Mdia: o valor ser obtido somando todos os dados e dividindo o resultado pelo total de elementos, que igual a 75. Agora, observe o seguinte: ao invs de somar 1500 dez vezes,

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 11

    no mais fcil multiplicar 10 por 1500? Ao invs de somar 2000 quinze vezes, no mais fcil multiplicar 2000 por 15? Utilizaremos esse mtodo a partir de agora

    A moda e a mediana possuem valores iguais a 2500 e a mdia menor do que 2500. Assim, a nica alternativa possvel a letra E.

    Exerccio resolvido sobre medidas de posio: (FCC - 2010 - Sefaz SP APOF) Em um setor de um rgo pblico realizado um levantamento com relao aos salrios de seus funcionrios administrativos. O resultado pode ser visualizado na tabela abaixo.

    Com relao a este levantamento e s medidas de posio, tem-se que (A) a mdia aritmtica, a mediana e a moda possuem o mesmo valor. (B) o valor da mdia aritmtica e o valor da mediana superam, cada um, o valor da moda em R$ 250,00. (C) o valor da moda superior ao valor da mdia aritmtica e tambm ao valor da mediana. (D) o valor da moda igual ao valor da mediana, porm supera o valor da mdia aritmtica. (E) a soma dos valores da mdia aritmtica, da mediana e da moda igual a R$ 7.250,00. Letra C Resoluo: Observando as alternativas e a tabela, percebemos que temos uma questo de estatstica descritiva com dados em rol. Moda: igual a 2500, pois o valor com a frequncia mais alta. Mediana: como o total de elementos igual a 50 (nmero par) temos que encontrar os dois elementos centrais e fazer a mdia entre eles. Neste caso, basta dividir 50 por 2 para achar o 1 elemento central, ou seja, o elemento na 25 posio. O 2 elemento central ser o prximo, ou seja, o elemento na 26 posio. O elemento na 25 posio igual a 2000 e o elemento na 26 posio igual a 2500. Assim sendo, a mediana igual a 2250. Sabendo que a moda maior do que a mediana, podemos eliminar as alternativas A, B e D. Mdia: devemos somar todos os elementos e dividir por 50, que o nmero total de elementos.

    Assim, a nica alternativa possvel a letra C.

    Vamos ver uma questo que cobra o conhecimento de grficos? Lembre-se de que no

    muda nada, s uma maneira diferente de organizar os dados.

    Exerccio resolvido sobre medidas de posio:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 12

    (FCC - 2010 - Sefin RO Auditor) Em uma cidade realizado um levantamento referente aos valores recolhidos de determinado tributo estadual no perodo de um ms. Analisando os documentos de arrecadao, detectou-se 6 nveis de valores conforme consta no eixo horizontal do grfico abaixo, em que as colunas representam as quantidades de recolhimentos correspondentes.

    Com relao s medidas de posio deste levantamento tem-se que o valor da (A) mdia aritmtica igual a metade da soma da mediana e a moda. (B) mdia aritmtica igual ao valor da mediana. (C) mdia aritmtica supera o valor da moda em R$ 125,00. (D) moda supera o valor da mediana em R$ 500,00. (E) mediana supera o valor da mdia aritmtica em R$ 25,00. Letra E Resoluo: Observando as alternativas e o grfico, vemos que se trata de uma questo de estatstica descritiva com dados em rol. Dyodi, s para relembrar, de onde voc tirou essa concluso? As alternativas falam sobre mdia, moda e mediana, ento sabemos que se trata de estatstica descritiva. Sabemos tambm que estamos trabalhando com dados em rol, porque as colunas esto espaadas, ou seja, sabemos exatamente quantos recolhimentos de R$500 foram feitos, assim como quantos recolhimentos de R$1000, etc. Moda: igual a 1500, pois o valor com a frequncia mais elevada. Basta observar qual coluna com a maior altura. Mediana: o total de elementos igual a 200 (nmero par). Devemos fazer a mdia entre o elemento na 100 e na 101 posio. Ambos os elementos so iguais a 1500, ento a mediana ser igual a 1500. Sabendo que a moda e a mediana so iguais a 1500, podemos eliminar somente a alternativa D. Mdia: devemos somar todos os elementos e dividir por 200.

    Conhecendo os trs valores, a nica alternativa possvel a letra E.

    Exerccio resolvido sobre medidas de posio:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 13

    (FCC - 2010 - TRF 4a - Analista Administrativo) Um levantamento realizado em um setor de um rgo pblico, durante 250 dias teis, forneceu a distribuio dos nmeros de processos analisados apresentada no grfico abaixo. No eixo horizontal constam as quantidades detectadas de processos e as colunas representam as respectivas quantidades de dias.

    Com relao a este levantamento, a mdia aritmtica (nmero de processos por dia), a mediana e a moda so iguais, respectivamente, a (A) 3,48; 3,50 e 4,00. (B) 3,48; 4,00 e 4,00. (C) 4,35; 3,50 e 3,50. (D) 4,35; 3,50 e 4,00. (E) 4,00; 4,00 e 4,00. Letra B Resoluo: Moda o valor que mais se repete. Basta observar que este valor aquele representado pela maior coluna, ou seja, a moda igual a 4. Assim, ficamos apenas com as alternativas B e E. Mediana o elemento central do conjunto de dados. Como estamos trabalhando com dados em rol, importante saber se o total de elementos um nmero par ou mpar. O total de elemento igual a 250, nmero par, portanto a mediana ser igual mdia aritmtica entre o 125 e o 126 elemento. Como ambos so iguais a 4, a mediana tambm ser igual a 4. Para calcularmos a mdia, devemos somar todos os valores e dividir pelo tamanho do banco de dados, ou seja, dividir por 250.

    A nossa resposta a letra B.

    Antes de dar prosseguimento na matria, gostaria de mostrar uma novidade que a FCC

    apresentou nas ltimas provas. O contedo o mesmo, mas mudaram um pouco a forma de cobrar a questo.

    Exerccio resolvido sobre medidas de posio: (FCC - 2012 - TRF 2a - Analista Estatstica)

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 14

    Em um perodo de 140 dias foi analisado o nmero de reclamaes registradas por dia em um guich de uma repartio pblica. Verificou-se que o nmero de dias ( ) em que ocorreram i reclamaes (0 i 6) pode ser obtido pela frmula:

    . A soma dos valores da mdia aritmtica, da mediana e da moda (nmero de reclamaes por dia), igual a (A) 10,4. (B) 10,9. (C) 11,4. (D) 12,0. (E) 12,6. Letra B Resoluo: Como resolver este tipo de questo? a mesma coisa, a diferena que a banca no nos forneceu diretamente a frequncia de cada um dos valores, de modo que teremos de construir a nossa tabela.

    Valor (i) Frequncia = 2 + 8 + 9

    0 - 0 + 0 + 9 = 9

    1 - 1 + 8 + 9 = 16

    2 - 4 + 16 + 9 = 21

    3 - 9 + 24 + 9 = 24

    4 - 16 + 32 + 9 = 25

    5 - 25 + 40 + 9 = 24

    6 - 36 + 48 + 9 = 21

    Moda: igual a 4, pois o valor com a frequncia mais alta. Mediana: como o nmero total de elementos igual a 140 (nmero par), devemos fazer a mdia entre os elementos na 70 e na 71 posio. O elemento na 70 posio igual a 3 e o elemento na 71 posio igual a 4. Assim, a mediana igual a 3,5. Mdia: devemos somar todos os elementos e dividir por 140.

    A soma dos 3 valores aproximadamente igual a 10,97 e a alternativa que melhor se encaixa a letra B.

    Alm da mdia aritmtica, existem outros tipos de mdia, tais como a harmnica e a

    geomtrica. Nas provas da FCC, no comum a cobrana de mdia harmnica ou de mdia geomtrica. No entanto, a ESAF costuma cobrar questes tericas sobre isso em provas. Por conta disso, devemos ter em mente a seguinte relao:

    A relao acima ser sempre verdadeira para qualquer conjunto de dados. A nica ocasio em que as 3 mdias so iguais ocorre quando os valores de todos os dados so iguais (por exemplo: 5 5 5 5 5).

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 15

    Dica: para decorar a relao acima, observe a ordem alfabtica (Aritmtica, Geomtrica e Harmnica). Note que a relao segue uma ordem alfabtica, de modo que a mdia aritmtica a maior.

    Exerccio resolvido sobre mdias aritmtica, geomtrica e harmnica: (ESAF - 2005 - Receita Federal Auditor) Assinale a opo que expresse a relao entre as mdias aritmtica ( ), geomtrica (G) e harmnica (H), para um conjunto de n valores positivos (X1, X2, ..., Xn):

    a) G H , com G = H = somente se os n valores forem todos iguais. b) G H, com G = = H somente se os n valores forem todos iguais. c) G H, com = G = H somente se os n valores forem todos iguais. d) H G , com H = G = somente se os n valores forem todos iguais. e) H G, com = H = G somente se os n valores forem todos iguais. Letra D Resoluo: Simples decoreba da relao acima.

    Para provas que no so especficas para o cargo de estatstico, garanto que o clculo

    da mdia harmnica no ser objeto de questo. No entanto, a FGV cobrou o clculo da mdia geomtrica em seu concurso para o ICMS/RJ em 2011. Como algo simples de aprender, creio que vale a pena conhecer a frmula:

    Vamos ver a questo mencionada?

    (FGV - 2011 - Sefaz RJ Auditor) Em uma repartio, foi tomada uma amostra do nmero de filhos de 4 funcionrios. O resultado foi {2, 1, 4, 2}. A mdia geomtrica simples dessa amostra (A) 2,25. (B) 1,75. (C) 2. (D) 2,4. (E) 2,5. Letra C Resoluo: Como temos 4 elementos, o valor de n igual a 4. Ento,

    Mdia geomtrica =

    Ainda sobre medidas de posio, devemos conhecer a noo de simetria. Simetria,

    segundo o dicionrio Aurlio, a correspondncia, em grandeza, forma e posio relativa, de partes situadas em lados opostos de uma linha ou plano mdio, ou, ainda, que se acham distribudas em volta de um centro ou eixo. Em outras palavras, h simetria quando os dois lados opostos a um centro, ou eixo, so iguais.

    Observe as posies da moda (Mo), mdia (Me) e mediana (Md) das distribuies de frequncia abaixo:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 16

    A distribuio simtrica fcil de lembrar. O problema recordar das diferenas entre as distribuies assimtricas. Para decorar as informaes das distribuies assimtricas, basta saber o seguinte:

    A moda sempre fica no topo da montanha; A mediana sempre fica no meio;

    A distribuio ser assimtrica positiva (ou direita) quando a cauda mais longa estiver na direita;

    A distribuio ser assimtrica negativa (ou esquerda) quando a cauda mais longa estiver na esquerda.

    Vamos ver como isso pode ser cobrado em provas?

    Exerccio resolvido sobre simetria: (FCC - 2009 - TJ AP - Analista Estatstica) Considere um conjunto de dados determinando uma curva de frequncia de uma distribuio estatstica unimodal. Verificando que se trata de uma curva assimtrica esquerda pode-se afirmar que: (A) O valor da mdia negativo. (B) Moda < Mediana < Mdia (C) Mdia < Mediana < Moda (D) Moda < Mdia < Mediana (E) Mediana < Moda < Mdia Letra C Resoluo: Se a curva assimtrica negativa, a moda deve ter o maior valor e a mdia o menor valor.

    Exerccio resolvido sobre simetria:

    (FCC - 2010 - TRT 8a - Analista Estatstico) A distribuio dos valores de um determinado atributo determina uma curva de freqncia unimodal. Com relao a uma distribuio com esta caracterstica, considere as seguintes informaes: I. A distribuio assimtrica direita caso se verifique moda < mediana < mdia. II. A distribuio assimtrica esquerda caso se verifique mediana < moda < mdia.

    III. Pelo coeficiente de assimetria de Pearson (A), definido como

    , se a mdia

    for superior a moda, ento a curva possui o ramo mais alongado direita. Est correto o que se afirma APENAS em (A) I. (B) II.

    Mo = Me = Md Mo Md Me Mo Md Me

    Mo < Md < Me Me < Md < Mo

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 17

    (C) I e II. (D) I e III. (E) II e III. Letra D Resoluo: Item I: Perfeito, basta lembrar que a distribuio simtrica positiva tem a cauda mais alongada para a direita. Item II: Item falso. Nas distribuio simtrica negativa, mdia < mediana < moda Item III: No precisava nem esquentar com a frmula. Se a mdia maior que a moda, temos uma distribuio simtrica positiva. Item correto.

    1.4. Medidas de Disperso

    Trata-se de medidas que buscam resumir, simplificar, a variabilidade do conjunto de dados. As medidas de disperso indicam se os valores esto prximos ou separados, uns dos outros. Observe: 1 conjunto de dados: 5 5 5 5 5 2 conjunto de dados: -10 0 25 3 conjunto de dados: 3 5 5 7 A mdia aritmtica dos trs conjuntos igual a 5, mas existe uma grande diferena entre eles. Notamos ento que apenas a mdia, ou qualquer outra medida de posio, no suficiente para descrever um conjunto de dados. Devemos tambm analisar a variabilidade das informaes. As principais medidas de disperso so: desvio mdio, varincia, desvio padro e coeficiente de variao. Em provas de concurso pblico, apenas as trs ltimas so cobradas, mas prefiro pecar pelo excesso e falaremos tambm sobre o desvio mdio. O desvio mdio, como o prprio nome diz, calcula a mdia dos desvios em relao mdia. Tome por exemplo o 3 conjunto de dados. A mdia aritmtica do conjunto igual a 5 e, portanto, devemos somar todos os desvios em relao a este valor e dividir pelo nmero de elementos. O clculo do desvio mdio fica assim:

    ( ) ( ) ( ) ( )

    ( )

    Note que o desvio mdio igual a zero, como acontece no 1 conjunto de dados. Mas note tambm que os 2 conjuntos diferem entre si significativamente. Por no ser uma boa medida de disperso, pois pode no refletir com transparncia as informaes, o desvio mdio no muito cobrado em provas de concurso. A varincia uma das medidas de disperso mais utilizadas e seu clculo se parece com o clculo do desvio mdio. A diferena que somamos os quadrados dos desvios ao invs de somarmos apenas os desvios. Isso faz com que no ocorra o problema acima. Vamos utilizar novamente o 3 conjunto de dados como exemplo. A varincia calculada da seguinte maneira:

    ( ) ( ) ( ) ( )

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 18

    ( )

    Observao 1: Existe uma outra forma de calcular a varincia que deve ser decorada! Repito: deve ser decorada! Muitos exerccios s podem ser resolvidos desta maneira. Esta 2 forma a seguinte:

    ( ) ( )

    (

    )

    Dica: Para no perder tempo na hora da prova, importante que o candidato saiba o que utilizar na resoluo do exerccio, assim que bater o olho no enunciado. Uma dica que funciona na grande maioria das vezes o seguinte: em relao ao clculo da varincia, sempre que o enunciado informar sobre valores de somatrios, devemos utilizar a 2 frmula.

    O desvio padro deriva da varincia e obtido atravs da raiz quadrada da varincia.

    Assim, no nosso exemplo, o desvio padro igual a .

    Notamos ento que, quanto mais prximo de zero for o valor da varincia ou do desvio padro, mais homogneo ser o conjunto de dados. Vamos ver uma questo que s pode ser resolvida atravs da 2 frmula?

    Exerccio resolvido sobre medidas de disperso: (FCC - 2012 - TRF 2a - Analista Estatstica) A soma dos quadrados dos valores dos elementos de uma populao de tamanho 20 igual a 65,6 e o respectivo desvio padro igual a 0,2. A mdia aritmtica dos elementos desta populao igual a (A) 0,8. (B) 1,2. (C) 1,8. (D) 2,4. (E) 3,0. Letra C Resoluo: Atravs do enunciado, encontramos as seguintes informaes:

    ; ;

    O 1 passo encontrar a varincia. Como o desvio padro igual a raiz quadrada da varincia, temos o seguinte:

    ( )

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 19

    A mdia obtida atravs da frmula:

    Como sabemos que n = 20, basta descobrir o valor de

    Para fazer isso, temos que aplicar a 2 frmula da varincia:

    (

    )

    Ento,

    ( )

    (

    )

    (

    )

    (

    )

    Assim, temos que a mdia igual a 36/20 = 1,8.

    Outra medida de disperso muito cobrada em provas o coeficiente de variao. O

    coeficiente de variao serve para comparar a disperso de diferentes distribuies. Imagine que voc tenha em mos um relatrio sobre 2 conjuntos de dados: peso de 100 barras de ao e peso de 100 melancias. As barras de ao podem variar 10 kg, 50 kg, etc. Por outro lado, as melancias iro variar 1kg, 2kg, etc. Ento, provavelmente a varincia das barras de ao ser maior que a varincia das melancias, mas isso no quer dizer que necessariamente as barras de ao possuem uma variabilidade maior que a das melancias. Dyodi, ficou confuso. Como assim?. Vamos visualizar o seguinte exemplo: Peso de trs bebs: 1kg; 2kg; 3kg Peso de trs homens adultos: 90kg; 100kg; 110kg Calcule a varincia dos dois conjuntos de dados acima. Voc vai perceber que a varincia dos pesos dos homens adultos maior do que a varincia dos pesos dos bebs. Mas, vamos parar e raciocinar um pouco. Pegue o elemento central de cada um dos dados e observe a variao para baixo e para cima. No caso dos bebs, variar 1kg em relao ao elemento central equivale a 50%. No caso dos homens adultos, variar 10kg em relao ao elemento central equivale a 10%. Pela lgica, a variabilidade dos bebs maior do que a variabilidade dos homens adultos! No entanto, o clculo da varincia diz o contrrio. E agora, qual o critrio para dizer qual conjunto de dados possui maior variabilidade? Pessoal, a lgica est certa. A variabilidade dos bebs maior do que a dos homens adultos. P Dyodi, ento pra que serve a varincia?!. A varincia serve para muitas coisas, mas no caso de comparao entre diferentes conjuntos de dados, a melhor medida o coeficiente de variao.

    Voltando ao exemplo dos bebs e dos homens adultos, teremos os seguintes dados:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 20

    Bebs:

    Homens adultos:

    Realizando o clculo do coeficiente de variao:

    Bebs:

    Homens adultos:

    Percebam que ao utilizarmos o critrio do coeficiente de variao, chegamos na mesma concluso que a lgica. Para ficar claro: ao comparar conjuntos de dados, devemos utilizar o coeficiente de variao, e no a varincia ou desvio padro! Observao 2: o coeficiente de variao uma medida de disperso relativa, pois depende do valor de outras duas medidas (desvio padro e mdia aritmtica). Alm disso, o coeficiente de variao uma medida adimensional. Estas informaes podem ser cobradas em questes tericas.

    Exerccio resolvido sobre medidas de disperso: (FCC - 2012 ISS SP - Auditor) Considere as seguintes afirmaes: I. (suprimido) II. O coeficiente de variao uma medida de disperso relativa que depende da unidade de medida da varivel que est sendo analisada. III. (suprimido) IV. (suprimido) Est correto o que se afirma APENAS em (A) I e II. (B) I e III. (C) II e IV. (D) I. (E) II e III. Letra D Resoluo: A 1 parte de enunciado est correta, pois o coeficiente de variao uma medida de disperso relativa. No entanto, a 2 parte no est correta, pois o coeficiente de variao uma medida adimensional, isto , no tem dimenso, grandeza nenhuma. Ao dizer que o coeficiente de variao depende da unidade de medida da varivel que esta sendo analisada, o enunciado se torna incorreto. Portanto, o item II est errado e podemos eliminar 3 alternativas.

    Exerccio resolvido sobre medidas de disperso: (FGV - 2008 - Sefaz RJ Auditor) Uma companhia utiliza um sistema de avaliao de desempenho de seus funcionrios por meio de dois indicadores de performance: Qualidade das tarefas e a Tempestividade com que as tarefas so realizadas. Os funcionrios receberam, na ltima avaliao, as medidas indicadas na tabela a seguir:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 21

    Com base na tabela, correto afirmar que: (A) a mdia aritmtica no uma boa medida para representar a performance dos funcionrios em face do elevado nvel de disperso das avaliaes. (B) as avaliaes da Qualidade foram mais dispersas do que as avaliaes da Tempestividade. (C) as avaliaes da Qualidade foram mais homogneas do que as da Tempestividade. (D) os funcionrios demoram mais para realizar as tarefas, mas a qualidade das tarefas melhor. (E) nada se pode afirmar Letra C Resoluo: Aprendemos que para comparar a variabilidade, a homogeneidade, de 2 conjuntos diferentes de dados, no podemos olhar para a varincia ou desvio padro, mas devemos olhar para o coeficiente de variao. Como o coeficiente de variao da tempestividade maior do que o da qualidade, podemos concluir que os dados da tempestividade so mais dispersos que os da qualidade.

    Exerccio resolvido sobre medidas de disperso: (FCC - 2012 - TRE SP - Analista Estatstica) Considere duas variveis X e Y representando o peso (em kg) e a altura (em cm), respectivamente, dos 100 scios de um clube. Em um censo realizado neste clube, foram apurados os seguintes resultados:

    e so o peso e a altura, respectivamente, do i-simo scio (i = 1, 2, 3, . . . ,100). Est correto afirmar que o coeficiente de variao de (A) X maior que o coeficiente de variao de Y. (B) X igual a 9%. (C) Y igual a 10%. (D) X igual metade do coeficiente de variao de Y. (E) Y ter seu valor modificado caso seja alterada em seu clculo a unidade de medida de centmetro para metro. Letra D Resoluo: Como o enunciado cobra o valor do coeficiente de variao, devemos ter mente o que devemos buscar para encontrar a soluo: o valor do desvio padro e o valor da mdia. O valor da mdia obtida facilmente atravs da frmula:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 22

    Agora, para achar o valor do desvio padro devemos primeiro encontrar o valor da varincia. Como o exerccio fornece o valor de somatrios, devemos aplicar a 2 frmula da varincia.

    ( )

    ( )

    ( )

    ( )

    Assim,

    Exerccio resolvido sobre medidas de disperso: (FCC - 2011 - Infraero - Analista Superior Administrador) Seja X a varivel que representa o valor dos salrios, em nmero de salrios mnimos, de todos os 100 funcionrios de uma empresa.

    Sabe-se que e que

    ( ) O coeficiente de variao de X (A) 0,30 (B) 0,325 (C) 0,35 (D) 0,375 (E) 0,39 Letra D Resoluo: Sabemos que para calcular o coeficiente de variao, precisamos apenas dos valores da mdia e do desvio padro. A mdia facilmente calculada pela diviso do somatrio de todos os valores pelo nmero total de elementos:

    O desvio padro calculado atravs da raiz quadrada da varincia. Assim, resta-nos calcular o valor da varincia. Utilizando a 2 frmula da varincia:

    Ento:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 23

    Exerccio resolvido sobre medidas de disperso: (FCC 2013 Sefaz SP Auditor) Considere: I. O coeficiente de variao de uma varivel uma medida de disperso absoluta que o resultado da diviso entre a mdia e o desvio padro da varivel em questo. II. (suprimido) III. O desvio padro mais apropriado do que o coeficiente de variao quando se deseja comparar a variabilidade de duas variveis. IV. (suprimido) Est correto o que se afirma APENAS em (A) I. (B) II. (C) III. (D) I e IV. (E) IV. Letra E Resoluo: Por enquanto, vamos analisar somente os itens que tratam de estatstica descritiva. Os outros itens sero trabalhados no decorrer do curso. Item I: percebemos dois erros na afirmativa. Em 1 lugar, o coeficiente de variao uma medida de disperso relativa, e no absoluta. Em 2 lugar, ele o resultado da diviso entre o desvio padro e a mdia, e no o inverso. Item III: para comparar a variabilidade entre conjuntos de dados, vimos que o coeficiente de variao uma melhor medida. Assim, j poderamos eliminar rapidamente as alternativas A, C e D.

    1.5. Propriedades das medidas de posio e de disperso

    Observe o seguinte conjunto de dados:

    {3,5,5,7}

    Fazendo os clculos, encontramos as seguintes medidas de posio e de variabilidade:

    Mdia = 5; Moda = 5; Mediana = 5;

    Varincia = 2; Desvio padro = ; Coef. Variao =

    O que acontece com essas medidas se adicionarmos o nmero 3 para todos os

    elementos?

    {6,8,8,10}

    Fazendo o clculo, encontramos as novas medidas:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 24

    Mdia = 8; Moda = 8; Mediana = 8;

    Varincia = 2; Desvio Padro = ; Coef. Variao =

    Atravs deste exemplo, podemos observar a seguinte propriedade:

    Ao somarmos um nmero a todos os elementos de um conjunto de dados, as novas medidas de posio ficam acrescidas de .

    Ao somarmos um nmero a todos os elementos de um conjunto de dados, a varincia e o

    desvio padro ficam inalterados.

    E o que acontece se multiplicarmos todos os nmeros por 3?

    {9,15,15,21}

    Fazendo o clculo, encontramos as novas medidas:

    Mdia = 15; Moda = 15; Mediana = 15;

    Varincia = 18; Desvio Padro = ; Coef. Variao =

    Atravs deste exemplo, podemos observar a seguinte propriedade:

    Ao multiplicarmos um nmero a todos os elementos de um conjunto de dados, as novas medidas de posio ficam multiplicadas por .

    Ao multiplicarmos um nmero a todos os elementos de um conjunto de dados, a

    varincia fica multiplicada por e o desvio padro fica multiplicado por . Ao multiplicarmos um nmero a todos os elementos de um conjunto de dados, o

    coeficiente de variao no se altera.

    E o que acontece com as medidas de posio (no iremos analisar as medidas de

    variabilidade neste caso) se incluirmos no conjunto de dados um elemento de valor muito discrepante? {3,5,5,7,1000}

    Fazendo o clculo, encontramos as novas medidas:

    Mdia = 204; Moda = 5, Mediana 5;

    Atravs deste exemplo, podemos observar a seguinte propriedade:

    Quando um valor muito discrepante includo num conjunto de dados, a moda e a mediana no so muito afetadas, por este motivo so consideradas medidas robustas. Por outro lado, a mdia ser muito afetada pelo valor discrepante.

    Vamos ver como essas propriedades so cobradas em provas?

    Exerccio resolvido sobre propriedades das medidas-resumo: (FCC - 2012 ISS SP - Auditor) Considere as seguintes afirmaes: I. (suprimido) II. (suprimido) III. Dentre as medidas de posio central, a mdia considerada uma medida robusta pelo fato de no ser afetada por valores aberrantes.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 25

    IV. (suprimido) Est correto o que se afirma APENAS em (A) I e II. (B) I e III. (C) II e IV. (D) I. (E) II e III. Letra D Resoluo: A mdia muito afetada por valores discrepantes, ao contrrio do que diz a afirmativa. A mediana e a moda podem ser consideradas medidas robustas, mas no a mdia. O item III est errado.

    Exerccio resolvido sobre propriedades das medidas-resumo: (FCC - 2007 - MPU - Analista Estatistica) Dados os conjuntos de nmeros P = {0, 1, 2, 3, 4, 5} e Q = {220, 225, 230, 235, 240, 245}, pode-se afirmar, de acordo com as propriedades da mdia, que a mdia dos elementos de Q igual a (A) constante 220 somada ao produto da mdia dos elementos de P por 5. (B) mdia dos elementos de P mais a constante 220. (C) mdia dos elementos de P multiplicada por uma constante arbitrria. (D) mdia dos elementos de P mais a constante 220 e esse ltimo resultado multiplicado por 5. (E) mdia dos elementos de P mais a constante 200. Letra A Resoluo: Devemos calcular a mdia dos 2 conjuntos e comparar com as alternativas. A mdia do conjunto P igual a

    Do modo como est escrito no enunciado, o clculo da mdia de Q envolveria nmeros muito grandes. Ento, podemos utilizar as propriedades da mdia para calcular a mdia do conjunto Q: Subtraindo 220 de todos os elementos do conjunto, temos o seguinte: Q = {0,5,10,15,20,25} A mdia de Q igual a

    Como Q igual ao conjunto Q adicionado de 220, para todos os elementos, a mdia de Q igual a

    Logo, a nica alternativa verdadeira a letra A.

    Exerccio resolvido sobre propriedades das medidas-resumo:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 26

    (FCC - 2010 - Dnocs Administrador) A mdia aritmtica e a varincia dos salrios dos empregados em uma fbrica so iguais a R$1.500,00 e 22.500 ( ) , respectivamente. Para todos os empregados foi concedido um reajuste de 8% e posteriormente um adicional fixo de R$ 180,00. O coeficiente de variao, aps o reajuste e o adicional concedidos, igual a (A) 5%. (B) 6%. (C) 8%. (D) 9%. (E) 10%. Letra D Resoluo: Em 1 lugar, devemos colocar no papel quais foram as alteraes: 1 evento: Todos os elementos do conjunto de dados foram multiplicados por 1,08 (cuidado! O salrio aumentou, ento no podemos multiplicar por 0,08). 2 evento: A todos os elementos do conjunto de dados, adicionou-se o valor 180. De acordo com as propriedades estudadas, teremos o seguinte aps o reajuste: Por fim, aps o adicional: Ento, o coeficiente de variao aps os 2 eventos ser igual a:

    Exerccio resolvido sobre propriedades das medidas resumo: (FCC - 2006 - Sefaz SP Auditor) Considerando as respectivas definies e propriedades relacionadas s medidas de posio e de variabilidade, correto afirmar: (A) Concedendo um reajuste de 10% em todos os salrios dos empregados de uma empresa, tem-se tambm que a respectiva varincia fica multiplicada por 1,10. (B) Definindo coeficiente de variao (CV) como sendo o quociente da diviso do desvio padro pela respectiva mdia aritmtica (diferente de zero) de uma seqncia de valores, tem-se ento que CV tambm poder ser obtido dividindo a correspondente varincia pelo quadrado da mdia aritmtica. (C) Subtraindo um valor fixo de cada salrio dos funcionrios de uma empresa, tem-se que o respectivo desvio padro dos novos valores igual ao valor do desvio padro dos valores anteriores. (D) Dividindo todos os valores de uma seqncia de nmeros estritamente positivos por 4, tem-se que o respectivo desvio padro fica dividido por 2. (E) Em qualquer distribuio de valores em estudo, a diferena entre a mediana e a moda sempre diferente de zero. Letra C

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 27

    Resoluo: Alternativa A: um reajuste de 10% em todos os salrios significa que estamos multiplicando todos os valores do conjunto de dados por 1,1. Cuidado! Um reajuste quer dizer que o salrio est aumentando, ento este nmero tem que ser maior do que 1. Lembrando das propriedades, sabemos ento que a varincia ser multiplicada por 1,21, ou seja, 1,1 ao quadrado.Item incorreto. Alternativa B: se dividirmos a varincia pelo quadrado da mdia, teremos o seguinte:

    ( )

    Coeficiente de variao no a mesma coisa que o quadrado do coeficiente de variao. Portanto, item incorreto. Alternativa C: perfeito! A soma ou a subtrao no interfere no valor da varincia ou desvio padro. Este o gabarito. Alternativa D: se dividirmos todos os elementos por 4, o desvio padro tambm ser dividido por 4. Item incorreto. Alternativa E: em outras palavras, o enunciado est dizendo que a moda e a mediana nunca podem ter valores iguais. Alternativa absurda. Percebam que mesmo se voc ficar em dvida em algumas alternativas, quem estudou sabe que a alternativa C est correta. Esta questo poderia ser facilmente resolvida em questo de segundos! Numa P1 de rea fiscal, isso pode fazer toda a diferena...

    Exerccio resolvido sobre propriedades:

    (FCC - 2010 - TRF 4a - Analista Administrativo) A mdia dos salrios dos funcionrios em uma repartio pblica igual a R$ 1.800,00, com um coeficiente de variao igual a 10%. Um reajuste de 20% em todos os salrios implica que, aps o reajuste, o valor (A) do novo desvio padro fica igual a R$ 198,00.

    (B) da nova varincia fica igual a 39.204 ( ) . (C) da nova varincia fica igual a 32.400 ( ) . (D) do novo desvio padro fica igual a R$ 324,00.

    (E) da nova varincia fica igual a 46.656 ( ) . Letra E Resoluo: Inicialmente, temos as seguintes informaes:

    Um reajuste de 20% significa que o salrio aumentou em 20%, ou seja, multiplicaremos todos os salrios por 1,2.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 28

    Assim, o novo desvio padro e a nova varincia so iguais a:

    A alternativa correta a letra E.

    Agora, vamos resumir algumas informaes importantes num quadro comparativo sobre as medidas:

    Quadro - Resumo

    Tipo

    afetada

    por

    valores

    extremos?

    Somar a

    todos os

    elementos

    Subtrair de

    todos os

    elementos

    Multiplicar

    por

    todos os

    elementos

    Dividir por

    todos os

    elementos

    Mdia Posio Sim Somar Subtrair Multiplicar

    por

    Dividir por

    Moda Posio No Somar Subtrair Multiplicar

    por

    Dividir por

    Mediana Posio No Somar Subtrair Multiplicar

    por

    Dividir por

    Varincia Disperso

    Absoluta - Nada fazer Nada fazer

    Multiplicar

    por

    Dividir por

    Desvio

    Padro

    Disperso

    Absoluta - Nada fazer Nada fazer

    Multiplicar

    por

    Dividir por

    Coeficiente

    de

    Variao

    Disperso

    Relativa -

    O

    denominador

    acrescido

    de

    O

    denominador

    subtrado

    de

    Nada

    fazer

    Nada

    fazer

    1.6. Medidas de Posio ou Medidas de Tendncia Central para dados agrupados

    Agora que aprendemos sobre frequncia e medidas de posio, podemos entender como a FCC costuma cobrar suas questes sobre estatstica descritiva. A maioria das questes utiliza a tcnica chamada interpolao linear, que ser estudada neste tpico. Quando temos um grande nmero de observaes, pode ser difcil ou, at mesmo, desnecessrio lidar com os nmeros individuais. Nestes casos, o agrupamento dos dados em classes uma ferramenta muito til para se analisar o conjunto de dados. Por exemplo, suponha que uma cidade possua 1.000 habitantes e que desejamos descobrir a composio etria desta cidade. Aps uma pesquisa com todos os cidados, uma parte do resultado foi divulgada da seguinte forma:

    10 pessoas com menos de 1 ano de vida

    5 pessoas com 1 ano de vida

    4 pessoas com 2 anos de vida

    4 pessoas com 3 anos de vida

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 29

    10 pessoas com 4 anos de vida

    Supondo que existem pessoas com mais de 100 anos de vida, nossa pesquisa teria mais de 100 classes de dados a serem analisados. Uma forma de facilitar a anlise das informaes agrupar vrias classes em uma. Desta maneira, podemos dizer que existem 33 pessoas na cidade que possuem menos de 5 anos de idade. Uma outra classe poderia ser aquela na qual os indivduos possuem idade entre 5 e 9 anos, e assim por diante. Observe que podemos obter a mesma concluso sobre a composio etria com menos trabalho do que se tivssemos trabalhado com todas as 100 classes individualmente, pois assim s trabalhamos com 12 classes. Observe um possvel resultado da pesquisa:

    N de pessoas

    0 5 anos 33

    5 10 anos 167

    10 15 anos 40

    15 20 anos 60

    20 30 anos 100

    30 40 anos 150

    40 50 anos 50

    50 60 anos 80

    60 70 anos 20

    70 80 anos 90

    80 90 anos 110

    90 100 anos 100

    Total = 1000

    Quando trabalhamos com dados agrupados, devemos ter o seguinte cuidado. Um

    pessoa que possui exatamente 5 anos de vida, nem um dia a mais e nem um dia a menos, est em qual classe acima: na 1, na 2 ou em ambas?

    Pessoal, cada um dos valores do conjunto de dados pertence a somente uma classe! Um mesmo valor nunca estar presente em duas classes ao mesmo tempo! Ento, resta-nos saber se a pessoa com exatamente 5 anos de vida est na 1 ou na 2 classe.

    O sinal indica que o valor a sua esquerda pertence a esta classe, ou seja, a pessoa com exatamente 5 anos de vida pertence 2 classe de dados. Da mesma forma, a pessoa com 10 anos de vida pertence 3 classe de dados. A pessoa com 4 anos e 364 dias de vida pertence 1 classe, e assim por diante. Dizemos que os intervalos so fechados esquerda e abertos direita.

    Com os dados agrupados, isto , em intervalos, como podemos proceder para o clculo da moda, mdia e mediana? O problema reside no fato de haver perda de informaes sobre a distribuio dos valores dentro de cada classe. Por exemplo, sabemos que existem

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 30

    100 pessoas com idade entre 20 anos e 30 anos, mas no sabemos quantas possuem 20, quantas possuem 21, e assim por diante.

    Desta forma, saiba que quando os dados esto agrupados, ocorre perda de

    informaes. Este tipo de conhecimento pode ser cobrado em questes tericas. Agora, vamos aos clculos das medidas de posio!

    Em relao mdia, no h maiores dificuldades. A soluo considerar, para cada classe, o valor correto como sendo o ponto mdio de cada intervalo. Ento, no clculo da mdia, existem 33 pessoas com 2,5 anos, 127 pessoas com 7,5 anos, 50 pessoas com 12,5 anos, e assim por diante. A mdia deve ser calculada da seguinte maneira:

    Do mesmo modo que fizemos para os dados em rol, este mtodo utilizado quando

    trabalhamos com tabelas de frequncias por questes de praticidade. Se fssemos somar um a uma todos os elementos, teramos o seguinte:

    Ao invs de somarmos um a um todos os 1000 nmeros, podemos utilizar o mtodo acima para o clculo. Isso sempre ser possvel, desde que saibamos quais so as frequncias de cada valor.

    O mtodo vale tanto para frequncias simples absolutas como para frequncias

    simples relativas.

    Em relao moda, descobrir a classe modal tarefa simples: basta analisar qual a classe com maior frequncia. No nosso exemplo, a classe modal aquela na qual os indivduos possuem entre 30 e 40 anos. Neste ponto da matria o aluno deve se perguntar: mas e se a questo cobrar um valor exato da moda, possvel encontrar este valor? A resposta afirmativa. No entanto, este tipo de questo somente costuma ser cobrada em provas com especialidade em estatstica e, mesmo assim, a prpria questo fornece a frmula necessria para o clculo (frmula de Czuber, frmula de King ou frmula de Pearson). Desta maneira, no estudaremos questes sobre o valor exato da moda para dados agrupados.

    Em relao mediana, a ideia utilizar o mtodo da interpolao linear. Este tipo de

    questo a preferida pelos examinadores da FCC. Relembrando os conceitos, a mediana o valor que ocupa a posio central entre os dados, dividindo o conjunto de dados em partes iguais.

    Ento, no nosso exemplo, temos 1000 habitantes e deveramos encontrar os valores

    que ocupam a 500 e a 501 posio e fazer a mdia aritmtica entre eles. Isso seria o correto se estivssemos trabalhando com dados em rol. Como estamos trabalhando com dados agrupados, basta apenas encontrar o valor que ocupa a 500 posio!

    Dyodi, no entendi. Qual a diferena? Por que no precisamos encontrar o valor na

    501 posio e fazer a mdia entre os dois valores?. Voc concorda comigo que, como os dados esto agrupados, ocorreu perda de informaes e estamos trabalhando com um monte de suposies? Pois ento, se no temos os dados exatos e estamos supondo vrias coisas, no faz sentido tentar buscar uma exatido para o clculo da mediana. Basta encontrarmos o valor na 500 posio e pronto. E como vamos proceder?

    33x 167x 40x 60x 100x 150x 50x 80x 20x 90x 110x 100x

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 31

    N de pessoas

    0 5 anos 33

    5 10 anos 167

    10 15 anos 40

    15 20 anos 60

    20 30 anos 100

    30 40 anos 150

    40 50 anos 50

    50 60 anos 80

    60 70 anos 20

    70 80 anos 90

    80 90 anos 110

    90 100 anos 100

    Total = 1000

    O primeiro passo encontrar a classe onde a mediana est situada. Como a mediana

    ocupa a 500 posio, percebemos que ela est na classe em que os indivduos possuem entre 30 e 40 anos de idade. Agora, basta utilizar uma simples regra de trs para encontrar o valor da mediana:

    150 pessoas representam um intervalo de 10 anos (40 30 = 10) Queremos encontrar a idade da 100 pessoa desta classe (pois j temos 400 pessoas

    nas classes anteriores) Ento: 150 pessoas --------------------- 10 anos 100 pessoas --------------------- x anos

    A mediana igual a 30 + 6,7 = 36,7 anos.

    O mtodo utilizado chamado de interpolao linear. Vamos ver um exemplo que utiliza frequncias relativas ao invs de absolutas:

    Exerccio resolvido sobre interpolao linear: (FCC - 2011 - Infraero - Analista Superior Administrador) O departamento de pessoal de certa empresa fez um levantamento dos salrios de seus 200 funcionrios, em nmero de salrios mnimos, obtendo os resultados da tabela abaixo:

    400 pessoas

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 32

    Sejam: x = mdia dos salrios obtida atravs da tabela acima, utilizando os pontos mdios das classes como representantes dos valores de sua respectiva classe. Md = mediana dos salrios obtida pela tabela acima pelo mtodo da interpolao linear. O valor de x + Md, em nmero de salrios mnimos, dado por (A) 9,0 (B) 9,15 (C) 9,25 (D) 9,5 (E) 9,75 Letra B Resoluo: Para o clculo da mdia, vamos considerar o valor de cada intervalo como sendo igual ao ponto mdio da classe. Ento, o valor da 1 classe ser igual a 2, o valor da 2 classe ser igual a 4, o valor da 3 classe ser igual a 6 e o valor da 4 classe ser igual a 8,5. Como estamos trabalhando com frequncias relativas, a soma das frequncias ser sempre igual a 1 (=100%). O clculo da mdia fica assim:

    A mediana deve se obtida pelo mtodo da interpolao linear. O 1 passo descobrir em qual classe est o valor da mediana: como a mediana o valor que ocupa a posio central dos dados, 50% das observaes devem estar acima e 50% devem estar abaixo da mediana. Na 1 classe, j temos 20% das observaes. Na 2 classe, temos mais 40% das observaes. Ento, a mediana est na 2 classe. Como precisamos de apenas 30% das observaes (pois j temos 20% das observaes na classe anterior), devemos utilizar o mtodo da interpolao linear: - 40% das observaes representam um intervalo de 2 salrios mnimos - Queremos apenas 30% das observaes 40% ----------------------------- 2 salrios mnimos 30% ----------------------------- a Ento,

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 33

    Exerccio resolvido sobre interpolao linear: Para resolver s questes, considere a tabela de frequncias relativas abaixo, que mostra a distribuio dos valores arrecadados, em 2008, sobre determinado tributo, referente a um ramo de atividade escolhido para anlise. Sabe-se que: I. As frequncias absolutas correspondem s quantidades de recolhimentos, sendo as frequncias relativas do segundo e terceiro intervalos de classe iguais a x e y, respectivamente. II. A mdia aritmtica da distribuio, valor arrecadado por recolhimento, igual a R$ 3.350,00 (valor encontrado considerando que todos os valores includos num certo intervalo de classe so coincidentes com o ponto mdio deste intervalo).

    (FCC - 2009 - Sefaz SP Auditor)

    A porcentagem de recolhimentos com valores arrecadados maiores ou iguais a R$ 3.000,00 (A) 70% (B) 65% (C) 55% (D) 45% (E) 40% Letra C (FCC - 2009 - Sefaz SP Auditor)

    Utilizando o mtodo da interpolao linear, tem-se que o valor da respectiva mediana (A) R$ 3.120,00 (B) R$ 3.200,00 (C) R$ 3.400,00 (D) R$ 3.600,00 (E) R$ 3.800,00 Letra B Resoluo: Vamos resolver duas questes do concurso do ICMS-SP 2009 na sequncia. Como estamos trabalhando com frequncias relativas, sabemos que o total das frequncias deve ser igual a 1. Assim, a soma de x e y deve ser igual a 0,6. O enunciado forneceu outra informao: a mdia igual a 3350.

    Resolvendo a equao acima:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 34

    Agora, podemos resolver o sistema e encontrar os valores de x e y.

    O valor de x igual a 0,35 e o valor de y igual a 0,25. A 1 questo pede a porcentagem de valores maiores ou iguais a trs mil reais. Devemos ento somar as frequncias das trs ltimas classes, que ser igual a 0,55, ou 55%. A 2 questo pede o valor da mediana. Como estamos diante de dados agrupados, basta encontramos o valor que est na posio 0,5. Considerando as duas primeiras classes, temos 45% do total dos dados. Percebemos ento que a mediana est na 3 classe de dados. Utilizando o mtodo da interpolao linear: 25% dos dados representam um intervalo de 1000 reais 5% dos dados representam um intervalo de x reais 0,25 ---------- 1000 0,05 ---------- x x = 200 Assim, a mediana ser igual a:

    Assim como os dados em rol, os dados agrupados tambm podem ser cobrados em forma de grfico. Vimos no incio do captulo que isso ocorre quando as colunas esto coladas, sem nenhum espaamento entre elas. Este tipo de grfico conhecido como histograma. Mostrarei agora as duas maneiras de se cobrar histograma em provas. Observe que a nica diferena fica por conta dos valores no eixo Y.

    O grfico do lado esquerdo apresenta no eixo Y as frequncias simples absolutas.

    Neste caso, a frmula de resoluo igual ao que estava sendo feito at agora.

    Exerccio resolvido sobre histograma: (FCC - 2010 - Dnocs Administrador) Uma pesquisa realizada no mercado forneceu o histograma de frequncias absolutas abaixo, representando a distribuio dos preos unitrios de venda de determinada pea.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 35

    Considerando os intervalos de classe fechados esquerda e abertos direita, correto afirmar que (A) 20% dos preos da pea so superiores a R$ 5,00. (B) 50% dos preos da pea so maiores ou iguais a R$ 2,00 e inferiores a R$ 4,00. (C) 90% dos preos da pea so superiores a R$ 2,00. (D) 35% dos preos da pea so maiores ou iguais a R$ 1,00 e inferiores a R$ 3,00. (E) 80% dos preos da pea so maiores ou iguais a R$ 2,00 e inferiores a R$ 5,00. Letra B Resoluo: A 1 coisa a ser feita contar o total de observaes. Temos 10 observaes com preos entre R$1 e R$2, 15 observaes com preos entre R$2 e R$3, e assim por diante.

    Letra A existem 10 observaes com preos maiores do que R$5, ou seja, 12,5% das observaes. Item incorreto. Letra B existem 40 observaes com preos entre R$2 e R$4, ou seja 50% das observaes. Item correto. Letra C existem 70 observaes com preos superiores a R$2, ou seja 87,5% das observaes. Item incorreto. Letra D existem 25 observaes com preos entre R$1 e R$3, ou seja, 31,25% das observaes. Item incorreto. Letra E existem 60 observaes com preos entre R$2 e R$5, ou seja, 75% das observaes. Item incorreto.

    Exerccio resolvido sobre histograma:

    (FCC - 2006 - Sefaz SP Auditor) O histograma de freqncias absolutas, abaixo, demonstra o comportamento dos valores arrecadados de um determinado tributo, no ano de 2005, em uma regio a ser analisada:

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 36

    Observao: Considere que todos os intervalos de classe do histograma so fechados esquerda e abertos direita. Utilizando as informaes contidas neste histograma, calculou-se a mdia aritmtica destes valores arrecadados, considerando que todos os valores includos num certo intervalo de classe so coincidentes com o ponto mdio deste intervalo. Tambm calculou-se a mediana de tais valores pelo mtodo da interpolao linear. Ento, o mdulo da diferena entre a mdia aritmtica e a mediana igual a (A) R$ 100,00 (B) R$ 400,00 (C) R$ 800,00 (D) R$ 900,00 (E) R$ 1.000,00 Letra A Resoluo: Para calcular a mediana, precisamos saber qual o total de elementos, que 2000. Ento, precisamos descobrir qual o valor do elemento que est na 1000 posio. possvel perceber que este elemento est na 3 classe de dados, pois j temos 600 nas duas primeiras classe. Utilizando a tcnica da interpolao linear: 500 elementos representam um intervalo de 1000 reais 400 elementos representam um intervalo de x reais 500 ---------- 1000 400 ---------- x x = 800 mediana = 3000+800 = 3800 Resta-nos calcular a mdia:

    Assim, a diferena entre mdia e mediana igual a 100. Alternativa A.

    Por sua vez, o grfico no lado direito apresenta no eixo Y as densidades de frequncia.

    No se preocupe com a definio de densidade de frequncia, apenas saiba o seguinte: a frequncia relativa do intervalo igual amplitude do intervalo multiplicado pela densidade. Conhecendo as frequncias relativas, a questo pode ser resolvida de acordo com o contedo estudado at agora.

    Exerccio resolvido sobre histograma: (FCC - 2011 - Infraero - Analista Superior Estatstico) Os preos unitrios de venda de um determinado equipamento no mercado esto distribudos conforme representao do histograma abaixo. No eixo das ordenadas constam as respectivas densidades de frequncias em ( ) . Define-se densidade de frequncia de um intervalo de classe como sendo o quociente da diviso da respectiva frequncia relativa pela correspondente amplitude do intervalo.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 37

    Considerando os intervalos de classe fechados esquerda e abertos direita, obtm-se que a porcentagem dos preos unitrios, que so iguais ou superiores a R$ 3.000,00 e inferiores a R$ 8.000,00, corresponde a (A) 70%. (B) 60%. (C) 55%. (D) 40%. (E) 30%. Letra A Resoluo: A maneira mais simples de resolver exerccios de histograma com densidades de frequncia escrever a frequncia relativa de cada intervalo no prprio grfico. Para isso, devemos lembrar que a frequncia relativa do intervalo igual multiplicao entre a amplitude e a densidade do intervalo. 1 intervalo frequncia relativa = (3-1).0,075 = 15% 2 intervalo frequncia relativa = (6-3).0,100 = 30% 3 intervalo frequncia relativa = (8-6).0,200 = 40% 4 intervalo frequncia relativa = (9-8).0,100 = 10% 5 intervalo frequncia relativa = (10-9).0,050 = 5% Assim,

    Como o exerccio pede a frequncia relativa quando os preos so superiores a R$3000 e inferiores a R$8000, temos que somar 30% e 40%. A resposta igual a 70%.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 38

    Exerccio resolvido sobre histograma:

    (FCC - 2012 - TRF 2a - Analista Estatstica) Considere que a distribuio dos salrios dos funcionrios em um setor pblico est representada por um histograma conforme abaixo, em que no eixo vertical constam as densidades de frequncias, em ( ) . Densidade de frequncia de um intervalo de classe o resultado da diviso da respectiva frequncia relativa pela correspondente amplitude do intervalo.

    Considerando que todos os intervalos classe so fechados esquerda e abertos direita, a porcentagem P dos funcionrios que ganham no mnimo R$ 2.000,00 e menos que R$ 6.000,00 tal que (A) P 65%. (B) 65% < P 70%. (C) 70% < P 75%. (D) 75% < P 80%. (E) P > 80%. Letra C Resoluo: Vamos resolver da mesma forma que fizemos para o exerccio anterior: 1 intervalo frequncia relativa = (2000-1000).0,00010 = 10% 2 intervalo frequncia relativa = (4000-2000).0,00020 = 40% 3 intervalo frequncia relativa = (5000-4000).0,00025 = 25% 4 intervalo frequncia relativa = (6000-5000).0,00010 = 10% 5 intervalo frequncia relativa = (9000-6000).0,00005 = 15%

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 39

    A questo pede a porcentagem de funcionrios que ganham entre dois mil reais e seis mil reais, que igual a 75%. Assim, a nica alternativa correta a letra C.

    1.7. Ramo e folhas

    Trata-se de uma outra maneira de representar os dados em rol. Dificilmente cair na sua provas, mas, se cair, no podemos perder uma questo como essa. Observe o exemplo abaixo para entender o que este grfico de ramo e folhas:

    Peso em Kg

    5 1 1 2 3 6 8

    6 1 2 8 9

    7 1 2 2 3 3 3 4 5

    8 4 6 9

    9 0 8

    A ideia deste grfico apenas organizar os dados de uma outra maneira. Segundo ele, existem 2 pessoas com 51 kg, 1 pessoa com 52 kg, 1 pessoa com 53 kg, e assim por diante. Deste modo, podemos observar que existem 23 elementos do conjunto, que a mediana igual a 72 kg e que a moda igual a 73 kg.

    Exerccio resolvido sobre grfico de ramo e folhas: (FCC - 2009 - TJ AP - Analista Estatstica) O diagrama de ramo e folhas a seguir corresponde s idades dos 40 funcionrios de um setor de um rgo pblico em uma determinada data.

    Ramos Folhas

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 40

    A soma da mediana e da moda destas idades igual a (A) 67,0 (B) 66,5 (C) 66,0 (D) 65,5 (E) 65,0 Letra A Resoluo: Contando o nmero de folhas, observamos que existem 40 observaes. Como o nmero de observaes par, a mediana representa a mdia aritmtica entre o 20 e o 21 elementos.

    A moda, o elemento que aparece com mais frequncia, igual a 33. A soma da mediana e da moda igual a 67.

    Exerccio resolvido sobre ramo e folhas:

    (FCC - 2009 - TRE PI - Analista Estatstica) O diagrama de ramo e folhas abaixo corresponde s observaes das idades de 50 eleitores escolhidos aleatoriamente em uma determinada zona eleitoral:

    O valor do mdulo da diferena entre a mediana e a moda destas idades observadas (A) 0 (B) 3 (C) 10 (D) 14 (E) 16 Letra D Resoluo: Contando o nmero de folhas, notamos que temos 50 observaes.

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 41

    A moda, o valor que mais se repete, igual a 46 (aparece quatro vezes). Por sua vez, como o total de observaes um nmero par, a mediana representa a mdia aritmtica entre os elementos na 25 e 26 posies:

    Assim, a diferena entre moda e mediana igual a 14. Alternativa correta letra D.

    1.7. Quantis e Box-Plot

    O quantil uma palavra estranha para algo simples. Vamos voltar um pouco no tempo

    e nos lembrar da professora da 1 srie ensinando os alunos a fazer operaes de diviso. Se eu dividir o todo em quatro partes iguais, qual a parte que cabe a cada integrante de um grupo de quatro amigos? A resposta seria 1/4, certo? Perfeito. E, para dividir este todo em quatro partes iguais, quantas linhas divisrias eu tive que fazer? A resposta correta 3, e essas linhas divisrias so os chamados quartis.

    No caso acima, a 1 linha divisria, q(0,25), chamada de 1 quartil. Isso quer dizer

    que 25% dos dados esto abaixo deste valor. A 2 linha divisria, q(0,5), chamada de 2 quartil e quer dizer que 50% dos dados esto abaixo deste valor. Por fim, a 3 linha divisria, q(0,75), chamada de 3 quartil e 75% dos dados esto abaixo deste valor.

    Perceberam a lgica da coisa? A noo de quantis exatamente essa. Vamos em

    frente! Alm dos quartis, as provas s vezes perguntam sobre decis (decil no plural). quase a mesma coisa, mas agora estamos dividindo o todo em dez partes. Assim, q(0,1) chamado de 1 decil e representa a linha divisria que coloca 10% dos dados abaixo de tal valor. Do mesmo modo, q(0,2) o 2 decil, q(0,3) o 3 decil e assim por diante.

    q(0,25) = 1 quartil = q(0,5) = 2 quartil = mediana = q(0,75) = 3 quartil = q(0,1) = 1 decil

    q(0,2) = 2 decil

    q(0,3) = 3 decil, etc

    Uma das formas que as questes podem cobrar este tema atravs da interpolao linear. Suponha que queiramos analisar o Q.I. de 1100 pessoas de certa cidade e encontramos o seguinte resultado (normalmente, o valor do Q.I. de uma pessoa considerada normal varia entre 90 e 110 pontos):

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 42

    N de pessoas

    68 70 pontos 5

    70 80 pontos 50

    80 90 pontos 150

    90 100 pontos 350

    100 110 pontos 300

    110 120 pontos 150

    120 130 pontos 50

    130 140 pontos 30

    140 150 pontos 10

    150 160 pontos 5

    Total = 1100

    Suponha que a questo pea para voc encontrar o valor de q(0,25). Como resolv-la? Primeiramente, devemos saber que estamos atrs do valor no qual 25% dos dados fiquem abaixo deste valor. Como temos 1100 dados, queremos encontrar o valor da 275 posio. Ento, o 1 passo encontrar a classe na qual est tal valor. No nosso exemplo, esta classe seria de 90 a 100 pontos. Atravs da interpolao linear, temos o seguinte:

    350 pessoas representam um intervalo de 10 pontos

    Queremos encontrar a pontuao da 70 pessoa desta classe

    Ento: 350 pessoas ------------- 10 pontos 70 pessoas ------------- x pontos

    O valor de q(0,25) igual a 90 + 2 = 92 pontos. Percebam que no estamos vendo nada de novo, isto exatamente igual metodologia usada para os dados agrupados.

    Outra forma de cobrar os quantis atravs de um grfico chamado Box-Plot. Para construir este grfico devemos obter 3 valores: q(0,25), q(0,5) e q(0,75). O Box-Plot nos d uma noo da simetria ou assimetria dos dados, a posio central e se existem dados discrepantes (tambm chamados de outliers). O Box-Plot no diz nada sobre a mdia.

    Utilizando a interpolao linear, descobrimos que o valor de q(0,5) do nosso exemplo igual a 99,86 pontos e que o valor de q(0,75) igual a 109 pontos.

    O 1 passo determinar os valores dos 3 quantis acima num eixo (pode ser horizontal ou vertical, pois as bancas no do importncia para isso). Estes 3 valores formaro uma caixa com um risco no meio (no necessariamente na metade da caixa; a posio do risco ir depender da simetria dos dados). Note que o risco est levemente mais afastado para esquerda da caixa, pois q(0,50) est mais prximo de q(0,25) do que de q(0,75):

  • Estatstica Prof.R.Dyodi

    Rua Baslio da Gama, 98 (prximo ao metr Repblica) Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Pgina 43

    O 2 passo encontrar 2 valores que indicaro o limite superior e o limite inferior do Box-Plot. Para isso devemos ter em mente que:

    Limite inferior = ( )

    Limite superior = ( )

    Ok, mas o que distncia interquartil? Essa distncia apenas representa a

    subtrao entre q(0,75) e q(0,25), ou seja, a largura da caixa. Assim teramos o seguinte:

    O 3 passo verificar se existem dados que esto fora da caixa, mas que no ultrapassam os limites encontrados. Se existirem, devemos ligar os extremos da caixa at o ltimo valor dentro dos limites (isso deve ser feito tanto pa