140
Caderno de Estatística I Dom Alberto Prof: Rosane de Fátima Worm C iências ontábeis ADMINISTRAÇÃO

Caderno Estat�stica - Rosane de F�tima Worm

Embed Size (px)

Citation preview

Page 1: Caderno Estat�stica - Rosane de F�tima Worm

Caderno de Estatística IDom Alberto

Prof: Rosane de Fátima Worm

Ciênciasontábeis

ADMINISTRAÇÃO

Page 2: Caderno Estat�stica - Rosane de F�tima Worm

C122 WORM, Rosane de Fátima

Caderno de Estatística I Dom Alberto / Rosane de Fátima Worm. – Santa Cruz do Sul: Faculdade Dom Alberto, 2010.

Inclui bibliografia.

1. Administração – Teoria 2. Ciências Contábeis – Teoria 3. Estatística I – Teoria I. WORM, Rosane de Fátima II. Faculdade Dom Alberto III. Coordenação de Administração IV. Coordenação de Ciências Contábeis V. Título

CDU 658:657(072)

Catalogação na publicação: Roberto Carlos Cardoso – Bibliotecário CRB10 010/10

Página 2

Page 3: Caderno Estat�stica - Rosane de F�tima Worm

Apresentação O Curso de Administração da Faculdade Dom Alberto iniciou sua

trajetória acadêmica em 2004, após a construção de um projeto pautado na importância de possibilitar acesso ao ensino superior de qualidade que, combinado à seriedade na execução de projeto pedagógico, propiciasse uma formação sólida e relacionada às demandas regionais.

Considerando esses valores, atividades e ações voltadas ao ensino sólido viabilizaram a qualidade acadêmica e pedagógica das aulas, bem como o aprendizado efetivo dos alunos, o que permitiu o reconhecimento pelo MEC do Curso de Administração em 2008.

Passados seis anos, o curso mostra crescimento quantitativo e qualitativo, fortalecimento de sua proposta e de consolidação de resultados positivos, como a publicação deste Caderno Dom Alberto, que é o produto do trabalho intelectual, pedagógico e instrutivo desenvolvido pelos professores durante esse período. Este material servirá de guia e de apoio para o estudo atento e sério, para a organização da pesquisa e para o contato inicial de qualidade com as disciplinas que estruturam o curso.

A todos os professores que com competência fomentaram o Caderno Dom Alberto, veículo de publicação oficial da produção didático-pedagógica do corpo docente da Faculdade Dom Alberto, um agradecimento especial.

Lucas Jost

Diretor Geral

Página 3

Page 4: Caderno Estat�stica - Rosane de F�tima Worm

PREFÁCIO

A arte de ensinar e aprender pressupõe um diálogo entre aqueles que

interagem no processo, como alunos e professores. A eles cabe a tarefa de

formação, de construção de valores, habilidades, competências necessárias à

superação dos desafios. Entre estes se encontra a necessidade de uma

formação profissional sólida, capaz de suprir as demandas de mercado, de

estabelecer elos entre diversas áreas do saber, de atender às exigências legais

de cada área de atuação, etc.

Nesse contexto, um dos fatores mais importantes na formação de um

profissional é saber discutir diversos temas aos quais se aplicam

conhecimentos específicos de cada área, dispondo-se de uma variedade ampla

e desafiadora de questões e problemas proporcionada pelas atuais

conjunturas. Para que isso se torne possível, além da dedicação daqueles

envolvidos no processo de ensino-aprendizagem, é preciso haver suporte

pedagógico que dê subsídios ao aprender e ao ensinar. Um suporte que

supere a tradicional metodologia expositiva e atenda aos objetivos expressos

na proposta pedagógica do curso.

Considerando esses pressupostos, a produção desse Caderno Dom

Alberto é parte da proposta pedagógica do curso da Faculdade Dom Aberto.

Com este veículo, elaborado por docentes da instituição, a faculdade busca

apresentar um instrumento de pesquisa, consulta e aprendizagem teórico-

prática, reunindo materiais cuja diversidade de abordagens é atualizada e

necessária para a formação profissional qualificada dos alunos do curso.

Ser um canal de divulgação do material didático produzido por

professores da instituição é motivação para continuar investindo da formação

qualificada e na produção e disseminação do que se discute, apresenta, reflete,

propõe e analisa nas aulas do curso. Espera-se que os leitores apreciem o

Caderno Dom Alberto com a mesma satisfação que a Faculdade tem em

elaborar esta coletânea.

Elvis Martins

Diretor Acadêmico de Ensino

Página 4

Page 5: Caderno Estat�stica - Rosane de F�tima Worm

Sumário

Apresentação

Prefácio

Plano de Ensino

Aula 1

Aula 2

Aula 3

Aula 4

Aula 5

Aula 6

Aula 7

Aula 8

Aula 9

Aula 10

Aula 11

Aula 12

Introdução a Estatística

Atividades

Distribuição de Freqüência

Representação Gráfica

Medidas de tendência central

A Mediana

Continuação Aula 6

Medidas de dispersão

Continuação Aula 8

Medidas de Posição

Coeficiente de Variação

Eventos Complementares

Página 5

10

84

90

96

108

113

116

118

124

125

129

138

6

4

3

Page 6: Caderno Estat�stica - Rosane de F�tima Worm

Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”.

Centro de Ensino Superior Dom Alberto

Plano de Ensino

Identificação Curso: Administração/Ciências Contábeis Disciplina: Estatística I

Carga Horária (horas): 60 Créditos: 4 Semestre: 2º

Ementa População e Amostra. Séries Estatísticas. Gráficos Estatísticos. Distribuição de Freqüência. Tipos de Médias. Medidas de Variabilidade. Medidas de Dispersão. Probabilidade.

Objetivos Geral: Desenvolver processos cognitivos e a aquisição de atitudes possibilitando o aluno a criar hábito de investigação e confiança para enfrentar situações novas e formar uma visão ampla e científica da realidade. Específicos: Compreender os conceitos de população, amostra e variável. Construir, ler, analisar e interpretar vários tipos de gráficos. Resolver problemas que envolvam os conceitos de estatística. Determinar a probabilidade de um evento num espaço amostra finito, independente da experimentação. Compreender e aplicar o conceito de distribuição binomial no cálculo de probabilidades.

Inter-relação da Disciplina Horizontal: As aplicações da disciplina são processadas de forma a adaptar o conhecimento teórico a uma situação prática e interdisciplinar ajustada a realidade dos negócios na economia brasileira. Vertical: Despertar o interesse do aluno na interpretação de dados com vista na utilização de instrumentos capazes de fornecer um conhecimento científico, no que se refere ao pleno entendimento e leitura de dados.

Competências Gerais Reconhecer e definir problemas, equacionar soluções, pensar estrategicamente, introduzir modificações no processo produtivo, atuar preventivamente, transferir e generalizar conhecimentos e exercer, em diferentes graus de complexidade, o processo da tomada de decisão; Desenvolver raciocínio lógico, crítico e analítico para operar com valores e formulações matemáticas presentes nas relações formais e causais entre fenômenos produtivos, administrativos e de controle, bem assim expressando-se de modo crítico e criativo diante dos diferentes contextos organizacionais e sociais;

Competências Específicas Identificar problemas específicos, da estatística descritiva, ler, compreender e interpretar dados. Coletar e organizar dados.

Habilidades Gerais Reconhecer e definir problemas, organizar, compreender e interpretar gráficos e demais dados estatísticos referentes a estatística descritiva.

Habilidades Específicas Conhecer métodos estatísticos para descrever, analisar e interpretar os dados referentes a estatística descritiva.

Conteúdo Programático PROGRAMA 1. Introdução a Estatística; 2. Natureza dos dados: variáveis quantitativas e qualitativas; variáveis discretas e contínuas; 3. População e Amostra; 4. Amostragem: conceitos e tipos;

Página 6

Page 7: Caderno Estat�stica - Rosane de F�tima Worm

Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”.

5. Dados absolutos e relativos; 6. Tabelas: conceitos; ROL; elementos essenciais; construção; 7. Séries estatísticas; 8. Gráficos: principais tipos; análise; histogramas; 9. Distribuição de freqüências: intervalos de classes; freqüências: absolutas, relativas e acumuladas; 10. Medidas de tendência central:

- Médias: aritmética, geométrica, ponderada e móvel - Mediana - Moda - Ponto médio.

11. Medidas de posição: - Escore z - Quartis, decis e percentis.

12. Medidas de variação: - Amplitude - Desvio-padrão - Variância.

13. Medidas de Assimetria e Curtose.. 14. Probabilidade:

- Experimentos - Espaço amostral - Eventos - Arranjos e Combinações.

15. Números índices

Estratégias de Ensino e Aprendizagem (metodologias de sala de aula) O planejamento do trabalho em sala de aula é à base da construção do processo de ensino e aprendizagem. Planejando a ação, o professor tem a possibilidade de saber exatamente qual o ponto de partida e o de chegada para cada tema abordado em seu curso. Um planejamento não é um esquema de trabalho rígido, inflexível. Pelo contrário, devem-se levar em conta as situações inesperadas que vão ocorrendo e adaptar ou modificar o que se havia inicialmente previsto, de acordo com suas observações de classe e necessidades dos alunos. Há metas que devem ser estabelecidas e alcançadas, sendo necessário que o professor disponha de um fio condutor para a ação que vai desenvolver e de uma previsão para os resultados dessa ação.

Avaliação do Processo de Ensino e Aprendizagem A avaliação do processo de ensino e aprendizagem deve ser realizada de forma contínua, cumulativa e sistemática com o objetivo de diagnosticar a situação da aprendizagem de cada aluno, em relação à programação curricular. Funções básicas: informar sobre o domínio da aprendizagem, indicar os efeitos da metodologia utilizada, revelar conseqüências da atuação docente, informar sobre a adequabilidade de currículos e programas, realizar feedback dos objetivos e planejamentos elaborados, etc. A forma de avaliação será da seguinte maneira: 1ª Avaliação – Peso 8,0 (oito): Prova; – Peso 2,0 (dois): Trabalho referente ao conteúdo ministrado até a 1a

2ª Avaliação avaliação.

- Peso 8,0 (oito): Prova; - Peso 2,0 (dois): referente ao Sistema de Provas Eletrônicas – SPE (maior nota das duas

provas do SPE) Observação: As provas do SPE deverão ser realizadas até o dia 30/09/2010 (1ª prova SPE) e até o dia 30/11/2010 (2ª prova SPE), sendo obrigatória a realização de ao menos uma prova.

Avaliação Somativa A aferição do rendimento escolar de cada disciplina é feita através de notas inteiras de zero a dez, permitindo-se a fração de 5 décimos. O aproveitamento escolar é avaliado pelo acompanhamento contínuo do aluno e dos resultados por ele obtidos nas provas, trabalhos, exercícios escolares e outros, e caso necessário, nas provas substitutivas. Dentre os trabalhos escolares de aplicação, há pelo menos uma avaliação escrita em cada disciplina no

Página 7

Page 8: Caderno Estat�stica - Rosane de F�tima Worm

Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”.

bimestre. O professor pode submeter os alunos a diversas formas de avaliações, tais como: projetos, seminários, pesquisas bibliográficas e de campo, relatórios, cujos resultados podem culminar com atribuição de uma nota representativa de cada avaliação bimestral. Em qualquer disciplina, os alunos que obtiverem média semestral de aprovação igual ou superior a sete (7,0) e freqüência igual ou superior a setenta e cinco por cento (75%) são considerados aprovados. Após cada semestre, e nos termos do calendário escolar, o aluno poderá requerer junto à Secretaria-Geral, no prazo fixado e a título de recuperação, a realização de uma prova substitutiva, por disciplina, a fim de substituir uma das médias mensais anteriores, ou a que não tenha sido avaliado, e no qual obtiverem como média final de aprovação igual ou superior a cinco (5,0).

Sistema de Acompanhamento para a Recuperação da Aprendizagem Serão utilizados como Sistema de Acompanhamento e Nivelamento da turma os Plantões Tira-Dúvidas que são realizados sempre antes de iniciar a disciplina, das 18h30min às 18h50min, na sala de aula.

Recursos Necessários Humanos

Professor. Físicos

Laboratórios, visitas técnicas, etc. Materiais

Recursos Multimídia.

Bibliografia

Básica CRESPO, Antônio Arnot. Estatística fácil. 18. ed. São Paulo: Saraiva, 2002. SILVA, Ermes Medeiros da. et al. Estatística: para cursos de economia, administração e ciências contábeis. São Paulo: Atlas, 1999. 1 e 2 v. MORETTIN, Pedro A; BUSSAB, Wilton de O. Estatística básica. 5. ed. São Paulo: Saraiva 2003. TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo: Atlas, 1995. SPIEGEL, Murray R. Estatística. 3. ed. São Paulo: Pearson Education, 1994.

Complementar BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 5. ed. Florianópolis: UFSC, 2002. MOORE, David. A Estatística básica e a sua prática. Rio de Janeiro: LTC, 2005. BUNCHAFT G.; KELLNER S. R. O. Estatística sem mistério. Petrópolis: Vozes; 1999. FONSECA, Jairo Simon da; MARTINS, Gilberto. Curso de estatística. São Paulo: Atlas, 1996. MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de estatística. São Paulo: Atlas, 1990.

Periódicos Jornais: Gazeta do Sul, Zero Hora. Revistas: Veja, Isto é.

Sites para Consulta http://www.mec.gov.br http://www.ime.usp.br http://www.ibge.gov.br

Outras Informações Endereço eletrônico de acesso à página do PHL para consulta ao acervo da biblioteca: http://192.168.1.201/cgi-bin/wxis.exe?IsisScript=phl.xis&cipar=phl8.cip&lang=por

Página 8

Page 9: Caderno Estat�stica - Rosane de F�tima Worm

Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”.

Cronograma de Atividades

Aula Consolidação Avaliação Conteúdo Procedimentos Recursos

1ª Apresentação do plano de ensino. Introdução a estatística. Natureza dos dados: tipos de variáveis; População e Amostra; AE QG, AP, DS

2ª Amostragem: conceitos e tipos; Dados absolutos e relativos; AE, TI AP, QG, DS

3ª Tabelas: conceitos; ROL; elementos essenciais; construção; Séries estatísticas; AE AP, QG, DS

4ª Gráficos: principais tipos; análise; histogramas; AE AP, QG, DS

5ª Distribuição de freqüências:intervalos de classes; freqüências: absolutas, relativas e acumuladas; AE AP, QG

6ª Distribuição de freqüências:intervalos de classes; freqüências: absolutas, relativas e acumuladas; AE, TI AP, QG

7ª Medidas de tendência central: Médias: aritmética, geométrica, ponderada e móvel PA, AE AP, QG

1 Consolidação 1. AE AP, QG

1 1ª Avaliação.

8ª Medidas de tendência central: Mediana; Moda; Ponto médio. AE AP, QG

9ª Medidas de posição: Escore z; Quartis, decis e percentis. AE AP, QG

10ª Medidas de variação: amplitude; desvio-padrão e variância. AE AP, QG

11ª Medidas de Assimetria e Curtose. Números índices. AE, TG AP, QG, DS

12ª Números índices. Probabilidade: Experimentos; Espaço amostral; Eventos; AE AP, QG, DS

13ª Probabilidade: Arranjos e Combinações. AE AP, QG

2 Consolidação 2. AE AP, QG

2 2ª avaliação.

3 Avaliação substituta.

Legenda Código Descrição Código Descrição Código Descrição AE Aula expositiva QG Quadro verde e giz LB Laboratório de informática TG Trabalho em grupo RE Retroprojetor PS Projetor de slides TI Trabalho individual VI Videocassete AP Apostila SE Seminário DS Data Show OU Outros PA Palestra FC Flipchart

Página 9

Page 10: Caderno Estat�stica - Rosane de F�tima Worm

MEDIDAS DE TENDÊNCIA CENTRAL

Depois de se fazer a coleta e a representação dos dados deuma pesquisa, é comum analisarmos as tendências queessa pesquisa revela. Assim, se a pesquisa envolve muitosdados, convém sintetizarmos todas essas informações a ummínimo de parâmetros que possam caracterizá-la. Essesparâmetros podem ser:

MEDIDAS DE TENDÊNCIA CENTRAL

Uma medida de tendência central é um valor no centro ou no meio de um conjunto de dados.

Página 10

Page 11: Caderno Estat�stica - Rosane de F�tima Worm

As medidas de posição mais importantes são as medidasde tendência central, que recebem tal denominação pelofato de os dados observados tenderem, em geral, a seagrupar em torno dos valores centrais. Dentre as medidasde tendência central, destacam-se as seguintes: Médiaaritmética, Moda e Mediana. Cada uma com um significadodiferenciado, porém tendo como serventia representar umconjunto de dados.

A maneira de se obter estas medidas é um poucodiferenciada dependendo de como os dados sãoapresentados. Eles podem vir de forma isolada (nãoagrupados) ou ainda ponderada (agrupados em intervalosou sem intervalo de classe, por ponto).

Página 11

Page 12: Caderno Estat�stica - Rosane de F�tima Worm

MEDIDAS DE TENDÊNCIA CENTRAL

MODA MEDIANA MÉDIA

Página 12

Page 13: Caderno Estat�stica - Rosane de F�tima Worm

Média: ponto de equilíbrio do conjunto.

Página 13

Page 14: Caderno Estat�stica - Rosane de F�tima Worm

Média Aritmética ( µ ou x )

É o quociente da divisão da soma dos valores da variável pelo número deles:

µ = ∑ xi ou X = ∑ xi N n

Sendo: µ ou x: média aritmética

Xi: valores da variável

n ou N: número de valores Página 14

Page 15: Caderno Estat�stica - Rosane de F�tima Worm

Dados não-agrupados

Quando se deseja conhecer a média dos dados não-agrupados, determinamos à média aritmética simples.

Exemplo: Sabendo-se que as vendas diárias da empresa A, durante uma semana, foram de 10, 14, 13, 15, 16, 18 e 12 unidades, tem-se, para produção média da semana:

10 + 14 + 13 + 15 + 16 + 18 + 12 = 98 = 147 7

Página 15

Page 16: Caderno Estat�stica - Rosane de F�tima Worm

Dados Agrupados – média aritmética ponderada

Sem intervalos de classe: As freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que leva a calcular a média aritmética ponderada.

_µ = ∑ xi.fi população X = ∑ xi.fi amostra

N n

Página 16

Page 17: Caderno Estat�stica - Rosane de F�tima Worm

Exemplo: Considerando a distribuição relativa a 34famílias de quatro filhos, adotando-se a variável“número de filhos do sexo masculino”, determine amédia.

Σ

N.º de Meninos fi

0 21 62 103 124 4

= 34 Página 17

Page 18: Caderno Estat�stica - Rosane de F�tima Worm

Com intervalos de classe: Convenciona-se quetodos os valores incluídos em um determinadointervalo de classe coincidem com o seu pontomédio, e determina-se a média aritméticaponderada.

__

µ = ∑ xi.fi população X = ∑ xi.fi amostraN n

Onde Xi é o ponto médio da classe

Página 18

Page 19: Caderno Estat�stica - Rosane de F�tima Worm

Exemplo: SALÁRIOS SEMANAIS EM REAIS DE UMAAMOSTRA DOS FUNCIONÁRIOS DA EMPRESA Z

Salários semanais (R$)

Freqüências

150 -- ├ 154 4154 ├ 158 9158 ├ 162 11162 ├ 166 8166 ├ 170 5170 ├ 174 3

Total 40 Página 19

Page 20: Caderno Estat�stica - Rosane de F�tima Worm

A média é utilizada quando:

Desejamos obter a medida de posição quepossui a maior estabilidade;

Houver a necessidade de um tratamentoalgébrico ulterior.

Página 20

Page 21: Caderno Estat�stica - Rosane de F�tima Worm

Média Geométrica SimplesPara uma seqüência numérica x:

x1, x2, ......., xn, a média geométrica simples, que

designaremos por , é definida por:

Exemplo: Se X: 2, 4, 6, 9, então:Página 21

Page 22: Caderno Estat�stica - Rosane de F�tima Worm

Média Geométrica PonderadaPara uma seqüência numérica x: x1, x2, ...., xn afetados de pesos p1, p2, ..., pn respectivamente, a média geométrica ponderada que designaremos por é definida por:

Página 22

Page 23: Caderno Estat�stica - Rosane de F�tima Worm

Exemplo: Se x: 1, 2, 5, com pesos 3, 3, 1 respectivamente então:

6938,1405.8.15.2.177133

7====gx

Página 23

Page 24: Caderno Estat�stica - Rosane de F�tima Worm

Média Móvel• Uma média, como o nome diz, mostra

o valor médio de uma amostra de determinado dado. Uma média móvel aritmética (MMA) é uma extensão desse conceito, representando o valor médio, normalmente dos preços de fechamento, em um período de tempo.

Página 24

Page 25: Caderno Estat�stica - Rosane de F�tima Worm

Exemplo: A média móvel simples é calculada pela formação do preço médio por um número específico de períodos. Para o cálculo usamos o preço de fechamento. Por exemplo: Vamos utilizar a média dos últimos 10 dias. Devemos somar os preços finais durante os últimos 10 dias e dividir o total por 10.

10+11+12+13+14+15+16+17+18+19=145(145/10) = 14,50

Página 25

Page 26: Caderno Estat�stica - Rosane de F�tima Worm

• Devemos repetir este cálculo conforme o passar dos dias, assim, as médias vão se juntando e formando uma linha. Se continuarmos com o nosso exemplo, o próximo preço final na média será 20, então teremos um novo período, somando o último dia (20) e removendo o primeiro da lista (10). Continuando com a média dos últimos 10 dias, a média móvel simples deverá ser calculada da seguinte maneira:

11+12+13+14+15+16+17+18+19+20=155(155/10) = 15,50• Repare que removemos o primeiro dia da lista (10)

para incluir o novo dia (20).• Durante os últimos dois dias, a média moveu-se de

14,50 para 15,50. Como são somados novos dias, os antigos serão removidos e a média permanece se movendo com o passar do tempo.

Página 26

Page 27: Caderno Estat�stica - Rosane de F�tima Worm

Exercícios

Página 27

Page 28: Caderno Estat�stica - Rosane de F�tima Worm

Moda: valor mais provável.

Página 28

Page 29: Caderno Estat�stica - Rosane de F�tima Worm

Moda (Mo)

A moda de uma distribuição é o valor da variável que tem a maior freqüência absoluta simples, quer dizer aquele valor que aparece mais [mais se repete]. Existem algumas situações nas quais não existe moda, isto é, todos os valores da variável só aparecem uma vez, não se repetem.

Em outras situações pode-se ter mais de uma moda, isto é, quando dois ou mais valores da variável têm maior freqüência [freqüências iguais], neste caso diz-se que o conjunto é bimodal. Podem-se ter três, quatro, etc. Nestes casos é difícil escolher a moda como um representante do grupo, uma vez que teremos muitos representantes. Para que se possa obter o valor da moda é necessário que os dados estejam no mínimo em escala nominal, quer dizer, com qualquer nível de mensuração podemos obter o valor da moda, uma vez que ela é oriunda apenas de uma contagem. Portanto, a moda é o valor que ocorre com maior freqüência em uma série de valores.

Página 29

Page 30: Caderno Estat�stica - Rosane de F�tima Worm

Exemplo: - o dono do restaurante vai prepararmais o filé de maior saída; maioria tirou “C”numa turma; o proprietário da loja de sapato vaicomprar mais os números de maior saída.

Página 30

Page 31: Caderno Estat�stica - Rosane de F�tima Worm

Dados não-agrupados

A moda é facilmente reconhecida: basta procurar o valor que mais se repete.

Exemplo: A série de dados: 7, 8, 9, 10, 10, 10, 11, 12, 12, 12, 12, 13, 15 tem moda igual a 12.

Amodal: são as séries nas quais nenhum valor apareça mais vezes que outros.Exemplo: 3, 5, 8, 10, 13.

Multimodal: é uma série que possui dois ou mais valores modais. Página 31

Page 32: Caderno Estat�stica - Rosane de F�tima Worm

Dados agrupadosSem intervalos de classe: É o valor da variável de maior freqüência

Xi fi3 85 17 15 Classe

Modal9 7 Mo = 710 6 Página 32

Page 33: Caderno Estat�stica - Rosane de F�tima Worm

Com intervalos de classe:

A classe que apresenta maior freqüência é denominada classe modal.O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta.

Há, para o cálculo da moda, outros métodos mais elaborados, como, por exemplo, o que faz uso da fórmula de CZUBER:

Página 33

Page 34: Caderno Estat�stica - Rosane de F�tima Worm

Exemplo: Calcule a moda da seguinte distribuição

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOSSALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z

Salários semanais (R$) Freqüências

150 |--- 154 4154 |--- 158 9158 |--- 162 11162 |--- 166 8166 |--- 170 5170 |--- 174 3

Total 40 Página 34

Page 35: Caderno Estat�stica - Rosane de F�tima Worm

Empregamos a moda quando:

Desejamos obter uma medida rápida e aproximada de posição;

A medida de posição deve ser o valor mais típico da distribuição

Página 35

Page 36: Caderno Estat�stica - Rosane de F�tima Worm

Mediana: divide o conjunto em duas partes iguais.

Página 36

Page 37: Caderno Estat�stica - Rosane de F�tima Worm

Mediana (Md):É o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Para que se possa obter o valor da mediana os dados têm que estar em uma escala de medida no mínimo ordinal, uma vez que se precisa ordená-los.

A mediana é o valor que divide o conjunto ao meio, isto é, concentra antes e depois de si, 50% das observações ordenadas. Ao contrário da média aritmética a mediana não sofre influência quando temos no conjunto valores discrepantes [tanto para mais como para menos]. Neste caso a mediana pode melhor representar um conjunto do que a média aritmética, porém não tem o mesmo significado que aquela.

Página 37

Page 38: Caderno Estat�stica - Rosane de F�tima Worm

A mediana pode ou não pertencer ao conjunto doqual ela é originária, vai pertencer sempre que oconjunto tiver um número ímpar de informaçõese vai ou não pertencer quando o conjunto tiverum número par de observações. Com isso jápodemos ver que a quantidade de observaçõesinflui na maneira pela qual vamos encontrar ovalor da mediana.

Página 38

Page 39: Caderno Estat�stica - Rosane de F�tima Worm

Dados não-agrupados:

Estando ordenados os valores de uma série esendo n o número de elementos da série, o valormediano será, quando n for:

ímpar : o termo de ordem ; n + 12

par : a média aritmética dos termos de ordemn e n + 1.2 2

Página 39

Page 40: Caderno Estat�stica - Rosane de F�tima Worm

Exemplo 1: Dada à série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, identifique a mediana.

Md = 10

Exemplo 2: Dada à série de valores: 2, 6, 7, 10, 12, 13, 18, 21, calcule a mediana.

Md = 11

O valor da mediana pode coincidir ou não com um elemento da série.

Página 40

Page 41: Caderno Estat�stica - Rosane de F�tima Worm

Dados agrupados: Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada por: n

2Sem intervalos de classe: É o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada.Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino, determine a mediana:

Página 41

Page 42: Caderno Estat�stica - Rosane de F�tima Worm

Σ

N.ºde Meninos fi0 21 62 103 124 4

= 34

Página 42

Page 43: Caderno Estat�stica - Rosane de F�tima Worm

No caso de existir uma freqüência acumulada (Fi), tal que:

a mediana será dada por:Md = xi + X i + 1

2

isto é, a mediana será a média aritmética entre o valor da variável correspondente a essa freqüência acumulada e a seguinte.

Página 43

Page 44: Caderno Estat�stica - Rosane de F�tima Worm

Exemplo: Determine a mediana da distribuição abaixo:

Xi fi Fi12 114 215 116 217 120 1

Página 44

Page 45: Caderno Estat�stica - Rosane de F�tima Worm

Com intervalos de classe: Classe mediana é aquela correspondente à freqüência acumulada imediatamente superior a ∑ fi.

2

Página 45

Page 46: Caderno Estat�stica - Rosane de F�tima Worm

Em seguida, emprega-se a fórmula:

Me = li + h ( ∑ fi/2 - Fi ( i -1) )fi

Sendo: li = limite inferior da classe medianah = amplitude do intervalo da classe medianafi = freqüência simples da classe medianaFi = freqüência acumulada da classe anterior à classe mediana

Página 46

Page 47: Caderno Estat�stica - Rosane de F�tima Worm

Exemplo: Calcule a mediana da seguinte distribuição:

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z

Salários semanais (R$)

Freqüências

150 -- |--- 154 4154 |--- 158 9158 |--- 162 11162 |--- 166 8166 |--- 170 5170 |--- 174 3

Total 40Página 47

Page 48: Caderno Estat�stica - Rosane de F�tima Worm

No caso de existir uma freqüência acumulada exatamente igual a , a mediana será o limite superior da classe correspondente.

Exemploi Classes fi Fi

0 |--- 10 110 |--- 20 320 |--- 30 930 |--- 40 740 |--- 50 450 |--- 60 2

26Página 48

Page 49: Caderno Estat�stica - Rosane de F�tima Worm

Empregamos a mediana quando:

Desejamos obter o ponto que divide a distribuição em partes iguais;

Há valores extremos que afetam de uma maneira acentuada a média;

A variável em estudo é salário.

Página 49

Page 50: Caderno Estat�stica - Rosane de F�tima Worm

ESTATÍSTICA

O que a Estatística significa para você?

Página 50

Page 51: Caderno Estat�stica - Rosane de F�tima Worm

INTRODUÇÃO

ESTATÍSTICA: é a ciência dos dados. Ela envolvecoletar, classificar, resumir, organizar, analisar einterpretar informação numérica.

ANTIGUIDADE: os povos já registravam o número de habitantes, nascimentos, óbitos, faziam estimativas das riquezas individual e social, distribuíam terras ao povo, cobravam impostos.

Página 51

Page 52: Caderno Estat�stica - Rosane de F�tima Worm

ESTATÍSTICA

Página 52

Page 53: Caderno Estat�stica - Rosane de F�tima Worm

ESTATÍSTICA ENVOLVE DOIS PROCESSOS DIFERENTES

DESCREVERCONJUNTODE DADOS

OBTER CONCLUSÕES(FAZER ESTIMATIVAS, PREVISÕES,TOMAR

DECISOES,ETC.)

Página 53

Page 54: Caderno Estat�stica - Rosane de F�tima Worm

ESTATÍSTICA

DESCRITIVA INFERENCIAL

A Estatística descritiva utilizamétodos numéricos e gráficospara detectar padrões em umconjunto de dados, para resumira informação revelada em umconjunto de dados paraapresentar a informação de umaforma conveniente.

A Estatística inferencial utiliza umaamostra de dados para fazerestimativas, tomar decisões,previsões ou outras generalizaçõesacerca de um conjunto maior dedados.

Página 54

Page 55: Caderno Estat�stica - Rosane de F�tima Worm

Página 55

Page 56: Caderno Estat�stica - Rosane de F�tima Worm

ESTATÍSTICA DESCRITIVA

COLETARCONTARORGANIZARTABULAR

DADOS ESTATÍSTICOS

DESCREVER O FENÔMENO ESTATÍSTICOPágina 56

Page 57: Caderno Estat�stica - Rosane de F�tima Worm

ESTATÍSTICA INFERENCIAL

MEDIANTE MÉTODOS E MODELOS VAI INFERIR POSSÍVEIS RESULTADOS

POPULAÇÃO

AMOSTRA

Página 57

Page 58: Caderno Estat�stica - Rosane de F�tima Worm

A natureza dos dados estatísticos

Dados numéricos ou dados quantitativos.

Dados categóricos ou dados qualitativos.

Obtidos: medindo ou contando

discreto contínuo

Resultam de um conjunto finito de valores possíveis, ou de um conjuntoenumerável desses valores. (ou seja, números inteiros.). Ex.: números de ovos que as galinhas põem.

Resultam de um número infinito de valores possíveis que podem ser associadosa pontos em uma escala contínua.Ex: quantidade de leite que as vacas produzem

Resultam de descrições, por exemplo, grupos sanguíneos, estado civil ou na religião de pacientes de um hospital.

Página 58

Page 59: Caderno Estat�stica - Rosane de F�tima Worm

Exemplos -. Cor dos olhos das aluna: qualitativa. Produção de café no Brasil: quantitativa contínua. Número de defeitos em aparelhos de TV: quantitativa discreta. Comprimento dos pregos produzidos por uma empresa: quantitativa contínua. O ponto obtido em cada jogada de um dado: quantitativa discreta

Página 59

Page 60: Caderno Estat�stica - Rosane de F�tima Worm

POPULAÇÃO

PESSOAS, ANIMAIS,OBJETOS ou NÚMEROSPASSÍVEIS DE UM LEVANTAMENTO OU PESQUISA

Página 60

Page 61: Caderno Estat�stica - Rosane de F�tima Worm

POPULAÇÃO

FINITA INFINITA

Consiste em um número finito, ou fixo, de elementos, medidas ou observações. Exemplos: pesos líquidos de 3000 latas de tintas de um certo lote de produção; pontos obtidos por todos os candidatos no vestibular de 2008 numa certa universidade.

Contém, pelo menos hipoteticamente, um número infinito de elementos. Por exemplo: quando medimos repetidamente o ponto de ebulição de um composto de silicone (não há limite para o número de vezes que podemos medir); quando observamos os totais obtidos em repetidas jogadas de um par de dados (não há limite para o número de vezes que podemos jogar um par de dados).

Página 61

Page 62: Caderno Estat�stica - Rosane de F�tima Worm

é um plano definido, completamentedeterminado antes da coleta de quaisquerdados, de obter uma amostra de uma dadapopulação.

Página 62

Page 63: Caderno Estat�stica - Rosane de F�tima Worm

AMOSTRAGEM

POPULAÇÃO

AMOSTRA

Página 63

Page 64: Caderno Estat�stica - Rosane de F�tima Worm

MÉTODOS PARA COMPOR A AMOSTRA

NÃO PROBABILÍSTICASOU INTENCIONALPROBABILÍSTICAS

ACIDENTALINTENCIONAL

CONVENIÊNCIA

ALEATÓRIASISTETMÁTICO

ESTRATIFICADOCONGLOMERADOS Página 64

Page 65: Caderno Estat�stica - Rosane de F�tima Worm

Métodos Probabilísticos

O método de amostragem probabilística exige que cada elemento da população possua determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da população, a probabilidade de cada elemento será 1/N. Trata-se do método que garante cientificamente a aplicação das técnicas estatísticas de inferências. Somente com base em amostragens probabilísticas é que se podem realizar inferências induções sobre a população a partir do conhecimento da amostra.

Página 65

Page 66: Caderno Estat�stica - Rosane de F�tima Worm

AMOSTRAGEM ALEATÓRIAos elementos da população são escolhidos de tal forma que cada um deles tenha igual chance de figurar na amostra. (Escolhe-se

uma amostra aleatória simples de n elementos, de maneira que toda amostra de tamanho n possível tenha a mesma chance

de ser escolhida.)

Página 66

Page 67: Caderno Estat�stica - Rosane de F�tima Worm

Ex: Vamos obter uma amostra, de 10%, representativapara a pesquisa da estatura de 90 alunos de uma escola:

1º - numeramos os alunos de 1 a 90.

2º - escrevemos os números dos alunos, de 1 a 90, empedaços iguais de papel, colocamos na urna e apósmisturar retiramos, um a um, nove números que formarão aamostra.

OBS: quando o número de elementos da amostra é muitogrande, esse tipo de sorteio torna-se muito trabalhoso.Neste caso utiliza-se uma Tabela de números aleatórios,construída de modo que os algarismos de 0 a 9 sãodistribuídos ao acaso nas linhas e colunas.

Página 67

Page 68: Caderno Estat�stica - Rosane de F�tima Worm

ESTRATIFICADA

Com a amostragem estratificada,subdividimos a população em, no mínimo, duas sub populações (ou estratos) que compartilham das

mesmas características (como sexo) e, em seguida, extraímos uma amostra de

cada estrato.

Página 68

Page 69: Caderno Estat�stica - Rosane de F�tima Worm

Ex: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São portanto dois estratos (sexo masculino e sexo feminino). Logo, temos:

SEXO POPULACÃO 10 % AMOSTRA

MASC. 54 5,4 5FEMIN. 36 3,6 4Total 90 9,0 9

Numeramos então os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e procedemos o sorteio casual com urna ou tabela de números aleatórios. Página 69

Page 70: Caderno Estat�stica - Rosane de F�tima Worm

PROBABILÍSTICA SISTEMÁTICA

Quando se conhece uma listagem dos elementos da população pode-se obter uma amostra aleatória de elementos dividindo-se o número de elementos da população pelo tamanho da amostra.

Exemplo: Se a população tem 10.000, onde devemos selecionar uma amostra de 1000. Vamos sortear o primeiro entre 1 e 10 e a partir deste acrescentar sempre 10, até completar a amostra.

Página 70

Page 71: Caderno Estat�stica - Rosane de F�tima Worm

CONGLOMERADONa amostragem por conglomerados, começamos dividindo a área da população em seções (ou conglomerados); em seguida escolhemos algumas dessas seções e, finalmente, tomamos todos os elementos das seções escolhidas.Uma diferença importante entre a amostragem por conglomerados e a amostragem estratificada é que a amostragem por conglomerados utiliza todos os elementos dos conglomerados selecionados, enquanto a amostragem estratificada utiliza uma amostra de membros de cada estrato. Pode-se encontrar um exemplo de amostragem por conglomerado em uma pesquisa pré-eleitoral, onde escolhemos aleatoriamente 30 zonas eleitorais e pesquisamos todos os elementos de cada uma das zonas escolhidas. Esse método é muito mais rápido e menos dispendioso do que a escolha de um indivíduo de cada uma das inúmeras zonas da área populacional. Os resultados podem ser ajustados ou ponderados para corrigir qualquer representação desproporcionada de grupos. A amostragem por conglomerados é extensamente utilizada pelo governo e por organizações particulares de pesquisa.

Página 71

Page 72: Caderno Estat�stica - Rosane de F�tima Worm

NÃO PROBABILÍSTICA

São amostragens em que há uma escolha deliberada dos elementos da amostra. Não é possível generalizar os resultados das pesquisas para a população, pois as amostras não-probabilísticas não garantem a representatividade da população.

Página 72

Page 73: Caderno Estat�stica - Rosane de F�tima Worm

ACIDENTALTrata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos.

Exemplo: As pessoas que de modo voluntário estão dispostas para responder ao questionário.

Pesquisas de opinião em praças públicas, ruas...

As pessoas que estão mais ao alcance do investigador.

Página 73

Page 74: Caderno Estat�stica - Rosane de F�tima Worm

INTENCIONALDe acordo com determinado critério, é escolhidointencionalmente um grupo de elementos que irão compor aamostra. O investigador se dirige intencionalmente a gruposde elementos dos quais deseja saber a opinião.

Exemplo1: Em um teste de mercado o investigadorpesquisa na cidade para comprovar as possibilidades decomercialização de um produto.

Exemplo2: Para extrair uma amostra de revistas que reflitam os valores da classe média brasileira, poderíamos ser levados pela intuição, selecionar Veja, Exame e Isto é.

Exemplo 3: Numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um grande salão de beleza e entrevista as pessoas que ali se encontram. Página 74

Page 75: Caderno Estat�stica - Rosane de F�tima Worm

Amostragem de Conveniência

Na amostragem de conveniência, simplesmente utilizamos resultados que já estão disponíveis.

Página 75

Page 76: Caderno Estat�stica - Rosane de F�tima Worm

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento Regional”.

Profª Rosane Worm Aula 1- 05/08/10

ESTATÍSTICA BÁSICA

1. INTRODUÇÃO

O que a Estatística significa para você?

ESTATÍSTICA: é a ciência dos dados. Ela envolve coletar, classificar, resumir, organizar, analisar e interpretar informação numérica.

ANTIGUIDADE: os povos já registravam o número de habitantes, nascimentos, óbitos, faziam estimativas das riquezas individual e social, distribuíam terras ao povo, cobravam impostos.

TIPOS DE APLICAÇÕES ESTATÍSTICAS NA EMPRESA

Para a maioria das pessoas, estatística significa, descrições numéricas, taxas mensais de desemprego, índice de falência para um novo negócio e proporção de mulheres executivas em um setor em particular, todos esses exemplos representam descrições estatísticas de um grande conjunto de dados coletados sobre algum fenômeno. Freqüentemente os dados são selecionados de algum conjunto maior do qual desejamos estimar alguma característica. Este processo de seleção é chamado de amostragem. Por exemplo, você pode coletar as idades de uma amostra de consumidores em uma videolocadora para estimar a idade média de todos

A Estatística descritiva utiliza métodos numéricos e gráficos para detectar padrões em um conjunto de dados, para resumir a informação revelada em um conjunto de dados para apresentar a informação de uma forma conveniente.

os consumidores da loja. Assim, você poderia usar suas estimativas nos anúncios da loja para atingir o grupo de faixa etária apropriada. Repare que a estatística envolve dois processos diferentes: (1) descrever conjuntos de dados e (2) obter conclusões (fazer estimativas, previsões, tomar decisões, etc.) sobre os conjuntos de dados baseados na amostragem. Assim, as aplicações da Estatística podem ser divididas em duas grandes áreas: estatística descritiva e estatística inferencial.

Por meio de sondagem, de coleta de dados e de recenseamento de opiniões, podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e financeiros disponíveis, as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de serem alcançados a curto, médio ou longo prazo.

A Estatística ajudará em tal trabalho, como também na seleção e organização da estratégia a ser adotada no empreendimento e, ainda, na escolha das técnicas de verificação e avaliação da quantidade e da qualidade do produto e mesmo dos possíveis lucros e/ou perdas.

Página 76

Page 77: Caderno Estat�stica - Rosane de F�tima Worm

A Estatística inferencial utiliza uma amostra de dados para fazer estimativas, tomar decisões, previsões ou outras generalizações acerca de um conjunto maior de dados.

A coleta, a organização ,a descrição dos dados, o cálculo e a interpretação de coeficientes pertencem à ESTATÍSTICA DESCRITIVA, enquanto a análise e a interpretação dos dados, associado a uma margem de incerteza, ficam a cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, também chamada como a medida da incerteza ou métodos que se fundamentam na teoria da probabilidade.

A natureza dos dados estatísticos Dados numéricos ou dados quantitativos. São obtidos medindo ou

contando, por exemplo, pesos de ratos utilizados num experimento (obtidos medindo) ou as faltas diárias de alunos numa turma ao longo do ano letivo (obtidos contando).

Podemos descrever os dados quantitativos distinguido entre discreto e

contínuo. • Dados discretos. Resultam de um conjunto finito de valores possíveis, ou

de um conjunto enumerável desses valores. (ou seja, números inteiros.). Ex.: números de ovos que as galinhas põem.

• Dados contínuos. Resultam de um número infinito de valores possíveis que podem ser associados a pontos em uma escala contínua. Ex: quantidade de leite que as vacas produzem.

Dados categóricos ou dados qualitativos. Resultam de descrições, por

exemplo, grupos sanguíneos, estado civil ou na religião de pacientes de um hospital.

Exemplos

Originalmente, a Estatística tratava apenas da descrição de populações humanas, resultados de censos. Mas, à medida que seus objetivos se ampliaram, o

-

. Cor dos olhos das aluna: qualitativa

. Produção de café no Brasil: quantitativa contínua

. Número de defeitos em aparelhos de TV: quantitativa discreta

. Comprimento dos pregos produzidos por uma empresa: quantitativa contínua

. O ponto obtido em cada jogada de um dado: quantitativa discreta

Populações e Amostras

Quando dissemos que a escolha de uma descrição estatística pode depender da natureza dos dados, estamos nos referindo, entre outras coisas, à seguinte distinção: se um conjunto de dados consiste em todas as observações possíveis de um dado fenômeno, dizemos que é uma população; se um conjunto de dados consiste em apenas uma parte da população, dizemos que é uma amostra.

Página 77

Page 78: Caderno Estat�stica - Rosane de F�tima Worm

termo “população” passou a ter a conotação muito mais ampla. Em Estatística, “população” é um temo técnico com um significado próprio.

Podemos designar como população qualquer grupo de elementos, depende do contexto em que os itens serão considerados. Suponhamos, por exemplo, que nos ofereçam um lote com 400 ladrilhos de cerâmicas, que podemos comprar ou não, dependendo de sua resistência. Se medirmos a resistência à quebra de 20 desses ladrilhos para estimar a resistência média de todos os ladrilhos, essas 20 mensurações constituem uma amostra da população que consiste nas resistências de todos os 400 ladrilhos. Em outro contexto, se pensarmos em firmar um contrato de longo prazo para o fornecimento de dezenas de milhares desses ladrilhos, consideraríamos como apenas uma amostra o conjunto das resistências dos 400 ladrilhos originais.

Distinguiremos ainda dois tipos de populações, as populações finitas e as populações infinitas.

Populações finitas. Consiste em um número finito, ou fixo, de elementos, medidas ou observações. Exemplos: pesos líquidos de 3000 latas de tintas de um certo lote de produção; pontos obtidos por todos os candidatos no vestibular de 2008 numa certa universidade.

Populações infinitas. Contém, pelo menos hipoteticamente, um número infinito de elementos. Por exemplo: quando medimos repetidamente o ponto de ebulição de um composto de silicone (não há limite para o número de vezes que podemos medir); quando observamos os totais obtidos em repetidas jogadas de um par de dados (não há limite para o número de vezes que podemos jogar um par de dados).

Planejamento da amostra e amostragem Em Estatística, um planejamento de amostra é um plano definido,

completamente determinado antes da coleta de quaisquer dados, de obter uma amostra de uma dada população. Assim, o plano para extrair uma amostra aleatória simples de tamanho 12 das 247 farmácias de uma cidade, utilizando uma tabela de números aleatórios de uma maneira predeterminada, constitui um planejamento de amostra.

Basicamente, existem dois métodos para composição da amostra: probabil-ístico e não probabilístico ou intencional.

Métodos Probabilísticos O método de amostragem probabilística exige que cada elemento da

população possua determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da população, a probabilidade de cada elemento será 1/N. Trata-se do método que garante cientificamente a aplicação das técnicas estatísticas de inferências. Somente com base em amostragens probabilísticas é que se podem realizar inferências induções sobre a população a partir do conhecimento da amostra.

Amostragem Aleatória Em uma amostra aleatória, os elementos da população são escolhidos de tal

forma que cada um deles tenha igual chance de figurar na amostra. (Escolhe-se uma amostra aleatória simples de n elementos, de maneira que toda a mostra de tamanho n possível tenha a mesma chance de ser escolhida.)

As amostras aleatórias podem ser escolhidas por diversos métodos, inclusive a utilização de tabelas de números aleatórios e de computadores para

Página 78

Page 79: Caderno Estat�stica - Rosane de F�tima Worm

gerar números aleatórios. Com a amostragem aleatória, espera-se que todos os grupos da população sejam representados na amostra de forma aproximadamente proporcional. Uma amostragem descuidada pode facilmente resultar em uma amostra tendenciosa, com características assaz diferentes das da população que a originou. Em contrapartida, a amostragem aleatória é cuidadosamente planejada para evitar qualquer tendenciosidade. Por exemplo, a utilização de catálogos telefônicos elimina automaticamente todos aqueles cujos telefones não figurem no catálogo, e a exclusão desse segmento da população pode facilmente conduzir a resultados falsos. Há cidades que, por exemplo, 42,5% dos números de telefones não estão no catálogo. Os pesquisadores costumam contornar esse problema utilizando computadores para gerar números de telefone, de modo que todos os números sejam possíveis. Eles devem também ter o cuidado de incluir os que inicialmente não foram encontrados ou se recusaram a responder. Uma empresa constatou que a taxa de recusa para entrevistas telefônicas é em geral de 20%, no mínimo. O fato de ignorarmos os que inicialmente se recusam a responder pode concorrer para que nossa amostra seja tendenciosa.

Amostragem Estratificada Com a amostragem estratificada, subdividimos a população em, no mínimo,

duas sub populações (ou estratos) que compartilham das mesmas características (como sexo) e, em seguida, extraímos uma amostra de cada estrato.

Em uma pesquisa sobre a Emenda Constitucional da Igualdade de Direitos, poderíamos utilizar o sexo como base para a criação de dois estratos. Após obter uma relação dos homens e uma relação das mulheres, aplicamos um método conveniente (como a amostragem aleatória) para escolher determinado número de elementos de cada relação. Quando os diversos estratos têm tamanhos amostrais que refletem a população global, temos o que se chama amostragem proporcional. No caso de alguns estratos não serem representados na proporção adequada então os resultados poderão ser ajustados ou ponderados convenientemente.

Para um tamanho fixo de amostra, se escolhemos aleatoriamente elementos de diferentes estratos, temos chance de obter resultados mais consistentes (e menos variáveis) do que com a simples escolha de uma amostra aleatória de toda a população. Por essa razão, costuma-se usar a amostragem estratificada para reduzir a variação nos resultados.

Amostragem Sistemática Quando se conhece uma listagem dos elementos da população pode-se

obter uma amostra aleatória de n elementos dividindo-se o número de elementos da população pelo tamanho da amostra.

nNk =

Escolhemos um ponto de partida, que deve ser um valor entre 1 e k e a

partir de então selecionamos cada ésimok − elemento da população para fazer parte da amostra.

Por exemplo, se a Motorola quisesse fazer uma pesquisa sobre seus 107.000 empregados, poderia partir de uma relação completa dos mesmos e selecionar cada 100º empregado, obtendo uma amostra de 1.070 elementos. Esse método é simples e utilizado com freqüência.

Amostragem por Conglomerado

Página 79

Page 80: Caderno Estat�stica - Rosane de F�tima Worm

Na amostragem por conglomerados, começamos dividindo a área da população em seções (ou conglomerados); em seguida escolhemos algumas dessas seções e, finalmente, tomamos todos os elementos das seções escolhidas.

Uma diferença importante entre a amostragem por conglomerados e a amostragem estratificada é que a amostragem por conglomerados utiliza todos os elementos dos conglomerados selecionados, enquanto a amostragem estratificada utiliza uma amostra de membros de cada estrato. Pode-se encontrar um exemplo de amostragem por conglomerado em uma pesquisa pré-eleitoral, onde escolhemos aleatoriamente 30 zonas eleitorais e pesquisamos todos os elementos de cada uma das zonas escolhidas. Esse método é muito mais rápido e menos dispendioso do que a escolha de um indivíduo de cada uma das inúmeras zonas da área popu-lacional. Os resultados podem ser ajustados ou ponderados para corrigir qualquer representação desproporcionada de grupos. A amostragem por conglomerados é extensamente utilizada pelo governo e por organizações particulares de pesquisa.

Métodos não Probabilísticos São amostragens em que há uma escolha deliberada dos elementos da

amostra. Não é possível generalizar os resultados das pesquisas para a população, pois as amostras não-probabilísticas não garantem a representatividade da população.

Amostragem Acidental Trata-se de uma amostra formada por aqueles elementos que vão

aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos.

Amostragem Intencional De acordo com determinado critério, é escolhido intencionalmente um grupo

de elementos que irão compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. Por exemplo, numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um grande salão de beleza e entrevista as pessoas que ali se encontram.

Amostragem de Conveniência Na amostragem de conveniência, simplesmente utilizamos resultados que já

estão disponíveis. Em alguns casos, os resultados da amostragem de conveniência podem ser

muito bons, mas em outros casos podem apresentar séria tendenciosidade. Ao fazer uma pesquisa sobre pessoas canhotas, seria conveniente um estudante pesquisar seus próprios colegas de classe, porque estão ao seu alcance imediato. Mesmo que tal amostra não seja aleatória, os resultados devem ser bem satisfatórios. Em contrapartida, poderia ser muito conveniente (e talvez mesmo lucrativo) para a ABC News fazer uma pesquisa pedindo aos espectadores que liguem para um número de telefone “900” para registrar suas opiniões, mas essa pesquisa seria auto-selecionada e os resultados seriam provavelmente tendenciosos

Um erro amostral é a diferença entre um resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuações amostrais aleatórias.

Ocorre um erro não-amostral quando os dados amostrais são coletados, registrados ou analisados incorretamente. Tais erros resultam de um erro que não

Página 80

Page 81: Caderno Estat�stica - Rosane de F�tima Worm

seja uma simples flutuação amostral aleatória, como a escolha de uma amostra não aleatória e tendenciosa, a utilização de um instrumento de mensuração defeituoso, um grande número de recusas de resposta ou a cópia incorreta dos dados amostrais.

Se extrairmos uma amostra cuidadosamente, de forma que ela represente realmente a população, podemos aplicar os métodos descritos neste livro para analisar o erro amostral, mas devemos ter o máximo de cuidado em minimizar os erros não-amostrais.

Exercício:

1- Classifique a variável como quantitativa discreta ou quantitativa contínua: a) População: funcionários de uma empresa. Variável: salários mensais. b) População: computadores produzidos por uma empresa. Variável: número

de peças usadas. c) População: jogadores de basquete de um clube. Variável: estatura.

2 . Classifique as variáveis em qualitativas ou quantitativas contínuas ou discretas:

a) População: alunos de uma escola. Variável: cor dos cabelos b) População: casais residentes em uma cidade. Variável: número de filhos. c) População: as jogadas de um dado. Variável: o ponto obtida em cada jogada. d) População: peças produzidas por certa máquina. Variável: número de peças produzidas por hora. e) População: peças produzidas por certa máquina. Variável: diâmetro externo.

3 - uma agência de turismo tem 2.500 clientes cadastrados. Para melhor atendê-los, foi pesquisada a preferência em relação ao tempo de duração, ao preço, ao número de acompanhantes, ao número de passeios e à qualidade dos serviços prestados em uma viagem. Foram consultados de modo imparcial, 700 pessoas.

a) Quantas pessoas têm a população estatística envolvida nessa pesquisa? b) A amostra pesquisada foi de quantas pessoas? c) Quais foram as variáveis qualitativas pesquisadas?

4- Quais são as etapas básicas do método estatístico? 5. Uma concessionária de automóveis tem cadastrados 3500 clientes e fez uma pesquisa sobre a preferência de compra em relação a “cor”(branco, vermelho ou azul), “preço”, “número de portas”(duas ou quatro) e “estado de conservação” (novo ou usado). Foram consultados 210 clientes. Diante dessas informações, responda:

Página 81

Page 82: Caderno Estat�stica - Rosane de F�tima Worm

a) Qual é o universo estatístico e qual é a amostra dessa pesquisa? b) Quais são as variáveis e qual é o tipo de cada uma? c) Quais os possíveis valores da variável “cor” nessa pesquisa?

6. Ao nascer, os bebês são pesados e medidos, para se saber se estão dentro das tabelas de peso e altura esperados. Estas duas variáveis são:

a) Qualitativas b) Ambas discretas. c) Ambas contínuas. d) Contínua e discreta, respectivamente. e) Discreta e contínua, respectivamente.

7. Para cada uma das seguintes variáveis aleatórias, determine se a variável é quantitativa ou qualitativa. Se quantitativa, determine se a variável de interesse é discreta ou contínua. a. Número de telefones por domicílio. b. Tipo de telefone mais utilizado. c. Número de chamadas de longa distância realizadas por mês. d. Duração (em minutos) da mais demorada chamada de longa distância. e. Cor do telefone mais utilizado. f. Quantia em dinheiro gasto com livros. g. Número de livros didáticos comprados. h. Tempo gasto na livraria. i. Sexo. j. Principal matéria acadêmica. k. Número de créditos matriculados para o semestre corrente. l. Método de pagamento na livraria. m. Nome do provedor de internet. n. Tarifa mensal do serviço de internet. o. Quantidade de tempo gasto por semana navegando na internet. p. Número semanal de e-mails recebidos. q. Número mensal de compras on-line. r. Total gasto em compras on-line. s. Quantia gasta no mês passado com vestuário. t. Número de agasalhos que possui. u. Quantia de tempo gasto no mês passado comprando vestuário. v. Horário mais provável para compra de vestuário (comercial, à noite ou fim de semana). w. Loja de departamento preferida. x. Número de pares de meias que possui. y. Número de alunos matriculados na disciplina de Estatística I. z. Disciplinas disponíveis para cursar no semestre corrente. 8. Identifique o tipo de amostragem utilizada: aleatória, estratificada, sistemática, por conglomerado ou conveniência. a. Ao escrever um livro, o autor baseou suas conclusões em 4.500 respostas a 100.000 questionários distribuídos a mulheres. b. Um sociólogo seleciona 12 homens e 12 mulheres de cada uma de quatro turmas de inglês. c. Um cabo eleitoral escreve o nome de cada senador em cartões separados, mistura-os e extrai 10.

Página 82

Page 83: Caderno Estat�stica - Rosane de F�tima Worm

d. Um programa de Planejamento Familiar pesquisa 500 homens e 500 mulheres sobre seus pontos de vista sobre o uso de anticoncepcionais. e. Um pesquisador médico de uma Universidade entrevista todos os portadores de leucemia em cada um de 20 hospitais selecionados aleatoriamente. f. Obtém-se uma amostra de um produto extraindo-se cada 100ª unidade de linha de montagem. g. Geram-se números aleatórios em um computador para selecionar números de série de carros a serem escolhidos para uma amostra de teste. h. Um fornecedor de peças para automóvel obtém uma amostra de todos os itens de cada um de 12 fornecedores selecionados aleatoriamente. i. Um fabricante de automóveis faz um estudo de mercado compreendendo testes de direção feitos por uma amostra de 10 homens e 10 mulheres em cada uma de quatro diferentes faixas etárias. j. Um fabricante de automóveis faz um estudo de mercado entrevistando clientes em potencial que solicitam teste de direção a um revendedor local.

Página 83

Page 84: Caderno Estat�stica - Rosane de F�tima Worm

Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento Regional”.

Escola

Aula 02- Estatística I – 12/08/10

Profª Rosane Worm

Atividades

1. Explique uma forma de se obter uma amostra estratificada dos empregados de uma empresa em que existam funcionários de escritório, funcionários de produção e vendedores. 2. Numa escola com 1200 alunos, foi feito um recenseamento, recolhendo-se dados referentes às seguintes variáveis: Idade dos alunos; anos de escolaridade; meio de transporte utilizado para ir à escola; local de almoço; número de irmãos; local de trabalho; número de televisores em casa; local de moradia. a) Das variáveis observadas, quais são quantitativas e quais são qualitativas? b) Como organizar uma amostra simples e uma sistemática para fazer esse recenseamento? 3. Deseja-se fazer uma pesquisa em uma população constituída por um número maior de homens que de mulheres. Como você faria para selecionar uma amostra: a) com o mesmo número de homens e de mulheres? b) Com mais mulheres que homens? 4. Suponha que 40% da população mencionada no problema anterior seja constituída por mulheres. Numa amostra estratificada proporcional formada por 50 indivíduos, qual seria o número de homens e o de mulheres? E numa amostra composta de 150 pessoas, quais seriam esses números? 5. Uma empresa de publicidade quer fazer um estudo sobre o interesse despertado por certa propaganda entre os alunos de 10 anos de idade das escolas de Ensino Fundamental de uma cidade. Para isso, pretende estratificar uma amostra de 300 crianças. Como a empresa poderia fazer essa amostra a partir dos dados da tabela abaixo?

População A 400 B 300 C 350 D 450 E 520

Página 84

Page 85: Caderno Estat�stica - Rosane de F�tima Worm

F 300

DESCRIÇÃO DE POPULAÇÃOES E AMOSTRAS COM TABELAS

Representação tabular

Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas.

TABELA: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática.

• De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar :

um traço horizontal ( - ) quando o valor é zero; três pontos ( ... ) quando não temos os dados; zero ( 0 ) quando o valor é muito pequeno para ser expresso pela

unidade utilizada; um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de

determinado valor.

Obs.: O lado direito e esquerdo de uma tabela oficial deve ser aberto.

Elementos Essenciais e Facultativos de uma Tabela: Podemos determinar que uma tabela estatística é formada por elementos facultativos e

por elementos essenciais:

ELEMENTOS ESSENCIAIS ELEMENTOS FACULTATIVOS Título: É a parte superior que

procede a tabela e que contém a designação do fato observado, o local e a época em que foi registrado.

Fonte: É a indicação da entidade responsável pelo fornecimento dos dados.

Corpo: É o conjunto de colunas e linhas, respectivamente, em ordem vertical e horizontal, que contém as informações sobre o fato observado.

Notas: São as informações destinadas a esclarecer o conteúdo das tabelas.

Cabeçalho: É a parte da tabela que especifica o conteúdo das colunas.

Chamadas: São as informações utilizadas para esclarecer certas minúcias em relação as linhas e colunas.

Coluna Indicadora: É a parte da tabela que especifica o conteúdo das colunas no sentido vertical.

Obs. Todos os elementos facultativos de uma representação tabular estão situados no rodapé.

.

Página 85

Page 86: Caderno Estat�stica - Rosane de F�tima Worm

17,2

Fonte: IBGE ( rodapé)

Listando dados numéricos

Em geral, listar, e portanto, organizar dados é a primeira etapa em qualquer tipo de análise estatística. Como situação típica, consideremos os dados seguintes, que representam o comprimento (em centímetros) de 60 sardinhas pescadas em uma colônia de pescadores:

18,8 20,7 22,6 18,6 18,3 22,7 24,0 20,0 22,4

16,5 17,8 17,9 24,7 20,7 20,9 25,0 21,0 17,2 18,4 16,5 18,5 20,7 20,0 21,9 17,6 23,4 16,5 24,0 22,5 20,0 22,8 21,4 19,2 22,5 20,8 24,4 17,0 18,9 16,7 17,8 22,7 24,7 22,7 22,4 18,3 24,2 23,1 16,7 16,1 24,2 21,0 24,4 18,8 17,5 18,8 17,2 24,6 21,2 18,6

A coleta desses dados por si só já não é tarefa simples, mas deveria ser evidente que é

preciso fazer muito mais para tornar os números compreensíveis. Seria interessante se soubéssemos os valores extremos (menor e maior valor). Ocasionalmente, é útil dispor os dados de maneira crescente ou decrescente. A listagem a seguir dos comprimentos das sardinhas está arranjada em ordem crescente:

16,1 16,5 16,5 16,5 16,7 16,7 17,0 17,2 17,2 17,2 17,5 17,6 17,8 17,8 17,9 18,3 18,3 18,4 18,5 18,6 18,6 18,8 18,8 18,8 18,9 19,2 20,0 20,0 20,0 20,7 20,7 20,7 20,8 20,9 21,0 21,0 21,2 21,4 21,9 22,4 22,4 22,5 22,5 22,6 22,7 22,7 22,7 22,8 23,1 23,4 24,0 24,0 24,2 24,2 24,4 24,4 24,6 24,7 24,7 25,0

Esta listagem de dados ordenados, também, no meio estatístico como ROL.

SÉRIE ESTATÍSTICA: É qualquer tabela que apresenta a distribuição de um conjunto de

dados estatísticos em função da época, do local ou da espécie.

SÉRIES HOMÓGRADAS: são aquelas em que a variável descrita apresenta variação discreta ou descontínua. Podem ser do tipo temporal, geográfica ou específica.

CORPO

Página 86

Page 87: Caderno Estat�stica - Rosane de F�tima Worm

Séries históricas, cronológicas ou temporais É a série cujos dados estão dispostos em correspondência com o tempo, ou seja, varia

o tempo e permanece constante o fato e o local.

Séries geográficas, espaciais, territoriais ou de localização É a série cujos dados estão dispostos em correspondência com o local, ou seja, varia o local e

permanece constante a época e o fato.

Séries específicas ou categóricas É a série cujos dados estão dispostos em correspondência com a espécie ou

qualidade, ou seja, varia o fato e permanece constante a época e o local.

Tabela 5. PRODUÇÃO BRASILEIRA DE AÇO BRUTO EM 1991 (em toneladas)

PROCESSOS 1991 Oxigênio básico Forno elétrico EOF

17.934 4.274 409

Fonte: Instituto Brasileiro de Siderurgia.

SÉRIES CONJUGADAS: Também chamadas de tabelas de dupla entrada. São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográfica-temporal.

Tabela 6. População Urbana do Brasil por Região de 1940 a 1980 (x1000)

Anos REGIÕES

N NE SE S CO

Tabela 1. PREÇO DO ACÉM NO VAREJO EM SÃO PAULO – 1989-94

ANOS PREÇO MÉDIO (US$)

1989 1990 1991 1992 1993 1994

2,24 2,73 2,12 1,89 2,04 2,62

Fonte: APA

Tabela 2. Produção de Petróleo Bruto no Brasil

De 1976 a 1980 (x1000m3) Anos Produção 1976 1977 1978 1979 1980

9.702 9.332 9.304 9.608 10.562

Fonte: Conjuntura Econômica (fev. 1983)

Tabela 3. EXPORTAÇÃO BRASILEIRA 1985

IMPORTADORES (%) América Latina EUA e Canadá Europa Ásia e Oceania África e Oriente Médio

13,0 28,2 33,9 10,9 14,0

Fontes: MIC e SECEX.

Tabela 4. População Urbana do Brasil em 1980(x1000)

Região Produção Norte Nordeste Sudeste Sul Centro-Oeste

3.037 17.568 42.810 11.878 5.115

Fonte: Anuário Estátistico (1984)

Página 87

Page 88: Caderno Estat�stica - Rosane de F�tima Worm

1940 1950 1960 1970 1980

406 581 958

1.624 3.037

3.381 4.745 7.517

11.753 17.567

7.232 10.721 17.461 28.965 42.810

1.591 2.313 4.361 7.303

11.878

271 424

1.007 2.437 5.115

Fonte: Anuário Estatístico (1984)

1. Classifique as seguintes séries:

b) AVICULTURA BRASILEIRA 1992 a) PRODUÇÃO DE BORRACHA NATURAL

ANOS TONELADAS 1991 29.543 1992 30.712 1993 40.663

Fonte: IBGE

c) VACINAÇÃO CONTRA A d) AQUECIMENTO DE UM MOTOR DE AVIÃO POLIOMIELITE – 1993 DE MARCA X REGIÕES QUANTIDADES Norte 211.209 Nordeste 631.040 Sudeste 1.119.708 Sul 418.785 Centro-Oeste

185.823

FONTE: Ministério da Saúde

2. De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trânsitos, 27306 casos de vítimas fatais, assim distribuídos: 11712 pedestres, 7116 passageiros e 8478 condutores.. Faça uma tabela para representar esses dados. 3. De acordo com o ministério dos transportes, em 1998, o tamanho das malhas de transporte no Brasil é assim distribuído: 320480 km de rodovias (estradas municipais não estão incluídas), 29700 km de Ferrovias (inclui as linhas de trens urbanos) e 40000 km de Hidrovias (desse total, apenas 8000 km estão sendo usados de fato). Faça uma tabela para representar esses dados. 4. De acordo com o Ministério de Educação a quantidade de alunos matriculados no ensino de 1º grau no Brasil nos anos de 1990 a 1996 em milhares de alunos, são: 19.720 – 20.567 – 21.473 – 21.887 – 20.598 – 22.473 – 23.564. Faça uma tabela para representar esses dados. 5. Estabelecimentos de ensino da região norte do Brasil em 1982 subdividiam-se em: Rondônia, Acre, Amazonas, Roraima, Pará e Amapá e possuem um total de 29, 13, 78, 4, 10 e

ESPÉCIE NÚMERO (1.000 cabeças)

Galinhas 204.160 Galos, frangos e pintos 435.465

Codornas 2.488 Fonte: IBGE

MINUTOS TEMPERATURA ( °C )

0 20 1 27 2 34 3 41 4 49 5 56 6 63

Dados fictícios

Página 88

Page 89: Caderno Estat�stica - Rosane de F�tima Worm

9 estabelecimentos de ensino, respectivamente, segundo o MEC. Faça uma tabela para apresentar esses dados. 6. De acordo com o IBGE(1988), a distribuição dos suicídios ocorridos no Brasil em 1986, segundo a causa atribuída, foi a seguinte: 263 alcoolismo, 198 por dificuldade financeira, 700 por doença metal, 189 por outro tipo de doença, 416 por desilusão amorosa e 217 por outras causas. Apresente essa distribuição em uma tabela.

Página 89

Page 90: Caderno Estat�stica - Rosane de F�tima Worm

Aula 3 – Estatística I – 19/08/10 Profª Rosane Worm

Distribuição de Freqüência

A freqüência é o número de repetições da observação no conjunto de observações. A distribuição de freqüência de uma série de observações é uma função que representa os pares de valores formados por cada observação e seu número de repetições.

Exemplo: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS

PELOS FUNCIONÁRIOS DA EMPRESA Z Salários

semanais (R$) Quantidade( fi)

150 ├ 154 4 154 ├ 158 9 158 ├ 162 11 162 ├ 166 8 166 ├ 170 5 170 ├ 174 3

Total 40 FONTE: PESQUISA DO SETOR DE PESSOAL

Na construção de tabelas de freqüências, devemos observar as seguintes diretrizes: 1. As classes devem ser mutuamente excludentes, ou seja, cada valor original deve pertencer exatamente a uma e só uma classe. 2. Todas as classes devem ser incluídas, mesmo as de freqüência zero. 3. Procurar utilizar a mesma amplitude para todas as classes, embora eventualmente seja impossível evitar intervalos com extremidade aberta. 4. Escolher números convenientes para limites de classe. Arredondar para cima a fim de ter menos casas decimais, ou utilizar números adequados à situação. 5. Utilizar entre 5 e 20 classes. 6. As somas das freqüências das diversas classes deve ser igual ao número de observações originais. Elementos de uma Distribuição de Freqüência 1. Classe: Classes de freqüência ou, simplesmente, classe são intervalos de variação da variável.

As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, . . ., k (onde k é o

número total de classes da distribuição).

Exemplo: O intervalo 154 ├ 158 define a segunda classe (i = 2) A distribuição é formada por seis classes, podemos afirmar que i = 6. 2. Limites de Classe: Determinam-se limites de classes os extremos de cada classe. O menor número é o limite inferior da classe ( li ) e o maior número, o limite superior da classe ( ls ).

Exemplo: Na terceira classe do exemplo acima, temos: li3 = 158 e Ls3= 162 3. Amplitude de um Intervalo de Classe (h): É a medida de intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior. Assim:

Página 90

Page 91: Caderno Estat�stica - Rosane de F�tima Worm

lilsh −=

Exemplo: o intervalo de classe do exemplo acima é 4, pois 162 ├ 158 = 4 4. Amplitude Total ( AT) : É a diferença entre o valor máximo e o valor mínimo da amostra.

AT = Vmax - Vmin

Exemplo: A amplitude amostral do exemplo acima é 24, pois 174 ├150 = 24 5.Ponto Médio de uma Classe ( Xi) : É o ponto que divide o intervalo de classe em duas partes iguais.

2lsliXi +

=

Exemplo: O ponto médio da segunda classe, em nosso exemplo, é 156. 6. TIPOS DE FREQUÊNCIAS

Freqüência absoluta (fi). É o número de repetições de um valor individual ou de uma classe de valores da variável.

Freqüência relativa (fri ou fri%) Representa a proporção de observações de um valor individual ou de uma classe, em relação ao número total de observações, ou seja, é o número de repetições dessa observação dividida pelo tamanho da amostra.

Freqüência absoluta acumulada (Fi). É a soma das freqüências daquela classe e de todas as classes que a antecedem.

Freqüência relativa acumulada (Fri ou Fri%). É a Fi dividida pelo total de observações (n).

Freqüência Simples ou Absoluta (fi): É o número de observações correspondentes a uma classe. A soma de todas as freqüências é representada por:

∑= fiN ( população )

∑= fin ( amostra )

Exemplo: Para a distribuição em estudo, temos: 40== ∑ fin Freqüência Acumulada ( Fi

fiffFi +++= ...21

) É o total das freqüências de todos os valores inferiores ao limite superior. do intervalo de uma dada classe. ou ∑= fiFi

Exemplo: Calcule a freqüência acumulada correspondente à terceira classe, em nosso

exemplo:

Página 91

Page 92: Caderno Estat�stica - Rosane de F�tima Worm

Freqüências Relativas simples (fri

nfifri =

) São os valores da razão entre as freqüências simples e a freqüência total.

Exemplo: Calcule a freqüência relativa simples da terceira classe, em nosso exemplo:

Freqüência Acumulada Relativa ( Fri

nFiFri =

) É a freqüência acumulada da classe, dividida pela freqüência total da distribuição.

Exemplo: Para a terceira classe, qual é a freqüência acumulada relativa?

7. Número de Classes: Pode-se utilizar a regra de STURGES, que fornece o número de classes em função do total de casos:

)(log33,31 NnK += Onde: K é o número de classes; N ou n é o número total de observações. Para determinar a amplitude do intervalo de classe, temos:

KHh =

SIMBOLOGIA ENTRE OS VALORES DE CLASSE:

Inclui o valor da esquerda mas não o da direita. Inclui o valor da direita mas não o da esquerda. Não inclui nem o valor da direita, nem o da esquerda. Inclui tanto o valor da direita quanto o da esquerda.

– Distribuição de Freqüência sem Intervalos de Classe

Quando se trata de variáveis discretas de variação relativamente pequena, cada valor pode ser tomado como um intervalo de classe. Ex: Uma professora organizou os resultados obtidos em uma prova da seguinte forma: 4 – 5 – 7 – 9 – 9 – 4 – 5 – 7 – 9 – 9 – 4 – 5 – 7 – 9 – 9 – 4 – 6 – 8 – 9 – 9 – 4 – 6 – 8 – 9 – 9 Nota Nº de alunos Total

Página 92

Page 93: Caderno Estat�stica - Rosane de F�tima Worm

EXERCÍCIO

1. Complete a seguinte tabela e responda as seguintes perguntas:

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS

PELOS FUNCIONÁRIOS DA EMPRESA Z

Salários semanais (R$)

Freqüências Xi % fr Fi Fri i %

150 ├ 154 4 154 ├ 158 9 158 ├ 162 11 162 ├ 166 8 166 ├ 170 5 170 ├ 174 3

Total 40 100 FONTE: PESQUISA DO SETOR DE PESSOAL

a) Quantos empregados têm salário entre R$ 154, inclusive, e R$ 158? b) Qual a percentagem de empregados cujos salários são inferiores a R$ 154? c) Quantos empregados têm salário abaixo de R$ 162? d) Quantos empregados têm salário não inferior a R$ 158? 1. Conhecidas as notas de 50 alunos: 33 41 50 55 60 66 71 74 81 89 35 42 52 55 61 67 73 76 84 91 35 45 53 56 64 68 73 77 85 94 39 47 54 57 65 68 73 78 85 94 41 48 55 59 65 69 74 80 88 98 Obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10

para intervalo das classes.

Página 93

Page 94: Caderno Estat�stica - Rosane de F�tima Worm

2. Os resultados do lançamento de um dado 50 vezes foram os seguintes 6 5 2 6 4 3 6 2 6 5

1 6 3 3 5 1 3 6 3 4

5 4 3 1 3 5 4 4 2 6

2 2 5 2 5 1 3 6 5 1

5 6 2 4 6 1 5 2 4 3

Forme uma distribuição de freqüência sem intervalos de classe.

4) Abaixo são mostrados os saldos médios amostrais de 48 contas de clientes do BB S.A. ( dados brutos em US$ 1,00).

120 150 250 300 375 500 550 650 800 1000 150 225 270 350 450 500 600 700 900 1000 150 225 275 360 450 500 600 750 950 1000 150 230 275 375 470 500 600 750 1000 150 250 275 375 475 500 650 800 1000

Pede-se: a) agrupar os dados numa distribuição de freqüências com intervalo de classes (use Teorema de STURGES); b) determine as freqüências simples e acumuladas (absolutas e relativas); c) calcule a interprete: fr2, f3 e Fr4 - Fr2;

5. Considere a seguinte distribuição de freqüência correspondente aos diferentes preços de um determinado produto em 20 lojas pesquisadas.

Preços ($) Número de lojas

50 2 51 5 52 6 53 6 54 1

Total 20

a) Quantas lojas apresentaram um preço de $52,00? b) Construa uma tabela de freqüências simples relativas. c) Construa uma distribuição de freqüência acumulada relativa. d) Quantas lojas apresentaram um preço de até $51,00 (inclusive)? e) Qual a porcentagem de lojas com preço maior que $52,00? f) Qual a porcentagem de lojas com preço maior do que $51,00 e menor do que

$54,00?

Página 94

Page 95: Caderno Estat�stica - Rosane de F�tima Worm

6. Com referência tabela abaixo

Distribuição de freqüência de Diárias para 200 apartamentos

Diárias (R$) Número de apartamentos 150 |--- 180 3 180 |--- 210 8 210 |--- 240 10 240 |--- 270 13 270 |--- 300 33 300 |--- 330 40 330 |--- 360 35 360 |--- 390 30 390 |--- 420 16 420 |--- 450 12

Total 200

Responda: a) Quais os limites (inferior e superior) da primeira classe? b) A amplitude dos intervalos de classe é a mesma para todas as classes? c) Suponha um aluguel mensal de $239,50. Identificar os limites superior e inferior da

classe na qual esta observação seria registrada. d) Construir a distribuição de freqüência simples relativa. e) Construir a distribuição de freqüência acumulada.

Página 95

Page 96: Caderno Estat�stica - Rosane de F�tima Worm

Aula 4 – Estatística I – 26/08/10 Profª Rosane Worm

Representação Gráfica Com as tabelas de freqüência, podemos identificar a natureza geral da

distribuição dos dados, bem como construir gráficos que facilitem a visualização dessa distribuição. O gráfico estatístico é uma forma de apresentação dos dados, onde o objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e visual do fenômeno em estudo.

Excelência gráfica 1. É uma apresentação bem elaborada de dados, que fornece substância, estatísticas e formas; 2. Comunica idéias complexas com clareza, precisão e eficiência; 3. Fornece ao observador o maior número de idéias, no menor espaço de tempo, com o menor volume de impressão; 4. Exige que seja transmitida a verdade sobre os dados.

Vejamos alguns tipos de gráficos

Histogramas É utilizado para descrever dados numéricos que tenham sido agrupados

na forma de distribuições de freqüências ou distribuições de freqüências relativas. Ao desenhar um histograma, a variável aleatória de interesse é exibida ao

longo do eixo horizontal (eixo X). O eixo vertical (eixo Y) representa o número (freqüência), proporção ou porcetagem de observações por intervalo de classe.

Altura em centímetros de 160 alunos do

curso de estatística

Fonte: Departamento de Estatística

Idade (em anos) de um grupo de 30 Clientes de uma loja de

calçados em Santa Cruz do Sul Página 96

Page 97: Caderno Estat�stica - Rosane de F�tima Worm

0

2

4

6

8

10

12

14

15|---26 26|---37 37|---48 48|---59 59|---70

Idade (Anos)

Núm

ero

de P

esso

as

Histograma da Percentagem de Fundos de Alto Risco

0%

5%

10%

15%

20%

25%

30%

35%

--- -20 0 20 40 60 80 100

Pontos Médios da Classe

Perc

enta

gem

Como se interpreta um histograma? Este gráfico é utilizado para variáveis contínuas. Características: - Cada barra representa a freqüência do intervalo respectivo; - Os intervalos devem ter a mesma amplitude; - As barras devem estar todas juntas. A simples observação da forma do histograma permite algumas

conclusões. Veja a figura. Os dados têm uma tendência central. As freqüências mais altas estão no centro da figura. Nos processos industriais, esta é a forma desejável.

Página 97

Page 98: Caderno Estat�stica - Rosane de F�tima Worm

A figura ao lado apresenta um

histograma com assimetria positiva. A média dos dados está localizada à esquerda do centro da figura e a cauda à direita é alongada. Esta ocorre quando o limite inferior é controlado ou quando não podem ocorrer valores abaixo de determinado limite.

A figura apresenta um histograma com

assimetria negativa. A média dos dados está localizada à direita do centro da figura e a cauda à esquerda é alongada. Esta forma ocorre quando o limite superior é controlado ou quando não podem ocorrer valores acima de certo limite.

Histograma em plateau, isto é, com

exceção das primeiras e das últimas classes, todas as outras têm freqüências quase iguais. Essa forma ocorre quando se misturam várias distribuições com diferentes médias.

Histograma

Histograma com assimetria positiva

Histograma com assimetria negativa

Histograma em plateau

Página 98

Page 99: Caderno Estat�stica - Rosane de F�tima Worm

A figura mostra um histograma com dois

picos, ou duas modas. As freqüências são baixas no centro da figura, mas existem dois picos fora do centro. Esta forma ocorre quando duas distribuições com médias bem diferentes se misturam. Podem estar misturados, por exemplo, os produtos de dois turnos de trabalho.

Os histogramas também mostram o grau de dispersão da variável. O

histograma à esquerda mostra pouca dispersão, mas o histograma à direita mostra grande dispersão.

Histogramas com dispersões diferentes

Usado principalmente para ilustrar uma série temporal.

Gráficos em Linhas

Produção de Petróleo Bruto no

Brasil de 1976 a 1980 (x1000 m³)

Fonte: Conjuntura Econômica (Fev. 1983)

Histograma com Dois picos

Página 99

Page 100: Caderno Estat�stica - Rosane de F�tima Worm

Gráfico de linhas comparativas

População Urbana do Brasil por Região de 1940 a 1980 (x 1000)

Fonte: Conjuntura Econômica (1984)

Gráficos de colunas ou barras

Representação gráfica da distribuição de freqüências. Este gráfico é utilizado para variáveis nominais e ordinais.

Características: • Todas as barras devem ter a mesma largura • Devem existir espaços entre as barras

Gráfico de Colunas Usado para ilustrar qualquer tipo de série.

População Urbana do Brasil em 1980 (x 1000)

5115

11878

42810

17568

3037

05000

1000015000200002500030000350004000045000

CO S SE NE N

Regiões

Popu

laçã

o

Fonte: Anuário Estatístico (1984)

Página 100

Page 101: Caderno Estat�stica - Rosane de F�tima Worm

Fonte: Anuário Estatístico (1984)

As larguras das barras que deverão ser todas iguais podendo ser adotado qualquer dimensão, desde que seja conveniente e desde que não se superponham. O número no topo de cada barra pode ou não ser omitido, se forem conservados, a escala vertical pode ser omitida.

Gráfico de colunas comparativas a. Colunas Justapostas (gráfico comparativo)

População Urbana do Brasil por Região de

1940 a 1980 (x1000)

Fonte: Anuário Estatístico (1984)

b. Colunas Sobrepostas (gráfico comparativo)

População Urbana do Brasil por Região de 1940 a 1980 (x 1000)

Página 101

Page 102: Caderno Estat�stica - Rosane de F�tima Worm

Fonte: Anuário Estatístico (1984)

Gráfico de Barras As regras usadas para o gráfico de barras são iguais as usadas para o

gráfico de colunas.

População Urbana do Brasil em 1980 (x 1000)

5115

11878

42810

17568

3037

0 10000 20000 30000 40000 50000

CO

S

SE

NE

N

Fonte: Anuário Estatístico (1984)

Assim como os gráficos de Colunas podem ser construídos gráficos de

barras comparativas. Representação gráfica da freqüência relativa (percentagem) de cada

categoria da variável. Este gráfico é utilizado para variáveis nominais e ordinais. É uma opção ao gráfico de barras quando se pretende dar ênfase à comparação das percentagens de cada categoria. A construção do gráfico de setores segue uma regra de 3 simples, onde as freqüências de cada classe correspondem ao ângulo que se deseja representar em relação à freqüência total que representa o total de 360.

Gráficos circulares ou de Setores

Características: Página 102

Page 103: Caderno Estat�stica - Rosane de F�tima Worm

• A área do gráfico equivale à totalidade de casos (360º = 100%); • Cada “fatia” representa a percentagem de cada categoria.

População Urbana e Rural do Brasil em 1980 (x 1000)

68%

32%

Urbana

Rural

Fonte: Anuário Estatístico (1984)

População Urbana e Rural do Brasil em 1980 (x 1000)

68%

32%

UrbanaRural

Fonte: Anuário Estatístico (1984)

Tem por objetivo despertar a atenção do público em geral, muito desses gráficos apresentam grande dose de originalidade e de habilidade na arte de apresentação dos dados.

Gráfico Pictorial - Pictograma

Evolução da matricula no Ensino Superior no Brasil de 1968 a 1994 (x 1000)

Página 103

Page 104: Caderno Estat�stica - Rosane de F�tima Worm

Fonte: Grandes números da educação brasileira março de 1996

Os métodos mais eficientes para deixar de fumar segundo 30.000 fumantes entrevistados no Canadá

É o tipo de gráfico ideal para representar séries temporais cíclicas, ou seja, toda a série que apresenta uma determinada periodicidade.

Gráfico Polar (radar)

Precipitação pluviométrica do município de Santa Maria – RS- 1999

Fonte: Base Aérea de Santa Maria Página 104

Page 105: Caderno Estat�stica - Rosane de F�tima Worm

É a representação de uma carta geográfica. Este tipo de gráfico é

empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com as áreas geográficas ou políticas.

Cartograma

Atividades 1. O gráfico a seguir ilustra o número de inscritos nos últimos quatro

vestibulares que disputaram as vagas oferecidas pela Universidade de São Paulo (USP) e pelas universidades federais do Rio de Janeiro (UFRJ), de Minas Gerais (UFMG) e do Rio Grande do Sul (UFRGS).

Fonte: Época 26/04/99 (com adaptações)

Com base nessas informações, julgue os itens seguintes como verdadeiro

ou falso: a. De 1997 a 1998, o crescimento percentual do número de inscritos na

USP foi maior que o da UFRGS. (___) b. Os crescimentos percentuais anuais na UFRJ diminuíram a cada ano.

(___) c. Todas as universidades tiverem crescimento no número de inscritos no

referido período. (___) d. A UFRGS foi a única que apresentou crescimento no número de

inscritos. (___)

Brasil por vendas (em mil reais)

144 237 300 440 320

Página 105

Page 106: Caderno Estat�stica - Rosane de F�tima Worm

e. A UFMG teve um crescimento de mais de 100% no número de inscritos no período. (___)

f. A UFRGS teve um crescimento de 3,74%, 36,17% em 97 e 98, respectivamente, e uma redução de cerca de 3,17% no número de inscritos em 99.

2. Numa turma de cursinho de informática, a distribuição das idades dos alunos, segundo o sexo, é dada pelo gráfico seguinte.

Com base nos dados do gráfico, pode-se afirmar que: a. o número de meninas com, no máximo, 16 anos é maior que o

número de meninos nesse mesmo intervalo de idade. (___) b. o número total de alunos é 19. (___) c. a média de idade das meninas é 15 anos. (___) d. o número de meninos é igual ao número de meninas. (___) e. o número de meninos com idade maior que 15 anos é maior que o

número de meninas nesse mesmo intervalo de idades. (___)

3. Considere os dados referentes ao consumo de água, em m3

, de 75 contas da CORSAN.

32 40 22 11 34 40 16 26 23 31 27 10 38 17 13 45 25 10 18 23 35 22 30 14 18 20 13 24 35 29 33 48 20 12 31 39 17 58 19 16 12 21 15 12 20 51 12 19 15 41 29 25 13 23 32 14 27 43 37 21 28 37 26 44 11 53 38 46 17 36 28 49 56 19 11

a. agrupar os dados em uma distribuição de freqüência. Utilize o limite inferior da distribuição igual a zero na primeira classe e amplitude de classe 10. b. determine as freqüências simples e acumuladas ( absolutas e relativas); c. calcule e interprete: fr2 , f3 e Fr4 – Fr2d. construa o correspondente histograma de freqüências relativas.

;

5. Abaixo são mostrados os saldos médios em R$ de 48 contas de clientes do BB Novo S.A.

450 500 150 1000 250 275 550 500 225 475 150 450 950 300 800 275 600 750 375 650 150 500 1000 700 475 900 800 275 600 750 375 650 150 500 225 250 150 120 250 360 230 500 350 375 470 600 1030 270 Página 106

Page 107: Caderno Estat�stica - Rosane de F�tima Worm

a. Agrupe os dados numa distribuição de freqüências. b. Determine as freqüências relativas: simples e acumulada. c. Apresente o histograma de freqüências relativas.

6. Conhecidas as notas de 50 alunos: 33 40 41 50 55 65 68 74 84 94 35 40 42 52 59 65 69 76 85 97 35 40 45 53 60 66 71 77 88 97 39 41 47 54 61 66 73 77 89 100 39 41 48 55 64 67 74 80 94 100 a) Construa uma tabela de freqüências usando a regra de Sturges. b) Construa o histograma e o polígono de freqüências. 7- Em uma eleição concorreram os candidatos A, B e C e, apurada a primeira urna, os votos foram os seguintes: A: 50 votos; B: 80 votos; C: 60 votos; brancos e nulos: 10 votos.A partir desses dados construa:

a) O gráfico de barras horizontal

8- Construa os gráficos de barras verticais e de setores para a variável hobby .

Hobby Freqüência Esporte 8 Música 6 Patinação 3 Dança 7

Página 107

Page 108: Caderno Estat�stica - Rosane de F�tima Worm

Aula 5 – Estatística I- 02/09/10 Profª Rosane Worm

MEDIDAS DE TENDÊNCIA CENTRAL

Uma medida de tendência central é um valor no centro ou no meio de um conjunto de dados.

Estudaremos aqui: Médias: aritmética, geométrica, ponderada e móvel Mediana Moda Ponto médio.

1. Média aritmética A média (aritmética) é, de modo geral, a mais importante de todas as

mensurações numéricas descritivas. A média aritmética de um conjunto de valores é o resultado da divisão da soma de todos os elementos desse conjunto pelo número de elementos do conjunto. Representamos a média pelo símbolo:

x Média da amostra (leia-se “x barra”) µ média da população (minúscula grega: mi)

então

Média de uma amostra: ixxnΣ

=

Média de uma população: ixN

µ Σ=

Onde, n é o tamanho da amostra. N é o tamanho da população. Σ indica um somatório de valores (sigma maiúsculo).

Ex. Selecionados aleatóriamente 10 alunos da turma, e obtemos as seguntes alturas (em m):

1,76 1,73 1,80 1,65 1,70 1,74 1,81 1,63 1,77 1,59 Calcule a média das alturas. Solução: Como se trata de uma amostra:

1,76+1,73+1,80+1,65+1,70+1,74+1,81+1,63+1,77+1,59 17,18 1,71810 10

ixxnΣ

= = = =

Página 108

Page 109: Caderno Estat�stica - Rosane de F�tima Worm

Média Aritmética Ponderada – dados agrupados

Sem intervalos de classe: As freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que leva a calcular a média aritmética ponderada.

N

fixi∑=.

µ ( população ) n

fixiX ∑=

. ( amostra )

Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos,

adotando-se a variável “número de filhos do sexo masculino”, determine a média.

N.º de Meninos f i

0 2 1 6 2 10 3 12 4 4 Σ = 34

Com intervalos de classe: Convenciona-se que todos os valores incluídos

em um determinado intervalo de classe coincidem com o seu ponto médio, e determina-se a média aritmética ponderada.

Nfixi∑=

.µ ( população )

nfixi

X ∑=.

( amostra )

onde Xi é o ponto médio da classe. Exemplo:

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS FUNCIONÁRIOS DA EMPRESA Z

Salários semanais (R$)

Freqüências

150 ├ 154 4 154 ├ 158 9 158 ├ 162 11 162 ├ 166 8 166 ├ 170 5 170 ├ 174 3

Total 40 FONTE: PESQUISA DO SETOR DE PESSOAL

Página 109

Page 110: Caderno Estat�stica - Rosane de F�tima Worm

Média Geométrica Simples Para uma seqüência numérica x: x1, x2, ......., xn

gx, a média geométrica simples,

que designaremos por , é definida por:

Exemplo: Se X: 2, 4, 6, 9, então:

559,44329.6.4.244

===gx Média Geométrica Ponderada Para uma seqüência numérica x: x1, x2, ...., xn afetados de pesos p1, p2, ..., pn

gxrespectivamente, a média geométrica ponderada que designaremos por é definida por:

Exemplo: Se x: 1, 2, 5, com pesos 3, 3, 1 respectivamente então:

6938,1405.8.15.2.177133

7====gx

Observando-se que: A média geométrica só é indicada para representar uma série de valores

aproximadamente em progressão geométrica. Os casos anteriores não são muito freqüentes nas aplicações. Vamos

restringir o desenvolvimento de médias ao caso de média aritmética, que é a média mais utilizada nas aplicações.

4. Média Móvel

Uma média, como o nome diz, mostra o valor médio de uma amostra de determinado dado. Uma média móvel aritmética

Exemplo: A média móvel simples é calculada pela formação do preço médio por um número específico de períodos. Para o cálculo usamos o preço de fechamento. Por exemplo: Vamos utilizar a média dos últimos 10 dias. Devemos somar os preços finais durante os últimos 10 dias e dividir o total por 10.

(MMA) é uma extensão desse conceito, representando o valor médio, normalmente dos preços de fechamento, em um período de tempo.

Página 110

Page 111: Caderno Estat�stica - Rosane de F�tima Worm

10+11+12+13+14+15+16+17+18+19=145

(145/10) = 14,50

Devemos repetir este cálculo conforme o passar dos dias, assim, as médias vão se juntando e formando uma linha. Se continuarmos com o nosso exemplo, o próximo preço final na média será 20, então teremos um novo período, somando o último dia (20) e removendo o primeiro da lista (10). Continuando com a média dos últimos 10 dias, a média móvel simples deverá ser calculada da seguinte maneira:

11+12+13+14+15+16+17+18+19+20=155

(155/10) = 15,50

Repare que removemos o primeiro dia da lista (10) para incluir o novo dia (20).

Durante os últimos dois dias, a média moveu-se de 14,50 para 15,50. Como são somados novos dias, os antigos serão removidos e a média permanece se movendo com o passar do tempo.

No modelo da média móvel, a projeção 1ˆ +ty é calculada com a fórmula:

11

t

t ii t k

y yk+

= − +

= × ∑

Ou, média móvel de ordem k:

1 2 11

...ˆ t t t t k

tY Y Y Yy

k− − − +

+

+ + + +=

EXERCÍCIOS 1. As notas finais de 15 alunos de um curso de computação estão

apresentadas abaixo. Qual a média das notas obtidas?

NOTAS 7,5 9,0 4,5 4,0 5,5 8,0 8,5 9,0 7,5 7,5 7,0 6,5 7,5 9,0 6,5

2. Os dados abaixo referem-se ao tempo de vida útil, em anos, de

determinado aparelho eletrônico: 5 – 5 – 6 – 4 – 20

Calcule a média aritmética simples.

Página 111

Page 112: Caderno Estat�stica - Rosane de F�tima Worm

3. No ano 2000, o número de nascimentos, por mês, em uma maternidade foi:

MÊS Jan. Fev. Março Abril Maio Junho Julho Agosto Set. Out. Nov. Dez.

NASC. 38 25 42 30 29 47 18 36 38 43 49 37 a) Calcule a média mensal de nascimentos. b) Em que meses o número de nascimentos ficou acima da média? 4. A classificação final para um determinado curso é a média ponderada

das provas de capacidade geral, com peso 3, e das provas de capacidade específica, com peso 2. Nessas condições, qual é a classificação final de um aluno que obteve 162 pontos na prova de capacidade geral e 147 pontos na prova de capacidade específica?

5. O quadro de distribuição de freqüências representa os salários mensais

de 40 empregados de uma firma.

CLASSE (EM REAIS)

PONTO MÉDIO DA CLASSE ( XI

FREQÜÊNCIA ( f ) i )

180 ├ 200 190 4 200 ├ 220 210 18 220 ├ 240 230 10 240 ├ 260 250 5 260 ├ 280 270 3

Calcule o salário médio mensal dos empregados dessa firma. 6. Calcule a média geométrica para as séries: X : 1, 2, 4, 7, 16

Y : 81, 26, 10, 3, 1

7. Calcule a média aritmética da série:

x fi i 2 1 3 4 4 3 5 2

Página 112

Page 113: Caderno Estat�stica - Rosane de F�tima Worm

Aula 6 – Estatística I – profª Rosane Worm

09/09/2010 A Mediana A mediana de um conjunto de valores é o valor do meio desse conjunto, quando os valores estão

dispostos em ordem crescente (ou decrescente). A mediana é representada geralmente por x~ (lê-se: “x til”) ou pode também ser representada com o símbolo md..

Para calcular a mediana, primeiro coloque os valores em ordem (crescente ou decrescente); em seguida aplique um dos dois processos a seguir:

Se o número de valores é ímpar, a mediana é o número localizado exatamente no meio da lista.

Se o número de valores é par, a mediana é a média dos dois valores do meio.

Exemplo 1. Calcule a mediana da altura de 7 alunos da turma. 1,76 1,73 1,80 1,65 1,70 1,74 1,81 Exemplo 2. Calcule a mediana da altura de 8 alunos da turma. 1,76 1,73 1,80 1,65 1,70 1,74 1,81 1,63

Moda A moda de um conjunto de dados é o valor que ocorre com maior freqüência. Quando dois valores ocorrem com a mesma freqüência máxima, cada um deles é uma moda, e o

conjunto se diz bimodal. Se mais de dois valores ocorrem com a mesma freqüência máxima, cada um deles é uma moda, e o conjunto é multimodal. Quando nenhum valor é repetido, o conjunto não tem moda (amodal). Costuma-se denotar a moda por Mo.

Exemplo 1. Um estudo sobre tempos de reação abrangeu 30 canhotos, 50 destros e 20 ambidestros. Qual é a moda das características citadas.

Exemplo 2. Determine a moda dos seguintes conjuntos de dados: a. 5 5 5 3 1 5 1 4 3 5 b. 1 2 2 2 3 5 6 6 6 7 9 4 c. 1 2 3 6

Ponto Médio O ponto médio é o valor que está a meio caminho entre o maior e o menor valor. Para obtê-lo,

somamos esses valores extremos e dividimos o resultado por 2, como na fórmula a seguir:

ponto médio =2

maior valor menor valor+

Embora o ponto médio não seja muito usado, incluímo-lo aqui para enfatizar o fato de que há

diferentes maneiras de definir o centro de um conjunto de dados. Ao nos referirmos ao valor médio de um conjunto de dados, devemos ser precisos, mencionando o

termo exato, como média, mediana, moda ou ponto médio. Página 113

Page 114: Caderno Estat�stica - Rosane de F�tima Worm

Exemplo. Calcule o ponto médio da altura de 8 alunos da turma. 1,76 1,73 1,80 1,65 1,70 1,74 1,81 1,63

Regra do Arredondamento Eis uma regra simples para arredondamento de respostas: “Tome uma decimal a mais, além das que aparecem nos dados.” Devemos arredondar apenas a resposta final, e não os valores intermediários. Por exemplo,

a média de 2, 3, 5 é 3,33333333..., que deve ser arredondada para 3,3. Como os dados originais são expressos em números inteiros, arredondamos a resposta para o décimo mais próximo. Outro exemplo: a média de 2,1, 3,4 e 5,7 é arredondada para 3,73 com duas decimais (uma a mais em relação às que figuram nos valores originais).

Atividades 1. As idades em anos de 25 pessoas presentes nesta sala de aula são: 20, 19, 22, 24, 25, 26, 18, 19, 18, 20, 21, 22, 23, 21, 19, 20, 19, 22, 21, 23, 24, 25, 22, 20, 22. Determine a média, moda, mediana e ponto médio de idade desse grupo de pessoas.

2. Calcule a média para a amostra abaixo que representa as pessoas apresentados na questão anterior:

PESOS ( Kg) fi

45 |--- 50

50 |--- 55

55 |--- 60

60 |--- 65

65 |--- 70

70 |--- 75

2

5

8

5

3

2

3. Numa faculdade obtiveram-se amostras de carros de estudantes e carros de professores e funcionários da faculdade, com as respectivas idades (em anos). Essas idades estão resumidas na tabela de freqüência a seguir. Ache a idade média de ambos os grupos de carros. Encontre também a classe modal e a classe da mediana.

Idade (em anos) Estudantes Profs. E Funcs.

0 - 2 23 30 3 - 5 33 47 6 - 8 63 36 9 - 11 68 30 12 - 14 19 8 15 - 17 10 0 18 - 20 1 0 21 - 23 0 1

4. As companhias de seguro pesquisam continuamente as idades na morte e as respectivas causas. Os dados se baseiam em um estudo de uma revista sobre mortes causadas por armas de fogo na América durante uma semana. Calcule a média, o ponto médio. Encontre as classes modal e mediana.

Página 114

Page 115: Caderno Estat�stica - Rosane de F�tima Worm

Idade na morte Freqüência 16 - 25 22 26 - 35 10 36 - 45 6 46 - 55 2 56 - 65 4 66 - 75 5 76 - 85 1

5. Qual é a média de idade de um grupo em que há 6 pessoas de 14 anos, 9 pessoas de 20 e 5 pessoas de 16? 6. Pesquisa sobre o peso em quilogramas de um grupo de pessoas. Determine a média, a moda e a mediana: Peso (kg) fi 40 ├ 44 1 44 ├ 48 3 48 ├ 52 7 52 ├ 56 6 56 ├ 60 3 Total 20 7. Determine a média, a moda e a mediana: Idade (em anos) fi 13 3 14 2 15 4 16 1 Total 8. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7; e 7,2. Determine: a) A nota média. b) A nota mediana. c) A nota modal.

Página 115

Page 116: Caderno Estat�stica - Rosane de F�tima Worm

– Aula 7 – Estatística- 16/09/2010 Profª Rosane Worm

1. A parcela da população convenientemente escolhida para representá-la é

chamada de: a) variável b) rol c) amostra d) dados brutos e) nenhuma das alternativas acima 2. Os gráficos próprios de uma distribuição de freqüência são:

a) colunas, curva de freqüência e histograma b) polígono de freqüência e histograma c) colunas, curva de freqüência e polígono de freqüência d) gráfico de setor, gráfico de barra, curva de freqüência e curva normal e) colunas, barra, setor e curva de freqüência.

3. Dados os conjuntos de valores abaixo A = { 3, 5, 6, 8, 9, 10, 10, 10, 11, 12, 17 } B = { 4, 5, 7, 10, 11, 13, 15 } C = { 2, 3, 4, 5, 5, 5, 5, 6, 7, 8, 8, 8, 8, 9, 10, 11 } Em relação à moda, podemos dizer que

I. A é unimodal e a moda é 10 II. B é unimodal e a moda é 10 III. C é bimodal e as modas são 5 e 8

Então: a. estas afirmações estão todas corretas b. estas afirmações estão todas erradas c. I e II estão corretas d. I e III estão corretas e. II e III estão corretas.

4. A altura de 80 homens de uma comunidade está distribuída de acordo com a tabela abaixo:

Altura (metros) f fri Fri (%) i % 1,60 ├ 1,65 4 5 5 1,65 ├ 1,70 12 15 20 1,70 ├ 1,75 18 22,5 42,5 1,75 ├ 1,80 26 32,5 75 1,80 ├ 1,85 10 12,5 87,5 1,85 ├ 1,90 8 10 97,5 1,90 ├ 1,95 2 2,5 100

Total 80 100

Página 116

Page 117: Caderno Estat�stica - Rosane de F�tima Worm

A moda que corresponde aos dados da tabela é a) 1,75 m. b) 1,80 m c) 1,775 m d) 1,70 m e) 1,725 m

5. A representação gráfica que apresenta a sequência de um trabalho de forma analítica, caracterizando as operações, os responsáveis e(ou) as unidades organizacionais envolvidas no processo é chamada de (A) organograma. (B) histograma. (C) gráfico de barras. (D) diagrama de dispersão. (E) fluxograma.

Página 117

Page 118: Caderno Estat�stica - Rosane de F�tima Worm

FACULDADE DOM ALBERTO Aula 8- Estatística- 14/10/2010

Profª Rosane Worm MEDIDAS DE DISPERSÃO Dispersão ou Variabilidade A média, ainda que considerada como um número que tem a faculdade de representar uma série de números não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. Considerando os seguintes conjuntos de valores das variáveis X, Y e Z:

X: 5, 5, 5, 5, 5. Y: 3, 4, 5, 6, 7. Z: 5, 0, 10, 8, 2. Calculando a média aritmética de cada um desses conjuntos, obtém-se: === ZYX 5. Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno do valor da média, pode-se dizer que o conjunto Xi apresenta dispersão ou variabilidade nula e que o conjunto yi apresenta uma dispersão ou variabilidade menor que o conjunto zi. Para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua média, é necessário recorre às medidas de dispersão. Dessas medidas, estudaremos: a variância absoluta, o desvio padrão e o coeficiente de variação ou de variabilidade.

Medidas de Dispersão Absoluta As principais medidas de dispersão absolutas são: amplitude total, desvio médio simples,

variância e desvio padrão.

1. DESVIO MÉDIO SIMPLES

O desvio médio simples que indicaremos por DMS é definido como sendo uma média aritmética do desvio de cada elemento da série para a média da série.

Cálculo do Desvio Médio Simples:

1º) Caso:

Dados Brutos ou Rol

Calculamos inicialmente a média da seqüência. Em seguida identificamos a distância de cada elemento da seqüência para sua média. Finalmente, calculamos a média destas distâncias.

Se a seqüência for representada por X: x1, x2, x3,... , xn

, então DMS admite como fórmula de cálculo:

DMS = ∑ xi - x

Página 118

Page 119: Caderno Estat�stica - Rosane de F�tima Worm

n Exemplo: Calcule o DMS para a seqüência x : 2, 8, 5, 6.

O DMS é a média aritmética simples destes valores. 2º) Caso:

Variável Discreta

No caso da apresentação de uma variável discreta, lembramos que a freqüência simples de cada elemento representa o número de vezes que este valor figura na série. Conseqüentemente, haverá repetições de distâncias iguais de cada elemento distinto da série para a média da série. Assim, a média indicada para estas distâncias é uma média aritmética ponderada.

A fórmula para o cálculo do DMS é: DMS = ∑| xi – x | fi ∑ f

.

i

Exemplo: Determinar o DMS para a série: X fi i 1 2 3 5 4 2 5 1

3º) Caso:

Variável Contínua

Nesta situação, por desconhecer os valores individuais dos elementos componentes da série, substituiremos estes valores xi

Desta forma, o desvio médio simples tem por cálculo a fórmula: , pelos pontos médios da classe.

DMS = ∑ xi – x f ∑ f

i

i

Onde xi

é o ponto médio da classe i.

Exemplo: Determinar o DMS para a série: Classe Intervalo de classe fi 1 2 4 5 2 4 6 10 3 6 8 4 4 8 10 1

Página 119

Page 120: Caderno Estat�stica - Rosane de F�tima Worm

Exercícios:

1. Calcule o DMS da série X : 3, 8, 12, 3, 9, 7.

2. Calcule o DMS da série Y: 2; 2,5; 3,5; 7; 10; 14,5; 20.

3. Calcule o DMS da série:

X fi i 2 3 4 8 5 10 6 6 8 2 10 1

4. Responda, justificando: Qual das série X e Y da 1ª e 2ª questão possui maior dispersão

absoluta?

5. Calcule o DMS da série: Classe

Salários US$

Nº de vendedores

1 70 120 8 2 120 170 28 3 170 220 54 4 220 270 32 5 270 320 12 6 320 370 6

6. A tabela mostra o total de pontos obtidos por dois times de futebol no período de 1996 a 2000.

ANOS 1996 1997 1998 1999 2000 TIME A 7 12 20 16 10 TIME B 18 16 15 9 12

a) Qual o desvio médio de cada um desses times? b) Qual o time mais regular nesse período?

Variância (σ² ou s²) e Desvio Padrão (σou s) A amplitude total e o desvio médio também são medidas de variação, no entanto a variância e o desvio padrão levam em consideração a totalidade dos valores da variável em estudo sem utilizar a idéia de módulo, o que faz delas índices de variabilidade bastante estáveis e os mais empregados. A variância

Página 120

Page 121: Caderno Estat�stica - Rosane de F�tima Worm

baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios.

Dados não agrupados Dados agrupados

Nxi∑ −

=2

2 )( µσ ou

Nfixi∑ −

=2

2 )( µσ ( população )

1)( 2

2

−= ∑

nxxi

s ou 1

)( 22

−= ∑

nfixxi

s ( amostra)

Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade

quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente. Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas,

denominada desvio padrão, definida como a raiz quadrada da variância. 2σσ = ( população )

2ss = ( amostra )

• Tanto o desvio padrão como a variância são usados como medidas de dispersão ou variabilidade.

O uso de uma ou de outra dependerá da finalidade que se tenha em vista. • A variância é uma medida que tem pouca utilidade na estatística descritiva, porém é extremamente

importante na inferência estatística e em combinações de amostras.

Para o cálculo do desvio padrão, considera-se os seguintes casos: Observe como exemplo, o conjunto de valores da variável populacional x: 40, 45, 48, 52, 54, 62 Exemplo: Calcule o desvio padrão da seguinte distribuição amostral:

X

i f

i Xi f

__ i (Xi - x )2 .

fi 0 2 1 6 2 12 3 7 4 3 30

Com intervalos de classe

Exemplo: Calcule o desvio padrão da tabela abaixo.

Página 121

Page 122: Caderno Estat�stica - Rosane de F�tima Worm

SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS FUNCIONÁRIOS DA EMPRESA Z

Salários semanais (R$) Freqüências 150 |--- 154 4 154 |--- 158 9 158 |--- 162 11 162 |--- 166 8 166 |--- 170 5 170 |--- 174 3

Total 40 FONTE: PESQUISA DO SETOR DE PESSOAL

Exercícios sobre Medidas de Dispersão 1) Calcule a variância e o desvio padrão da População: X: 2, 3, 7, 9, 11, 13. 2)Calcule a variância e o desvio padrão da População: Y: 5, 12, 4, 20, 13, 17. 3) Calcule a variância e o desvio padrão da amostra: Z: 15, 16, 17, 20, 21. 4) Calcule a variância e o desvio padrão da amostra: T: 6, 5, 10, 12, 19. 5) Calcule a variância e o desvio padrão da população:

Idade (anos) Nº. de alunos 17 3 18 18 19 17 20 8 21 4 50

Página 122

Page 123: Caderno Estat�stica - Rosane de F�tima Worm

6) Calcule a variância e o desvio padrão para o número de acidentes diários, observados em um cruzamento, durante 40 dias. (Amostra)

Nº. de acidentes por dia Nº. de dias 0 30 1 5 2 3 3 1 4 1

7) Calcule a variância e o desvio padrão para a distribuição de valores de 54

notas fiscais emitidas na mesma data, selecionadas em uma loja de departamentos. (Amostra)

Classe Consumo por nota US$ Nº.de notas 1 0├ 50 10 2 50├100 28 3 100 ├ 150 12 4 150├ 200 2 5 200├ 250 1 6 250├ 300 1 54

8) Calcule a variância e o desvio padrão para as alturas de 70 alunos de uma classe (Amostra).

Classe Alturas (cm)

Nº. de alunos

1 150├ 160 2 2 160├ 170 15 3 170├ 180 18 4 180├ 190 18 5 190├ 200 16 6 200├ 210 1

Página 123

Page 124: Caderno Estat�stica - Rosane de F�tima Worm

Aula 9 – Estatística – 21/10/2010 Profª Rosane Worm

1. As companhias de seguro pesquisam continuamente as idades na morte e as respectivas causas. Os dados se baseiam em um estudo de uma revista sobre mortes causadas por armas de fogo na América durante uma semana. Calcule o desvio-padrão e a variância.

Idade na morte Freqüência 16 - 25 22 26 - 35 10 36 - 45 6 46 - 55 2 56 - 65 4 66 - 75 5 76 - 85 1

2. Calcule o desvio-padrão e a variância para a amostra abaixo que representa o peso das pessoas.

PESOS ( Kg) f

45 |--- 50 50 |--- 55 55 |--- 60 60 |--- 65 65 |--- 70 70 |--- 75

2 5 8 5 3 2

3. Em um colégio funciona uma cantina. Os gastos diários de 12 alunos com a cantina estão abaixo relacionados em reais: (amostra)

0,80 1,20 0,90 1,40 2,00 1,00 1,50 1,50 0,80 1,50 1,00 0,80 a) determine o gasto médio diário de um aluno na cantina. b) Determine a variância e o desvio padrão. c) Qual é a moda dos gastos diários na cantina?

4. Com o objetivo de verificar o comportamento do consumidor, um órgão de defesa do consumidor registrou o seguinte número de queixas ao longo de 10 dias: (amostra)

58 39 63 60 95 48 56 72 75 80 a) Determine à média e a mediana do número de queixas recebidas? b) Qual é o desvio padrão dos dados acima?

5. Em uma classe as notas obtidas pelos alunos foram agrupadas da seguinte maneira: (população)

Nota Nº alunos 0 ├ 2 1 2 ├ 4 6 4 ├ 6 9 6 ├ 8 8 8 ├ 10 6

A partir desses dados calcule o desvio padrão.

Página 124

Page 125: Caderno Estat�stica - Rosane de F�tima Worm

-2

-3

0

1

2

3

-1

Valores incomuns

Valores incomuns

Valores Usuais

Valores incomuns

z

Aula 10- Estatística – 28/10/2010

Profª Rosane Worm

Medidas de Posição As Medidas de Posição nos permitem comparar valores, elas nos dão informações

importantes sobre sobre a posição dos dados dentro do conjunto. Estudaremos aqui: Escore Z Quartis, Decis e Percentis.

Escores z O escore padronizado, ou escore z, é o número de desvios-padrão

pelo qual um valor x dista da média (para mais ou para menos). Obtém-se como segue:

x xzs−

= → Amostra

xz µσ−

= → População

A importância dos escores z na estatística reside no fato de que eles permitem distinguir

entre valores usuais e valores raros, ou incomuns. Consideramos usuais os valores cujos escores padronizados estão entre -2,00 e 2,00, e incomuns os valores com escore z inferior a -2,00 ou superior a 2,00. Nosso critério para classificar um escore z como incomum decorre da regra empírica e do teorema de Tchebichev.

Exemplo. As alturas da população de homens adultos têm média µ = 175 cm., desvio-

padrão σ = 7,1 cm. e distribuição em forma de sino. O jogador de basquete Michael Jordan ganhou reputação de gigante por suas proezas no jogo, mas com 198 cm, ele pode ser considerado excepcionalmente alto, comparado com a população geral de homens adultos? Determine o escore z para a altura de 198 cm.

Em comparação com a população geral, Michel Jordan é exepcionalmente alto. Quartis, Decis e Percentis

OBS: Arredondar z para duas decimais.

Página 125

Page 126: Caderno Estat�stica - Rosane de F�tima Worm

Assim como a mediana divide os dados em duas partes iguais, os três quartis, denotados por

Q1, Q2 e Q3

- Q

, dividem as observações ordenadas (dispostas em ordem crescente) em quatro partes iguais. Ao grosso modo:

1 - Q

separa os 25% inferiores dos 75% superiores dos valores ordenados; 2

- Qé a mediana;

3

separa os 75% inferiores dos 25% superiores dos dados.

Mais precisamente, ao menos 25 % dos dados serão no máximo iguais a Q1, e ao menos 75% dos dados serão no mínimo iguais a Q1 3Q. Ao menos75% dos dados serão no máximo iguais a , enquanto ao menos 25 % serão, no mínimo, iguais a 3Q .

Analogamente, há nove decis, denotados por 1D , 2D , 3D ,..., 9D , que dividem os dados em

10 grupos com cerca de 10% deles em cada grupo. Há, finalmente, 99 percentis, que dividem os dados em 100 grupos com cerca de 1% em

cada grupo.

O processo de determinação do percentil correspondente a um determinado valor x, é bastante simples, como se pode ver na expressão seguinte.

número de valores inferiores apercentil do valor 100número total de valores

xx = ⋅

Para o processo inverso, há vários métodos diferentes para achar o valor correspondente a

determinado percentil, sendo um deles:

Cálculo do p-ésimo percentil Etapa 1: Arranje os dados na ordem crescente Etapa 2: Calcule o índice L

100

kL n = ⋅

onde n → número de escores, ou valores, no conjunto de dados k → percentil a ser utilizado

L → indicador que dá a posição de um escore

kP → mok percentil

Página 126

Page 127: Caderno Estat�stica - Rosane de F�tima Worm

Uma vez dominados os cálculos para os percentis, podemos seguir o mesmo processo para

calcular os quartis e decis fazendo-se os ajustes relativos. Sendo que:

Quartis Decis 1 25Q P= 1 10D P=

2 50Q P= 2 20D P=

3 75Q P= 9 90D P=

Exemplo: calcule Q1

da sequência X : 2, 5, 8, 5, 5, 10, 12, 12, 11, 13, 15

Exemplo: calcule D3 da sequência: 2; 8; 7,5; 6; 10; 12; 2; 9 Exemplo: calcule D4

X da série

fi i 2 3 4 5 5 8 7 6 10 2

Exemplo: Calcule o Q3

da série

Classe Intervalo de classe f i 1 0 ├ 10 16 2 10 ├ 20 18 3 20 ├ 30 24 4 30 ├ 40 35 5 40 ├ 50 12

Atividades 1. Os carros dos estudantes de certa faculdade têm idade média de 7,9 anos com desvio-

padrão de 3,67 anos, determine os escores z para os carros com as seguintes idades: a. Um GOL de 12 anos Página 127

Page 128: Caderno Estat�stica - Rosane de F�tima Worm

b. Um Corsa de 2 anos c. Um Fiesta novo

2. Os números de horas que os calouros passam estudando cada semana têm média de 7,06 h e desvio-padrão de 5,32 h. Determine o escore z para um calouro que estuda 20 horas por semana.

3. Qual dos dois escores abaixo acusa melhor posição relativa? a. Um escore de 60 em um teste com 50x = e 5s = b. Um escore de 250 em um teste com 200x = e 20s =

4. Dois grupos semelhantes de estudantes fazem testes equivalentes de facilidade de linguagem. Qual dos resultados seguintes indica maior facilidade relativa a linguagem? a. Uma pontuação de 65 em um teste com 70x = e 10s = b. Uma pontuação de 455 em um teste com 500x = e 80s =

5. A distribuição de frequência abaixo representa a idade de 50 alunos de uma classe de 1º

ano de uma faculdade: Idade (anos) Nº de alunos 17 3 18 18 19 17 20 8 21 4

Calcule: a) Q1 b) K3 c) D1 d) Q3 e) P

95

6. A distribuição de freqüências abaixo representa o consumo por nota de 50 notas fiscais emitidas durante um dia em uma loja de departamentos

Classe Intervalo de classe N° notas 1 0 ├ 50 10 2 50 ├ 100 28 3 100 ├ 150 12 4 150 ├ 200 2 5 200 ├ 250 1 6 250 ├ 300 1

Calcule: a) Q1 b) D3 c) D7 d) Q2 e) P

98

Página 128

Page 129: Caderno Estat�stica - Rosane de F�tima Worm

CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Aula 11 – 04/11/2010 Profª Rosane Worm

Coeficiente de Variação ( δ para população ou g para amostras )

É a caracterização da dispersão ou variabilidade dos dados em termos relativos a seu

valor.

µσδ = ou x

sg =

MEDIDAS DE ASSIMETRIA

Assimetria A comparação da média, mediana e moda pode nos dizer algo sobre a característica da

assimetria, definida a seguir. Definição: Uma distribuição de dados é simétrica quando a metade esquerda do seu

histograma é aproximadamente a imagem-espelho da metade direita (uma distribuição de dados é assimétrica quando não é simétrica, estendendo-se mais para um lado do que para o outro).

Negativamente assimétricos: a média e a mediana estão à esquerda da moda. Embora nem sempre previsíveis, os dados negativamente assimétricos têm em geral a média à esquerda da mediana.

Positivamente assimétricos; a média e a mediana estão à direita.

Histogramas de distribuições assimétricas e simétrica: f

x

f

x

Assimetria para a esquerda (negativamente assimétrica): A média e a mediana estão à

esquerda da moda.

Simetria (assimetria zero): A média, a mediana e a

moda coincidem.

Assimetria para a direita (positivamente assimétrica): A média e a mediana estão à

direita da moda.

Histograma de distribuição simétrica.

(média = mediana = moda)

Histograma de distribuição assimétrica para a direita (positiva).

(média > mediana > moda) Página 129

Page 130: Caderno Estat�stica - Rosane de F�tima Worm

f

x

Fórmulas para o cálculo do coeficiente de assimetria: Coeficiente de Pearson 1º Coeficiente de Pearson

1. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson.

(população)

X fi i 1 2 2 10 3 6 4 4 5 2 6 1

2. Classifique, quanto à assimetria, a distribuição abaixo: (amostra)

Classe Int. C. f i 1 3 ├ 5 1 2 5 ├ 7 2 3 7 ├ 9 13 4 9 ├ 11 3 5 11 ├ 13 1

3. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson.

População

SMoxAS −

=

AS = 0 diz-se que a distribuição é simétrica

AS > 0 diz-se que a distribuição é assimétrica positiva (à direita)

AS ∠ 0 diz-se que a distribuição é assimétrica positiva (à direita)

Histograma de distribuição assimétrica para a esquerda (negativa). (média < mediana < moda)

Página 130

Page 131: Caderno Estat�stica - Rosane de F�tima Worm

X fi i 2 2 3 4 4 6 5 1

0

6 6 7 4 8 2

4. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson.

Amostra Classe Int. C. f i

1 0 ├ 4 10 2 4 ├ 8 15 3 8 ├ 12 6 4 12 ├ 16 2 5 16 ├ 20 1

5. Em um exame final de Estatística, o grau médio de um grupo de 150 alunos foi 78 e o desvio padrão, 8,0. Em Matemática, entretanto, o grau médio final foi 73 e o desvio padrão, 7,6. a)Em que disciplina foi maior a dispersão relativa? b) Se um estudante obteve 75 em Estatística e 71 em Matemática. Em qual dos exames foi mais elevada a sua posição relativa? 6. Medidas as estaturas de 1.017 indivíduos, obtivemos média = 162,2 cm e s= 8,01 cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg. a) Esses indivíduos apresentam maior variabilidade em estatura ou em peso? b) Se um indivíduo tem estatura de 175 cm e peso de 65 kg em qual obteve uma posição mais elevada? 7. Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo?

Página 131

Page 132: Caderno Estat�stica - Rosane de F�tima Worm

8. Uma rede de lojas afirma que as vendas diárias de televisores obedecem à seguinte distribuição: População Classe Nº de

televisores Nº de dias

1 0 | 20 5 2 20 | 40 25 2 40 | 60 40 3 60 | 80 15 4 80 | 100 10 5 100 | 120 5 ∑

a) Calcule o desvio padrão da distribuição: b) Calcule a variância populacional da distribuição: c) Calcule o coeficiente de variação.

d) Classifique, quanto à assimetria, a distribuição segundo o coeficiente de Pearson.

e) Calcule o Q3

9. Calcule a média aritmética, a mediana, a moda, o primeiro e o terceiro quartis, a variância, o desvio padrão, o coeficiente de variação e a assimetria das distribuições de freqüências abaixo:

da distribuição.

a) NOTAS fi 0 2 5 2 4 8 4 6 14 6 8 10

8 10 7 ∑ = 44

b)

Estaturas (cm) fi 150 158 5 158 166 12 166 174 18 174 182 27 182 190 8

∑ = 70

PROBABILIDADES Conhecidas certas condições, podemos prever, por exemplo, a temperatura em que a

água entrará em ebulição ou a velocidade com que um corpo, em queda livre, atingirá o solo.

Página 132

Page 133: Caderno Estat�stica - Rosane de F�tima Worm

Estes experimentos cujos resultados podem ser previstos, isto é, podem ser determinados antes da sua realização, são denominados experimentos determinísticos.

Considere agora os seguintes experimentos: ∗ No lançamento de uma moeda, qual a face voltada para cima? ∗ No lançamento de um dado, qual o número que saiu? ∗ Uma carta foi retirada de um baralho completo. Que carta é essa? Estes experimentos que, ao serem realizados repetidas vezes, nas mesmas condições,

não podem ter seus resultados previstos são denominados experimentos aleatórios. Experimento aleatório apresenta as seguintes características: ∗ Pode se repetir várias vezes nas mesmas condições; ∗ É conhecido o conjunto de todos os resultados possíveis; ∗ Não se pode prever o resultado. Como não se pode prever o resultado de um experimento aleatório, procura-se descobrir

as possibilidades de ocorrência de cada um, ou seja, a probabilidade de que ele ocorra. A teoria da probabilidade mede a “chance” de ocorrer um determinado resultado num

experimento aleatório.

EXPERIMENTO ALEATÓRIO Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim, da afirmação “é

provável que meu time ganhe a partida de hoje” pode resultar: a. Que, apesar do favoritismo, ele perca; b. Que, como pensamos, ele ganhe; c. que empate.

Como vimos, o resultado final depende do acaso. Fenômenos como esse são chamados fenômenos aleatórios ou experimentos aleatórios.

ESPAÇO AMOSTRAL A cada experimento correspondem, em geral, vários resultados possíveis. Assim, ao

lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou coroa. Já ao lançarmos um dado há 6 resultados possíveis: 1, 2, 3, 4, 5, ou 6.

Ao conjunto desses resultados possíveis damos o nome de Espaço Amostral ou

Conjunto Universo, representado por S. S = { Cara, Coroa} S = { 1, 2, 3, 4, 5, 6}

Se temos 2 lançamento sucessivos de uma moeda podemos obter cara nos dois

lançamentos, ou cara no primeiro e coroa no segundo, ou cara no primeiro e coroa no segundo, ou cara nos dois lançamentos, o espaço amostral é: S= { ( C, C), (C, K), ( K, C) ( K, K)

EVENTO Chamamos de evento qualquer subconjunto do espaço amostral S de um

experimento aleatório. 1- Considere o espaço amostral do lançamento de um dado e a observação

da face superior. Descreva, por seus elementos, os seguintes eventos: a) A: sair face par. b) B: sair face com número primo. c) C: sair face maior que três. d) D: sair face maior que 6.

Página 133

Page 134: Caderno Estat�stica - Rosane de F�tima Worm

e) E: sair face múltipla de 3. f) F: sair face menor ou igual a 4.

Suponha-se que um evento E possa acontecer de h maneiras diferentes, em um total de n

modos possíveis, igualmente prováveis. Então, a probabilidade de ocorrência do evento (denominada sucesso) é definida por: p = Pr {E} = h/n

A probabilidade de não ocorrência do evento (denominado insucesso ou fracasso) é definida por: q = Pr {não E} = n – h /n = 1 – h/n = 1 – p = 1 – Pr {E}

Assim, p + q = 1 ou Pr { não E} = 1 O evento “não E” é representado, às vezes por E, ou ~E

Admita-se que o evento E seja a ocorrência dos números 3 ou 4, em um único lance de um dado. Há 6 maneiras segundo as quais o dado pode cair, e que resultam nos números 1, 2, 3, 4, 5, ou 6. Se o dado é honesto (isto é, não é viciado), pode-se supor que as seis maneiras sejam igualmente prováveis. Como E pode ocorrer de duas destas maneiras, tem-se: p= Pr {E} = 2/6 = 1/3

A probabilidade de não ser conseguido um 3 ou um 4 ( isto é de ocorrência de um 1, 2, 5 ou 6) é: q = Pr {~E} = 1 – 1/3 = 2/3

Note-se que a possibilidade de um evento é um número compreendido entre 0 e 1. Se o

evento não pode ocorrer, sua probabilidade é 0. Se ele deve ocorrer isto é, se sua ocorrência é certa, sua probabilidade é 1.

Se p é a probabilidade de que um evento ocorra, a vantagem a favor de seu

acontecimento é q:p. por conseguinte, a vantagem contra o aparecimento de um 3 ou um 4, em um único lance de um dado honesto, é de q : p = 2/3 : 1/3 = 2 : 1, isto é, 2 para 1 2. Considere o espaço amostral S= { 1,2,3,4,5,6,7,8,9,10} e os seguintes eventos: A= { 2, 3, 4} B= { 1, 3, 5, 7, 9} C= { 5 } D= { 1, 2, 3 } E = { 2, 4, 6} Determine:

a) A U B b) A ∩ B c) A ∩ C d) (A ∩ D) U E

Exercícios:

1- Determine a probabilidade de cada evento:

a) um número par aparece no lançamento de um dado.

b) Uma figura aparece ao se extrair uma carta de um baralho de 52 cartas. c) Uma só coroa aparece no lançamento de três moedas. S= { (c,c,c), (k,k,k), (c,k,c),

(k,c,k), (c,k,k), (k,k,c)(k,c,c) (c,c,k)} 2- Um número inteiro é escolhido aleatoriamente dentre os números 1, 2, 3, ..., 49, 50. determine a probabilidade de:

a. o número ser divisível por 5.

Página 134

Page 135: Caderno Estat�stica - Rosane de F�tima Worm

b. O número terminar em 3

c. O número ser divisível por 6 ou por 8; d. O número ser divisível por 4 e por 6.

3- Dois dados são lançados simultaneamente. Determine a probabilidade de: a. a soma ser menor que 4; b. a soma ser 9;

c. o primeiro resultado ser maior que o segundo; d. a soma ser menor ou igual a 5.

4- O experimento consiste em retirar ao acaso uma bola de uma urna que contém 20 bolas iguais em peso e volume; sendo 5 bolas brancas, 8bolas pretas e 7 bolas amarelas, e anotar sua cor. Determine a função de probabilidade. 5- Um casal planeja ter 3 filhos. Determine os eventos;

a) os três são do sexo feminino. b) pelo menos 1 é do sexo masculino. c) os 3 do mesmo sexo.

6- uma urna contém 20 bolinhas numeradas de 1 a 20. Escolhe-se ao acaso uma bolinha e observa-se o seu número. Determine os seguintes eventos:

a) o número escolhido é impar. b) o número escolhido é maior que 15. c) o número escolhido é múltiplo de 5. d) o número escolhido é múltiplo de 2 e de 3. e) o número escolhido é primo. f) o número escolhido é ímpar e múltiplo de 7.

Função de Probabilidade Uma vez identificado o espaço amostral S = { a1, a2,...an} de um elemento, podemos

associar a cada elemento sua possibilidade de ocorrência. 1. 0 ≤ p(a i) ≤ 1 i = 1,2,…,n

Página 135

Page 136: Caderno Estat�stica - Rosane de F�tima Worm

2. ∑ p(a i) = 1 i = 1,2,…n O valor p(ai) é denominado probabilidade de ocorrência do resultado ai. PROBABILIDADE CLÁSSICA Aplica-se às situações em que os resultados que compõem o espaço amostral

ocorrem com mesma regularidade, ou seja, os resultados são equiprováveis. Deste modo definimos: P(ai) = n (ai) n (ai) é o número de casos favoráveis à realização de ai n n é o número total de casos possíveis OU P =

Probabilidade de um evento

E S

Exemplo: lançamento de um dado e observação da face superior. Determine a probabilidade de cada um dos eventos abaixo: a) Sair face 2 ou face 3. b) Sair face ímpar. c) Sair face maior que 1. d) Sair face 5. e) Sair face 1 ou 2 ou 3 ou 4 ou 5 ou 6. f) Sair face múltiplo de 9 Inicialmente, determinamos o espaço amostral e a função de probabilidade. O espaço amostral é S= { 1, 2, 3, 4, 5, 6} A função de probabilidade é dada por: S __P___R 1 _____ p(1) = 1/6 2 _____ p ( 2) = 1/6 3 _____ p ( 3) = 1/6 4 _____ p ( 4) = 1/6 5 _____ p ( 5) = 1/6 6 _____ p ( 6) = 1/6

1. O experimento consiste em lançar dois dados e observar a diferença dos pontos das faces superiores. Determine a função de probabilidade. 2. O experimento consiste em lançar dois dados e observar o produto dos pontos das faces superiores. Determine a função de probabilidade. 3. No lançamento de dois dados e na observação da soma dos pontos das faces superiores, determine a probabilidade de cada um dos eventos seguintes:

a. A – a soma ser par. b. B - A soma ser ímpar. c. C - a soma ser múltiplo de 3. d. D - A soma ser um número primo. e. E - A soma ser maior ou igual a 7.

Página 136

Page 137: Caderno Estat�stica - Rosane de F�tima Worm

f. F – A soma ser maior que 12.

Página 137

Page 138: Caderno Estat�stica - Rosane de F�tima Worm

CENTRO DE ENSINO SUPERIOR DOM ALBERTO

Aula 12 – Estatística I – 11/11/2010

Profª Rosane Worm

Eventos Complementares Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra

(sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação: p + q = 1 ⇒ q = 1 – p

Ex. A probabilidade de tirar um 4 no lançamento de um dado é p = 1/6. logo a probabilidade de não tirar o 4 no lançamento de um dado é q = 1 – 1/6 = 5/6.

Eventos Independentes Dois eventos são independentes quando a realização ou a não-realização de um dos

eventos não efeta a probabilidade da realização do outro e vice-versa. Ex. quando lançamos dois dados, o resultado obtido em um deles independe do resultado

obtido no outro. A probabilidade de que dois eventos se realizem simultâneamente é dada por p = p1 x p2

Ex. Lançamos dois dados. A probabilidade de obter 1 no 1º dado é : p1= 1/6. A probabilidade de obtermos 5 no 2º dado é p2

Eventos Mutuamente Exclusivos

= 1/6. Logo, a probabilidade de obtermos, simultaneamente, 1 no 1º e 5 no 2º é : p = 1/6 x 1/6 = 1/36.

Dois eventos são mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s). Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza. P = p1 + p

2. Ex. Lançamos um dado. A probabilidade de tirar o 3 ou o 5 é : p = 1/6 + 1/6 = 2/6 = 1/3

Exercícios 1. Qual a probabilidade de sair o ás de ouros quando retiramos uma carta de um baralho

com 52 cartas? 2. Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52

cartas? 3. Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule: a) a probabilidade de essa peça ser defeituosa. b) a probabilidade de essa peça não ser defeituosa. 4. No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5.

Página 138

Page 139: Caderno Estat�stica - Rosane de F�tima Worm

5. De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do segundo ser o 5 de paus?

6. Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas

brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde?

7. No lançamento de um dado, qual a probabilidade de se obter um número não-inferior a

5?

8. Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 10 ou maior que 10.

9. Em um lote de 12 peças, 4 são defeituosas. Sendo retiradas aleatoriamente 2 peças,

calcule: a) A probabilidade de ambas serem defeituosas. b) A probabilidade de ambas não serem defeituosas. 10. Um lote é formado por 10 peças boas, 4 com defeitos e 2 com defeitos graves. Uma

peça é escolhida ao acaso. Calcule a probabilidade de que: a) Ela não tenha defeitos graves. b) Ela não tenha defeitos. c) Ela seja boa ou tenha defeitos graves.

11- O quadro abaixo representa a classificação por sexo e por estado civil, de um conjunto

de 50 deputados presentes em uma reunião.

ESTADO CIVIL

SEXO M F

Casado 10 8 Solteiro 5 3 Desquitado 7 5 Divorciado 8 4

Uma pessoa é sorteada ao acaso. Determine a probabilidade dos eventos: a) Ser um homem. b) Ser uma mulher c) Ser uma pessoa casada. d) Ser uma pessoa solteira. e) Ser uma pessoa desquitada.

Página 139

Page 140: Caderno Estat�stica - Rosane de F�tima Worm

f) Ser uma pessoa divorciada.

12- O quadro abaixo representa a classificação de um grupo de 30 mulheres, segundo o estado civil e a cor dos cabelos:

COR DOS CABELOS ESTADO CIVIL Loira Morena Ruiva Casada 5 8 3 Solteira 2 4 1 Viúva 0 1 1 Divorciada 3 1 1

Uma mulher é sorteada neste grupo. Determine a probabilidade dos eventos: a) Ser casada. b) Não ser loira. c) Não ser morena nem ruiva. d) Ser viúva. e) Ser solteira ou casada. f) Ser morena e solteira. g) Ser viúva e ruiva. 13- Um experimento consiste em sortear um aluno em uma classe pela lista de chamada

(1 a 20). Determine a probabilidade dos seguintes eventos. a) ser sorteado um número par. b) Não ser sorteado um número maior que 12 e múltiplo de 3. c) Ser sorteado um número menor que 7 e múltiplo de 4. d) Ser sorteado um número menor que 13, maior que 8 e múltiplo de 7. e) Ser sorteado um número real.

Página 140