DOCUMENTO PROTEGIDO PELA LEI DE DIREITO … · STATUS (Estado). Há indícios de que 3000 anos A.C. já se faziam censos na . 12 Babilônia, China e Egito e até mesmo o 4º. livro

1

UNIVERSIDADE CANDIDO MENDES

PÓS-GRADUAÇÃO “LATO SENSU”

AVM FACULDADE INTEGRADA

APLICAÇÃO DE MÉTODOS QUANTITATIVOS

NA ÁREA DE FINANÇAS E GESTÃO CORPORATIVA

Por: Marcelo Fernandes Aleixo

Orientador

Profa. Ana Claudia Morrissy

Rio de Janeiro

2013

DOCU

MENTO

PRO

TEGID

O PEL

A LE

I DE D

IREIT

O AUTO

RAL

2

UNIVERSIDADE CANDIDO MENDES

PÓS-GRADUAÇÃO “LATO SENSU”

AVM FACULDADE INTEGRADA

APLICAÇÃO DE MÉTODOS QUANTITATIVOS

NA ÁREA DE FINANÇAS E GESTÃO CORPORATIVA

Apresentação de monografia à AVM Faculdade

Integrada como requisito parcial para obtenção do grau

de especialista em Finanças e Gestão Corporativa.

Por: Marcelo Fernandes Aleixo

3

AGRADECIMENTOS

Antes de tudo a Deus, pelas inúmeras

bênçãos recebidas ao longo da vida.

À nossa orientadora Ana Claudia Morrissy

pela ajuda prestada e a devida orientação.

Aos amigos que me auxiliaram e apoiaram

nos momentos difíceis.

E a todos aqueles que direta ou

indiretamente, de alguma forma, me

ajudaram na elaboração deste trabalho.

4

DEDICATÓRIA

À minha esposa Renata, que tanto

colaborou para a confecção e o

aperfeiçoamento desse trabalho. Também a

João Marcelo, meu filho, pela alegria que traz

à minha vida e a meu Lar e a meus pais e

irmãos, que são um apoio constante em

minha vida.

5

RESUMO

O objetivo desta obra é apresentar as principais técnicas estatísticas e

métodos quantitativos tais como: tipos de variáveis e suas associações, medidas

centrais e de dispersão, tipos de gráficos e tabelas de frequência e de que modo

foram, ou possam ser utilizados na área financeira, seja de forma direta ou de

forma indireta. No caso indireto temos a construção de índices e modelos

financeiros que se utilizaram ou utilizam dos conceitos e das medidas estatísticas

na sua elaboração.

Abordamos, também, alguns conceitos básicos de conjuntos e

probabilidades, pois a noção destes é de suma importância na interpretação de

resultados, na construção de intervalos de confiança, na comparação de

resultados obtidos em períodos diferentes e na construção de modelos estatísticos

e quantitativos, dos quais apresentaremos os principais.

Assim este trabalho visa mostrar o ganho ou agilidade que as técnicas

estatísticas oferecem a área financeira, facilitando a tomada de decisões por parte

da área administrativa e gerencial, seja em função do conhecimento em se

construir bancos de dados ou em função da interpretação destes dados através de

resumos obtidos com as técnicas estatísticas e métodos quantitativos

apresentados.

6

METODOLOGIA

Foram utilizadas referências bibliográficas sobre o tema a fim de

subsidiar e resumir os principais conceitos que envolvem as áreas em estudo:

Finanças, Gestão Corporativa e Estatística. A primeira preocupação consistiu em

consultar autores e obras com reconhecido valor e larga utilização nas áreas a

serem estudadas, de forma a aprender e a fundamentar a pesquisa e o trabalho

monográfico realizado.

Também foi realizada uma pesquisa na WEB em busca de conceitos,

teses e estudos sobre o tema que tenham uma boa confiabilidade. Para tal, nos

baseamos em sites e trabalhos que tenham como fonte instituições de ensino,

e/ou profissionais das mesmas.

7

SUMÁRIO

INTRODUÇÃO 08

CAPÍTULO I - Conceitos e Definições 10

1.1. Finanças 10

1.2. Estatística 11

1.3. Gestão Empresarial 14

CAPÍTULO II – Técnicas Estatísticas 15

2.1. Variáveis 15

2.2. Distribuição de Freqüências 18

2.3. Métodos Gráficos 21

2.4. Medidas Resumo 28

2.5. Análise Bidimensional 35

2.6. Exemplos do uso de medidas resumo na área de finanças 41

2.7. População Amostra 42

2.8. Probabilidade 44

2.9. Variáveis Aleatórias e Modelos Probabilísticos 47

Conclusão 53

Bibliografia Consultada 54

Bibliografia Citada 54

Webgrafia 55

Anexos 56

ÍNDICE 59

8

INTRODUÇÃO

Muitos homens e mulheres dedicam boa parte da vida, senão toda ela,

a trabalhos e pesquisas que visam trazer melhores condições de vida, progresso e

avanços para toda a humanidade em todas as áreas do conhecimento humano,

seja na Economia, Educação, Agricultura, Química, Física, Nutrição, Medicina,

Segurança, Indústria e tantas outras que não conseguiríamos mencioná-las.

Nessa busca incessante do progresso, teorias, hipóteses e idéias

surgem a partir da observação atenta dos fatos e das leis da natureza. Uma vez

formuladas, estas hipóteses devem ser testadas ou comprovadas, através de

ensaios e pesquisas devidamente conduzidos, desde o momento da obtenção das

informações, bem como da exploração e interpretação da massa de dados que irá

então: comprovar, condenar ou mostrar estarem incompletas tais teorias, que

poderá apontar rumos antes não imaginados, ou ainda mesmo demonstrar que

são necessárias novas informações e novas pesquisas. Este é o lado mais

apurado e mais complexo que demanda maior acuidade, precisão e técnicas mais

avançadas. Assim, surgem vacinas, novos tratamentos e remédios ou drogas na

Medicina, alimentos geneticamente modificados ou mais enriquecidos em

vitaminas e outros nutrientes necessários ao homem na Nutrição e na Biologia,

também assim são testados e desenvolvidos novos procedimentos tanto nas

áreas médicas como na indústria e no comércio. Aqui relatamos, talvez, o viés

mais nobre do uso ou da interpretação de dados/informações. Falamos talvez

porque o que falar daqueles que mais simples e intuitivos nos levam às projeções

e decisões menos complicadas, mas tão necessárias ao nosso dia a dia.

Suponhamos que você esteja na feira e quer comprar maçãs. Quantas maçãs

você vai comprar? Bom se você come uma (1) maçã por dia e vai à feira uma vez

por semana, precisará de pelo menos sete (7) maçãs. Parece simples e é, pois

conhecemos os nossos hábitos, conhecemos os mecanismos da situação,

possuímos os dados, a informação necessária para tomarmos a decisão mais

apropriada. Outro exemplo bem simples é aquele que todo brasileiro faz quando

9

recebe o salário e diminui dele todas as despesas fixas e que não pode deixar de

pagar ou usufruir, para ver o que sobra. Caso sobre alguma coisa passa-se para

as despesas menos necessárias ou até mesmo um investimento. Seriam

inumeráveis os exemplos de situações vividas em nosso cotidiano onde o

processo é bem conhecido e onde dispomos das informações ou dados básicos a

fim de tomarmos decisões e fazermos projeções. Tudo isso de forma simples,

espontânea e quase intuitiva. Com relação aos estudos e trabalhos

desempenhados pelos cientistas e pesquisadores, o que eles buscam? É

exatamente, conhecer, entender bem um processo até então desconhecido e

possuir o maior número de informações/dados a fim de resolver problemas, e

apontar soluções que melhorem o mundo.

Num mundo cada vez mais interligado e globalizado, em que os meios

eletrônicos facilitam a circulação e o acesso bem como a divulgação de

informações e dados sobre os mais variados assuntos, torna-se ainda mais

complexo o problema da obtenção de dados confiáveis. A boa intenção, a

honestidade, o compromisso e a seriedade de uma pessoa ao disponibilizar dados

nem sempre são suficientes para garantir a força e a confiabilidade dos dados

obtidos. Há uma ciência que não só apura e interpreta os dados, mas

principalmente ensina a programar e conduzir o processo de obtenção de dados

de forma que estes dados sejam representativos no universo estudado. Esta

ciência é vista por algumas pessoas como filha da Matemática, uma vez que lida

com números e lógica, contudo são necessárias outras aptidões. Estamos falando

da Estatística. O propósito, com esta monografia é justamente mostrar a

importância da Estatística, nas ciências, especificamente na área de finanças e

gestão corporativa, e da necessidade de interação entre as várias áreas de

conhecimento para se chegar às conclusões e à tomada de medidas que

realmente possam beneficiar a todos, de acordo com as boas práticas da

Governança Corporativa.

10

1- CONCEITOS E DEFINIÇÕES

1.1 - Finanças

Finanças é a parte da Administração (Gestão Corporativa) que trata da

maximização da riqueza dos acionistas através de:

Captação de Financiamento cuja finalidade é estruturar o capital com

adequada taxa de juros e prazo escolhendo o melhor sistema de financiamento.

Seleção de Projetos Rentáveis cujo objetivo é escolher as aplicações

com maiores VPL e TIR.

Promoção de Adequada Liquidez tarefa que consiste em conciliar o

pagamento das contas no prazo correto fazendo uso dos recursos disponíveis no

curto prazo.

Gerenciamento adequado do Grau de Risco que consiste na avaliação

e mensuração da exposição aos vários tipos de risco em busca das metas e dos

objetivos traçados, ou seja, do lucro.

Como foi exposto anteriormente somente o correto acompanhamento

de índices e taxas e a produção de um histórico de dados e informações obtidas

através de métodos quantitativos pode fundamentar de forma eficiente a tomada

de decisões na esfera gerencial e administrativa.

Façamos uma análise rápida sobre a questão do risco. Segundo se

depreende de estudos já realizados, a atividade empresarial pressupõe a

aceitação do risco, pois não existe empresa sem risco. Imaginemos que as vendas

da empresa tenham ficado abaixo do esperado e que não haja dinheiro suficiente

no caixa para custear os gastos. Vai haver uma perda, seja por fazer um

financiamento ou por baixar uma aplicação. Existem vários tipos de risco como o

de imagem e o de liquidez entre outros.

11

Risco pela ótica do resultado é a possibilidade ou probabilidade P(x) de

que um resultado venha a ocorrer muito ou pouco diferente do que foi planejado,

ou até mesmo de não ocorrer. Outra definição muito mencionada é a de que risco

seria a dificuldade de prever resultados futuros de um negócio em função da

amplitude da dispersão dos resultados possíveis (esta é uma visão bem

estatística).

Sendo assim surge uma pergunta, pode-se medir o risco de um

negócio? E a resposta é sim. Através do Grau de Criticidade de um Risco, que é o

produto da probabilidade de ocorrência P(x) vezes a amplitude do impacto, onde P

(x) pode ser quantificada pela observação de dados históricos ou pela opinião de

especialistas ou utilizando-se ainda a Variância e Desvio Padrão dos resultados

possíveis. Já a amplitude do impacto depende da área em questão. Podemos ter

um impacto tributário na área de produção, ou podemos ter um impacto na taxa de

financiamento como exemplo.

Finanças é a arte e a ciência da gestão de ativos financeiros. O campo de estudo de instituições financeiras, dos mercados financeiros e do funcionamento dos sistemas financeiros, quer dentro de uma nação quer no mercado internacional. Quanto ao verbo, financiar significa fornecer fundos para negócios e projetos.

No nível micro, as finanças são o estudo do planejamento financeiro, da gestão de ativos e da captação de fundos por empresas e instituições financeiras.

O termo finanças pode assim incorporar o estudo do dinheiro e outros ativos; o gerenciamento e controle desses ativos ou recursos; e a análise e gerenciamento de riscos de projetos (www.wikipédia.com.br, em 03/2013)

1.2 - Estatística

A origem da palavra Estatística está associada à palavra latina

STATUS (Estado). Há indícios de que 3000 anos A.C. já se faziam censos na

http://pt.wikipedia.org/wiki/Institui%C3%A7%C3%A3o_financeira

http://pt.wikipedia.org/wiki/Mercado_financeiro

http://pt.wikipedia.org/wiki/Sistema_financeiro

http://pt.wikipedia.org/wiki/Sistema_financeiro

http://pt.wikipedia.org/wiki/Neg%C3%B3cio

http://pt.wikipedia.org/wiki/Projeto

http://pt.wikipedia.org/wiki/Or%C3%A7amento

http://pt.wikipedia.org/wiki/Administra%C3%A7%C3%A3o_financeira

http://pt.wikipedia.org/wiki/Financiamento

http://pt.wikipedia.org/wiki/Financiamento

http://pt.wikipedia.org/wiki/Empresa

http://pt.wikipedia.org/wiki/Institui%C3%A7%C3%A3o_financeira

http://pt.wikipedia.org/wiki/Dinheiro

http://pt.wikipedia.org/wiki/Ativo

http://pt.wikipedia.org/wiki/Gerenciamento_de_riscos_de_projeto

http://www.wikipdia.com.br/

12

Babilônia, China e Egito e até mesmo o 4º. livro do Velho Testamento faz

referência a uma instrução dada a Moisés, para que fizesse um levantamento dos

homens de Israel que estivessem aptos para guerrear. Usualmente, estas

informações eram utilizadas para a taxação de impostos ou para o alistamento

militar. O Imperador César Augusto, por exemplo, ordenou que se fizesse o censo

em todo o Império Romano.

Contudo, mesmo que a prática de coletar dados sobre colheitas,

composição da população humana ou de animais, impostos, etc., fosse conhecida

pelos egípcios, hebreus, caldeus e gregos, e se atribuam a Aristóteles cento e

oitenta descrições de Estados, apenas no século XVII a Estatística passou a ser

considerada disciplina autônoma, tendo como objetivo básico à descrição dos

bens do Estado.

A palavra Estatística foi cunhada pelo acadêmico alemão Gottfried

Achenwall (1719-1772), que foi um notável continuador dos estudos de Hermann

Conrig (1606-1681). Gottfried determinou os objetivos da Estatística e suas

relações com as demais ciências.

Com a Escola Alemã as tabelas tornaram-se mais completas, surgiram

as representações gráficas e o cálculo das probabilidades, e a Estatística deixou

de ser simples catalogação de dados numéricos coletivos para se tornar o estudo

de como chegar a conclusões sobre o todo (“população”), partindo da observação

de partes desse todo (“amostras”).

Atualmente, os estudos estatísticos têm avançado rapidamente e, com

seus processos e técnicas, têm contribuído para a organização dos negócios e

recursos do mundo moderno.

No século XVIII o estudo de tais fatos foi adquirindo, aos poucos, feição verdadeiramente científica. Godofredo Achenwall batizou a nova ciência (ou método) com o nome de estatística, determinando seu objetivo e suas relações com as ciências (CRESPO, 2010, pg 01).

13

1.2.1 - O QUE É ESTATÍSTICA ?

A Estatística é uma parte da matemática aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões (CRESPO, 2010, pg 01).

“O que modernamente se conhece como Ciências Estatísticas, ou simplesmente Estatística, é um conjunto de técnicas e métodos de pesquisa e análise de dados que entre outros tópicos, envolve o planejamento do experimento a ser realizado, a coleta qualificada dos dados, a inferência, o processamento, a análise e a disseminação das informações" (Site oficial da ENCE- Internet, 2012).

Para melhor compreensão do que seja estatística, são citadas abaixo

algumas informações contidas no site da ENCE- Escola Nacional de Ciências

Estatística que é uma Instituição Federal de Ensino Superior que faz parte do

Instituto Brasileiro de Geografia e Estatística e que foi fundada em 06 de março de

1953.

O desenvolvimento e aperfeiçoamento de técnicas estatísticas de obtenção e análise de informações, permite o controle e o estudo adequado de fenômenos, fatos, eventos e ocorrências em diversas áreas do conhecimento.

A Estatística tem por objetivo fornecer métodos e técnicas para lidarmos, racionalmente, com situações sujeitas a incertezas. (Site oficial da ENCE- Internet, 2012).

1.2.2 - AS APLICAÇÕES DA ESTATÍSTICA

O crescente uso da Estatística vem ao encontro da necessidade de

realizar análises e avaliações objetivas, fundamentadas em conhecimentos

científicos. As informações estatísticas são concisas, específicas e eficazes,

fornecendo assim subsídios imprescindíveis para as tomadas racionais de

decisão. Neste sentido, a Estatística fornece ferramentas importantes para que as

empresas e instituições possam definir melhores suas metas, avaliar sua

14

performance, identificar seus pontos fracos e atuar na melhoria contínua de seus

processos. Na prática, a Estatística pode ser empregada como ferramenta

fundamental em várias outras ciências.

1.3 - Gestão Empresarial

A Gestão Empresarial pode ser vista como um modelo de trabalho,

orientado por uma política de valores, capaz de planejar, alocar e gerir recursos,

ações, iniciativas, princípios, valores e estratégias, procurando viabilizar o alcance

dos objetivos propostos por uma organização (empresa).

Ela pode encerrar critérios formais e/ou informais de atuação,

evidenciando a visão, os valores e a missão que norteiam o alcance dos objetivos

e resultados procurados. Inspirada nesse modelo, ela formata a sua estrutura

hierárquica, o organograma de cargos e funções, o processo disciplinar e os

incentivos, as principais interfaces operacionais internas e externas, a estratégia

comercial e de marketing, a logística, o desenvolvimento de parceiros, da sua

cadeia de suprimentos, entre outros.

Em economia, negócio, é referido como um comércio ou empresa, que

é administrado por pessoa(s) para captar recursos financeiros para gerar bens e

serviços, e por conseqüência proporciona a circulação de capital de giro entre os

diversos setores. Em apertada síntese, podemos dizer que, entende-se por

negócio toda e qualquer atividade econômica com o objetivo de gerar lucro.

Etimologicamente, e num sentido mais lato, a palavra negócio deriva do

latim, e quer dizer a negação do ócio. Negócio não trata apenas de negócio

financeiro ou comercial, mas sim toda a atividade humana que tem efeitos

jurídicos.

15

2- TÉCNICAS ESTATÍSTICAS

Em alguma fase de seu trabalho, o pesquisador depara-se com o

problema de analisar e entender um conjunto de dados relevante ao seu particular

objeto de estudos. Ele necessitará trabalhar os dados para transformá-los em

informações, de modo a compará-los com outros resultados, ou ainda para julgar

sua adequação a alguma teoria.

A inferência estatística (...) é a parte da metodologia da Ciência que tem por objetivo a coleta, redução, análise e modelagem dos dados, a partir do que, finalmente, faz-se a inferência para uma população da qual os dados (a amostra) foram obtidos. Um aspecto importante da modelagem dos dados é fazer previsões, a partir das quais se podem tomar decisões (BUSSAB E MORETIN, 2011, p.01).

No início de um estudo estamos interessados na redução, análise e

interpretação dos dados sob consideração, adotando um enfoque que

chamaremos de análise exploratória de dados. Nesta fase devemos obter a maior

quantidade possível de informação, dos dados, a fim de se obter a indicação de

modelos plausíveis a serem utilizados numa fase posterior, a análise confirmatória

de dados (ou inferência estatística).

Tradicionalmente, uma análise descritiva de dados limita-se a calcular algumas medidas de posição e variabilidade, como a média e a variância, por exemplo. Contrária a essa tendência, uma corrente mais moderna, liderada por Tukey (1977), utiliza principalmente técnicas gráficas, em oposição a resumos numéricos. Isso não significa que sumários não devam ser obtidos, mas uma análise exploratória de dados não deve se limitar a calcular tais medidas (BUSSAB E MORETIN, 2011, p.01).

2.1- Tipos de variáveis

De modo geral para cada característica (variável) investigada numa

pesquisa, tem-se associado um ou mais resultados, e são as opções, os tipos de

16

resultados possíveis que vão determinar a classificação das variáveis. Algumas

variáveis apresentam como resultados uma qualidade ou atributo e são por isso

classificadas como do tipo qualitativas enquanto outras vão apresentar resultados

numéricos resultantes de uma contagem ou mensuração, e então são chamadas

de variáveis do tipo quantitativas. A divisão das variáveis em qualitativas e

quantitativas ainda permite uma subdivisão em dois tipos cada, assim teríamos as

variáveis qualitativas nominais e qualitativas ordinais e as variáveis quantitativas

discretas ou quantitativas contínuas, para uma melhor compreensão fazemos a

seguir um resumo dos tipos de variáveis e alguns exemplos.

Variável Qualitativa Nominal

É a variável para a qual não existe nenhuma ordenação nas possíveis

realizações ou resultados.

Exemplos: estado de origem de uma pessoa, sexo da pessoa, estado

civil.

Variável Qualitativa ordinal

É a variável a para a qual existe uma ordem nos seus resultados ou nas

possíveis realizações.

Exemplos: grau de instrução cujos resultados seriam ensino

fundamental, médio e superior e correspondem a uma ordenação baseada no

número de anos de escolaridade completo. Outro exemplo é a variável classe

social que tem como resultados classe alta, média e baixa.

Variável quantitativa discreta

É a variável cujos possíveis valores formam um conjunto finito ou

enumerável de números, e que resultam, freqüentemente, de uma contagem.

Exemplo: número de filhos (0,1,2).

17

Variável quantitativa contínua

É a variável cujos possíveis valores pertencem a um intervalo de

números reais e que resultam de uma mensuração.

Exemplo: peso e estatura de uma pessoa (15,5 Kg ou 1,81m).

È importante esclarecermos que para cada tipo de variável existem

técnicas apropriadas ao resumo das informações, por isso a importância de

identificar-se qual o tipo da variável em estudo. Ainda é oportuno salientar que em

algumas situações podemos adaptar técnicas que são utilizadas em um caso para

outros casos.

Moretin e Bussab observam que em algumas situações podem-se

atribuir valores numéricos as várias qualidades ou atributos (ou ainda, classes) de

uma variável qualitativa e depois proceder-se à análise como se esta fosse

quantitativa, desde que o procedimento seja passível de interpretação (pg. 10).

Segundo Roberto Jarry Richardson na obra Pesquisa Social ao se

definir variáveis deve-se obedecer a três princípios básicos, caso contrário haverá

uma perda de informação essencial ou, pior ainda, à inutilidade completa da

medição (pg. 67). Embora a obra seja mais voltada para as pesquisas no campo

social tais princípios são válidos de maneira geral para a definição de variáveis em

estudo.

Primeiro princípio os valores de uma variável devem ser mutuamente

excludentes, o que significa que uma e só uma categoria da mesma classe (um

valor da mesma variável) pode ser atribuída a cada um dos indivíduos em estudo

caso contrário o mesmo sujeito poderia ser listado duas vezes na distribuição de

freqüências. Imaginemos a variável local de origem com as seguintes classes,

entre outras: Local com menos de 3.000 habitantes e local com menos de 6.000

habitantes. Neste caso um indivíduo que morasse em um local com menos de

3.000 habitantes seria listado em ambas as classes.

18

Segundo princípio o conjunto de valores possíveis deve ser exaustivo, o

que significa que todas as possibilidades empíricas devem ser incluídas no

conjunto, ou seja, todos os elementos da amostra devem ser classificados em

algumas das categorias classificadas. Um exemplo seria a variável religião, no

Brasil, se contivesse as categorias Budista, Mulçumano e Protestante

(adequadamente definidas), mas não contivesse as categorias Católica e Espírita

além de outras.

Terceiro princípio é aquele que se refere à representatividade da

variável. Segundo o autor quando a variável é definida como representante formal

de um conjunto de valores possíveis, determinados por uma regra de medição

comum, já está garantida a validade deste princípio (pg. 68).

2.2 - Distribuição de freqüências

Um dos maiores interesses de um pesquisador quando se estuda uma

variável é conhecer o comportamento dela. Uma das maneiras de conhecer e

analisar, ainda que de forma global, o conjunto de possíveis realizações de uma

variável é através da distribuição de freqüências. Vejamos os exemplos a seguir:

Tabela 1 - Tabela de freqüência do Grau de instrução na empresa AC

Grau de Freqüências Proporção Porcentagem

instrução ni fi 100fi Fundamental 15 0,37 37,50

Médio 20 0,50 50,00 Superior 5 0,12 12,50

Total 40 1,00 100,00 Fonte: Dados hipotéticos

19

Tabela 2 - Tabela de freqüência do Grau de instrução na empresa BD

Grau de Freqüências Proporção Porcentagem

instrução ni fi 100fi Fundamental 20 0,19 19,04

Médio 60 0,57 57,14 Superior 25 0,23 23,81

Total 105 1,00 100,00 Fonte: Dados hipotéticos

Onde,

ni é o número de realizações encontradas em cada classe da variável,

é a freqüência absoluta da categoria.

fi = ni/n é a proporção ou (freqüências relativa) de cada classe, sendo n

o número total de observações.

100fi é a freqüência relativa em porcentagem para cada classe.

As medidas de proporção são muito úteis quando se necessita

comparar resultados de duas pesquisas distintas. No caso em questão como

iríamos fazer para comparar o grau de instrução das duas empresas pelo campo

da freqüência se os totais de empregados são diferentes nos dois casos. Mas nas

colunas de proporção e porcentagem a comparação é possível, pois elas foram

reduzidas a um mesmo total (no caso 1,000 e 100,000).

A distribuição de freqüências é uma técnica facilmente aplicável para

variáveis discretas, mas para variáveis contínuas devemos ter certo cuidado.

Imaginemos a construção de uma tabela de freqüência para variável salário, como

não há classes básicas o que existia no exemplo anterior somos obrigados a

agrupar os dados por faixas de salário.

Ao resumirmos os dados referentes a uma variável contínua, perde-se

alguma informação. No exemplo a seguir, não sabemos quais são os cinco

20

salários da classe de 6.000 a 8.000 Reais a não ser que investiguemos a tabela

original (vide anexo tabela 4). Uma medida geralmente adotada é supor que os

cinco salários daquela classe sejam iguais ao ponto médio da referida classe. È

importante esclarecer que a notação [a,b) utilizada para o intervalo de números

contém o extremo a mas não contém o extremo b.

Tabela 3 - Tabela de Freqüência dos Salários da Empresa Estuda que é Bom

Classe de Freqüências Proporção Porcentagem

Salário. Em Reais ni fi 100fi [0.000, 2.000) 15 0,38 37,50 [2.000, 4.000) 10 0,25 25,00 [4.000, 6.000) 8 0,20 20,00 [6.000, 8.000) 5 0,13 12,50

[8.000, 12.000) 2 0,05 5,00 Total 40 1,00 100

Fonte: Dados Hipotéticos – Anexo Tabela 7

A determinação do número de intervalos ou classes vai depender da

variável estudada e que informação o pesquisador deseja extrair destes dados, é

uma questão teoricamente controvertida e diversos autores apresentam soluções

diferentes, entre elas uma das mais mencionadas é a fórmula de Sturges onde o

número de intervalos é o inteiro mais próximo do algarismo obtido pela expressão

da a seguir:

N= 1 + 3,3322log10(n), sendo n o número de observações, ou o

tamanho da amostra.

A escolha dos intervalos é arbitrária e familiaridade do pesquisador é que lhe indicará quantas e quais classes (intervalos) devem ser usadas. Entretanto, deve-se observar que, com um pequeno número de classes, perde-se informação e com um número grande de classes, o objetivo de resumir dados fica prejudicado. Normalmente, sugere-se o uso de 5 a 15 classes com a mesma amplitude. (BUSSAB E MORETIN, 2011, p.13).

21

2.3 - Métodos gráficos

Podemos começar este item com a pergunta por que utilizar gráficos?

Uma das respostas é que a utilização da representação gráfica da distribuição de

uma variável mostra de forma rápida a variabilidade da mesma.

Segundo Bussab e Moretin na obra Estatística Básica os métodos

gráficos têm encontrado um uso cada vez maior devido ao seu forte apelo visual.

Normalmente, é mais fácil para qualquer pessoa entender a mensagem de um

gráfico do que àquela embutida em tabelas ou sumários numéricos (pg. 3).

Segundo estudos feitos em 1983 por John Chambers os gráficos são

utilizados para diversos fins:

Buscar padrões e relações;

Apresentar resultados de modo rápido e fácil.

Confirmar (ou não) certas expectativas que se tinha sobre os dados;

Confirmar (ou não) suposições feitas sobre os procedimentos

estatísticos usados; e Descobrir novos fenômenos;

Devemos salientar que existem vários tipos de gráficos para

representar as variáveis qualitativas e as quantitativas sendo que as últimas

possuem mais opções e que o mesmo tipo de gráfico pode sofrer variações. Um

bom exemplo é o gráfico de barras que pode ser apresentado como plano ou em

3D, ou ainda na forma vertical ou horizontal. A seguir apresentaremos alguns

exemplos de gráficos para as variáveis qualitativas e quantitativas.

2.3.1 Gráficos para Variáveis qualitativas

Os principais gráficos utilizados para estas variáveis são os gráficos de

setores ou pizza também chamado de queijo quando apresentado em 3D (terceira

dimensão) e os gráficos

formas de figuras também

Gráfico 1

Fonte: Dados H

Gráfico 2

Fonte: Dados H

Os dois gráficos

empresa BD o número d

maior que na empresa AC

instrução fundamental. U

áficos de barras ou retângulos. Estes gráficos

mbém são chamados de pictóricos.

áfico 1 - Grau de instrução na Empresa AC

ados Hipotéticos – Tabela 1

áfico 2 - Grau de instrução na Empresa BD

ados Hipotéticos – Tabela 2

ráficos apresentados permitem uma fácil percepç

ero de pessoas com grau de instrução médio

sa AC, onde temos um maior número de pessoas

tal. Uma das funcionalidades deste gráfico

37,5%

50,0%

12,5%

Grau de instrução na Empresa AC

Fundame

Médio

Superior

19,0%

57,1%

23,8%

Grau de Instrução na Empresa BD

Fundame

Médio

Superior

22

áficos que utilizam

ercepção de que na

médio e superior é

ssoas com grau de

fico é mostrar as

ndamental

perior

ndamental

perior

classes de uma variável

todo.

“pizzausuacírcusetor(BUS

Gráfico 3

Fonte: Dados H

Gráfico 4

Fonte: Dados H

10

150

Peç

as ven

didas

Masculinas

Femininas

Infantis

iável e as suas proporções ou percentagens e

O gráfico de composição em setores, send“pizza” o mais conhecido, destina-se a representarusualmente em porcentagem, de partes de um todocírculo de raio arbitrário, representando o todosetores, que corresponde às partes de maneira(BUSSAB E MORETIN, 2011, p.16).

fico 3 – Peças de roupas vendidas no ano de 20

ados Hipotéticos – Anexo Tabela 4

fico 4 - Peças de roupas vendidas no ano de 201

dos Hipotéticos – Anexo Tabela 5

0

50

100

150

MasculinasFemininas

Infantis

100130

110

Peças de roupas vendidas 2009

0 50 100 150

linas

ninas

fantis

80

110

Peças vend

Peças de roupas vendidas 2010

23

ens em relação ao

sendo em forma de entar a composição, todo. Consiste num todo, dividido em aneira proporcional.

de 2009

e 2010

150

150

vendidas

24

Os dois gráficos de barras apresentados permitem a fácil percepção de

que em 2010 a empresa teve um aumento nas vendas de peças de roupas

femininas, e um decréscimo nas peças masculinas e a venda de roupas infantis

não se alterou em relação ao ano de 2009. Informações que permitem a quem

está gerenciando o negócio identificar uma tendência, e ver se ela é geral, ou se

algum fato ou acontecimento sazonal é responsável por este comportamento nas

vendas. O ideal seria ter mais um ou dois anos de série de dados. Este gráfico

com a informação de peças vendidas por tipo de público já fornece mais

informação do que um gráfico só com as vendas totais, e para isto bastou que ao

planejar o banco de dados se incluísse a variável qualitativa: tipo de público.

2.3.2 Gráficos para Variáveis quantitativas

Para as variáveis quantitativas podemos usar os gráficos aplicados às

variáveis qualitativas e temos ainda outros como o gráfico de ramo e folhas e o

gráfico de dispersão unidimensional, lembrando que quando tratamos de variáveis

quantitativas contínuas necessitamos algumas adaptações, exatamente como no

caso em que estudamos as freqüências.

Gráfico de dispersão unidimensional é um gráfico em que os valores

são representados por pontos ao longo da reta provida de uma escala. Existem

três variações para este gráfico. Em uma os valores plotados no gráfico são

acompanhados por um número que indica as repetições, em outra maneira

fazemos o gráfico empilhando os valores repetidos, um em cima do outro e ainda

há um terceiro modo, onde se apresentaria apenas o ponto mais alto da pilha para

cada informação. A seguir apresentamos as variações do gráfico para os dois

primeiros modos mencionados, utilizamos como fonte de dados o número de

empregados nas empresas de uma cidade imaginária Y (tabela 3 do Anexo).

Gráfico 5 – Núm

Fonte: Dados H

Gráfico 6 – Núm

Fonte: Dados H

O diagrama de

regra fixa para a sua cons

duas partes: a primeira c

vertical enquanto a segu

vertical. O ramo e folhas é

de valores e o seu objetiv

3

0 5

Nº de e

Número de empregados por empresa na cidad


Número de empregados por empresa na cidad


a de ramo e folhas ou a técnica ramo e folhas

construção, mas a idéia básica é dividir cada o

eira chamada de ramo é colocada à esquerda

segunda chamada de folha é colocada à di

lhas é um procedimento alternativo para resumi

objetivo é conseguir uma idéia sobre a forma d

3 5 2 1 1

10 15 20 25 30

Qtde de emprega

º de empregados por empresa na cidade Y

25

cidade Y

cidade Y

olhas não tem uma

ada observação em

erda de uma linha

à direita da linha

esumir um conjunto

rma de distribuição

35

pregados

26

destes valores. Os gráficos de barras e os histogramas também permitem essa

visualização da distribuição. O histograma é uma variação do gráfico de barras,

aplicado a varáveis quantitativas contínuas, que quando agrupadas em classes,

resulta em uma perda de informação. Surge então uma pergunta, por que

construir um ramo e folhas se há outras opções? Porque uma das vantagens do

diagrama de ramo e folhas em relação ao histograma é que não se perde ou

perde-se pouca informação sobre os dados. No gráfico a seguir, apresentamos o

diagrama de ramo e folhas da variável salário, da empresa “Estuda que é bom”.

No ramo estão às unidades de milhar e nas folhas as unidades de centena

referente aos salários.

Gráfico 7 - Diagrama de ramo e folhas sem duplicação dos ramos

0 1 000 000 000 000 000 300 300 300 300 500 500 500 700 700 2 000 000 000 000 500 500 3 000 000 500 900 4 000 000 000 500 500 500 5 000 500 6 000 000 500 500 7 000 8 500 9 10 11 000


Como no caso estudado o diagrama tem muitas folhas utilizaremos a

técnica de dupilcar os ramos, para ver como ficará a distribuição. Utilizamos a

notação (1, 2,...)º, que abrange as centenas de 000 a 499 e a notação (1, 2,...)*,

que abrange as centenas de 500 a 999, para construir o gráfico a seguir .

27

Gráfico 8 - Diagrama de ramo e folhas com duplicação dos ramos

0º 0* 1º 000 000 000 000 000 300 300 300 300 1* 500 500 500 700 700 900 2º 000 000 000 000 2* 500 500 3º 000 000 3* 500 900 4º 000 000 000 4* 500 500 500 5º 000 5* 500 6º 000 000 6* 500 500 7º 000 7* 8º 8* 500 9º 9* 10º 10* 11º 000


Com o diagrama de ramos e folhas podemos ter as mesmas

impressões conseguidas com um gráfico de barras ou de dispersão

unidimensional, mas sem perda de informação sobre os dados. Um ramo que

apresente muitas folhas significa maior incidência de realizações ou observações,

ou ainda uma maior freqüência, um ramo e folha distante dos demais pode

significar um ponto atípico em relação aos demais, também podemos perceber

onde os dados se concentram e ainda ter uma idéia sobre a simetria ou assimetria

dos dados, assunto que também abordaremos mais a frente.

O histograma é um gráfico de barras contíguas, onde as bases são

proporcionais aos intervalos das classes e a área de cada retângulo proporcional à

respectiva freqüência. Po

relativa (fi). Calcula-se fi/∆

classe i ou da i-ésima c

quantidade dos dados

apresentará o retângulo m

histograma seja igual a um

Gráfico 9 – Hist

Fonte: Tabela 3

Gráfico 10 – Gr

Fonte: Tabela 3

0,0%

10,0%

20,0%

30,0%

40,0%

Porcen

tagen

0

5

10

15

Freqüên

cias

Grá

ia. Pode-se usar a freqüência absoluta (ni), ou

se fi/∆i ou ni/∆i, que é chamada densidade de

ima classe. A altura do retângulo será de a

dos em cada classe, assim a classe com

gulo mais alto. Essa convenção permite que a

l a um.

Histograma - variável salário Empresa Estuda

bela 3 – Salários da Empresa Estuda que é Bom

Gráfico de barras segundo as classes da vari

bela 3 – Salários da Empresa Estuda que é Bom

37,5%

25,0%20,0%

12,5%

5%

0 2 4 6 8

Salár

Histograma para Variável Salário

1.000 3.000 5.000 7.000 10.000

15

108

52

Salá

Gráfico de barras para Variável Salário

28

ou a freqüência

e de freqüência da

de acordo com a

com mais dados

que a área total do

studa que é Bom

Bom

a variável salário

om

12

Salários

Salários

29

2.4 - Medidas Resumo

Observamos que o resumo de dados por meio de tábuas de freqüência

e gráficos fornece muitas informações sobre as variáveis em estudo, que não são

encontradas ou não são de fácil visualização nas tabelas de dados originais. Em

algumas situações se faz necessário resumir ainda mais os dados estudados,

buscando-se um ou alguns valores que sejam representativos de toda a série de

dados. Nestes casos costuma-se utilizar as medidas de posição ou localização

central que são a média, a moda e a mediana, em conjunto com as medidas de

dispersão como o desvio médio, a variância, o desvio padrão, amplitude total e o

coeficiente de variação.

2.4.1 - Medidas de posição

Mediana é a medida de tendência central de um conjunto de dados que

se caracteriza por indicar o elemento que ocupa a posição central da série de

observações estudadas, sendo que as mesmas devem estar ordenadas de forma

crescente. Da definição de mediana, segue-se que sua característica principal é

dividir um conjunto ordenado de dados em dois grupos iguais; a metade terá

valores inferiores à mediana, a outra metade terá valores superiores à mediana. A

mediana geralmente é indicada por md.

Em geral, a mediana ocupa a posição (n + 1)/2 onde n representa a

quantidade de valores do conjunto. Uma maneira fácil de obter-se a mediana é

usar a regra abaixo.

Se o número de dados é ímpar, a mediana é o valor que está no centro

da série e corresponde a elemento X na posição (n+1)/2, ou md = X(n+1)/2.

Se o número de dados é par, a mediana é a média dos dois valores

que estão no centro da série e corresponde a média dos elementos de X que

estão nas posições (n)/2 e (n/2)+1, ou md = [X(n+1)/2 + X(n/2)+1]/2. Vejamos os

exemplos a seguir:

30

Exemplo 1 – Variável X : 4,5,6,7,8 onde temos md=X3=6

Exemplo 2 – Variável Y : 2,5,6,7,15 onde temos md=X3=6

Exemplo 3 – Variável W : 4,6,6,7 onde temos md=(X2+X3)/2=(6+6)/2=6

Exemplo 4 – Variável K : 6,6,6,6,6 onde temos md= X3=6.

Exemplo 5 – Variável Z : 4,5,5,6,7,7,8 onde temos md= X3=6

Moda é a medida de tendência central de um conjunto de dados que se

caracteriza por indicar o elemento de maior ocorrência ou de maior probabilidade

da série de dados ou da variável em estudo, ou ainda no dizer de Moretin e

Bussab é a realização mais freqüente do conjunto de valores observados (pg.35

Cap 3). Alertamos que existe a possibilidade de haver mais de uma moda, isto

ocorre quando a distribuição dos valores estudada possui 2(duas), 3(três) ou mais

realizações com a maior e a mesma freqüência, nestes casos a distribuição pode

ser chamada de bimodal ou trimodal etc.. No exemplo 5 variável Z apresentado

acima para mediana, temos uma distribuição bimodal, mas existem também, os

casos em que a distribuição não tem moda, isto ocorre quando todos os valores

têm a mesma freqüência é o caso do exemplo 2 variável Y, apresentado acima.

Média é a medida de tendência central mais utilizada pelas pessoas e o

que talvez alguns desconheçam é que existem formas alternativas de se calcular a

média.

a) Média geométrica (G) de um conjunto de N números x1.x2...xn é a

raiz de ordem N do produto destes números e é dada pela

expressão abaixo:

31

b) Média harmônica (H) de um conjunto de N números x1.x2...xn é a

recíproca da média aritmética das recíprocas dos números e é dada

pela expressão a seguir:

c) Média aritmética de um conjunto de dados é aquela obtida pela

soma das observações divididas pelo número delas, é considerada

como ponto de equilíbrio ou centro de gravidade de uma

distribuição e é dada pela expressão abaixo:

Este é o calculo da média mais conhecido e utilizado pelas pessoas e

apresenta uma variação pouco conhecida e chamada de média aparada que

consiste em calcular a média das observações centrais desprezando-se uma

porcentagem das iniciais e das finais.

A relação entre os 3(três) tipos de cálculo da média, válida para um

conjunto de números positivos, é dada pela expressão tal que a

igualdade é válida só quando x1 = x2 =...= xn.

Considerações sobre o uso das medidas de posição: Para se calcular a

moda de uma variável, precisamos apenas de um processo de contagem ou

simplesmente da distribuição de freqüências, enquanto a mediana requer que as

realizações da variável sejam, pelo menos, ordenadas e a média só pode ser

calculada para variáveis quantitativas. Tais condições tornam o calculo de

medidas de posição bastante limitado para as variáveis qualitativas. No caso das

32

variáveis qualitativas nominais, podemos trabalhar apenas com a moda, enquanto

podemos utilizar moda e mediana para as variáveis ordinais. Outro aspecto

importante de se ressaltar é que a mediana é uma medida mais resistente do que

a média, principalmente com relação às distribuições assimétricas ou que

contenham valores atípicos, nestes casos uma alternativa é usar a média aparada,

que também é resistente. Quando se diz que à mediana é mais resistente que a

média, significa falar que ela é menos influenciada por valores grandes ou

pequenos de mais em relação à maioria dos dados, mas que afetam a média, no

caso do exemplo 2 variável Y: 4,5,6,7,18 com Md=6, Média=8 e que não possui

moda notamos que o valor 18 puxou a média para cima.

2.4.2 Medidas de dispersão

As medidas de dispersão visam à mensuração da variabilidade do

conjunto de observações estudado ou da variável estudada. Estas medidas são

usadas junto com as medidas de posição que embora representem os dados de

forma resumida são incapazes de mostrar a variabilidade dos mesmos. As

medidas de dispersão foram criadas pela necessidade de resumir a variabilidade

do conjunto de observações, de modo tal que permita a comparação de conjuntos

diferentes de valores para a mesma variável em momentos ou períodos distintos

ou segundo algum outro critério relevante do estudo.

Segundo apostila de estatística básica da USP medidas de dispersão

são índices que indicam o grau de concentração ou dispersão de uma distribuição

em torno da média (Módulo1, p.12).

Desvio Médio é obtido pela soma dos desvios, em módulo, das

observações em relação à média, dividida pelo número de observações e é dado

pela expressão:

33

Variância é obtida pela soma dos quadrados das observações em

relação à média, dividida pelo número de observações e é dado pela expressão:

Desvio Padrão é definido como a raiz quadrada positiva da variância,

isto porque o fato da variância ser uma medida expressa pelo quadrado da

dimensão dos dados em estudo o que traz algum tipo de confusão na

interpretação dos dados, por isso costuma-se usar o desvio padrão que e é dado

pela seguinte expressão:

Amplitude total é a medida de dispersão obtida pela diferença entre a

maior e a menor das observações. É vista como o intervalo total de uma série e

obtida pela diferença entre o maior e o menor valor da série.

Amplitude total = maior Xi – menor Xi.

Coeficiente de variação é a medida de dispersão obtida pela razão

entre o desvio padrão e a média, multiplicando-se este resultado por 100%.

As medidas de amplitude total e coeficiente de variação, calculadas

para a média possuem variações para o cálculo em relação à mediana, conforme

as expressões a seguir:

Distancia entre quantis, chamada de DEQ = Q3 – Q1.

Coeficiente de variação quantílica

34

Vimos que a mediana é um valor que deixa metade dos dados abaixo dela e metade acima. De modo geral, podemos definir uma medida, chamada quantil de ordem p ou p-quantil, indicada por q(p), onde p é uma proporção qualquer, 0<p<1, tal que 100p% das observações sejam menores do que q(p). (BUSSAB E MORETIN, 2011, p.41).

Estas medidas calculadas com relação à mediana são alternativas para

contornar a influência que a média e o desvio padrão sofrem por conta de valores

extremos e também para se ter idéia da simetria ou da assimetria dos dados. Para

melhor compreensão dos quantis indicamos abaixo alguns:

q(0,25)= q1: 1º Quartil = 25º Percentil

q(0,50)= q2: Mediana = 2º Quartil = 50º Percentil

q(0,75)= q3: 3º Quartil = 75º Percentil

q(0,40)=: 4º Decil

Existe um método chamado de esquema dos cinco números, utilizado

para se verificar a assimetria ou a simetria dos dados, que utiliza as medidas dos

quantis. Os cinco números são a Md, q1, q3, x1 e x n onde x1 e x n são os valores

extremos da distribuição de dados. O esquema de cinco números dá origem a um

gráfico ou diagrama chamado Box-plot (ver figura 3 em anexos). Estes estudos

foram desenvolvidos por Hoaglin, Mosteller and Tukey (1983).

Todas as medidas apresentadas permitem a comparação entre

variáveis diferentes e entre amostras da mesma variável. Assim podemos

comparar o desempenho de duas ações para ver qual tem melhor média ou

mediana de retorno, ver qual tem maior variação e proceder à escolha do

investimento ou aplicação a ser feito no caso da gestão empresarial. Pode ser

traçada uma estratégia empresarial em que se concentre a produção da empresa

na classe que tem maior moda, ou freqüência de compra. Assim estas medidas

quando devidamente aplicadas trazem informações importantíssimas para a

35

tomada de decisão nos negócios. Na parte do anexo, tabela 8 – cálculo das

medidas resumo, temos o cálculo de algumas destas medidas para as cinco

variáveis X,Y,W,K e Z apresentadas acima.

Cabe-nos ainda esclarecer que existem adaptações de algumas das

medidas resumo, para dados agrupados (são aqueles que são divididos em

intervalos), como exemplo temos uma fórmula para calcular a mediana e outra

para calcular a moda de dados agrupados.

2.4.3 - Medidas de assimetria e Curtose

Da relação ou comparação entre a média, moda e mediana podemos

ter idéia acerca da simetria ou assimetria da distribuição de uma variável,

lembrando que como o próprio nome sugere o valor da mediana deve estar em

algum ponto entre o valor da média e o valor da moda, desta forma temos as

seguintes situações apresentadas a seguir:

Se < Md < Mo teremos uma distribuição assimétrica à esquerda.

Se = Md = Mo teremos uma distribuição simétrica.

Se > Md > Mo teremos uma distribuição assimétrica à direita.

Figura 1 – Tipos de distribuição segundo a assimetria

36

Outro meio de se ter idéia se a distribuição de uma variável é simétrica

ou assimétrica é através de gráficos como o de barras, o ramo e folhas e o

histograma, apresentados para variável salário, que apresenta no caso estudado

distribuição assimétrica à direita. Do ponto de vista prático o gerente sabe que à

medida que o salário aumenta menor é a concentração de pessoas.

Uma das medidas utilizadas para se calcular a assimetria de um

conjunto de dados, é o coeficiente de assimetria de Pearson dado pela seguinte

expressão:

Curtose

Quando a distribuição apresentar uma curva de freqüência mais

fechada, ou mais aguda em sua parte superior, que a normal recebe o nome de

leptocúrtica, caso a curva de freqüência seja mais aberta, ou mais achatada na

sua parte superior é chamada de platicútica. A normal que é nossa base

referencial recebe o nome de mesocúrtica.

Denominamos curtose o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada curva normal (curva correspondente a uma distribuição teórica de probabilidade). (CRESPO, 2010, p.119).

Figura 2 – Tipos de distribuição segundo a curtose

37

A medida utilizada para se calcular a curtose de um conjunto de dados

é o coeficiente percentílico de curtose dado pela expressão a seguir:

O valor obtido deve ser comparado com o valor para a curva normal

que é de 0,263, assim temos:

C = 0,263 => curva mesocúrtica

C < 0,263 => curva leptocúrtica

C > 0,263 => curva platicúrtica

2.5 Análise Bidimensional

Até o momento estudamos como resumir e organizar informações

referentes a uma variável, mas freqüentemente estamos interessados em analisar

o comportamento conjunto de duas ou mais variáveis aleatórias. Nestes casos os

dados aparecem na forma de uma matriz, onde geralmente, as linhas indicam os

elementos ou indivíduos e as colunas mostram as variáveis.

O principal objetivo das análises nessa situação é explorar as relações (similaridades) entre as colunas, ou algumas vezes entre as linhas. Como no caso de apenas uma variável que estudamos, a distribuição conjunta das freqüências será um instrumento poderoso para a compreensão do comportamento dos dados. (BUSSAB E MORETIN, 2011, p.68).

Como vemos, no entender, de Moretin e Bussab a principal análise na

situação de estudarmos mais de uma variável é identificar se há relação entre elas

e qual é essa relação; mas também podem-se investigar relações entre as linhas

que representam os elementos.

38

Para o caso de um estudo com duas variáveis podemos ter três

combinações possíveis envolvendo o tipo das variáveis quanto ao fato de serem

qualitativas ou quantitativas e para cada caso teremos técnicas de análise

diferentes. Apresentamos a seguir as três situações possíveis:

a) as duas variáveis são qualitativas;

b) as duas variáveis são quantitativas; e

c) uma variável é qualitativa e a outra é quantitativa.

Quando temos duas variáveis qualitativas resumem-se os dados em

tabelas de dupla entrada, também chamadas de tabelas de contingência, onde

aparecerão as freqüências absolutas ou as contagens dos elementos que

pertencem simultaneamente a categorias de uma e outra variável. Quando temos

uma variável quantitativa e outra qualitativa, usualmente analisa-se o que

acontece com a variável quantitativa quando os dados são categorizados de

acordo com os diversos atributos da variável qualitativa e finalmente se as duas

variáveis são quantitativas, as observações provêm de mensurações, então são

apropriadas, técnicas como gráficos de dispersão ou de quantis. Quando temos

duas variáveis quantitativas agrupadas em classes acabamos por retornar ao caso

de uma tabela de dupla entrada.

Associação entre variáveis qualitativas

Conhecer o grau de dependência entre as variáveis estudadas é um

dos principais objetivos quando construímos uma distribuição conjunta (tabelas de

contingência) das mesmas, descrever a associação entre elas e poder prever o

melhor resultado de uma ao conhecer-se a realização da outra, é o que se busca.

Um bom exemplo é o caso da variável salário (dividida em classes) associada a

variável classe social, é esperado encontrar-se uma relação positiva entre as

variáveis, pois se o salário aumenta a classe social deve ser maior e vice versa.

39

De um modo geral, a quantificação do grau de associação entre duas variáveis é feita pelos chamados coeficientes de associação ou correlação. Essas são medidas que descrevem, por meio de um único número, a associação (ou dependência) entre duas variáveis. Para maior facilidade de compreensão, esse coeficientes usualmente variam entre 0 e 1, ou entre -1 e +1 e a proximidade de zero indica falta de associação. (BUSSAB E MORETIN, 2011, p76).

Entre as medidas utilizadas para verificar a associação entre variáveis

qualitativas estão:

Coeficiente de Contingência de Pearson

Como o coeficiente de Pearson não varia entre 0 e 1 , e o valor máximo

de C depende do número de linhas e colunas ( chamadas de r e s) define-se um

outro coeficiente que varia entre 0 e 1 e atinge o máximo igual a 1 quando r = s

dado pela expressão abaixo:

Percebemos que ambas as medidas se baseiam na estatística ou no

cálculo do Qui-Quadrado de Pearson dada pela expressão:

Calcula-se [(oi – ei)2 / ei] para cada casela da tabela de distribuição

conjunta das variáveis estudadas e somam-se estes valores obtendo-se uma

medida de afastamento global dada pela expressão acima. Esta medida é

chamada de Qui-Quadrado observado e é muito utilizada para os testes de

hipóteses sobre independência e aderência de variáveis, onde comparamos o

40

valor observado com o valor tabelado encontrado em uma tabela de distribuição

de probabilidades da variável Qui-Quadrado.

Associação entre variáveis quantitativas

Quando as variáveis envolvidas são quantitativas podemos utilizar as

análises já estudadas para as variáveis qualitativas além de outros procedimentos

analíticos e gráficos mais refinados, sendo que em nosso estudo falaremos do

gráfico de dispersão e do coeficiente de correlação.

Gráficos de dispersão

Este tipo de gráfico já foi analisado para uma única variável no capítulo

de gráficos, mas agora devemos observá-lo com relação a duas variáveis. A

representação gráfica ajuda muito a compreender o comportamento conjunto das

duas variáveis em estudo e quanto à existência ou não de associação. Vejamos o

exemplo a seguir, onde cruzamos as variáveis: anos de serviço com número de

clientes.

Gráfico 10 – Gráfico de barras segundo as classes da variável salário

Fonte: Dados Hipotéticos - AnexoTabela 9

0

20

40

60

80

0 2 4 6 8 10 12

Núm

ero

de c

lient

es

Anos de Serviço

Gráfico de dispersão

41

Neste caso o gráfico parece indicar uma associação entre as variáveis

estudadas uma vez que o número de clientes cresce à medida que aumentam os

anos de serviço.

Um primeiro ponto a se ressaltar é que as relações podem ser lineares

ou não lineares. Nós abordaremos apenas a situação de linearidade para qual

define-se uma medida que avalia o quanto a nuvem de pontos do gráfico de

dispersão aproxima-se de uma reta, e o grau de associação entre as duas

variáveis, esta medida é o coeficiente de correlação linear.

Coeficiente de correlação linear

Esta medida varia num intervalo finito de -1 a +1, indicando se a relação

é linear direta (positiva), se é uma relação linear inversa (negativa) ou ainda em

caso de valores próximos a zero indica não haver uma relação linear entre as

variáveis. A fórmula de correlação apresentada está em função da covariância

cuja expressão encontra-se a seguir:

Associação entre variáveis qualitativas e quantitativas

Como já mencionado anteriormente neste caso, usualmente analisa-se

o que acontece com a variável quantitativa quando os dados são categorizados de

acordo com os diversos atributos da variável qualitativa e podemos utilizar as

medidas-resumo, ramo e folhas, histogramas etc... Como nas situações anteriores

seria conveniente contar com uma medida que quantificasse a associação ou o

grau de dependência entre as variáveis. Primeiro calcula-se a variância dos dados

42

da variável quantitativa, sem levar em consideração as categorias da qualitativa,

obtendo-se o que vamos chamar de dispersão global dos dados. Depois

calculamos a variância dentro de cada categoria da qualitativa e se essas

variâncias forem menores do que a global, podemos dizer que a variável

qualitativa melhora o entendimento ou a capacidade de previsão da quantitativa,

portanto existe uma relação entre as duas variáveis. Uma medida-resumo da

variância entre as categorias da variável qualitativa pode ser calculada pela média

das variâncias ponderada pelo número de observações em cada categoria e é

dada pela expressão abaixo onde k é o número de categorias e vari(S) é a

variância de S dentro da categoria i, i=1,2,...,k.

Bussab e Moretin na obra Estatística Básica propõem uma medida que

nos fornece o ganho relativo na variância, obtido com a introdução da variável

qualitativa e dada pela seguinte expressão abaixo.

O símbolo R2 é usual nas técnicas de analise da variância e regressão,

assuntos que não serão abordados por nós, e varia entre 0 e 1. A medida R2 nos

dirá o quanto da variação total da variável quantitativa é explicado pela variável

quantitativa.

2.6 - Exemplos do uso de medidas centrais e de

dispersão na área de finanças.

Teoria do portfólio

O artigo de Harry Markowitz de 1952, Portfolio Selection fundou a teoria

da seleção de carteira, tendo sido um dos precursores da teoria moderna de

finanças. Pela primeira vez os conceitos de risco e retorno são apresentados de

43

forma precisa. A descrição do retorno e risco através de indicadores de média e

variância atualmente tão usada por profissionais de finanças, não era tão óbvia

naqueles dias. Esta façanha de Markowitz tornou possível a utilização da

poderosa álgebra de matemática estatística nos estudos de seleção de carteiras.

O desvio padrão e a variancia medem a variabilidade

do retorno de um título isolado. Dizemos que o desvio-padrão e a

variância são medidas apropriadas do risco de um título quando a

carteira de um investidor contém apenas esse título. Em sua maior

parte, os investidores possuem carteiras, e em consequência disso

a variância (ou desvio-padrão) não é uma boa medida do risco de

um título isolado. O beta é uma medida mais apropriada. (Ross, A.

Stephen ,1995, Atlas,Administração Financeira, páginas 198).

O modelo CAPM

Em 1964, William Sharpe desenvolve um modelo imaginando um

mundo onde todos os investidores utilizam a teoria da seleção de carteiras de

Markowitz e através dele tomam decisões usando a avaliação das médias e

variâncias dos ativos. Sharpe supõe que os investidores compartilham dos

mesmos retornos esperados, variâncias e covariâncias. Mas ele não assume que

os investidores tenham, todos, o mesmo grau de aversão ao risco. Eles podem

reduzir o grau de exposição ao risco tomando parcelas maiores de ativos de

menor risco, ou construindo carteiras combinando muitos ativos de risco.

2.7 - População e amostra

Ao conjunto de entes portadores, de pelo menos, uma característica comum denominamos população estatística, ou universo estatístico. (CRESPO. 2010, p.10).

Uma amostra é um subconjunto finito de uma população. (CRESPO. 2010, p.11).

44

Muitas vezes, devido à impossibilidade ou a inviabilidade econômica ou

temporal, limitam-se as observações referentes a uma determinada pesquisa a

apenas uma parte da população. A essa parte proveniente da população em

estudo chamamos amostra. Para as inferências serem corretas, é necessário

garantir que a amostra seja representativa da população, ou seja, a amostra deve

possuir as mesmas características básicas da população, com relação ao

fenômeno a ser pesquisado.

Técnicas de amostragem

É necessário que a amostra ou as amostras que vão ser utilizadas

sejam obtidas por processos adequados chamados de amostragem ou técnicas de

amostragem. Essas técnicas permitem, tanto quanto possível que as amostras

sejam recolhidas ao acaso e que cada elemento da população tenha a mesma

chance de ser escolhido, o que garante a representatividade das amostras.

2.7.1 - Tipos de amostragem

Amostragem casual ou aleatória simples pode ser realizada

numerando-se a população de 1 a n e sorteando-se, a seguir por meio de um

dispositivo Aleatório qualquer os k elementos que vão compor a amostra. Para

amostras com um número elevado de elementos usa-se uma tábua de números

aleatórios.

Amostragem proporcional estratificada se realiza quando a população

se divide em subpopulações também chamadas estratos. Neste caso além de

considerarmos a existência dos estratos, obtemos os elementos da amostra de

forma proporcional ao número de elementos de cada estrato. Uma pesquisa onde

existam dois estratos (em função do sexo): masculino e feminino é um exemplo.

45

Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. (CRESPO. 2010, p.12).

Amostragem sistemática – Segundo Crespo na obra Estatística Fácil

este tipo de amostragem ocorre quando os elementos da população já se acham

ordenados, não há necessidade de construir o sistema de referência. São

exemplos os prédios de uma rua, as linhas de produção etc. Nestes casos, a

seleção dos elementos que constituirão a amostra pode ser feita por um sistema

imposto pelo pesquisador (pg. 14).

2.8 - Probabilidade

O estudo das probabilidades e o estudo de conjuntos são muito úteis

para as pesquisas estatísticas e os métodos quantitativos, por isso alguns dos

conceitos, das propriedades e técnicas usadas nas duas áreas serão abordados

neste trabalho.

Espaço Amostral, segundo Meyer na obra Probabilidade Aplicações a

Estatística é o conjunto de todos os resultados possíveis do experimento

considerado e é representado pela letra S (pg.11). Um exemplo é o lançamento de

um dado: S=1,2,3,4,5,6.

Evento é simplesmente um conjunto de resultados possíveis; é um

subconjunto do espaço amostral S. Obter um número impar como resultado do

lançamento de um dado: A=1,3,5, é um exemplo.

A probabilidade de um evento A é definida como um número real (tal

que, 0 ≤ P(A)≤ 1 ) igual ao resultado da divisão do número de elementos de A

[n(A)] pelo número de elementos de S [n(S)] e é dada pela expressão

P(A)=n(A)/n(S). Outra definição muito utilizada é a de que P(A) é igual ao número

46

de casos favoráveis dividido pelo número de casos possíveis assim para o

exemplo no qual queríamos obter um número ímpar como resultado do

lançamento de um dado a probabilidade seria P(A) = 3/6 ou P(A)= 50%.

Conjuntos união, interseção, complementar e vazio

Ainda segundo Meyer na obra já citada, nas páginas 5, 6 e 7, da teoria

de conjuntos e supondo A e B dois conjuntos definem-se:

O conjunto C - união de A e B (algumas vezes denominado a soma de

A e B) como sendo C=x / x Є A ou x Є B (ou ambos). Desse modo, C será

formado de todos os elementos que estejam em A, ou em B, ou em ambos e

representaremos ou escreveremos a união de A e B, como: C = A U B.

O conjunto D - interseção de A e B (algumas vezes denominada o

produto de A e B) como sendo D=x / x Є A e x Є B. Portanto D será formado de

todos os elementos que estão e m A e B, e representaremos ou escreveremos a

interseção de A e B, como: D = A ∩ B.

O complemento do conjunto A é denotado por Ā e é constituído por

todos os elementos que não estejam em A, mas que façam parte do conjunto

fundamental U (universo – conjunto total). Isto é

Conjunto vazio ou nulo é o conjunto que não contém qualquer elemento

e geralmente é representado pelo símbolo Ø.

Uma vez revisados estes conceitos de conjuntos podemos seguir com o

estudo de outras propriedades e definições sobre o cálculo das probabilidades.

Eventos mutuamente excludentes

Dois eventos, A e B, são denominados mutuamente excludentes, se eles não puderem ocorrer juntos. Exprimiremos isso escrevendo A ∩ B = Ø, isto é, a interseção de A e B é o conjunto vazio. (Meyer, 2ª edição, p.7).

47

Para o exemplo do lançamento de dados, se tivermos os eventos

A=tirar números pares e B=tirar números ímpares, eles serão mutuamente

excludentes, pois A ∩ B Ø.

O teorema da adição para o cálculo de probabilidades é dado por:

P(A U B) = P(A) + P(B) – P(A ∩ B)

Logo no caso de eventos mutuamente excludentes onde A ∩ B = Ø, a

P(A ∩ B)=0, pois não temos casos favoráveis e o teorema se resume a:

P(A U B) = P(A) + P(B)

Eventos complementares

Pela definição do que seria um conjunto complementar, o evento

complementar de A, dado pelo símbolo Ā, será formado por todos os resultados

pertencentes ao espaço amostral S e não pertencente ao evento A, logo vem que:

P(Ā)= 1 – P(A)

Esta expressão ou este entendimento é muito útil e importante, pois

sabemos ser possível avaliar ou calcular P(A) em função do P(Ā), isto porque em

muitas situações é mais fácil calcular P(Ā) do que achar P(A).

Eventos independentes

Dois eventos A e B serão independentes se o conhecimento da

ocorrência de A de nenhum modo influenciar a probabilidade da ocorrência de B,

ou de forma equivalente se verificarmos que as probabilidades absolutas serão

iguais às probabilidades condicionadas. Assim por definição A e B serão eventos

independentes se, e somente se, P(A ∩ B)= P(A).P(B).

48

2.9 - Variáveis aleatórias e modelos probabilísticos

O conhecimento sobre conjuntos, espaços amostrais e probabilidades

bem como algumas de suas propriedades nos levam saber da existência e da

necessidade de modelos probabilísticos que representem todos ou quase todos os

tipos de variáveis. A construção de modelos bem como e a inferência sobres seus

parâmetros é uma das áreas da estatística que ajuda em muito as demais

ciências. Para melhor compreensão vejamos alguns conceitos, definições e

exemplos.

Segundo Stevenson na obra Estatística Aplicada a Administração uma variável aleatória (v.a.) é uma função com valores numéricos, cujo valor é determinado por fatores de chance. (p.97).

Uma variável aleatória é considerada discreta se toma valores que podem ser contados. Exemplos: número de acidentes numa semana, número de defeitos em sapatos, número de terremotos, número de jogos empatados, número de livros em uma estante.

Uma variável aleatória é considerada contínua quando pode tomar qualquer valor de determinado intervalo. Uma variável aleatória contínua tem um número infinito de valores possíveis, são exemplos típicos: pesos de caixas de laranja, alturas de pinheiros, duração de uma conversa telefônica, o tempo necessário para completar um ensaio. (Stevenson,p.98)

A distinção entre variáveis discretas e contínuas é importante porque a

utilização de diferentes modelos (distribuições) de probabilidade depende do tipo

de variável aleatória considerada.

O valor esperado de um experimento é uma média, e pode ser

calculado como:

Onde x1...xn são os valores de uma v.a. e pi são as probabilidades

correspondentes, sendo E(X) o valor esperado, a esperança ou a média de X.

49

O desvio padrão é definido como a raiz quadrada positiva da variância,

e esta pode ser obtida pela expresão abaixo:

Uma distribuição de probabilidades é uma distribuição de freqüências

relativas para os resultados de um espaço amostral; mostra a proporção das

vezes em que v.a. tende a assumir cada um dos diversos valores.

A função de distribuição acumulada (f.d.a.) para uma variável aleatória

X é chamada, por alguns, apenas de função distribuição (f.d) e é denotada por

F(X), tal que F(X) = P (X≤ x).

2.9.1 - Modelos probabilísticos para variáveis Aleatórias

Discretas

Algumas variáveis aleatórias adaptam-se muito bem a uma série

problemas práticos. Portanto, o conhecimento dessas variáveis é de grande

importância para a construção de modelos probabilísticos para situações reais e a

conseqüente estimação de seus parâmetros. Para algumas dessas distribuições

existem tabelas que facilitam o cálculo de probabilidades, em função de seus

parâmetros, geralmente a média, o desvio padrão e o total de elementos(n).

Distribuição Uniforme discreta

Este é o caso mais simples de v.a. discreta, em que cada valor possível

possui a mesma probabilidade de ocorrer. Um exemplo seria a v.a. X assumindo o

número de pontos marcados na face superior de um dado.

50

Distribuição de Bernouli

Ocorre em experimentos cujos resultados possuem ou não uma

determinada característica, podemos então dizer que os resultados assumem

duas possibilidades chamadas sucesso (possui a característica) ou fracasso (não

possui a característica). Define-se desta forma a v.a. X que assume dois valores

apenas: 1, se ocorrer sucesso, e 0, se ocorrer fracasso. Exemplos: Uma peça é

escolhida ao acaso de um lote com 400 peças e queremos saber se ela é

defeituosa ou não; Uma pessoa é escolhida ao acaso dentre 100 é do sexo

feminino ou não; o lançamento de uma moeda, o lançamento de um dado dando

como resultado 6.

Distribuição Binomial

Quando obtemos uma amostra de tamanho n de uma distribuição de

Bernoulli (equivalente a repetimos n vezes um ensaio de Bernoulli), e supondo que

as repetições sejam independentes, isto é o resultado de um ensaio não influencia

no resultado de qualquer outro ensaio, teremos uma amostra constituída de uma

seqüência de sucessos e fracassos. Os mesmos exemplos utilizados para a

variável de Bernoulli se aplicam para a Binomial desde que ocorra repetição.

Como exemplo podemos retirar 6 peças de um lote com 400, e querer obter qual

a probabilidade de que 4 peças sejam defeituosas.

Definimos como experimento binomial ao experimento que consiste em

n ensaios de Bernoulli; cujos ensaios são independentes; e para o qual a

probabilidade de sucesso em cada ensaio é sempre igual a p, 0<p<1 e q=1-p. P(x)

é dado pela expressão a seguir, tal que E(X) = np e Var(X)= npq.

51

Distribuição Hipergeométrica

Essa distribuição é adequada quando consideramos extrações casuais

feitas sem reposição de uma população dividida segundo dois atributos. Para

casos de N grande esta distribuição aproxima-se da distribuição binomial.

Distribuição de Poison

Segundo Bussab, na obra Estatística Básica, esta distribuição é

largamente empregada quando se deseja contar o número de eventos de certo

tipo que ocorrem num intervalo de tempo, ou superfície ou volume. Número de

chamadas recebidas por um telefone em 5 minutos; número de falhas de um

computador num dia de operação; e a desintegração de substâncias radioativas

(emissão de partículas alfa em 7,5 segundos) são exemplos para esta variável.

(p.149).

2.9.2 - Modelos probabilísticos para variáveis Aleatórias

Contínuas

Vale lembrar que para estas variáveis também se calculam E(X) e

Var(X), utilizando-se as devidas modificações, cálculos e adaptações em função

da variável ser contínua. Relacionamos a seguir alguns dos modelos e a sua

utilização.

Modelo Normal

É um modelo fundamental em probabilidades e inferência estatística,

suas origens remontam a Gauss em seus trabalhos sobre erros de observações

astronômicas, por volta de 1810, donde o nome de distribuição gaussiana para tal

modelo.

Existe uma relação que permite transformar qualquer curva normal em

uma curva normal com distribuição padrão ou reduzida N(0,1) (média zero e

variância=1). Este dispositivo é muito importante porque uma vez tendo um

52

modelo normal qualquer é só transformá-lo para normal reduzida e consultarmos a

tabela da normal reduzida. Seja uma normal qualquer X ~ N(µ,σ2), então um valor

específico da v.a. X tem o seu correspondente na normal reduzida como sendo

Z=(X-µ)/σ.

Outro recurso importante é a aproximação que pode ser feita do modelo

discreto Binomial para o Modelo contínuo Normal.

Modelo Exponencial

Este modelo tem aplicações em confiabilidade de sistemas. Um bom

exemplo é o tempo de vida, em horas, de um transistor.

Distribuição ou Modelo Gama

È uma extensão do modelo exponencial, ocorre quando a v.a. assume

valores positivos, é utilizado em muitas áreas da matemática.

Distribuição ou Modelo Qui-Quadrado

É um caso especial do modelo Gama, e tem muitas aplicações em

estatística entre estas temos os testes de independência entre duas variáveis e o

teste de aderência (vide 2.4.4). Como no caso da normal, existem tabelas para

obter as probabilidades.

Distribuição ou Modelo t de Student

Esta distribuição é importante no que se refere à inferência sobre

médias populacionais e é dada por uma v.a definida pelo quociente entre uma

variável Normal N(0,1) e uma variável qui-quadrado. Esta variável também é muito

utilizada na prática e existem tabelas fornecendo as probabilidades relativas a ela.

O nome Student vem do pseudônimo usado pelo estatístico inglês W. S. Gosset

que introduziu essa distribuição no início do século passado. Quando parâmetro v,

que determina os graus de liberdade, é grande esta distribuição aproxima-se

bastante da de uma Normal N(0,1).

53

Distribuição ou Modelo F de Snedecor

Esta distribuição é dada por uma v.a. definida como o quociente de

duas variáveis com distribuição qui-quadrado.

Nos anexos apresentamos dois quadros com as distribuições, os

parâmetros e as expressões E(x) e Var(x) para os modelos discretos (quadro 1) e

contínuos (quadro 2) apresentados acima.

2.9.3 - Exemplos do uso de modelos probabilísticos na

área de finanças.

Uma das aplicações onde mais são utilizados estes modelos,

principalmente o normal e o t de Student, é a construção de intervalos de

confiança, para os índices de variação de investimentos e ações. Qualquer

variável econômica que possa ter sua função de distribuição acumulada (f.d.a.)

aproximada para um modelo conhecido pode ser facilmente estudada e analisada

através das tabelas existentes.

A distribuição de Qui-Quadrado é utilizada em testes de independência

entre variáveis ou de adequação de dados a uma determinada distribuição. Um

exemplo de aplicação foi visto no capítulo 2.5 Análise Bidimensional.

54

CONCLUSÃO

Começamos nosso trabalho apresentando os tipos de variáveis

existentes e quais os resultados a elas associados, pois isto facilita na escolha das

ferramentas e na interpretação dos dados obtidos. Ao longo deste trabalho ainda,

abordamos e estudamos varias técnicas estatísticas e métodos quantitativos

capazes de representar conjuntos de dados, através de uma medida central e de

uma medida de dispersão. Avançando-se um pouco mais conseguimos determinar

probabilidades ou ajustar os dados a um determinado modelo probabilístico

conhecido o que permite obter facilmente, através de tabelas, as probabilidades

associadas ao fenômeno ou a construir intervalos de confiança, onde é possível

mensurar o nível de erro ou o grau de confiança nos mesmos.

Questões básicas como determinar o tipo de variáveis são importantes

na hora de se planejar e construir um banco de dados que forneça em tempo ágil

a informação necessária para a tomada de decisões e ou avaliação de

performance. A escolha de índices e ou a construção de medidas na área

financeira, mostra a utilidade de várias medidas estatísticas em suas construções.

A simples construção de tabelas de freqüência e a escolha correta de gráficos

tornam a visualização e compreensão das informações contidas em um conjunto

de dados, muito mais fáceis, pois os comportamentos e tendências das variáveis

envolvidas são percebidos de maneira mais clara, permitindo-se avaliações e

decisões gerenciais. Muitas vezes não temos muita informação sobre uma variável

desejada, mas conhecemos sua relação com outra variável da qual temos

informações, então avaliamos uma em função da outra. Podemos assim concluir

de forma favorável pela grande contribuição dos métodos quantitativos e das

técnicas estatísticas e sua importância não só na área de finanças como em todos

os ramos da ciência.

55

BIBLIOGRAFIA CITADA

Chambers, John, William Cleveland, Beat Kleiner, and Paul Tukey. Graphical Methods for Data Analysis. Wadsworth,1983.

Crespo, Antônio Arnot. Estatística Fácil. 19ª edição Atualizada. São Paulo: Saraiva,2009

Meyer, Paul L. Probabilidade: Aplicações a Estatística. 2ª Edição. Rio de Janeiro: Livros técnico e científicos Editora,1983.

Moretin,Pedro Alberto; Bussab, Wilton de Oliveira. Estatística Básica. 7ª Edição. São Paulo: Saraiva ,2011

Richardson, Roberto Jarry. Colaboradores. Pesquisa Social: Métodos e Técnicas. São Paulo: Editora Atlas, 1985

Ross, Stephen A., Westerfield, Randolph W., Jaffe, Jeffrey F. Administração Financeira. 3ª edição. São Paulo: Editora Atlas, 1995.

Stevenson, William J. Estatística Aplicada a Administração. Editora Harbra,1981.

BIBLIOGRAFIA CONSULTADA

Drucker, Peter Ferdinand. O essencial de Drucker. Edição Junho 2008, Actual Editora. Lisboa, 2001. 77-91

Freitas, Dra. Corina, Costa; Rennó, MSc Camilo Daleles; MSc. Júnior, Manoel Araújo Souza. Estatística Curso 1- INPE. São José dos Campos. Março de 2003.

Markowitz, Harry Max. Artigo Porfólio Selection. Journal of Finance. Estados Unidos da América. Março de 1952.

Sharpe, William F. "Capital Asset Prices: A Theory of Market Equilibrium Under Conditions of Risk." The Journal of Finance (New York) Vol XIX, 3 (September 1964): 425-442.

Morettin, Luiz Gonzaga. Estatística Básica: Probabilidade e Inferência. 7ª edição. São Paulo: Editora Pearson Education, 1999.

Torezani, Walquiria. Apostila de estatística 1. Faculdade UNIVILA –Curso de Administração. Vila Velha, 2004.

56

WEBGRAFIA

ENCE Escola Nacional de Ciências Estatísticas. < URL: www.ence.ibge.gov.br/ web/ence/as-aplicacoes-da-estatistica > data de acesso: 05/01/2013.

USP Universidade de São Paulo. < www.usp.br/fau/cursos /graduacao/arq.../Apostila_Provisoria.pdf> data de acesso:15/01/2013.

http://www.usp.br/fau/cursos%20/graduacao/arq.../Apostila_Provisoria.pdf

http://www.usp.br/fau/cursos%20/graduacao/arq.../Apostila_Provisoria.pdf

57

Anexos

Tabelas

Tabela 4- Peças de roupas vendidas em 2009

Tipo Vendas %

Masculinas 100 29,4% Femininas 130 38,2%

Infantis 110 32,4% Total 340 1

Fonte: Dados Hipotéticos

Tabela 5 - Peças de roupas vendidas em 2010

Tipo Vendas % Masculinas 80 23,5% Femininas 150 44,1%

Infantis 110 32,4% Total 340 1


Tabela 6 - Número de empregados por empresa na cidade Y

Número Empregados Quantidade de Empresas 5 3

10 3 15 5 20 2 25 1 30 1


58

Tabela 7 - Salários da Empresa Estuda que é Bom

Salário Ocorrências 1000 5 1300 4 1500 3 1700 2 1900 1 2000 4 2500 2 3000 2 3500 1 3900 1 4000 3 4500 3 5000 1 5500 1 6000 2 6500 2 7000 1 8500 1

11000 1 Fonte: Dados Hipotéticos

59

Tabela 8 - Cálculo das medidas resumo

Nº de observações (i) Var X Var Y Var W Var K Var Z 1 4 2 4 6 4 2 5 5 6 6 5 3 6 6 6 6 5 4 7 7 7 6 6 5 8 15 6 7 6 7 7 8

Medidas Resumo Var X Var Y Var W Var K Var Z Média aritmética 6,00 7,00 5,75 6,00 6,00

Moda #N/D #N/D 6,00 6,00 5,00 Mediana 6,00 6,00 6,00 6,00 6,00 Variância 2,50 23,50 1,58 - 2,00

Desvio Padrão 1,58 4,85 1,26 - 1,41 Desvio Médio 1,20 3,20 0,88 - 1,14

Media geométrica 5,83 5,75 5,63 6,00 5,85 Média harmônica 5,65 4,65 5,51 6,00 5,70


Tabela 9 - Número de clientes (Y) por Número de anos de serviço (X)

Agente Anos de serviço (X) Número de clientes (Y)

A 2 48 B 3 50 C 4 56 D 5 52 E 4 43 F 6 60 G 7 62 H 8 58 I 8 64 J 10 72


Fi

Figur

Figuras e Quadros

Figura 1 - Exemplos de Box - Plot

60

61

Quadro 1 – Modelos para Variáveis Discretas

Quadro 2 – Modelos para Variáveis Contínuas

62

ÍNDICE

FOLHA DE ROSTO 02

AGRADECIMENTO 03

DEDICATÓRIA 04

RESUMO 05

METODOLOGIA 06

SUMÁRIO 07

INTRODUÇÃO 08

CAPÍTULO I - Conceitos e Definições 10

1.1. Finanças 10

1.2. Estatística 11

1.3. Gestão Empresarial 14

CAPÍTULO II – Técnicas Estatísticas 15

2.1. Variáveis 15

2.2. Distribuição de Freqüências 18

2.3. Métodos Gráficos 21

2.4. Medidas Resumo 29

2.5. Análise Bidimensional 37

2.6. Exemplos do uso de medidas resumo na área de finanças 42

2.7. População Amostra 43

2.8. Probabilidade 45

2.9. Variáveis Aleatórias e Modelos Probabilísticos 48

CONCLUSÃO 54

BIBLIOGRAFIA CONSULTADA 55

BIBLIOGRAFIA CITADA 55

WEBGRAFIA 56

ANEXOS 57

ÍNDICE 62

Documents

DOCUMENTO PROTEGIDO PELA LEI DE DIREITO … · STATUS (Estado). Há indícios de que 3000 anos A.C. já se faziam censos na . 12 Babilônia, China e Egito e até mesmo o 4º. livro