Upload
vucong
View
218
Download
0
Embed Size (px)
Citation preview
1
UNIVERSIDADE CANDIDO MENDES
PÓS-GRADUAÇÃO “LATO SENSU”
AVM FACULDADE INTEGRADA
APLICAÇÃO DE MÉTODOS QUANTITATIVOS
NA ÁREA DE FINANÇAS E GESTÃO CORPORATIVA
Por: Marcelo Fernandes Aleixo
Orientador
Profa. Ana Claudia Morrissy
Rio de Janeiro
2013
DOCU
MENTO
PRO
TEGID
O PEL
A LE
I DE D
IREIT
O AUTO
RAL
2
UNIVERSIDADE CANDIDO MENDES
PÓS-GRADUAÇÃO “LATO SENSU”
AVM FACULDADE INTEGRADA
APLICAÇÃO DE MÉTODOS QUANTITATIVOS
NA ÁREA DE FINANÇAS E GESTÃO CORPORATIVA
Apresentação de monografia à AVM Faculdade
Integrada como requisito parcial para obtenção do grau
de especialista em Finanças e Gestão Corporativa.
Por: Marcelo Fernandes Aleixo
3
AGRADECIMENTOS
Antes de tudo a Deus, pelas inúmeras
bênçãos recebidas ao longo da vida.
À nossa orientadora Ana Claudia Morrissy
pela ajuda prestada e a devida orientação.
Aos amigos que me auxiliaram e apoiaram
nos momentos difíceis.
E a todos aqueles que direta ou
indiretamente, de alguma forma, me
ajudaram na elaboração deste trabalho.
4
DEDICATÓRIA
À minha esposa Renata, que tanto
colaborou para a confecção e o
aperfeiçoamento desse trabalho. Também a
João Marcelo, meu filho, pela alegria que traz
à minha vida e a meu Lar e a meus pais e
irmãos, que são um apoio constante em
minha vida.
5
RESUMO
O objetivo desta obra é apresentar as principais técnicas estatísticas e
métodos quantitativos tais como: tipos de variáveis e suas associações, medidas
centrais e de dispersão, tipos de gráficos e tabelas de frequência e de que modo
foram, ou possam ser utilizados na área financeira, seja de forma direta ou de
forma indireta. No caso indireto temos a construção de índices e modelos
financeiros que se utilizaram ou utilizam dos conceitos e das medidas estatísticas
na sua elaboração.
Abordamos, também, alguns conceitos básicos de conjuntos e
probabilidades, pois a noção destes é de suma importância na interpretação de
resultados, na construção de intervalos de confiança, na comparação de
resultados obtidos em períodos diferentes e na construção de modelos estatísticos
e quantitativos, dos quais apresentaremos os principais.
Assim este trabalho visa mostrar o ganho ou agilidade que as técnicas
estatísticas oferecem a área financeira, facilitando a tomada de decisões por parte
da área administrativa e gerencial, seja em função do conhecimento em se
construir bancos de dados ou em função da interpretação destes dados através de
resumos obtidos com as técnicas estatísticas e métodos quantitativos
apresentados.
6
METODOLOGIA
Foram utilizadas referências bibliográficas sobre o tema a fim de
subsidiar e resumir os principais conceitos que envolvem as áreas em estudo:
Finanças, Gestão Corporativa e Estatística. A primeira preocupação consistiu em
consultar autores e obras com reconhecido valor e larga utilização nas áreas a
serem estudadas, de forma a aprender e a fundamentar a pesquisa e o trabalho
monográfico realizado.
Também foi realizada uma pesquisa na WEB em busca de conceitos,
teses e estudos sobre o tema que tenham uma boa confiabilidade. Para tal, nos
baseamos em sites e trabalhos que tenham como fonte instituições de ensino,
e/ou profissionais das mesmas.
7
SUMÁRIO
INTRODUÇÃO 08
CAPÍTULO I - Conceitos e Definições 10
1.1. Finanças 10
1.2. Estatística 11
1.3. Gestão Empresarial 14
CAPÍTULO II – Técnicas Estatísticas 15
2.1. Variáveis 15
2.2. Distribuição de Freqüências 18
2.3. Métodos Gráficos 21
2.4. Medidas Resumo 28
2.5. Análise Bidimensional 35
2.6. Exemplos do uso de medidas resumo na área de finanças 41
2.7. População Amostra 42
2.8. Probabilidade 44
2.9. Variáveis Aleatórias e Modelos Probabilísticos 47
Conclusão 53
Bibliografia Consultada 54
Bibliografia Citada 54
Webgrafia 55
Anexos 56
ÍNDICE 59
8
INTRODUÇÃO
Muitos homens e mulheres dedicam boa parte da vida, senão toda ela,
a trabalhos e pesquisas que visam trazer melhores condições de vida, progresso e
avanços para toda a humanidade em todas as áreas do conhecimento humano,
seja na Economia, Educação, Agricultura, Química, Física, Nutrição, Medicina,
Segurança, Indústria e tantas outras que não conseguiríamos mencioná-las.
Nessa busca incessante do progresso, teorias, hipóteses e idéias
surgem a partir da observação atenta dos fatos e das leis da natureza. Uma vez
formuladas, estas hipóteses devem ser testadas ou comprovadas, através de
ensaios e pesquisas devidamente conduzidos, desde o momento da obtenção das
informações, bem como da exploração e interpretação da massa de dados que irá
então: comprovar, condenar ou mostrar estarem incompletas tais teorias, que
poderá apontar rumos antes não imaginados, ou ainda mesmo demonstrar que
são necessárias novas informações e novas pesquisas. Este é o lado mais
apurado e mais complexo que demanda maior acuidade, precisão e técnicas mais
avançadas. Assim, surgem vacinas, novos tratamentos e remédios ou drogas na
Medicina, alimentos geneticamente modificados ou mais enriquecidos em
vitaminas e outros nutrientes necessários ao homem na Nutrição e na Biologia,
também assim são testados e desenvolvidos novos procedimentos tanto nas
áreas médicas como na indústria e no comércio. Aqui relatamos, talvez, o viés
mais nobre do uso ou da interpretação de dados/informações. Falamos talvez
porque o que falar daqueles que mais simples e intuitivos nos levam às projeções
e decisões menos complicadas, mas tão necessárias ao nosso dia a dia.
Suponhamos que você esteja na feira e quer comprar maçãs. Quantas maçãs
você vai comprar? Bom se você come uma (1) maçã por dia e vai à feira uma vez
por semana, precisará de pelo menos sete (7) maçãs. Parece simples e é, pois
conhecemos os nossos hábitos, conhecemos os mecanismos da situação,
possuímos os dados, a informação necessária para tomarmos a decisão mais
apropriada. Outro exemplo bem simples é aquele que todo brasileiro faz quando
9
recebe o salário e diminui dele todas as despesas fixas e que não pode deixar de
pagar ou usufruir, para ver o que sobra. Caso sobre alguma coisa passa-se para
as despesas menos necessárias ou até mesmo um investimento. Seriam
inumeráveis os exemplos de situações vividas em nosso cotidiano onde o
processo é bem conhecido e onde dispomos das informações ou dados básicos a
fim de tomarmos decisões e fazermos projeções. Tudo isso de forma simples,
espontânea e quase intuitiva. Com relação aos estudos e trabalhos
desempenhados pelos cientistas e pesquisadores, o que eles buscam? É
exatamente, conhecer, entender bem um processo até então desconhecido e
possuir o maior número de informações/dados a fim de resolver problemas, e
apontar soluções que melhorem o mundo.
Num mundo cada vez mais interligado e globalizado, em que os meios
eletrônicos facilitam a circulação e o acesso bem como a divulgação de
informações e dados sobre os mais variados assuntos, torna-se ainda mais
complexo o problema da obtenção de dados confiáveis. A boa intenção, a
honestidade, o compromisso e a seriedade de uma pessoa ao disponibilizar dados
nem sempre são suficientes para garantir a força e a confiabilidade dos dados
obtidos. Há uma ciência que não só apura e interpreta os dados, mas
principalmente ensina a programar e conduzir o processo de obtenção de dados
de forma que estes dados sejam representativos no universo estudado. Esta
ciência é vista por algumas pessoas como filha da Matemática, uma vez que lida
com números e lógica, contudo são necessárias outras aptidões. Estamos falando
da Estatística. O propósito, com esta monografia é justamente mostrar a
importância da Estatística, nas ciências, especificamente na área de finanças e
gestão corporativa, e da necessidade de interação entre as várias áreas de
conhecimento para se chegar às conclusões e à tomada de medidas que
realmente possam beneficiar a todos, de acordo com as boas práticas da
Governança Corporativa.
10
1- CONCEITOS E DEFINIÇÕES
1.1 - Finanças
Finanças é a parte da Administração (Gestão Corporativa) que trata da
maximização da riqueza dos acionistas através de:
Captação de Financiamento cuja finalidade é estruturar o capital com
adequada taxa de juros e prazo escolhendo o melhor sistema de financiamento.
Seleção de Projetos Rentáveis cujo objetivo é escolher as aplicações
com maiores VPL e TIR.
Promoção de Adequada Liquidez tarefa que consiste em conciliar o
pagamento das contas no prazo correto fazendo uso dos recursos disponíveis no
curto prazo.
Gerenciamento adequado do Grau de Risco que consiste na avaliação
e mensuração da exposição aos vários tipos de risco em busca das metas e dos
objetivos traçados, ou seja, do lucro.
Como foi exposto anteriormente somente o correto acompanhamento
de índices e taxas e a produção de um histórico de dados e informações obtidas
através de métodos quantitativos pode fundamentar de forma eficiente a tomada
de decisões na esfera gerencial e administrativa.
Façamos uma análise rápida sobre a questão do risco. Segundo se
depreende de estudos já realizados, a atividade empresarial pressupõe a
aceitação do risco, pois não existe empresa sem risco. Imaginemos que as vendas
da empresa tenham ficado abaixo do esperado e que não haja dinheiro suficiente
no caixa para custear os gastos. Vai haver uma perda, seja por fazer um
financiamento ou por baixar uma aplicação. Existem vários tipos de risco como o
de imagem e o de liquidez entre outros.
11
Risco pela ótica do resultado é a possibilidade ou probabilidade P(x) de
que um resultado venha a ocorrer muito ou pouco diferente do que foi planejado,
ou até mesmo de não ocorrer. Outra definição muito mencionada é a de que risco
seria a dificuldade de prever resultados futuros de um negócio em função da
amplitude da dispersão dos resultados possíveis (esta é uma visão bem
estatística).
Sendo assim surge uma pergunta, pode-se medir o risco de um
negócio? E a resposta é sim. Através do Grau de Criticidade de um Risco, que é o
produto da probabilidade de ocorrência P(x) vezes a amplitude do impacto, onde P
(x) pode ser quantificada pela observação de dados históricos ou pela opinião de
especialistas ou utilizando-se ainda a Variância e Desvio Padrão dos resultados
possíveis. Já a amplitude do impacto depende da área em questão. Podemos ter
um impacto tributário na área de produção, ou podemos ter um impacto na taxa de
financiamento como exemplo.
Finanças é a arte e a ciência da gestão de ativos financeiros. O campo de estudo de instituições financeiras, dos mercados financeiros e do funcionamento dos sistemas financeiros, quer dentro de uma nação quer no mercado internacional. Quanto ao verbo, financiar significa fornecer fundos para negócios e projetos.
No nível micro, as finanças são o estudo do planejamento financeiro, da gestão de ativos e da captação de fundos por empresas e instituições financeiras.
O termo finanças pode assim incorporar o estudo do dinheiro e outros ativos; o gerenciamento e controle desses ativos ou recursos; e a análise e gerenciamento de riscos de projetos (www.wikipédia.com.br, em 03/2013)
1.2 - Estatística
A origem da palavra Estatística está associada à palavra latina
STATUS (Estado). Há indícios de que 3000 anos A.C. já se faziam censos na
12
Babilônia, China e Egito e até mesmo o 4º. livro do Velho Testamento faz
referência a uma instrução dada a Moisés, para que fizesse um levantamento dos
homens de Israel que estivessem aptos para guerrear. Usualmente, estas
informações eram utilizadas para a taxação de impostos ou para o alistamento
militar. O Imperador César Augusto, por exemplo, ordenou que se fizesse o censo
em todo o Império Romano.
Contudo, mesmo que a prática de coletar dados sobre colheitas,
composição da população humana ou de animais, impostos, etc., fosse conhecida
pelos egípcios, hebreus, caldeus e gregos, e se atribuam a Aristóteles cento e
oitenta descrições de Estados, apenas no século XVII a Estatística passou a ser
considerada disciplina autônoma, tendo como objetivo básico à descrição dos
bens do Estado.
A palavra Estatística foi cunhada pelo acadêmico alemão Gottfried
Achenwall (1719-1772), que foi um notável continuador dos estudos de Hermann
Conrig (1606-1681). Gottfried determinou os objetivos da Estatística e suas
relações com as demais ciências.
Com a Escola Alemã as tabelas tornaram-se mais completas, surgiram
as representações gráficas e o cálculo das probabilidades, e a Estatística deixou
de ser simples catalogação de dados numéricos coletivos para se tornar o estudo
de como chegar a conclusões sobre o todo (“população”), partindo da observação
de partes desse todo (“amostras”).
Atualmente, os estudos estatísticos têm avançado rapidamente e, com
seus processos e técnicas, têm contribuído para a organização dos negócios e
recursos do mundo moderno.
No século XVIII o estudo de tais fatos foi adquirindo, aos poucos, feição verdadeiramente científica. Godofredo Achenwall batizou a nova ciência (ou método) com o nome de estatística, determinando seu objetivo e suas relações com as ciências (CRESPO, 2010, pg 01).
13
1.2.1 - O QUE É ESTATÍSTICA ?
A Estatística é uma parte da matemática aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões (CRESPO, 2010, pg 01).
“O que modernamente se conhece como Ciências Estatísticas, ou simplesmente Estatística, é um conjunto de técnicas e métodos de pesquisa e análise de dados que entre outros tópicos, envolve o planejamento do experimento a ser realizado, a coleta qualificada dos dados, a inferência, o processamento, a análise e a disseminação das informações" (Site oficial da ENCE- Internet, 2012).
Para melhor compreensão do que seja estatística, são citadas abaixo
algumas informações contidas no site da ENCE- Escola Nacional de Ciências
Estatística que é uma Instituição Federal de Ensino Superior que faz parte do
Instituto Brasileiro de Geografia e Estatística e que foi fundada em 06 de março de
1953.
O desenvolvimento e aperfeiçoamento de técnicas estatísticas de obtenção e análise de informações, permite o controle e o estudo adequado de fenômenos, fatos, eventos e ocorrências em diversas áreas do conhecimento.
A Estatística tem por objetivo fornecer métodos e técnicas para lidarmos, racionalmente, com situações sujeitas a incertezas. (Site oficial da ENCE- Internet, 2012).
1.2.2 - AS APLICAÇÕES DA ESTATÍSTICA
O crescente uso da Estatística vem ao encontro da necessidade de
realizar análises e avaliações objetivas, fundamentadas em conhecimentos
científicos. As informações estatísticas são concisas, específicas e eficazes,
fornecendo assim subsídios imprescindíveis para as tomadas racionais de
decisão. Neste sentido, a Estatística fornece ferramentas importantes para que as
empresas e instituições possam definir melhores suas metas, avaliar sua
14
performance, identificar seus pontos fracos e atuar na melhoria contínua de seus
processos. Na prática, a Estatística pode ser empregada como ferramenta
fundamental em várias outras ciências.
1.3 - Gestão Empresarial
A Gestão Empresarial pode ser vista como um modelo de trabalho,
orientado por uma política de valores, capaz de planejar, alocar e gerir recursos,
ações, iniciativas, princípios, valores e estratégias, procurando viabilizar o alcance
dos objetivos propostos por uma organização (empresa).
Ela pode encerrar critérios formais e/ou informais de atuação,
evidenciando a visão, os valores e a missão que norteiam o alcance dos objetivos
e resultados procurados. Inspirada nesse modelo, ela formata a sua estrutura
hierárquica, o organograma de cargos e funções, o processo disciplinar e os
incentivos, as principais interfaces operacionais internas e externas, a estratégia
comercial e de marketing, a logística, o desenvolvimento de parceiros, da sua
cadeia de suprimentos, entre outros.
Em economia, negócio, é referido como um comércio ou empresa, que
é administrado por pessoa(s) para captar recursos financeiros para gerar bens e
serviços, e por conseqüência proporciona a circulação de capital de giro entre os
diversos setores. Em apertada síntese, podemos dizer que, entende-se por
negócio toda e qualquer atividade econômica com o objetivo de gerar lucro.
Etimologicamente, e num sentido mais lato, a palavra negócio deriva do
latim, e quer dizer a negação do ócio. Negócio não trata apenas de negócio
financeiro ou comercial, mas sim toda a atividade humana que tem efeitos
jurídicos.
15
2- TÉCNICAS ESTATÍSTICAS
Em alguma fase de seu trabalho, o pesquisador depara-se com o
problema de analisar e entender um conjunto de dados relevante ao seu particular
objeto de estudos. Ele necessitará trabalhar os dados para transformá-los em
informações, de modo a compará-los com outros resultados, ou ainda para julgar
sua adequação a alguma teoria.
A inferência estatística (...) é a parte da metodologia da Ciência que tem por objetivo a coleta, redução, análise e modelagem dos dados, a partir do que, finalmente, faz-se a inferência para uma população da qual os dados (a amostra) foram obtidos. Um aspecto importante da modelagem dos dados é fazer previsões, a partir das quais se podem tomar decisões (BUSSAB E MORETIN, 2011, p.01).
No início de um estudo estamos interessados na redução, análise e
interpretação dos dados sob consideração, adotando um enfoque que
chamaremos de análise exploratória de dados. Nesta fase devemos obter a maior
quantidade possível de informação, dos dados, a fim de se obter a indicação de
modelos plausíveis a serem utilizados numa fase posterior, a análise confirmatória
de dados (ou inferência estatística).
Tradicionalmente, uma análise descritiva de dados limita-se a calcular algumas medidas de posição e variabilidade, como a média e a variância, por exemplo. Contrária a essa tendência, uma corrente mais moderna, liderada por Tukey (1977), utiliza principalmente técnicas gráficas, em oposição a resumos numéricos. Isso não significa que sumários não devam ser obtidos, mas uma análise exploratória de dados não deve se limitar a calcular tais medidas (BUSSAB E MORETIN, 2011, p.01).
2.1- Tipos de variáveis
De modo geral para cada característica (variável) investigada numa
pesquisa, tem-se associado um ou mais resultados, e são as opções, os tipos de
16
resultados possíveis que vão determinar a classificação das variáveis. Algumas
variáveis apresentam como resultados uma qualidade ou atributo e são por isso
classificadas como do tipo qualitativas enquanto outras vão apresentar resultados
numéricos resultantes de uma contagem ou mensuração, e então são chamadas
de variáveis do tipo quantitativas. A divisão das variáveis em qualitativas e
quantitativas ainda permite uma subdivisão em dois tipos cada, assim teríamos as
variáveis qualitativas nominais e qualitativas ordinais e as variáveis quantitativas
discretas ou quantitativas contínuas, para uma melhor compreensão fazemos a
seguir um resumo dos tipos de variáveis e alguns exemplos.
Variável Qualitativa Nominal
É a variável para a qual não existe nenhuma ordenação nas possíveis
realizações ou resultados.
Exemplos: estado de origem de uma pessoa, sexo da pessoa, estado
civil.
Variável Qualitativa ordinal
É a variável a para a qual existe uma ordem nos seus resultados ou nas
possíveis realizações.
Exemplos: grau de instrução cujos resultados seriam ensino
fundamental, médio e superior e correspondem a uma ordenação baseada no
número de anos de escolaridade completo. Outro exemplo é a variável classe
social que tem como resultados classe alta, média e baixa.
Variável quantitativa discreta
É a variável cujos possíveis valores formam um conjunto finito ou
enumerável de números, e que resultam, freqüentemente, de uma contagem.
Exemplo: número de filhos (0,1,2).
17
Variável quantitativa contínua
É a variável cujos possíveis valores pertencem a um intervalo de
números reais e que resultam de uma mensuração.
Exemplo: peso e estatura de uma pessoa (15,5 Kg ou 1,81m).
È importante esclarecermos que para cada tipo de variável existem
técnicas apropriadas ao resumo das informações, por isso a importância de
identificar-se qual o tipo da variável em estudo. Ainda é oportuno salientar que em
algumas situações podemos adaptar técnicas que são utilizadas em um caso para
outros casos.
Moretin e Bussab observam que em algumas situações podem-se
atribuir valores numéricos as várias qualidades ou atributos (ou ainda, classes) de
uma variável qualitativa e depois proceder-se à análise como se esta fosse
quantitativa, desde que o procedimento seja passível de interpretação (pg. 10).
Segundo Roberto Jarry Richardson na obra Pesquisa Social ao se
definir variáveis deve-se obedecer a três princípios básicos, caso contrário haverá
uma perda de informação essencial ou, pior ainda, à inutilidade completa da
medição (pg. 67). Embora a obra seja mais voltada para as pesquisas no campo
social tais princípios são válidos de maneira geral para a definição de variáveis em
estudo.
Primeiro princípio os valores de uma variável devem ser mutuamente
excludentes, o que significa que uma e só uma categoria da mesma classe (um
valor da mesma variável) pode ser atribuída a cada um dos indivíduos em estudo
caso contrário o mesmo sujeito poderia ser listado duas vezes na distribuição de
freqüências. Imaginemos a variável local de origem com as seguintes classes,
entre outras: Local com menos de 3.000 habitantes e local com menos de 6.000
habitantes. Neste caso um indivíduo que morasse em um local com menos de
3.000 habitantes seria listado em ambas as classes.
18
Segundo princípio o conjunto de valores possíveis deve ser exaustivo, o
que significa que todas as possibilidades empíricas devem ser incluídas no
conjunto, ou seja, todos os elementos da amostra devem ser classificados em
algumas das categorias classificadas. Um exemplo seria a variável religião, no
Brasil, se contivesse as categorias Budista, Mulçumano e Protestante
(adequadamente definidas), mas não contivesse as categorias Católica e Espírita
além de outras.
Terceiro princípio é aquele que se refere à representatividade da
variável. Segundo o autor quando a variável é definida como representante formal
de um conjunto de valores possíveis, determinados por uma regra de medição
comum, já está garantida a validade deste princípio (pg. 68).
2.2 - Distribuição de freqüências
Um dos maiores interesses de um pesquisador quando se estuda uma
variável é conhecer o comportamento dela. Uma das maneiras de conhecer e
analisar, ainda que de forma global, o conjunto de possíveis realizações de uma
variável é através da distribuição de freqüências. Vejamos os exemplos a seguir:
Tabela 1 - Tabela de freqüência do Grau de instrução na empresa AC
Grau de Freqüências Proporção Porcentagem
instrução ni fi 100fi Fundamental 15 0,37 37,50
Médio 20 0,50 50,00 Superior 5 0,12 12,50
Total 40 1,00 100,00 Fonte: Dados hipotéticos
19
Tabela 2 - Tabela de freqüência do Grau de instrução na empresa BD
Grau de Freqüências Proporção Porcentagem
instrução ni fi 100fi Fundamental 20 0,19 19,04
Médio 60 0,57 57,14 Superior 25 0,23 23,81
Total 105 1,00 100,00 Fonte: Dados hipotéticos
Onde,
ni é o número de realizações encontradas em cada classe da variável,
é a freqüência absoluta da categoria.
fi = ni/n é a proporção ou (freqüências relativa) de cada classe, sendo n
o número total de observações.
100fi é a freqüência relativa em porcentagem para cada classe.
As medidas de proporção são muito úteis quando se necessita
comparar resultados de duas pesquisas distintas. No caso em questão como
iríamos fazer para comparar o grau de instrução das duas empresas pelo campo
da freqüência se os totais de empregados são diferentes nos dois casos. Mas nas
colunas de proporção e porcentagem a comparação é possível, pois elas foram
reduzidas a um mesmo total (no caso 1,000 e 100,000).
A distribuição de freqüências é uma técnica facilmente aplicável para
variáveis discretas, mas para variáveis contínuas devemos ter certo cuidado.
Imaginemos a construção de uma tabela de freqüência para variável salário, como
não há classes básicas o que existia no exemplo anterior somos obrigados a
agrupar os dados por faixas de salário.
Ao resumirmos os dados referentes a uma variável contínua, perde-se
alguma informação. No exemplo a seguir, não sabemos quais são os cinco
20
salários da classe de 6.000 a 8.000 Reais a não ser que investiguemos a tabela
original (vide anexo tabela 4). Uma medida geralmente adotada é supor que os
cinco salários daquela classe sejam iguais ao ponto médio da referida classe. È
importante esclarecer que a notação [a,b) utilizada para o intervalo de números
contém o extremo a mas não contém o extremo b.
Tabela 3 - Tabela de Freqüência dos Salários da Empresa Estuda que é Bom
Classe de Freqüências Proporção Porcentagem
Salário. Em Reais ni fi 100fi [0.000, 2.000) 15 0,38 37,50 [2.000, 4.000) 10 0,25 25,00 [4.000, 6.000) 8 0,20 20,00 [6.000, 8.000) 5 0,13 12,50
[8.000, 12.000) 2 0,05 5,00 Total 40 1,00 100
Fonte: Dados Hipotéticos – Anexo Tabela 7
A determinação do número de intervalos ou classes vai depender da
variável estudada e que informação o pesquisador deseja extrair destes dados, é
uma questão teoricamente controvertida e diversos autores apresentam soluções
diferentes, entre elas uma das mais mencionadas é a fórmula de Sturges onde o
número de intervalos é o inteiro mais próximo do algarismo obtido pela expressão
da a seguir:
N= 1 + 3,3322log10(n), sendo n o número de observações, ou o
tamanho da amostra.
A escolha dos intervalos é arbitrária e familiaridade do pesquisador é que lhe indicará quantas e quais classes (intervalos) devem ser usadas. Entretanto, deve-se observar que, com um pequeno número de classes, perde-se informação e com um número grande de classes, o objetivo de resumir dados fica prejudicado. Normalmente, sugere-se o uso de 5 a 15 classes com a mesma amplitude. (BUSSAB E MORETIN, 2011, p.13).
21
2.3 - Métodos gráficos
Podemos começar este item com a pergunta por que utilizar gráficos?
Uma das respostas é que a utilização da representação gráfica da distribuição de
uma variável mostra de forma rápida a variabilidade da mesma.
Segundo Bussab e Moretin na obra Estatística Básica os métodos
gráficos têm encontrado um uso cada vez maior devido ao seu forte apelo visual.
Normalmente, é mais fácil para qualquer pessoa entender a mensagem de um
gráfico do que àquela embutida em tabelas ou sumários numéricos (pg. 3).
Segundo estudos feitos em 1983 por John Chambers os gráficos são
utilizados para diversos fins:
Buscar padrões e relações;
Apresentar resultados de modo rápido e fácil.
Confirmar (ou não) certas expectativas que se tinha sobre os dados;
Confirmar (ou não) suposições feitas sobre os procedimentos
estatísticos usados; e Descobrir novos fenômenos;
Devemos salientar que existem vários tipos de gráficos para
representar as variáveis qualitativas e as quantitativas sendo que as últimas
possuem mais opções e que o mesmo tipo de gráfico pode sofrer variações. Um
bom exemplo é o gráfico de barras que pode ser apresentado como plano ou em
3D, ou ainda na forma vertical ou horizontal. A seguir apresentaremos alguns
exemplos de gráficos para as variáveis qualitativas e quantitativas.
2.3.1 Gráficos para Variáveis qualitativas
Os principais gráficos utilizados para estas variáveis são os gráficos de
setores ou pizza também chamado de queijo quando apresentado em 3D (terceira
dimensão) e os gráficos
formas de figuras também
Gráfico 1
Fonte: Dados H
Gráfico 2
Fonte: Dados H
Os dois gráficos
empresa BD o número d
maior que na empresa AC
instrução fundamental. U
áficos de barras ou retângulos. Estes gráficos
mbém são chamados de pictóricos.
áfico 1 - Grau de instrução na Empresa AC
ados Hipotéticos – Tabela 1
áfico 2 - Grau de instrução na Empresa BD
ados Hipotéticos – Tabela 2
ráficos apresentados permitem uma fácil percepç
ero de pessoas com grau de instrução médio
sa AC, onde temos um maior número de pessoas
tal. Uma das funcionalidades deste gráfico
37,5%
50,0%
12,5%
Grau de instrução na Empresa AC
Fundame
Médio
Superior
19,0%
57,1%
23,8%
Grau de Instrução na Empresa BD
Fundame
Médio
Superior
22
áficos que utilizam
ercepção de que na
médio e superior é
ssoas com grau de
fico é mostrar as
ndamental
perior
ndamental
perior
classes de uma variável
todo.
“pizzausuacírcusetor(BUS
Gráfico 3
Fonte: Dados H
Gráfico 4
Fonte: Dados H
10
150
Peç
as ven
didas
Masculinas
Femininas
Infantis
iável e as suas proporções ou percentagens e
O gráfico de composição em setores, send“pizza” o mais conhecido, destina-se a representarusualmente em porcentagem, de partes de um todocírculo de raio arbitrário, representando o todosetores, que corresponde às partes de maneira(BUSSAB E MORETIN, 2011, p.16).
fico 3 – Peças de roupas vendidas no ano de 20
ados Hipotéticos – Anexo Tabela 4
fico 4 - Peças de roupas vendidas no ano de 201
dos Hipotéticos – Anexo Tabela 5
0
50
100
150
MasculinasFemininas
Infantis
100130
110
Peças de roupas vendidas 2009
0 50 100 150
linas
ninas
fantis
80
110
Peças vend
Peças de roupas vendidas 2010
23
ens em relação ao
sendo em forma de entar a composição, todo. Consiste num todo, dividido em aneira proporcional.
de 2009
e 2010
150
150
vendidas
24
Os dois gráficos de barras apresentados permitem a fácil percepção de
que em 2010 a empresa teve um aumento nas vendas de peças de roupas
femininas, e um decréscimo nas peças masculinas e a venda de roupas infantis
não se alterou em relação ao ano de 2009. Informações que permitem a quem
está gerenciando o negócio identificar uma tendência, e ver se ela é geral, ou se
algum fato ou acontecimento sazonal é responsável por este comportamento nas
vendas. O ideal seria ter mais um ou dois anos de série de dados. Este gráfico
com a informação de peças vendidas por tipo de público já fornece mais
informação do que um gráfico só com as vendas totais, e para isto bastou que ao
planejar o banco de dados se incluísse a variável qualitativa: tipo de público.
2.3.2 Gráficos para Variáveis quantitativas
Para as variáveis quantitativas podemos usar os gráficos aplicados às
variáveis qualitativas e temos ainda outros como o gráfico de ramo e folhas e o
gráfico de dispersão unidimensional, lembrando que quando tratamos de variáveis
quantitativas contínuas necessitamos algumas adaptações, exatamente como no
caso em que estudamos as freqüências.
Gráfico de dispersão unidimensional é um gráfico em que os valores
são representados por pontos ao longo da reta provida de uma escala. Existem
três variações para este gráfico. Em uma os valores plotados no gráfico são
acompanhados por um número que indica as repetições, em outra maneira
fazemos o gráfico empilhando os valores repetidos, um em cima do outro e ainda
há um terceiro modo, onde se apresentaria apenas o ponto mais alto da pilha para
cada informação. A seguir apresentamos as variações do gráfico para os dois
primeiros modos mencionados, utilizamos como fonte de dados o número de
empregados nas empresas de uma cidade imaginária Y (tabela 3 do Anexo).
Gráfico 5 – Núm
Fonte: Dados H
Gráfico 6 – Núm
Fonte: Dados H
O diagrama de
regra fixa para a sua cons
duas partes: a primeira c
vertical enquanto a segu
vertical. O ramo e folhas é
de valores e o seu objetiv
3
0 5
Nº de e
Número de empregados por empresa na cidad
ados Hipotéticos – Anexo Tabela 6
Número de empregados por empresa na cidad
ados Hipotéticos – Anexo Tabela 6
a de ramo e folhas ou a técnica ramo e folhas
construção, mas a idéia básica é dividir cada o
eira chamada de ramo é colocada à esquerda
segunda chamada de folha é colocada à di
lhas é um procedimento alternativo para resumi
objetivo é conseguir uma idéia sobre a forma d
3 5 2 1 1
10 15 20 25 30
Qtde de emprega
º de empregados por empresa na cidade Y
25
cidade Y
cidade Y
olhas não tem uma
ada observação em
erda de uma linha
à direita da linha
esumir um conjunto
rma de distribuição
35
pregados
26
destes valores. Os gráficos de barras e os histogramas também permitem essa
visualização da distribuição. O histograma é uma variação do gráfico de barras,
aplicado a varáveis quantitativas contínuas, que quando agrupadas em classes,
resulta em uma perda de informação. Surge então uma pergunta, por que
construir um ramo e folhas se há outras opções? Porque uma das vantagens do
diagrama de ramo e folhas em relação ao histograma é que não se perde ou
perde-se pouca informação sobre os dados. No gráfico a seguir, apresentamos o
diagrama de ramo e folhas da variável salário, da empresa “Estuda que é bom”.
No ramo estão às unidades de milhar e nas folhas as unidades de centena
referente aos salários.
Gráfico 7 - Diagrama de ramo e folhas sem duplicação dos ramos
0 1 000 000 000 000 000 300 300 300 300 500 500 500 700 700 2 000 000 000 000 500 500 3 000 000 500 900 4 000 000 000 500 500 500 5 000 500 6 000 000 500 500 7 000 8 500 9 10 11 000
Fonte: Dados Hipotéticos – Anexo Tabela 7
Como no caso estudado o diagrama tem muitas folhas utilizaremos a
técnica de dupilcar os ramos, para ver como ficará a distribuição. Utilizamos a
notação (1, 2,...)º, que abrange as centenas de 000 a 499 e a notação (1, 2,...)*,
que abrange as centenas de 500 a 999, para construir o gráfico a seguir .
27
Gráfico 8 - Diagrama de ramo e folhas com duplicação dos ramos
0º 0* 1º 000 000 000 000 000 300 300 300 300 1* 500 500 500 700 700 900 2º 000 000 000 000 2* 500 500 3º 000 000 3* 500 900 4º 000 000 000 4* 500 500 500 5º 000 5* 500 6º 000 000 6* 500 500 7º 000 7* 8º 8* 500 9º 9* 10º 10* 11º 000
Fonte: Dados Hipotéticos – Anexo Tabela 7
Com o diagrama de ramos e folhas podemos ter as mesmas
impressões conseguidas com um gráfico de barras ou de dispersão
unidimensional, mas sem perda de informação sobre os dados. Um ramo que
apresente muitas folhas significa maior incidência de realizações ou observações,
ou ainda uma maior freqüência, um ramo e folha distante dos demais pode
significar um ponto atípico em relação aos demais, também podemos perceber
onde os dados se concentram e ainda ter uma idéia sobre a simetria ou assimetria
dos dados, assunto que também abordaremos mais a frente.
O histograma é um gráfico de barras contíguas, onde as bases são
proporcionais aos intervalos das classes e a área de cada retângulo proporcional à
respectiva freqüência. Po
relativa (fi). Calcula-se fi/∆
classe i ou da i-ésima c
quantidade dos dados
apresentará o retângulo m
histograma seja igual a um
Gráfico 9 – Hist
Fonte: Tabela 3
Gráfico 10 – Gr
Fonte: Tabela 3
0,0%
10,0%
20,0%
30,0%
40,0%
Porcen
tagen
0
5
10
15
Freqüên
cias
Grá
ia. Pode-se usar a freqüência absoluta (ni), ou
se fi/∆i ou ni/∆i, que é chamada densidade de
ima classe. A altura do retângulo será de a
dos em cada classe, assim a classe com
gulo mais alto. Essa convenção permite que a
l a um.
Histograma - variável salário Empresa Estuda
bela 3 – Salários da Empresa Estuda que é Bom
Gráfico de barras segundo as classes da vari
bela 3 – Salários da Empresa Estuda que é Bom
37,5%
25,0%20,0%
12,5%
5%
0 2 4 6 8
Salár
Histograma para Variável Salário
1.000 3.000 5.000 7.000 10.000
15
108
52
Salá
Gráfico de barras para Variável Salário
28
ou a freqüência
e de freqüência da
de acordo com a
com mais dados
que a área total do
studa que é Bom
Bom
a variável salário
om
12
Salários
Salários
29
2.4 - Medidas Resumo
Observamos que o resumo de dados por meio de tábuas de freqüência
e gráficos fornece muitas informações sobre as variáveis em estudo, que não são
encontradas ou não são de fácil visualização nas tabelas de dados originais. Em
algumas situações se faz necessário resumir ainda mais os dados estudados,
buscando-se um ou alguns valores que sejam representativos de toda a série de
dados. Nestes casos costuma-se utilizar as medidas de posição ou localização
central que são a média, a moda e a mediana, em conjunto com as medidas de
dispersão como o desvio médio, a variância, o desvio padrão, amplitude total e o
coeficiente de variação.
2.4.1 - Medidas de posição
Mediana é a medida de tendência central de um conjunto de dados que
se caracteriza por indicar o elemento que ocupa a posição central da série de
observações estudadas, sendo que as mesmas devem estar ordenadas de forma
crescente. Da definição de mediana, segue-se que sua característica principal é
dividir um conjunto ordenado de dados em dois grupos iguais; a metade terá
valores inferiores à mediana, a outra metade terá valores superiores à mediana. A
mediana geralmente é indicada por md.
Em geral, a mediana ocupa a posição (n + 1)/2 onde n representa a
quantidade de valores do conjunto. Uma maneira fácil de obter-se a mediana é
usar a regra abaixo.
Se o número de dados é ímpar, a mediana é o valor que está no centro
da série e corresponde a elemento X na posição (n+1)/2, ou md = X(n+1)/2.
Se o número de dados é par, a mediana é a média dos dois valores
que estão no centro da série e corresponde a média dos elementos de X que
estão nas posições (n)/2 e (n/2)+1, ou md = [X(n+1)/2 + X(n/2)+1]/2. Vejamos os
exemplos a seguir:
30
Exemplo 1 – Variável X : 4,5,6,7,8 onde temos md=X3=6
Exemplo 2 – Variável Y : 2,5,6,7,15 onde temos md=X3=6
Exemplo 3 – Variável W : 4,6,6,7 onde temos md=(X2+X3)/2=(6+6)/2=6
Exemplo 4 – Variável K : 6,6,6,6,6 onde temos md= X3=6.
Exemplo 5 – Variável Z : 4,5,5,6,7,7,8 onde temos md= X3=6
Moda é a medida de tendência central de um conjunto de dados que se
caracteriza por indicar o elemento de maior ocorrência ou de maior probabilidade
da série de dados ou da variável em estudo, ou ainda no dizer de Moretin e
Bussab é a realização mais freqüente do conjunto de valores observados (pg.35
Cap 3). Alertamos que existe a possibilidade de haver mais de uma moda, isto
ocorre quando a distribuição dos valores estudada possui 2(duas), 3(três) ou mais
realizações com a maior e a mesma freqüência, nestes casos a distribuição pode
ser chamada de bimodal ou trimodal etc.. No exemplo 5 variável Z apresentado
acima para mediana, temos uma distribuição bimodal, mas existem também, os
casos em que a distribuição não tem moda, isto ocorre quando todos os valores
têm a mesma freqüência é o caso do exemplo 2 variável Y, apresentado acima.
Média é a medida de tendência central mais utilizada pelas pessoas e o
que talvez alguns desconheçam é que existem formas alternativas de se calcular a
média.
a) Média geométrica (G) de um conjunto de N números x1.x2...xn é a
raiz de ordem N do produto destes números e é dada pela
expressão abaixo:
31
b) Média harmônica (H) de um conjunto de N números x1.x2...xn é a
recíproca da média aritmética das recíprocas dos números e é dada
pela expressão a seguir:
c) Média aritmética de um conjunto de dados é aquela obtida pela
soma das observações divididas pelo número delas, é considerada
como ponto de equilíbrio ou centro de gravidade de uma
distribuição e é dada pela expressão abaixo:
Este é o calculo da média mais conhecido e utilizado pelas pessoas e
apresenta uma variação pouco conhecida e chamada de média aparada que
consiste em calcular a média das observações centrais desprezando-se uma
porcentagem das iniciais e das finais.
A relação entre os 3(três) tipos de cálculo da média, válida para um
conjunto de números positivos, é dada pela expressão tal que a
igualdade é válida só quando x1 = x2 =...= xn.
Considerações sobre o uso das medidas de posição: Para se calcular a
moda de uma variável, precisamos apenas de um processo de contagem ou
simplesmente da distribuição de freqüências, enquanto a mediana requer que as
realizações da variável sejam, pelo menos, ordenadas e a média só pode ser
calculada para variáveis quantitativas. Tais condições tornam o calculo de
medidas de posição bastante limitado para as variáveis qualitativas. No caso das
32
variáveis qualitativas nominais, podemos trabalhar apenas com a moda, enquanto
podemos utilizar moda e mediana para as variáveis ordinais. Outro aspecto
importante de se ressaltar é que a mediana é uma medida mais resistente do que
a média, principalmente com relação às distribuições assimétricas ou que
contenham valores atípicos, nestes casos uma alternativa é usar a média aparada,
que também é resistente. Quando se diz que à mediana é mais resistente que a
média, significa falar que ela é menos influenciada por valores grandes ou
pequenos de mais em relação à maioria dos dados, mas que afetam a média, no
caso do exemplo 2 variável Y: 4,5,6,7,18 com Md=6, Média=8 e que não possui
moda notamos que o valor 18 puxou a média para cima.
2.4.2 Medidas de dispersão
As medidas de dispersão visam à mensuração da variabilidade do
conjunto de observações estudado ou da variável estudada. Estas medidas são
usadas junto com as medidas de posição que embora representem os dados de
forma resumida são incapazes de mostrar a variabilidade dos mesmos. As
medidas de dispersão foram criadas pela necessidade de resumir a variabilidade
do conjunto de observações, de modo tal que permita a comparação de conjuntos
diferentes de valores para a mesma variável em momentos ou períodos distintos
ou segundo algum outro critério relevante do estudo.
Segundo apostila de estatística básica da USP medidas de dispersão
são índices que indicam o grau de concentração ou dispersão de uma distribuição
em torno da média (Módulo1, p.12).
Desvio Médio é obtido pela soma dos desvios, em módulo, das
observações em relação à média, dividida pelo número de observações e é dado
pela expressão:
33
Variância é obtida pela soma dos quadrados das observações em
relação à média, dividida pelo número de observações e é dado pela expressão:
Desvio Padrão é definido como a raiz quadrada positiva da variância,
isto porque o fato da variância ser uma medida expressa pelo quadrado da
dimensão dos dados em estudo o que traz algum tipo de confusão na
interpretação dos dados, por isso costuma-se usar o desvio padrão que e é dado
pela seguinte expressão:
Amplitude total é a medida de dispersão obtida pela diferença entre a
maior e a menor das observações. É vista como o intervalo total de uma série e
obtida pela diferença entre o maior e o menor valor da série.
Amplitude total = maior Xi – menor Xi.
Coeficiente de variação é a medida de dispersão obtida pela razão
entre o desvio padrão e a média, multiplicando-se este resultado por 100%.
As medidas de amplitude total e coeficiente de variação, calculadas
para a média possuem variações para o cálculo em relação à mediana, conforme
as expressões a seguir:
Distancia entre quantis, chamada de DEQ = Q3 – Q1.
Coeficiente de variação quantílica
34
Vimos que a mediana é um valor que deixa metade dos dados abaixo dela e metade acima. De modo geral, podemos definir uma medida, chamada quantil de ordem p ou p-quantil, indicada por q(p), onde p é uma proporção qualquer, 0<p<1, tal que 100p% das observações sejam menores do que q(p). (BUSSAB E MORETIN, 2011, p.41).
Estas medidas calculadas com relação à mediana são alternativas para
contornar a influência que a média e o desvio padrão sofrem por conta de valores
extremos e também para se ter idéia da simetria ou da assimetria dos dados. Para
melhor compreensão dos quantis indicamos abaixo alguns:
q(0,25)= q1: 1º Quartil = 25º Percentil
q(0,50)= q2: Mediana = 2º Quartil = 50º Percentil
q(0,75)= q3: 3º Quartil = 75º Percentil
q(0,40)=: 4º Decil
Existe um método chamado de esquema dos cinco números, utilizado
para se verificar a assimetria ou a simetria dos dados, que utiliza as medidas dos
quantis. Os cinco números são a Md, q1, q3, x1 e x n onde x1 e x n são os valores
extremos da distribuição de dados. O esquema de cinco números dá origem a um
gráfico ou diagrama chamado Box-plot (ver figura 3 em anexos). Estes estudos
foram desenvolvidos por Hoaglin, Mosteller and Tukey (1983).
Todas as medidas apresentadas permitem a comparação entre
variáveis diferentes e entre amostras da mesma variável. Assim podemos
comparar o desempenho de duas ações para ver qual tem melhor média ou
mediana de retorno, ver qual tem maior variação e proceder à escolha do
investimento ou aplicação a ser feito no caso da gestão empresarial. Pode ser
traçada uma estratégia empresarial em que se concentre a produção da empresa
na classe que tem maior moda, ou freqüência de compra. Assim estas medidas
quando devidamente aplicadas trazem informações importantíssimas para a
35
tomada de decisão nos negócios. Na parte do anexo, tabela 8 – cálculo das
medidas resumo, temos o cálculo de algumas destas medidas para as cinco
variáveis X,Y,W,K e Z apresentadas acima.
Cabe-nos ainda esclarecer que existem adaptações de algumas das
medidas resumo, para dados agrupados (são aqueles que são divididos em
intervalos), como exemplo temos uma fórmula para calcular a mediana e outra
para calcular a moda de dados agrupados.
2.4.3 - Medidas de assimetria e Curtose
Da relação ou comparação entre a média, moda e mediana podemos
ter idéia acerca da simetria ou assimetria da distribuição de uma variável,
lembrando que como o próprio nome sugere o valor da mediana deve estar em
algum ponto entre o valor da média e o valor da moda, desta forma temos as
seguintes situações apresentadas a seguir:
Se < Md < Mo teremos uma distribuição assimétrica à esquerda.
Se = Md = Mo teremos uma distribuição simétrica.
Se > Md > Mo teremos uma distribuição assimétrica à direita.
Figura 1 – Tipos de distribuição segundo a assimetria
36
Outro meio de se ter idéia se a distribuição de uma variável é simétrica
ou assimétrica é através de gráficos como o de barras, o ramo e folhas e o
histograma, apresentados para variável salário, que apresenta no caso estudado
distribuição assimétrica à direita. Do ponto de vista prático o gerente sabe que à
medida que o salário aumenta menor é a concentração de pessoas.
Uma das medidas utilizadas para se calcular a assimetria de um
conjunto de dados, é o coeficiente de assimetria de Pearson dado pela seguinte
expressão:
Curtose
Quando a distribuição apresentar uma curva de freqüência mais
fechada, ou mais aguda em sua parte superior, que a normal recebe o nome de
leptocúrtica, caso a curva de freqüência seja mais aberta, ou mais achatada na
sua parte superior é chamada de platicútica. A normal que é nossa base
referencial recebe o nome de mesocúrtica.
Denominamos curtose o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada curva normal (curva correspondente a uma distribuição teórica de probabilidade). (CRESPO, 2010, p.119).
Figura 2 – Tipos de distribuição segundo a curtose
37
A medida utilizada para se calcular a curtose de um conjunto de dados
é o coeficiente percentílico de curtose dado pela expressão a seguir:
O valor obtido deve ser comparado com o valor para a curva normal
que é de 0,263, assim temos:
C = 0,263 => curva mesocúrtica
C < 0,263 => curva leptocúrtica
C > 0,263 => curva platicúrtica
2.5 Análise Bidimensional
Até o momento estudamos como resumir e organizar informações
referentes a uma variável, mas freqüentemente estamos interessados em analisar
o comportamento conjunto de duas ou mais variáveis aleatórias. Nestes casos os
dados aparecem na forma de uma matriz, onde geralmente, as linhas indicam os
elementos ou indivíduos e as colunas mostram as variáveis.
O principal objetivo das análises nessa situação é explorar as relações (similaridades) entre as colunas, ou algumas vezes entre as linhas. Como no caso de apenas uma variável que estudamos, a distribuição conjunta das freqüências será um instrumento poderoso para a compreensão do comportamento dos dados. (BUSSAB E MORETIN, 2011, p.68).
Como vemos, no entender, de Moretin e Bussab a principal análise na
situação de estudarmos mais de uma variável é identificar se há relação entre elas
e qual é essa relação; mas também podem-se investigar relações entre as linhas
que representam os elementos.
38
Para o caso de um estudo com duas variáveis podemos ter três
combinações possíveis envolvendo o tipo das variáveis quanto ao fato de serem
qualitativas ou quantitativas e para cada caso teremos técnicas de análise
diferentes. Apresentamos a seguir as três situações possíveis:
a) as duas variáveis são qualitativas;
b) as duas variáveis são quantitativas; e
c) uma variável é qualitativa e a outra é quantitativa.
Quando temos duas variáveis qualitativas resumem-se os dados em
tabelas de dupla entrada, também chamadas de tabelas de contingência, onde
aparecerão as freqüências absolutas ou as contagens dos elementos que
pertencem simultaneamente a categorias de uma e outra variável. Quando temos
uma variável quantitativa e outra qualitativa, usualmente analisa-se o que
acontece com a variável quantitativa quando os dados são categorizados de
acordo com os diversos atributos da variável qualitativa e finalmente se as duas
variáveis são quantitativas, as observações provêm de mensurações, então são
apropriadas, técnicas como gráficos de dispersão ou de quantis. Quando temos
duas variáveis quantitativas agrupadas em classes acabamos por retornar ao caso
de uma tabela de dupla entrada.
Associação entre variáveis qualitativas
Conhecer o grau de dependência entre as variáveis estudadas é um
dos principais objetivos quando construímos uma distribuição conjunta (tabelas de
contingência) das mesmas, descrever a associação entre elas e poder prever o
melhor resultado de uma ao conhecer-se a realização da outra, é o que se busca.
Um bom exemplo é o caso da variável salário (dividida em classes) associada a
variável classe social, é esperado encontrar-se uma relação positiva entre as
variáveis, pois se o salário aumenta a classe social deve ser maior e vice versa.
39
De um modo geral, a quantificação do grau de associação entre duas variáveis é feita pelos chamados coeficientes de associação ou correlação. Essas são medidas que descrevem, por meio de um único número, a associação (ou dependência) entre duas variáveis. Para maior facilidade de compreensão, esse coeficientes usualmente variam entre 0 e 1, ou entre -1 e +1 e a proximidade de zero indica falta de associação. (BUSSAB E MORETIN, 2011, p76).
Entre as medidas utilizadas para verificar a associação entre variáveis
qualitativas estão:
Coeficiente de Contingência de Pearson
Como o coeficiente de Pearson não varia entre 0 e 1 , e o valor máximo
de C depende do número de linhas e colunas ( chamadas de r e s) define-se um
outro coeficiente que varia entre 0 e 1 e atinge o máximo igual a 1 quando r = s
dado pela expressão abaixo:
Percebemos que ambas as medidas se baseiam na estatística ou no
cálculo do Qui-Quadrado de Pearson dada pela expressão:
Calcula-se [(oi – ei)2 / ei] para cada casela da tabela de distribuição
conjunta das variáveis estudadas e somam-se estes valores obtendo-se uma
medida de afastamento global dada pela expressão acima. Esta medida é
chamada de Qui-Quadrado observado e é muito utilizada para os testes de
hipóteses sobre independência e aderência de variáveis, onde comparamos o
40
valor observado com o valor tabelado encontrado em uma tabela de distribuição
de probabilidades da variável Qui-Quadrado.
Associação entre variáveis quantitativas
Quando as variáveis envolvidas são quantitativas podemos utilizar as
análises já estudadas para as variáveis qualitativas além de outros procedimentos
analíticos e gráficos mais refinados, sendo que em nosso estudo falaremos do
gráfico de dispersão e do coeficiente de correlação.
Gráficos de dispersão
Este tipo de gráfico já foi analisado para uma única variável no capítulo
de gráficos, mas agora devemos observá-lo com relação a duas variáveis. A
representação gráfica ajuda muito a compreender o comportamento conjunto das
duas variáveis em estudo e quanto à existência ou não de associação. Vejamos o
exemplo a seguir, onde cruzamos as variáveis: anos de serviço com número de
clientes.
Gráfico 10 – Gráfico de barras segundo as classes da variável salário
Fonte: Dados Hipotéticos - AnexoTabela 9
0
20
40
60
80
0 2 4 6 8 10 12
Núm
ero
de c
lient
es
Anos de Serviço
Gráfico de dispersão
41
Neste caso o gráfico parece indicar uma associação entre as variáveis
estudadas uma vez que o número de clientes cresce à medida que aumentam os
anos de serviço.
Um primeiro ponto a se ressaltar é que as relações podem ser lineares
ou não lineares. Nós abordaremos apenas a situação de linearidade para qual
define-se uma medida que avalia o quanto a nuvem de pontos do gráfico de
dispersão aproxima-se de uma reta, e o grau de associação entre as duas
variáveis, esta medida é o coeficiente de correlação linear.
Coeficiente de correlação linear
Esta medida varia num intervalo finito de -1 a +1, indicando se a relação
é linear direta (positiva), se é uma relação linear inversa (negativa) ou ainda em
caso de valores próximos a zero indica não haver uma relação linear entre as
variáveis. A fórmula de correlação apresentada está em função da covariância
cuja expressão encontra-se a seguir:
Associação entre variáveis qualitativas e quantitativas
Como já mencionado anteriormente neste caso, usualmente analisa-se
o que acontece com a variável quantitativa quando os dados são categorizados de
acordo com os diversos atributos da variável qualitativa e podemos utilizar as
medidas-resumo, ramo e folhas, histogramas etc... Como nas situações anteriores
seria conveniente contar com uma medida que quantificasse a associação ou o
grau de dependência entre as variáveis. Primeiro calcula-se a variância dos dados
42
da variável quantitativa, sem levar em consideração as categorias da qualitativa,
obtendo-se o que vamos chamar de dispersão global dos dados. Depois
calculamos a variância dentro de cada categoria da qualitativa e se essas
variâncias forem menores do que a global, podemos dizer que a variável
qualitativa melhora o entendimento ou a capacidade de previsão da quantitativa,
portanto existe uma relação entre as duas variáveis. Uma medida-resumo da
variância entre as categorias da variável qualitativa pode ser calculada pela média
das variâncias ponderada pelo número de observações em cada categoria e é
dada pela expressão abaixo onde k é o número de categorias e vari(S) é a
variância de S dentro da categoria i, i=1,2,...,k.
Bussab e Moretin na obra Estatística Básica propõem uma medida que
nos fornece o ganho relativo na variância, obtido com a introdução da variável
qualitativa e dada pela seguinte expressão abaixo.
O símbolo R2 é usual nas técnicas de analise da variância e regressão,
assuntos que não serão abordados por nós, e varia entre 0 e 1. A medida R2 nos
dirá o quanto da variação total da variável quantitativa é explicado pela variável
quantitativa.
2.6 - Exemplos do uso de medidas centrais e de
dispersão na área de finanças.
Teoria do portfólio
O artigo de Harry Markowitz de 1952, Portfolio Selection fundou a teoria
da seleção de carteira, tendo sido um dos precursores da teoria moderna de
finanças. Pela primeira vez os conceitos de risco e retorno são apresentados de
43
forma precisa. A descrição do retorno e risco através de indicadores de média e
variância atualmente tão usada por profissionais de finanças, não era tão óbvia
naqueles dias. Esta façanha de Markowitz tornou possível a utilização da
poderosa álgebra de matemática estatística nos estudos de seleção de carteiras.
O desvio padrão e a variancia medem a variabilidade
do retorno de um título isolado. Dizemos que o desvio-padrão e a
variância são medidas apropriadas do risco de um título quando a
carteira de um investidor contém apenas esse título. Em sua maior
parte, os investidores possuem carteiras, e em consequência disso
a variância (ou desvio-padrão) não é uma boa medida do risco de
um título isolado. O beta é uma medida mais apropriada. (Ross, A.
Stephen ,1995, Atlas,Administração Financeira, páginas 198).
O modelo CAPM
Em 1964, William Sharpe desenvolve um modelo imaginando um
mundo onde todos os investidores utilizam a teoria da seleção de carteiras de
Markowitz e através dele tomam decisões usando a avaliação das médias e
variâncias dos ativos. Sharpe supõe que os investidores compartilham dos
mesmos retornos esperados, variâncias e covariâncias. Mas ele não assume que
os investidores tenham, todos, o mesmo grau de aversão ao risco. Eles podem
reduzir o grau de exposição ao risco tomando parcelas maiores de ativos de
menor risco, ou construindo carteiras combinando muitos ativos de risco.
2.7 - População e amostra
Ao conjunto de entes portadores, de pelo menos, uma característica comum denominamos população estatística, ou universo estatístico. (CRESPO. 2010, p.10).
Uma amostra é um subconjunto finito de uma população. (CRESPO. 2010, p.11).
44
Muitas vezes, devido à impossibilidade ou a inviabilidade econômica ou
temporal, limitam-se as observações referentes a uma determinada pesquisa a
apenas uma parte da população. A essa parte proveniente da população em
estudo chamamos amostra. Para as inferências serem corretas, é necessário
garantir que a amostra seja representativa da população, ou seja, a amostra deve
possuir as mesmas características básicas da população, com relação ao
fenômeno a ser pesquisado.
Técnicas de amostragem
É necessário que a amostra ou as amostras que vão ser utilizadas
sejam obtidas por processos adequados chamados de amostragem ou técnicas de
amostragem. Essas técnicas permitem, tanto quanto possível que as amostras
sejam recolhidas ao acaso e que cada elemento da população tenha a mesma
chance de ser escolhido, o que garante a representatividade das amostras.
2.7.1 - Tipos de amostragem
Amostragem casual ou aleatória simples pode ser realizada
numerando-se a população de 1 a n e sorteando-se, a seguir por meio de um
dispositivo Aleatório qualquer os k elementos que vão compor a amostra. Para
amostras com um número elevado de elementos usa-se uma tábua de números
aleatórios.
Amostragem proporcional estratificada se realiza quando a população
se divide em subpopulações também chamadas estratos. Neste caso além de
considerarmos a existência dos estratos, obtemos os elementos da amostra de
forma proporcional ao número de elementos de cada estrato. Uma pesquisa onde
existam dois estratos (em função do sexo): masculino e feminino é um exemplo.
45
Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. (CRESPO. 2010, p.12).
Amostragem sistemática – Segundo Crespo na obra Estatística Fácil
este tipo de amostragem ocorre quando os elementos da população já se acham
ordenados, não há necessidade de construir o sistema de referência. São
exemplos os prédios de uma rua, as linhas de produção etc. Nestes casos, a
seleção dos elementos que constituirão a amostra pode ser feita por um sistema
imposto pelo pesquisador (pg. 14).
2.8 - Probabilidade
O estudo das probabilidades e o estudo de conjuntos são muito úteis
para as pesquisas estatísticas e os métodos quantitativos, por isso alguns dos
conceitos, das propriedades e técnicas usadas nas duas áreas serão abordados
neste trabalho.
Espaço Amostral, segundo Meyer na obra Probabilidade Aplicações a
Estatística é o conjunto de todos os resultados possíveis do experimento
considerado e é representado pela letra S (pg.11). Um exemplo é o lançamento de
um dado: S=1,2,3,4,5,6.
Evento é simplesmente um conjunto de resultados possíveis; é um
subconjunto do espaço amostral S. Obter um número impar como resultado do
lançamento de um dado: A=1,3,5, é um exemplo.
A probabilidade de um evento A é definida como um número real (tal
que, 0 ≤ P(A)≤ 1 ) igual ao resultado da divisão do número de elementos de A
[n(A)] pelo número de elementos de S [n(S)] e é dada pela expressão
P(A)=n(A)/n(S). Outra definição muito utilizada é a de que P(A) é igual ao número
46
de casos favoráveis dividido pelo número de casos possíveis assim para o
exemplo no qual queríamos obter um número ímpar como resultado do
lançamento de um dado a probabilidade seria P(A) = 3/6 ou P(A)= 50%.
Conjuntos união, interseção, complementar e vazio
Ainda segundo Meyer na obra já citada, nas páginas 5, 6 e 7, da teoria
de conjuntos e supondo A e B dois conjuntos definem-se:
O conjunto C - união de A e B (algumas vezes denominado a soma de
A e B) como sendo C=x / x Є A ou x Є B (ou ambos). Desse modo, C será
formado de todos os elementos que estejam em A, ou em B, ou em ambos e
representaremos ou escreveremos a união de A e B, como: C = A U B.
O conjunto D - interseção de A e B (algumas vezes denominada o
produto de A e B) como sendo D=x / x Є A e x Є B. Portanto D será formado de
todos os elementos que estão e m A e B, e representaremos ou escreveremos a
interseção de A e B, como: D = A ∩ B.
O complemento do conjunto A é denotado por Ā e é constituído por
todos os elementos que não estejam em A, mas que façam parte do conjunto
fundamental U (universo – conjunto total). Isto é
Conjunto vazio ou nulo é o conjunto que não contém qualquer elemento
e geralmente é representado pelo símbolo Ø.
Uma vez revisados estes conceitos de conjuntos podemos seguir com o
estudo de outras propriedades e definições sobre o cálculo das probabilidades.
Eventos mutuamente excludentes
Dois eventos, A e B, são denominados mutuamente excludentes, se eles não puderem ocorrer juntos. Exprimiremos isso escrevendo A ∩ B = Ø, isto é, a interseção de A e B é o conjunto vazio. (Meyer, 2ª edição, p.7).
47
Para o exemplo do lançamento de dados, se tivermos os eventos
A=tirar números pares e B=tirar números ímpares, eles serão mutuamente
excludentes, pois A ∩ B Ø.
O teorema da adição para o cálculo de probabilidades é dado por:
P(A U B) = P(A) + P(B) – P(A ∩ B)
Logo no caso de eventos mutuamente excludentes onde A ∩ B = Ø, a
P(A ∩ B)=0, pois não temos casos favoráveis e o teorema se resume a:
P(A U B) = P(A) + P(B)
Eventos complementares
Pela definição do que seria um conjunto complementar, o evento
complementar de A, dado pelo símbolo Ā, será formado por todos os resultados
pertencentes ao espaço amostral S e não pertencente ao evento A, logo vem que:
P(Ā)= 1 – P(A)
Esta expressão ou este entendimento é muito útil e importante, pois
sabemos ser possível avaliar ou calcular P(A) em função do P(Ā), isto porque em
muitas situações é mais fácil calcular P(Ā) do que achar P(A).
Eventos independentes
Dois eventos A e B serão independentes se o conhecimento da
ocorrência de A de nenhum modo influenciar a probabilidade da ocorrência de B,
ou de forma equivalente se verificarmos que as probabilidades absolutas serão
iguais às probabilidades condicionadas. Assim por definição A e B serão eventos
independentes se, e somente se, P(A ∩ B)= P(A).P(B).
48
2.9 - Variáveis aleatórias e modelos probabilísticos
O conhecimento sobre conjuntos, espaços amostrais e probabilidades
bem como algumas de suas propriedades nos levam saber da existência e da
necessidade de modelos probabilísticos que representem todos ou quase todos os
tipos de variáveis. A construção de modelos bem como e a inferência sobres seus
parâmetros é uma das áreas da estatística que ajuda em muito as demais
ciências. Para melhor compreensão vejamos alguns conceitos, definições e
exemplos.
Segundo Stevenson na obra Estatística Aplicada a Administração uma variável aleatória (v.a.) é uma função com valores numéricos, cujo valor é determinado por fatores de chance. (p.97).
Uma variável aleatória é considerada discreta se toma valores que podem ser contados. Exemplos: número de acidentes numa semana, número de defeitos em sapatos, número de terremotos, número de jogos empatados, número de livros em uma estante.
Uma variável aleatória é considerada contínua quando pode tomar qualquer valor de determinado intervalo. Uma variável aleatória contínua tem um número infinito de valores possíveis, são exemplos típicos: pesos de caixas de laranja, alturas de pinheiros, duração de uma conversa telefônica, o tempo necessário para completar um ensaio. (Stevenson,p.98)
A distinção entre variáveis discretas e contínuas é importante porque a
utilização de diferentes modelos (distribuições) de probabilidade depende do tipo
de variável aleatória considerada.
O valor esperado de um experimento é uma média, e pode ser
calculado como:
Onde x1...xn são os valores de uma v.a. e pi são as probabilidades
correspondentes, sendo E(X) o valor esperado, a esperança ou a média de X.
49
O desvio padrão é definido como a raiz quadrada positiva da variância,
e esta pode ser obtida pela expresão abaixo:
Uma distribuição de probabilidades é uma distribuição de freqüências
relativas para os resultados de um espaço amostral; mostra a proporção das
vezes em que v.a. tende a assumir cada um dos diversos valores.
A função de distribuição acumulada (f.d.a.) para uma variável aleatória
X é chamada, por alguns, apenas de função distribuição (f.d) e é denotada por
F(X), tal que F(X) = P (X≤ x).
2.9.1 - Modelos probabilísticos para variáveis Aleatórias
Discretas
Algumas variáveis aleatórias adaptam-se muito bem a uma série
problemas práticos. Portanto, o conhecimento dessas variáveis é de grande
importância para a construção de modelos probabilísticos para situações reais e a
conseqüente estimação de seus parâmetros. Para algumas dessas distribuições
existem tabelas que facilitam o cálculo de probabilidades, em função de seus
parâmetros, geralmente a média, o desvio padrão e o total de elementos(n).
Distribuição Uniforme discreta
Este é o caso mais simples de v.a. discreta, em que cada valor possível
possui a mesma probabilidade de ocorrer. Um exemplo seria a v.a. X assumindo o
número de pontos marcados na face superior de um dado.
50
Distribuição de Bernouli
Ocorre em experimentos cujos resultados possuem ou não uma
determinada característica, podemos então dizer que os resultados assumem
duas possibilidades chamadas sucesso (possui a característica) ou fracasso (não
possui a característica). Define-se desta forma a v.a. X que assume dois valores
apenas: 1, se ocorrer sucesso, e 0, se ocorrer fracasso. Exemplos: Uma peça é
escolhida ao acaso de um lote com 400 peças e queremos saber se ela é
defeituosa ou não; Uma pessoa é escolhida ao acaso dentre 100 é do sexo
feminino ou não; o lançamento de uma moeda, o lançamento de um dado dando
como resultado 6.
Distribuição Binomial
Quando obtemos uma amostra de tamanho n de uma distribuição de
Bernoulli (equivalente a repetimos n vezes um ensaio de Bernoulli), e supondo que
as repetições sejam independentes, isto é o resultado de um ensaio não influencia
no resultado de qualquer outro ensaio, teremos uma amostra constituída de uma
seqüência de sucessos e fracassos. Os mesmos exemplos utilizados para a
variável de Bernoulli se aplicam para a Binomial desde que ocorra repetição.
Como exemplo podemos retirar 6 peças de um lote com 400, e querer obter qual
a probabilidade de que 4 peças sejam defeituosas.
Definimos como experimento binomial ao experimento que consiste em
n ensaios de Bernoulli; cujos ensaios são independentes; e para o qual a
probabilidade de sucesso em cada ensaio é sempre igual a p, 0<p<1 e q=1-p. P(x)
é dado pela expressão a seguir, tal que E(X) = np e Var(X)= npq.
51
Distribuição Hipergeométrica
Essa distribuição é adequada quando consideramos extrações casuais
feitas sem reposição de uma população dividida segundo dois atributos. Para
casos de N grande esta distribuição aproxima-se da distribuição binomial.
Distribuição de Poison
Segundo Bussab, na obra Estatística Básica, esta distribuição é
largamente empregada quando se deseja contar o número de eventos de certo
tipo que ocorrem num intervalo de tempo, ou superfície ou volume. Número de
chamadas recebidas por um telefone em 5 minutos; número de falhas de um
computador num dia de operação; e a desintegração de substâncias radioativas
(emissão de partículas alfa em 7,5 segundos) são exemplos para esta variável.
(p.149).
2.9.2 - Modelos probabilísticos para variáveis Aleatórias
Contínuas
Vale lembrar que para estas variáveis também se calculam E(X) e
Var(X), utilizando-se as devidas modificações, cálculos e adaptações em função
da variável ser contínua. Relacionamos a seguir alguns dos modelos e a sua
utilização.
Modelo Normal
É um modelo fundamental em probabilidades e inferência estatística,
suas origens remontam a Gauss em seus trabalhos sobre erros de observações
astronômicas, por volta de 1810, donde o nome de distribuição gaussiana para tal
modelo.
Existe uma relação que permite transformar qualquer curva normal em
uma curva normal com distribuição padrão ou reduzida N(0,1) (média zero e
variância=1). Este dispositivo é muito importante porque uma vez tendo um
52
modelo normal qualquer é só transformá-lo para normal reduzida e consultarmos a
tabela da normal reduzida. Seja uma normal qualquer X ~ N(µ,σ2), então um valor
específico da v.a. X tem o seu correspondente na normal reduzida como sendo
Z=(X-µ)/σ.
Outro recurso importante é a aproximação que pode ser feita do modelo
discreto Binomial para o Modelo contínuo Normal.
Modelo Exponencial
Este modelo tem aplicações em confiabilidade de sistemas. Um bom
exemplo é o tempo de vida, em horas, de um transistor.
Distribuição ou Modelo Gama
È uma extensão do modelo exponencial, ocorre quando a v.a. assume
valores positivos, é utilizado em muitas áreas da matemática.
Distribuição ou Modelo Qui-Quadrado
É um caso especial do modelo Gama, e tem muitas aplicações em
estatística entre estas temos os testes de independência entre duas variáveis e o
teste de aderência (vide 2.4.4). Como no caso da normal, existem tabelas para
obter as probabilidades.
Distribuição ou Modelo t de Student
Esta distribuição é importante no que se refere à inferência sobre
médias populacionais e é dada por uma v.a definida pelo quociente entre uma
variável Normal N(0,1) e uma variável qui-quadrado. Esta variável também é muito
utilizada na prática e existem tabelas fornecendo as probabilidades relativas a ela.
O nome Student vem do pseudônimo usado pelo estatístico inglês W. S. Gosset
que introduziu essa distribuição no início do século passado. Quando parâmetro v,
que determina os graus de liberdade, é grande esta distribuição aproxima-se
bastante da de uma Normal N(0,1).
53
Distribuição ou Modelo F de Snedecor
Esta distribuição é dada por uma v.a. definida como o quociente de
duas variáveis com distribuição qui-quadrado.
Nos anexos apresentamos dois quadros com as distribuições, os
parâmetros e as expressões E(x) e Var(x) para os modelos discretos (quadro 1) e
contínuos (quadro 2) apresentados acima.
2.9.3 - Exemplos do uso de modelos probabilísticos na
área de finanças.
Uma das aplicações onde mais são utilizados estes modelos,
principalmente o normal e o t de Student, é a construção de intervalos de
confiança, para os índices de variação de investimentos e ações. Qualquer
variável econômica que possa ter sua função de distribuição acumulada (f.d.a.)
aproximada para um modelo conhecido pode ser facilmente estudada e analisada
através das tabelas existentes.
A distribuição de Qui-Quadrado é utilizada em testes de independência
entre variáveis ou de adequação de dados a uma determinada distribuição. Um
exemplo de aplicação foi visto no capítulo 2.5 Análise Bidimensional.
54
CONCLUSÃO
Começamos nosso trabalho apresentando os tipos de variáveis
existentes e quais os resultados a elas associados, pois isto facilita na escolha das
ferramentas e na interpretação dos dados obtidos. Ao longo deste trabalho ainda,
abordamos e estudamos varias técnicas estatísticas e métodos quantitativos
capazes de representar conjuntos de dados, através de uma medida central e de
uma medida de dispersão. Avançando-se um pouco mais conseguimos determinar
probabilidades ou ajustar os dados a um determinado modelo probabilístico
conhecido o que permite obter facilmente, através de tabelas, as probabilidades
associadas ao fenômeno ou a construir intervalos de confiança, onde é possível
mensurar o nível de erro ou o grau de confiança nos mesmos.
Questões básicas como determinar o tipo de variáveis são importantes
na hora de se planejar e construir um banco de dados que forneça em tempo ágil
a informação necessária para a tomada de decisões e ou avaliação de
performance. A escolha de índices e ou a construção de medidas na área
financeira, mostra a utilidade de várias medidas estatísticas em suas construções.
A simples construção de tabelas de freqüência e a escolha correta de gráficos
tornam a visualização e compreensão das informações contidas em um conjunto
de dados, muito mais fáceis, pois os comportamentos e tendências das variáveis
envolvidas são percebidos de maneira mais clara, permitindo-se avaliações e
decisões gerenciais. Muitas vezes não temos muita informação sobre uma variável
desejada, mas conhecemos sua relação com outra variável da qual temos
informações, então avaliamos uma em função da outra. Podemos assim concluir
de forma favorável pela grande contribuição dos métodos quantitativos e das
técnicas estatísticas e sua importância não só na área de finanças como em todos
os ramos da ciência.
55
BIBLIOGRAFIA CITADA
Chambers, John, William Cleveland, Beat Kleiner, and Paul Tukey. Graphical Methods for Data Analysis. Wadsworth,1983.
Crespo, Antônio Arnot. Estatística Fácil. 19ª edição Atualizada. São Paulo: Saraiva,2009
Meyer, Paul L. Probabilidade: Aplicações a Estatística. 2ª Edição. Rio de Janeiro: Livros técnico e científicos Editora,1983.
Moretin,Pedro Alberto; Bussab, Wilton de Oliveira. Estatística Básica. 7ª Edição. São Paulo: Saraiva ,2011
Richardson, Roberto Jarry. Colaboradores. Pesquisa Social: Métodos e Técnicas. São Paulo: Editora Atlas, 1985
Ross, Stephen A., Westerfield, Randolph W., Jaffe, Jeffrey F. Administração Financeira. 3ª edição. São Paulo: Editora Atlas, 1995.
Stevenson, William J. Estatística Aplicada a Administração. Editora Harbra,1981.
BIBLIOGRAFIA CONSULTADA
Drucker, Peter Ferdinand. O essencial de Drucker. Edição Junho 2008, Actual Editora. Lisboa, 2001. 77-91
Freitas, Dra. Corina, Costa; Rennó, MSc Camilo Daleles; MSc. Júnior, Manoel Araújo Souza. Estatística Curso 1- INPE. São José dos Campos. Março de 2003.
Markowitz, Harry Max. Artigo Porfólio Selection. Journal of Finance. Estados Unidos da América. Março de 1952.
Sharpe, William F. "Capital Asset Prices: A Theory of Market Equilibrium Under Conditions of Risk." The Journal of Finance (New York) Vol XIX, 3 (September 1964): 425-442.
Morettin, Luiz Gonzaga. Estatística Básica: Probabilidade e Inferência. 7ª edição. São Paulo: Editora Pearson Education, 1999.
Torezani, Walquiria. Apostila de estatística 1. Faculdade UNIVILA –Curso de Administração. Vila Velha, 2004.
56
WEBGRAFIA
ENCE Escola Nacional de Ciências Estatísticas. < URL: www.ence.ibge.gov.br/ web/ence/as-aplicacoes-da-estatistica > data de acesso: 05/01/2013.
USP Universidade de São Paulo. < www.usp.br/fau/cursos /graduacao/arq.../Apostila_Provisoria.pdf> data de acesso:15/01/2013.
57
Anexos
Tabelas
Tabela 4- Peças de roupas vendidas em 2009
Tipo Vendas %
Masculinas 100 29,4% Femininas 130 38,2%
Infantis 110 32,4% Total 340 1
Fonte: Dados Hipotéticos
Tabela 5 - Peças de roupas vendidas em 2010
Tipo Vendas % Masculinas 80 23,5% Femininas 150 44,1%
Infantis 110 32,4% Total 340 1
Fonte: Dados Hipotéticos
Tabela 6 - Número de empregados por empresa na cidade Y
Número Empregados Quantidade de Empresas 5 3
10 3 15 5 20 2 25 1 30 1
Fonte: Dados Hipotéticos
58
Tabela 7 - Salários da Empresa Estuda que é Bom
Salário Ocorrências 1000 5 1300 4 1500 3 1700 2 1900 1 2000 4 2500 2 3000 2 3500 1 3900 1 4000 3 4500 3 5000 1 5500 1 6000 2 6500 2 7000 1 8500 1
11000 1 Fonte: Dados Hipotéticos
59
Tabela 8 - Cálculo das medidas resumo
Nº de observações (i) Var X Var Y Var W Var K Var Z 1 4 2 4 6 4 2 5 5 6 6 5 3 6 6 6 6 5 4 7 7 7 6 6 5 8 15 6 7 6 7 7 8
Medidas Resumo Var X Var Y Var W Var K Var Z Média aritmética 6,00 7,00 5,75 6,00 6,00
Moda #N/D #N/D 6,00 6,00 5,00 Mediana 6,00 6,00 6,00 6,00 6,00 Variância 2,50 23,50 1,58 - 2,00
Desvio Padrão 1,58 4,85 1,26 - 1,41 Desvio Médio 1,20 3,20 0,88 - 1,14
Media geométrica 5,83 5,75 5,63 6,00 5,85 Média harmônica 5,65 4,65 5,51 6,00 5,70
Fonte: Dados Hipotéticos
Tabela 9 - Número de clientes (Y) por Número de anos de serviço (X)
Agente Anos de serviço (X) Número de clientes (Y)
A 2 48 B 3 50 C 4 56 D 5 52 E 4 43 F 6 60 G 7 62 H 8 58 I 8 64 J 10 72
Fonte: Dados Hipotéticos
Fi
Figur
Figuras e Quadros
Figura 1 - Exemplos de Box - Plot
60
61
Quadro 1 – Modelos para Variáveis Discretas
Quadro 2 – Modelos para Variáveis Contínuas
62
ÍNDICE
FOLHA DE ROSTO 02
AGRADECIMENTO 03
DEDICATÓRIA 04
RESUMO 05
METODOLOGIA 06
SUMÁRIO 07
INTRODUÇÃO 08
CAPÍTULO I - Conceitos e Definições 10
1.1. Finanças 10
1.2. Estatística 11
1.3. Gestão Empresarial 14
CAPÍTULO II – Técnicas Estatísticas 15
2.1. Variáveis 15
2.2. Distribuição de Freqüências 18
2.3. Métodos Gráficos 21
2.4. Medidas Resumo 29
2.5. Análise Bidimensional 37
2.6. Exemplos do uso de medidas resumo na área de finanças 42
2.7. População Amostra 43
2.8. Probabilidade 45
2.9. Variáveis Aleatórias e Modelos Probabilísticos 48
CONCLUSÃO 54
BIBLIOGRAFIA CONSULTADA 55
BIBLIOGRAFIA CITADA 55
WEBGRAFIA 56
ANEXOS 57
ÍNDICE 62