Upload
daniel-brentano
View
30
Download
1
Embed Size (px)
Citation preview
Estatística Básica usando o Excel 2007
Marcelo Rodrigo P. Ferreira
1. Visão geral do Excel 2007
Visualmente, o Excel 2007 difere das versões anteriores principalmente pela estrutura de abas. As funcionalidades
do Excel encontram-se agrupadas em sete abas, a saber: Início, Inserir, Layout da Página, Fórmulas, Dados, Revisão e
Exibição. Nesse texto, a pasta de trabalho (Arquivo) “Exemplo.xlsx” será utilizada na apresentação de exemplos.
Sugere-se fortemente que os exemplos apresentados sejam reproduzidos utilizando esse conjunto de dados.
1.1. Terminologia Básica:
Pasta de Trabalho: Arquivo Excel contendo uma ou mais planilhas.
Planilha: Grade retangular de linhas e colunas onde as informações são inseridas.
Linha: Conjunto de todas as células consecutivas dispostas horizontalmente. Representadas por números de
1 a 1048576.
Coluna: Conjunto de todas as células consecutivas dispostas verticalmente. Representadas por letras de A a
XFD, totalizando 16384 colunas.
Célula: Interseção de uma coluna e uma linha. Exemplos: A1, B376, ZH91, XFD1048576. São, no total,
17179869184 células.
Intervalo: Conjunto contíguo de células. Exemplos: A2:A11, C13:D18, A20:E20, A11:E20 (Ver figuras abaixo).
Abas
Coluna G
Linha 9 Célula G9
Barra de Fórmulas
Planilhas
2. Estatística Básica com o Excel 2007
Nessa seção, apresentamos as funções básicas do Excel mais utilizadas. Os exemplos estão reproduzidos para as
variáveis “Idade”, “Altura” e “Peso” na planilha “Plan1” da pasta de trabalho “Exemplo.xlsx”.
2.1. Funções estatísticas
Abaixo listamos as funções estatísticas mais utilizadas.
SOMA: Retorna a soma de um conjunto de valores. Exemplo: =SOMA(C2:C31) retornará a soma de todas as
idades no intervalo C2:C31.
MÉDIA: Retorna a média de um conjunto de valores. Exemplo: =MÉDIA(C2:C31) retornará a média de todas
as idades no intervalo C2:C31.
MED: Retorna a mediana de um conjunto de valores. Exemplo: =MED(C2:C31) retornará a mediana de todas
as idades no intervalo C2:C31.
MODO: Retorna a moda de um conjunto de valores. Exemplo: =MODO(C2:C31) retornará a moda de todas as
idades no intervalo C2:C31.
MÍNIMO: Retorna o menor valor de um conjunto de valores. Exemplo: =MÍNIMO(C2:C31) retornará a menor
de todas as idades no intervalo C2:C31.
MÁXIMO: Retorna o maior valor de um conjunto de valores. Exemplo: =MÁXIMO(C2:C31) retornará a maior
de todas as idades no intervalo C2:C31.
PERCENTIL: Retorna um percentil especificado para um conjunto de valores. Exemplo:
=PERCENTIL(C2:C31;0,25) retornará percentil 25 das idades no intervalo C2:C31.
VAR: Retorna a variância amostral de um conjunto de valores. Exemplo: =VAR(C2:C31) retornará a variância
amostral de todas as idades no intervalo C2:C31.
DESVPAD: Retorna o desvio padrão amostral de um conjunto de valores. Exemplo: =DESVPAD(C2:C31)
retornará o desvio padrão amostral de todas as idades no intervalo C2:C31.
DISTORÇÃO: Retorna o coeficiente de assimetria de um conjunto de valores. Exemplo: =DISTORÇÃO(C2:C31)
retornará o coeficiente de assimetria das idades no intervalo C2:C31.
CURT: Retorna o coeficiente de curtose de um conjunto de valores. Exemplo: =CURT(C2:C31) retornará o
coeficiente de curtose das idades no intervalo C2:C31.
CORREL: Retorna o coeficiente de correlação linear de Pearson entre dois intervalos de valores. Exemplo:
=CORREL(D2:D31;E2:E31) retorna o coeficiente de correlação linear de Pearson entre as variáveis “Altura” e
“Peso” para os 30 indivíduos da amostra. As correlações entre as variáveis do arquivo exemplo estão
calculadas no intervalo H27:J29 da planilha “Plan1”.
2.2. Funções condicionais úteis
Abaixo, listamos as funções condicionais mais utilizadas.
CONT.SE: Conta o número de células dentro de um intervalo que atendem a um único critério que você
especifica. Exemplo 1: = CONT.SE(B2:B31;”=F”) retorna o número de células no intervalo B2:B31 que são
iguais a “F” (Célula M5 de “Plan1”); em termos práticos, estamos contando o número de indivíduos do
gênero feminino na amostra. Exemplo 2: = CONT.SE(C2:C31;”<=30”) retorna o número de células no
intervalo C2:C31 cujos valores são menores ou iguais a 30 (Célula M9 de “Plan1”); em termos práticos,
estamos contando quantos indivíduos na amostra têm idade menor ou igual a 30 anos.
CONT.SES: Aplica critérios a células em vários intervalos e conta o número de vezes que todos os critérios
são atendidos. Essa função é particularmente útil para construção de tabelas de distribuição de freqüência e
tabelas de dupla entrada (Tabelas cruzadas com informações de duas variáveis). Exemplo 1: =
CONT.SES(B2:B31;”=F”;C2:C31;”<=30”) retorna o número de células cujos valores são iguais a “F” no
intervalo B2:B31 e menores ou iguais a 30 no intervalo C2:C31 (Célula M16 de “Plan1”); em termos práticos
estamos contando quantos indivíduos na amostra são do gênero feminino e têm idade menor ou igual a 30.
Exemplo 2: CONT.SES(C2:C31;”>=30”;C2:C31;”<40”) retorna o número de células cujos valores são maiores
ou iguais a 30 e menores que 40 no intervalo C2:C31 (Célula M22 de “Plan1”); em termos práticos, estamos
contanto quantos indivíduos têm idade maior ou igual e 30 e menor do que 40.
3. Construção de Gráficos
3.1. Gráfico de Barras
Gráficos de barras são úteis para representação de variáveis qualitativas. A construção de um gráfico de barras parte
de uma tabela de frequências simples. Por exemplo, para gerar um gráfico de barras representando a variável
“Gênero”, basta selecionar a tabela de freqüência construída, clicar na aba “Inserir”, clicar na opção “Barras” e
selecionar um dos layouts de gráficos disponíveis. No nosso exemplo, vamos optar por um gráfico de barras simples,
em duas dimensões (A primeira opção, sombreada na cor laranja).
Note, na figura abaixo, a presença de três abas adicionais sob a barra intitulada “Ferramentas de Gráfico”. Através
dessas abas podemos configurar todas as opções do gráfico, como, por exemplo, design, título, legenda, cores,
fontes, títulos de eixos, etc. Observe que estas abas ficam disponíveis apenas quando um gráfico é selecionado.
Obs.: Os gráficos de colunas prestam-se ao mesmo fim que os gráficos de barras e sua construção no Excel 2007 se
dá de maneira idêntica à construção dos gráficos de barras.
3.2. Gráfico de Setores (Pizza ou Torta)
A construção de um gráfico de pizza também parte de uma tabela de freqüências simples. Por exemplo, para gerar
um gráfico de pizza representando a variável “Gênero”, basta selecionar a tabela de freqüência construída, clicar na
aba “Inserir”, clicar na opção “Pizza” e selecionar um dos layouts de gráficos disponíveis. No nosso exemplo, vamos
optar por um gráfico de pizza simples, em duas dimensões (A primeira opção, sombreada na cor laranja).
O resultado será o mostrado na figura abaixo.
As opções citadas para os gráficos de barras também se aplicam aos gráficos de pizza. É interessante, nesse tipo de
gráfico, apresentar os percentuais de cada categoria. Para isso, basta clicar na aba “Layout”, clicar em “Rótulos de
Dados” e selecionar a opção “Mais Opções de Rótulo de Dados...”. Na janela que se abrirá basta desmarcar a opção
“Valor” e marcar a opção “Porcentagem”.
3. Gráfico de Dispersão Bidimensional
A utilidade deste tipo de gráfico está na possibilidade de avaliação do comportamento conjunto de duas variáveis.
Sua construção parte dos próprios dados. Basta selecionar os intervalos de valores que queremos que sejam
representados no gráfico, clicar na aba “Inserir”, clicar na opção “Dispersão” e selecionar um tipo de gráfico.
O resultado, no exemplo, é apresentado abaixo.
Opções como título, títulos de eixos, cores, legenda, design, dentre outras, podem ser adicionadas/modificadas
através das abas “Design”, “Layout” e “Formatar”.
4. Histograma
A construção de um histograma, como a de um gráfico de colunas ou de barras, parte de uma tabela de distribuição
de frequências por classes. Basta selecionar o intervalo de células contendo as classes e as respectivas freqüências e
seguir com a construção de um gráfico de colunas, como mostrado na figura abaixo.
O resultado e um gráfico como o apresentado na figura a seguir.
Depois de construído o gráfico de colunas, devemos formatar o gráfico para que não existam espaços entre as
colunas. Fazemos isso clicando com o botão direito do mouse sobre uma das colunas do gráfico, selecionando a
opção “Formatar Série de Dados” e, na janela de se abre, definindo a opção “Largura do Espaçamento” como 0%.
Outras opções como, por exemplo, cores, títulos, legendas e eixos podem ser adicionadas/modificadas também
através das abas “Design”, “Layout” e “Formatar”.
Lembre que num histograma não pode haver espaço entre as colunas, pois se trata de um gráfico representativo de
variáveis contínuas. A figura a seguir ilustra essa opção.