10
Estatística Básica usando o Excel 2007 Marcelo Rodrigo P. Ferreira 1. Visão geral do Excel 2007 Visualmente, o Excel 2007 difere das versões anteriores principalmente pela estrutura de abas. As funcionalidades do Excel encontram-se agrupadas em sete abas, a saber: Início, Inserir, Layout da Página, Fórmulas, Dados, Revisão e Exibição. Nesse texto, a pasta de trabalho (Arquivo) “Exemplo.xlsx” será utilizada na apresentação de exemplos. Sugere-se fortemente que os exemplos apresentados sejam reproduzidos utilizando esse conjunto de dados. 1.1. Terminologia Básica: Pasta de Trabalho: Arquivo Excel contendo uma ou mais planilhas. Planilha: Grade retangular de linhas e colunas onde as informações são inseridas. Linha: Conjunto de todas as células consecutivas dispostas horizontalmente. Representadas por números de 1 a 1048576. Coluna: Conjunto de todas as células consecutivas dispostas verticalmente. Representadas por letras de A a XFD, totalizando 16384 colunas. Célula: Interseção de uma coluna e uma linha. Exemplos: A1, B376, ZH91, XFD1048576. São, no total, 17179869184 células. Intervalo: Conjunto contíguo de células. Exemplos: A2:A11, C13:D18, A20:E20, A11:E20 (Ver figuras abaixo). Abas Coluna G Linha 9 Célula G9 Barra de Fórmulas Planilhas

Tutorial Excel 2007 Basic o

Embed Size (px)

Citation preview

Estatística Básica usando o Excel 2007

Marcelo Rodrigo P. Ferreira

1. Visão geral do Excel 2007

Visualmente, o Excel 2007 difere das versões anteriores principalmente pela estrutura de abas. As funcionalidades

do Excel encontram-se agrupadas em sete abas, a saber: Início, Inserir, Layout da Página, Fórmulas, Dados, Revisão e

Exibição. Nesse texto, a pasta de trabalho (Arquivo) “Exemplo.xlsx” será utilizada na apresentação de exemplos.

Sugere-se fortemente que os exemplos apresentados sejam reproduzidos utilizando esse conjunto de dados.

1.1. Terminologia Básica:

Pasta de Trabalho: Arquivo Excel contendo uma ou mais planilhas.

Planilha: Grade retangular de linhas e colunas onde as informações são inseridas.

Linha: Conjunto de todas as células consecutivas dispostas horizontalmente. Representadas por números de

1 a 1048576.

Coluna: Conjunto de todas as células consecutivas dispostas verticalmente. Representadas por letras de A a

XFD, totalizando 16384 colunas.

Célula: Interseção de uma coluna e uma linha. Exemplos: A1, B376, ZH91, XFD1048576. São, no total,

17179869184 células.

Intervalo: Conjunto contíguo de células. Exemplos: A2:A11, C13:D18, A20:E20, A11:E20 (Ver figuras abaixo).

Abas

Coluna G

Linha 9 Célula G9

Barra de Fórmulas

Planilhas

A2:A11

C13:D18

A20:E20

A11:E20

2. Estatística Básica com o Excel 2007

Nessa seção, apresentamos as funções básicas do Excel mais utilizadas. Os exemplos estão reproduzidos para as

variáveis “Idade”, “Altura” e “Peso” na planilha “Plan1” da pasta de trabalho “Exemplo.xlsx”.

2.1. Funções estatísticas

Abaixo listamos as funções estatísticas mais utilizadas.

SOMA: Retorna a soma de um conjunto de valores. Exemplo: =SOMA(C2:C31) retornará a soma de todas as

idades no intervalo C2:C31.

MÉDIA: Retorna a média de um conjunto de valores. Exemplo: =MÉDIA(C2:C31) retornará a média de todas

as idades no intervalo C2:C31.

MED: Retorna a mediana de um conjunto de valores. Exemplo: =MED(C2:C31) retornará a mediana de todas

as idades no intervalo C2:C31.

MODO: Retorna a moda de um conjunto de valores. Exemplo: =MODO(C2:C31) retornará a moda de todas as

idades no intervalo C2:C31.

MÍNIMO: Retorna o menor valor de um conjunto de valores. Exemplo: =MÍNIMO(C2:C31) retornará a menor

de todas as idades no intervalo C2:C31.

MÁXIMO: Retorna o maior valor de um conjunto de valores. Exemplo: =MÁXIMO(C2:C31) retornará a maior

de todas as idades no intervalo C2:C31.

PERCENTIL: Retorna um percentil especificado para um conjunto de valores. Exemplo:

=PERCENTIL(C2:C31;0,25) retornará percentil 25 das idades no intervalo C2:C31.

VAR: Retorna a variância amostral de um conjunto de valores. Exemplo: =VAR(C2:C31) retornará a variância

amostral de todas as idades no intervalo C2:C31.

DESVPAD: Retorna o desvio padrão amostral de um conjunto de valores. Exemplo: =DESVPAD(C2:C31)

retornará o desvio padrão amostral de todas as idades no intervalo C2:C31.

DISTORÇÃO: Retorna o coeficiente de assimetria de um conjunto de valores. Exemplo: =DISTORÇÃO(C2:C31)

retornará o coeficiente de assimetria das idades no intervalo C2:C31.

CURT: Retorna o coeficiente de curtose de um conjunto de valores. Exemplo: =CURT(C2:C31) retornará o

coeficiente de curtose das idades no intervalo C2:C31.

CORREL: Retorna o coeficiente de correlação linear de Pearson entre dois intervalos de valores. Exemplo:

=CORREL(D2:D31;E2:E31) retorna o coeficiente de correlação linear de Pearson entre as variáveis “Altura” e

“Peso” para os 30 indivíduos da amostra. As correlações entre as variáveis do arquivo exemplo estão

calculadas no intervalo H27:J29 da planilha “Plan1”.

2.2. Funções condicionais úteis

Abaixo, listamos as funções condicionais mais utilizadas.

CONT.SE: Conta o número de células dentro de um intervalo que atendem a um único critério que você

especifica. Exemplo 1: = CONT.SE(B2:B31;”=F”) retorna o número de células no intervalo B2:B31 que são

iguais a “F” (Célula M5 de “Plan1”); em termos práticos, estamos contando o número de indivíduos do

gênero feminino na amostra. Exemplo 2: = CONT.SE(C2:C31;”<=30”) retorna o número de células no

intervalo C2:C31 cujos valores são menores ou iguais a 30 (Célula M9 de “Plan1”); em termos práticos,

estamos contando quantos indivíduos na amostra têm idade menor ou igual a 30 anos.

CONT.SES: Aplica critérios a células em vários intervalos e conta o número de vezes que todos os critérios

são atendidos. Essa função é particularmente útil para construção de tabelas de distribuição de freqüência e

tabelas de dupla entrada (Tabelas cruzadas com informações de duas variáveis). Exemplo 1: =

CONT.SES(B2:B31;”=F”;C2:C31;”<=30”) retorna o número de células cujos valores são iguais a “F” no

intervalo B2:B31 e menores ou iguais a 30 no intervalo C2:C31 (Célula M16 de “Plan1”); em termos práticos

estamos contando quantos indivíduos na amostra são do gênero feminino e têm idade menor ou igual a 30.

Exemplo 2: CONT.SES(C2:C31;”>=30”;C2:C31;”<40”) retorna o número de células cujos valores são maiores

ou iguais a 30 e menores que 40 no intervalo C2:C31 (Célula M22 de “Plan1”); em termos práticos, estamos

contanto quantos indivíduos têm idade maior ou igual e 30 e menor do que 40.

3. Construção de Gráficos

3.1. Gráfico de Barras

Gráficos de barras são úteis para representação de variáveis qualitativas. A construção de um gráfico de barras parte

de uma tabela de frequências simples. Por exemplo, para gerar um gráfico de barras representando a variável

“Gênero”, basta selecionar a tabela de freqüência construída, clicar na aba “Inserir”, clicar na opção “Barras” e

selecionar um dos layouts de gráficos disponíveis. No nosso exemplo, vamos optar por um gráfico de barras simples,

em duas dimensões (A primeira opção, sombreada na cor laranja).

Note, na figura abaixo, a presença de três abas adicionais sob a barra intitulada “Ferramentas de Gráfico”. Através

dessas abas podemos configurar todas as opções do gráfico, como, por exemplo, design, título, legenda, cores,

fontes, títulos de eixos, etc. Observe que estas abas ficam disponíveis apenas quando um gráfico é selecionado.

Obs.: Os gráficos de colunas prestam-se ao mesmo fim que os gráficos de barras e sua construção no Excel 2007 se

dá de maneira idêntica à construção dos gráficos de barras.

3.2. Gráfico de Setores (Pizza ou Torta)

A construção de um gráfico de pizza também parte de uma tabela de freqüências simples. Por exemplo, para gerar

um gráfico de pizza representando a variável “Gênero”, basta selecionar a tabela de freqüência construída, clicar na

aba “Inserir”, clicar na opção “Pizza” e selecionar um dos layouts de gráficos disponíveis. No nosso exemplo, vamos

optar por um gráfico de pizza simples, em duas dimensões (A primeira opção, sombreada na cor laranja).

O resultado será o mostrado na figura abaixo.

As opções citadas para os gráficos de barras também se aplicam aos gráficos de pizza. É interessante, nesse tipo de

gráfico, apresentar os percentuais de cada categoria. Para isso, basta clicar na aba “Layout”, clicar em “Rótulos de

Dados” e selecionar a opção “Mais Opções de Rótulo de Dados...”. Na janela que se abrirá basta desmarcar a opção

“Valor” e marcar a opção “Porcentagem”.

3. Gráfico de Dispersão Bidimensional

A utilidade deste tipo de gráfico está na possibilidade de avaliação do comportamento conjunto de duas variáveis.

Sua construção parte dos próprios dados. Basta selecionar os intervalos de valores que queremos que sejam

representados no gráfico, clicar na aba “Inserir”, clicar na opção “Dispersão” e selecionar um tipo de gráfico.

O resultado, no exemplo, é apresentado abaixo.

Opções como título, títulos de eixos, cores, legenda, design, dentre outras, podem ser adicionadas/modificadas

através das abas “Design”, “Layout” e “Formatar”.

4. Histograma

A construção de um histograma, como a de um gráfico de colunas ou de barras, parte de uma tabela de distribuição

de frequências por classes. Basta selecionar o intervalo de células contendo as classes e as respectivas freqüências e

seguir com a construção de um gráfico de colunas, como mostrado na figura abaixo.

O resultado e um gráfico como o apresentado na figura a seguir.

Depois de construído o gráfico de colunas, devemos formatar o gráfico para que não existam espaços entre as

colunas. Fazemos isso clicando com o botão direito do mouse sobre uma das colunas do gráfico, selecionando a

opção “Formatar Série de Dados” e, na janela de se abre, definindo a opção “Largura do Espaçamento” como 0%.

Outras opções como, por exemplo, cores, títulos, legendas e eixos podem ser adicionadas/modificadas também

através das abas “Design”, “Layout” e “Formatar”.

Lembre que num histograma não pode haver espaço entre as colunas, pois se trata de um gráfico representativo de

variáveis contínuas. A figura a seguir ilustra essa opção.

O resultado deve ser um gráfico como o mostrado na figura a seguir.