Upload
bunme
View
78
Download
2
Embed Size (px)
DESCRIPTION
INTRODUÇÃO À ESTATÍSTICA. PROFESSOR DORTA. ORIGEM. - PowerPoint PPT Presentation
Citation preview
42510011 0010 1010 1101 0001 0100 1011
INTRODUÇÃO À ESTATÍSTICA
PROFESSOR DORTA
4251
0011 0010 1010 1101 0001 0100 1011
ORIGEM• A palavra estatística, de origem latina,
significou por muito tempo “ciência sobre os assuntos do Estado. Os que governavam,
sentindo necessidade de informações, organizavam departamentos que tinham a
responsabilidade de fazer estas investigações.
4251
0011 0010 1010 1101 0001 0100 1011ORIGEM
• A palavra foi proposta pela primeira vez no século XVII, em latim, por Schmeitzel na
Universidade de Lena e adotada pelo acadêmico alemão Godofredo Achenwall.
Aparece como vocabulário na Enciclopédia Britânica em 1797, e adquiriu um
significado de coleta e classificação de dados, no início do século 19.
4251
0011 0010 1010 1101 0001 0100 1011APLICAÇÃO
• A Estatística trabalha com métodos científicos para coleta, organização, resumo
e apresentação de dados e também para a obtenção de conclusões e tomada de
decisões.
4251
0011 0010 1010 1101 0001 0100 1011EXEMPLO DE APLICAÇÃO:
• Todos nós temos um pouco de cientista. Quase que diariamente, temos “palpites” com relação a acontecimentos futuros em
nossas vidas, a fim de prever o que acontecerá em novas situações ou
experiências.
4251
0011 0010 1010 1101 0001 0100 1011
• À medida em que essas situações ocorrem, podemos, às vezes, confirmar nossas idéias; outras vezes, entretanto, não temos tanta sorte e, por isso, acabamos experimentando experiências desagradáveis.
• Por exemplo: Alguém poderia levantar a hipótese de que crianças socialmente isoladas assistem mais televisão do que crianças bem integradas em seus grupos - e, a partir daí, testa sua idéia através de pesquisa sistemática.
4251
0011 0010 1010 1101 0001 0100 1011
ALGUNS CONCEITOS IMPORTANTES
4251
0011 0010 1010 1101 0001 0100 1011POPULAÇÃO
• População: é o conjunto de todos os elementos dos quais desejamos pesquisar alguma característica.
• Ex: Censo Demográfico.
4251
0011 0010 1010 1101 0001 0100 1011POPULAÇÃO E AMOSTRA
• Muitas vezes é impraticável para o pesquisador observar todos os
elementos do grupo que pretende estudar. É preciso, então, recorrer à pesquisa com uma parte do todo.
4251
0011 0010 1010 1101 0001 0100 1011POPULAÇÃO E AMOSTRA
• Todos os elementos do grupo a ser estudado constituem a população. A
parte da população efetivamente examinada é a amostra.
4251
0011 0010 1010 1101 0001 0100 1011AMOSTRA
• Suponhamos uma pesquisa sobre o nível de escolaridade de um grupo de oitocentas pessoas. Nesse caso, a população é o conjunto das oitocentas pessoas. Se sentirmos desnecessário ou impossível examinar os oitocentos elementos, podemos recorrer a amostragem, ou seja, podemos analisar parte desses elementos.
4251
0011 0010 1010 1101 0001 0100 1011AMOSTRA
• É claro que se escolhermos apenas dois desses oitocentos elementos, corremos o risco de selecionar exatamente dois elementos com as mesmas características. Se os dois forem analfabetos, por exemplo, podemos concluir que todos os elementos da população também o são.
4251
0011 0010 1010 1101 0001 0100 1011AMOSTRA
• Observe que, qualquer que seja a amostra, sempre corremos o risco de chegar a
conclusões erradas, mas este risco diminui à medida que aumenta a quantidade de
elementos a serem examinados.
4251
0011 0010 1010 1101 0001 0100 1011AMOSTRA
• Devemos estabelecer um mínimo de elementos para compor a amostra. Essa
quantidade não deve ser menor que 10% do total de elementos da população. Assim, estaremos minimizando as chances de as
informações da amostra se afastarem demasiadamente daquelas que obteríamos
se examinássemos toda a população.
4251
0011 0010 1010 1101 0001 0100 1011AMOSTRA
• Além de estabelecer um critério para a quantidade de elementos que farão parte
da amostra, é importante estabelecer critérios de seleção desses elementos.
4251
0011 0010 1010 1101 0001 0100 1011
ALGUMAS FORMAS DE AMOSTRAGEM
4251
0011 0010 1010 1101 0001 0100 1011
I) AMOSTRAGEM ALEATÓRIA SIMPLES:
É o processo mais elementar e freqüentemente utilizado. É equivalente a
um sorteio lotérico. Pode ser realizada numerando-se a população de 1 a n e
sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, x números dessa seqüência, os quais corresponderão
aos elementos pertencentes à amostra.
4251
0011 0010 1010 1101 0001 0100 1011
Exemplo: Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola:
• 1º - numeramos os alunos de 1 a 90.
• 2º - escrevemos os números dos alunos, de 1 a 90, em pedaços iguais de papel, colocamos na urna e após misturar retiramos, um a um, nove números que formarão a amostra.
4251
0011 0010 1010 1101 0001 0100 1011
II) AMOSTRAGEM PROPORCIONAL ESTRATIFICADA:
• Quando a população se divide em estratos (subpopulações), convém que o sorteio dos elementos da amostra leve em consideração tais estratos, daí obtemos os elementos da amostra proporcional ao número de elementos desses estratos.
4251
0011 0010 1010 1101 0001 0100 1011• Exemplo: Vamos obter uma amostra proporcional estratificada, de 10%, do
exemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São portanto dois estratos (sexo masculino e sexo feminino).
4251
0011 0010 1010 1101 0001 0100 1011
Logo, temos:
• Numeramos então os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e procedemos o sorteio casual com urna ou tabela de números aleatórios.
sexo população 10% amostramasculino 54 5,4 5feminino 36 3,6 4
total 90 9,0 9
4251
0011 0010 1010 1101 0001 0100 1011III) AMOSTRAGEM SISTEMÁTICA
Quando os elementos da população já se acham ordenados, não há necessidade de construir o sitema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador.
4251
0011 0010 1010 1101 0001 0100 1011
• Exemplo: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada
por 90 casas para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte
procedimento: como 900/90 = 10, escolhemos por sorteio casual um número de 01 a 10, o qual indicaria o primeiro elemento sorteado para a
amostra; os demais elementos seriam periodicamente considerados de 10 em 10. Assim,
suponhamos que o número sorteado fosse 4 a amostra seria: 4ª casa, 14ª casa, 24ª casa, 34ª casa,
44ª casa, etc.
4251
0011 0010 1010 1101 0001 0100 1011VARIÁVEL
Definição: É a característica a ser estudada.
4251
0011 0010 1010 1101 0001 0100 1011VARIÁVEL
• Exemplo: A fim de ter um perfil de seu “público”nos fins de semana, o proprietário de um cinema contratou dois pesquisadores para coletar dados referentes à sua clientela. Os pesquisadores escolheram seis objetos
de estudo: sexo, idade, nível de escolaridade, estado civil, renda mensal e
meio de transporte utilizado para chegar ao cinema.
4251
0011 0010 1010 1101 0001 0100 1011VARIÁVEL
• Num fim de semana foram entrevistados 19 freqüentadores desse cinema. Os resultados estão apresentados na tabela seguinte.
4251
0011 0010 1010 1101 0001 0100 1011
SEXO IDADE ESCOLARIDADE ESTADO CIVIL TRANSPORTE RENDA (em S.M.)
Masculino 28 M CASADO CARRO 11,8
Masculino 38 M CASADO CARRO 13,9
Feminino 24 S SOLTEIRA CARRO 12,4
Masculino 43 M CASADO CARRO 19,5
Feminino 32 S SEPARADA ÔNIBUS 12,1
Feminino 19 M SOLTEIRA A PÉ 5,0
Masculino 22 S SOLTEIRO ÔNIBUS 8,9
Masculino 25 M SOLTEIRO ÔNIBUS 13,3
Masculino 41 S CASADO A PÉ 14,7
Feminino 40 F SOLTEIRA CARRO 16,6
Feminino 35 S SOLTEIRA CARRO 9,3
Masculino 29 F CASADO CARRO 11,6
Feminino 31 F SOLTEIRA CARRO 10,2
Feminino 36 S CASADA CARRO 16,0
Feminino 48 M CASADA CARRO 18,8
Masculino 23 M SOLTEIRO A PÉ 15,4
Masculino 27 S SOLTEIRO A PÉ 10,7
Masculino 26 S SEPARADO ÔNIBUS 8,2
Masculino 29 S CASADO ÔNIBUS 12,5
4251
0011 0010 1010 1101 0001 0100 1011VARIÁVEL
• Algumas variáveis, como sexo, nível de escolaridade, estado civil e transporte,
apresentam como resultado uma qualidade, atributo ou preferência da pessoa
entrevistada. Variáveis dessa natureza recebem o nome de variáveis qualitativas.
4251
0011 0010 1010 1101 0001 0100 1011VARIÁVEL
• Outras variáveis, como idade e renda mensal apresentam como resposta um número, resultante nesse exemplo de mensuração. Variáveis assim definidas são chamadas variáveis quantitativas.
• Cabe ressaltar, que se os pesquisadores tivessem perguntado: “Quantas vezes por semana você costuma ir ao cinema?”, teríamos como objeto de estudo uma variável quantitativa, cujos valores assumidos são resultante de contagem.
4251
0011 0010 1010 1101 0001 0100 1011VARIÁVEIS: QUADRO RESUMO
VARIÁVEL
QUALITATIVA QUANTITATIVA
DISCRETA(contagem)
CONTÍNUA(mensuração)
4251
0011 0010 1010 1101 0001 0100 1011
• Situação: A direção de um parque contratou uma equipe de pesquisadores para
coletar algumas informações sobre seus freqüentadores. Os cem entrevistados
responderam às seguintes questões: sexo, idade, quantas vezes por semana vão ao
parque, período de visita (manhã, tarde ou noite), tempo de permanência e quantia
gasta nas dependências do parque. Cada um desses objetos de estudo corresponde a uma variável. Classifique as variáveis quanto ao
tipo.
4251
0011 0010 1010 1101 0001 0100 1011RESOLUÇÃO DO PROBLEMA
• Variáveis qualitativas: sexo e período de visita.
• Variáveis quantitativas I) Discreta: número de visitas por semana.II) Contínuas: idade, tempo de
permanência e quantia gasta nas dependências do parque.
4251
0011 0010 1010 1101 0001 0100 1011
SÉRIES ESTATÍSTICAS
• SÉRIE ESTATÍSTICA: É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos.
• TABELA: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática.
4251
0011 0010 1010 1101 0001 0100 1011
• De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar :
• um traço horizontal ( - ) quando o valor é zero; • três pontos ( ... ) quando não temos os dados; • zero ( 0 ) quando o valor é muito pequeno para
ser expresso pela unidade utilizada; • um ponto de interrogação ( ? ) quando temos
dúvida quanto à exatidão de determinado valor. • Obs: Os lados direito e esquerdo de uma tabela
oficial devem ser abertos. “Salientamos que em alguns documentos as tabelas não são abertas devido a limitações de editores como o html".
4251
0011 0010 1010 1101 0001 0100 1011
DISTRIBUIÇÃO DE FREQUÊNCIA
• É um tipo de tabela que condensa uma coleção de dados conforme as freqüências (repetições de seus valores – número de vezes que a variável é observada na população estudada).
4251
0011 0010 1010 1101 0001 0100 1011EXEMPLO:
• Um repórter do jornal A Voz da Terra foi destacado para acompanhar a apuração de votos da eleição da diretoria do clube da cidade, a qual concorrem os candidatos A, B, C e D. O objetivo da pesquisa é a publicação da porcentagem de votos obtidos pelos candidatos.
4251
0011 0010 1010 1101 0001 0100 1011Como organizar os dados?
Os dados obtidos constituem os dados brutos.
O repórter poderá recorrer a uma organização numérica simples, registrada através de símbolos de fácil visualização:
4251
0011 0010 1010 1101 0001 0100 1011
TABELA PRIMITIVA OU DADOS BRUTOS: É uma tabela ou
relação de elementos que não foram numericamente organizados
Candidatos Votos
A
B
C
D
4251
0011 0010 1010 1101 0001 0100 1011
ROL DOS DADOS: É a tabela obtida após a
ordenação dos dados (crescente ou decrescente). Candidatos Votos
D 9
B 11
A 14
C 16
4251
0011 0010 1010 1101 0001 0100 1011
• Deste modo, ele terá iniciado o trabalho de tabulação dos dados. Apesar das anotações do repórter
trazerem todas as informações sobre estas eleições, é mais provável que seja publicada uma tabela, com número de votos de cada candidato e a respectiva
porcentagem de votos.
4251
0011 0010 1010 1101 0001 0100 1011
EXEMPLO DE DISTRIBUIÇÃO POR FREQÜÊNCIA:
Candidato Número de votos
Votos (%)
D 9 18
B 11 22
A 14 28
C 16 32
Total 50 100
4251
0011 0010 1010 1101 0001 0100 1011
• Na tabela do exemplo dado, a freqüência de votos do candidato A é 9, a do candidato B
é 11, a do C é 14 e a do D é 16. Estas freqüências, representadas na segunda
coluna, são as freqüências absolutas (F). Sua soma é igual a 50 que é o número total de observações. Na coluna “% de votos”, obtida a partir do cálculo de porcentagem
de votos de cada candidato, estão representadas as freqüências relativas (Fr).
4251
0011 0010 1010 1101 0001 0100 1011EXEMPLO 2:
• DADOS BRUTOS: 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
• ROL: 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
4251
0011 0010 1010 1101 0001 0100 1011
Distribuição de freqüência:Dados Freqüência
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1
52 1
54 1
57 1
58 2
60 2
Total 20
4251
0011 0010 1010 1101 0001 0100 1011
Distribuição de frequência com intervalos de classe: Quando o tamanho da amostra é elevado é mais racional
efetuar o agrupamento dos valores em vários intervalos de classe.
Classes Freqüência41 |----- 45 745 |----- 49 349 |----- 53 453 |----- 57 157 |----- 61 5
Total 20
4251
0011 0010 1010 1101 0001 0100 1011Cálculo do número de classes :
• Procurar no Google por: "Regra de Sturges"
4251
0011 0010 1010 1101 0001 0100 1011REPRESENTAÇÃO GRÁFICA
• Dados estatísticos podem ser representados tanto por tabelas quanto por gráficos.
4251
0011 0010 1010 1101 0001 0100 1011CLASSIFICAÇÃO:
• Diagramas;
• Pictogramas;
• Cartogramas.
4251
0011 0010 1010 1101 0001 0100 1011Diagramas
• São gráficos geométricos dispostos em duas dimensões. São os mais usados na
representação de séries estatísticas.
4251
0011 0010 1010 1101 0001 0100 1011
I) Gráficos em barras horizontais (gráfico de barras)
• Para sua construção, as freqüências são anotadas no eixo das abscissas, e os
valores da variável, no eixo das ordenadas.
4251
0011 0010 1010 1101 0001 0100 1011Gráficos em barras horizontais
4251
0011 0010 1010 1101 0001 0100 1011
Gráficos em barras verticais (gráfico de colunas)
• Como o próprio nome indica, nesse tipo de gráfico as freqüências serão representadas por colunas – retângulos com bases de mesma medida, cujas alturas correspondem às freqüências.
4251
0011 0010 1010 1101 0001 0100 1011
Gráfico de colunas 3D
4251
0011 0010 1010 1101 0001 0100 1011Gráfico de setores (Pizza)
• Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a
participação do dado no total. O total é representado pelo círculo, que fica dividido em
tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente
proporcionais aos dados da série. O gráfico em setores só deve ser empregado “quando há, no
máximo, sete dados”.
4251
0011 0010 1010 1101 0001 0100 1011Gráfico de setores
4251
0011 0010 1010 1101 0001 0100 1011Gráficos de linhas (poligonal)
• São frequentemente usados para representação de séries cronológicas com um grande número de períodos de tempo.
As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo
gráfico.
4251
0011 0010 1010 1101 0001 0100 1011
Gráficos de linhas
Taxas Brutas de Nupcialidade
Brasil, 1979-1994
Fonte: Fundação IBGE, Anuário Estatístico do Brasil 1960/1991 e 1994
4251
0011 0010 1010 1101 0001 0100 1011II) PICTOGRAMAS
• São construídos a partir de figuras representativas da intensidade do fenômeno.
Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois
sua forma é atraente e sugestiva. Os símbolos devem ser auto-explicativos. A
desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e
não de detalhes minuciosos.
4251
0011 0010 1010 1101 0001 0100 1011PICTOGRAMA
4251
0011 0010 1010 1101 0001 0100 1011III) CARTOGRAMAS
• São ilustrações relativas a cartas geográficas (mapas). O objetivo desse
gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas
geográficas ou políticas.
4251
0011 0010 1010 1101 0001 0100 1011CARTOGRAMA
4251
0011 0010 1010 1101 0001 0100 1011CARTOGRAMA
4251
0011 0010 1010 1101 0001 0100 1011CARTOGRAMA
4251
0011 0010 1010 1101 0001 0100 1011
MEDIDAS DE TENDÊNCIA CENTRAL
• Pesquisadores em muitos campos tem usado o termo “média” em questões tais como:
Quantos cigarros fuma, em média, o adolescente? Qual a nota média de um
universitário? Em média, quantos são os acidentes automobilísticos que resultam diretamente da ingestão de álcool ou de
outras drogas?
4251
0011 0010 1010 1101 0001 0100 1011
• Uma forma útil de descrever um grupo como um todo, consiste em encontrar um
único número que represente o que é “médio” ou “típico” naquele conjunto
particular de dados. Em pesquisa, tal valor é conhecido como medida de tendência central, uma vez que ela se localiza em
torno do meio ou centro de uma distribuição – onde a maior parte dos dados tende a
concentrar-se.
4251
0011 0010 1010 1101 0001 0100 1011MODA
• É o valor que ocorre com maior freqüência em uma série de valores.
• Mo é o símbolo da moda.
• Assim, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa fábrica.
4251
0011 0010 1010 1101 0001 0100 1011
• A moda é facilmente reconhecida: basta, procurar o valor que mais se repete.
Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10.
• Há séries nas quais não existe valor modal.
Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda.
Neste caso, a série é denominada amodal.
4251
0011 0010 1010 1101 0001 0100 1011• Em outros casos, pode haver dois ou mais
valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais.
Exemplo: A série { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7.
Portanto, ela é denominada série bimodal.
4251
0011 0010 1010 1101 0001 0100 1011
A MODA QUANDO OS DADOS ESTÃO AGRUPADOS
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de
maior freqüência.
4251
0011 0010 1010 1101 0001 0100 1011I) Sem intervalos de classe
Uma vez agrupados os dados, é possível determinar imediatamente a moda:
basta fixar o valor da variável de maior freqüência.
4251
0011 0010 1010 1101 0001 0100 1011
Exemplo: Qual é a moda das temperaturas na tabela abaixo:
• Resposta: 2º C é a temperatura modal, pois é a de maior freqüência.
temperatura freqüência
Oº C 3
1º C 9
2º C 12
3º C 6
4251
0011 0010 1010 1101 0001 0100 1011II) Com intervalos de classe
• A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método
mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação
de moda bruta.
4251
0011 0010 1010 1101 0001 0100 1011
Exemplo: Calcule a estatura modal conforme a tabela abaixo.
Fórmula: Mo = (l + L) /2 Em que: l = limite inferior da
classe modal e L= limite superior da classe modal.
A classe modal é 58|----- 62, pois é a de maior freqüência. l =58 e L=62
• Mo = (58+62) / 2 = 60 cm ( este valor é estimado, pois não conhecemos o valor real da moda).
Classes (em cm)
freqüência
54 |----- 58 9
58 |----- 62 11
62 |----- 66 8
66 |----- 70 5
4251
0011 0010 1010 1101 0001 0100 1011MEDIANA
• Quando dados são dispostos em ordem crescente ou decrescente, torna-se possível localizar a mediana (Md), que corresponde ao ponto central da distribuição.
4251
0011 0010 1010 1101 0001 0100 1011
I) Se a série dada tiver número ímpar de termos:
• A mediana será o dado que cai exatamente no meio da distribuição. A posição do valor mediano pode ser determinada pelo exame dos dados ou pela fórmula:
Posição da mediana = (n +1) /2
Em que n é o número de valores da distribuição.
4251
0011 0010 1010 1101 0001 0100 1011
Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 }
• ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 }
• n = 9 , logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da série
ordenada será a mediana
• A mediana é o 5º elemento = 2
4251
0011 0010 1010 1101 0001 0100 1011
II) Se a série dada tiver número par de termos:
• A mediana será sempre aquele ponto da distribuição que é antecedido e precedido por igual número de dados. Para uma distribuição com número par de dados, sempre há dois valores considerados “centrais”. Assim, a mediana é a média aritmética desses dois valores.
4251
0011 0010 1010 1101 0001 0100 1011
Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 1, 4, 1, 3, 5, 6 }
• Ordenar a série { 0, 0, 1, 1, 1, 3, 3, 4, 5, 6 }
• Os valores centrais são 1 e 3.
• E a mediana da série é: (1+3)/2=2
4251
0011 0010 1010 1101 0001 0100 1011MÉDIA ARITMÉTICA
• A medida de tendência central mais comumente usada é a média aritmética, ,
cujo cálculo consiste em somar um conjunto de valores e dividir o total pelo número de valores.
x
4251
0011 0010 1010 1101 0001 0100 1011
Fórmula:
nx... xxx
n
x n321
n
1ii
x
4251
0011 0010 1010 1101 0001 0100 1011
• Exemplo: Calcular a média aritmética dos elementos do conjunto {2, 3, 8, 27}.
104
27832 x
4251
0011 0010 1010 1101 0001 0100 1011MÉDIA ARITMÉTICA PONDERADA
Exemplo:
Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para
variável o número de filhos do sexo masculino. Calcularemos a quantidade
média de meninos por família:
4251
0011 0010 1010 1101 0001 0100 1011
Quadro resumo:Número de meninos Freqüência
(número de famílias)0 2
1 6
2 10
3 12
4 4
total 34
4251
0011 0010 1010 1101 0001 0100 1011
• Como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula:
n
nn
ii
i
ffffffff
f
fx
... .x... .x.x.x
.x
321
n332211
1
n
1ii
4251
0011 0010 1010 1101 0001 0100 1011
Voltando à tabela para resolver o problema proposto.
0 2 01 6 62 10 203 12 364 4 16
total 34 78
• Média Aritmética Ponderada:
ix if ii fx .
famíliapor meninos 3,23478 x
4251
0011 0010 1010 1101 0001 0100 1011
• Exercício: (Unifesp) Para ser aprovado num curso, um estudante precisa submeter-se a três provas
parciais durante o período letivo e uma prova final, com pesos 1, 1, 2 e 3 respectivamente, e obter média no mínimo igual a 7. Se um estudante
obteve nas provas parciais as notas 5, 7 e 5, respectivamente, a nota mínima
que necessita obter na prova final para ser aprovado é:
4251
0011 0010 1010 1101 0001 0100 1011
Logo, a média aritmética ponderada será:
9n
273
77
3n22
7 3211
3.n2.51.71.5
7
n
x
4251
0011 0010 1010 1101 0001 0100 1011
MÉDIA ARITMÉTICA (EM INTERVALOS DE CLASSE)
• Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula:
• Em que é o ponto médio de cada classe.
n
nn
ii
i
ffffffff
f
fx
... .x... .x.x.x
.x
321
n332211
1
n
1ii
ix
4251
0011 0010 1010 1101 0001 0100 1011
Exemplo: Calcular a estatura média de bebês conforme a tabela abaixo.
• Aplicando a fórmula temos:
2.440 / 40 = 61
Logo, = 61 cm
estaturas (cm)
freqüência
ponto médio
50 |----- 54
4 52 208
54 |----- 58
9 56 504
58 |----- 62
11 60 660
62 |----- 66
8 64 512
66 |----- 70
5 68 340
70 |----- 74
3 72 216
Total 40 2440
x
)( if )( ix ii fx .
4251
0011 0010 1010 1101 0001 0100 1011MÉDIA GEOMÉTRICA
• Simples:
• Ponderada:
n...321G ...x.xx M nx
i
nf
fn
fff x...x.xx M ...321Gp321
4251
0011 0010 1010 1101 0001 0100 1011Exercício: Calcular a média geométrica dos elementos do conjunto {2, 3, 8, 27}.
Podemos proceder da seguinte forma:
63.23.2 3.3.2.2 2.3.8.27 M 4 444 334G
4251
0011 0010 1010 1101 0001 0100 1011MÉDIA HARMÔNICA
DEFINIÇÃO: É o inverso da média aritmética dos inversos.
FÓRMULA:
nxxxx
M
n
H 1...1111
321
nxxxx
n1...111
321
4251
0011 0010 1010 1101 0001 0100 1011
MEDIDAS DE VARIABILIDADE (MEDIDAS DE DISPERSÃO)
• AMPLITUDE;
• VARIÂNCIA;
• DESVIO PADRÃO.
4251
0011 0010 1010 1101 0001 0100 1011
MEDIDAS DE DISPERSÃO:INTRODUÇÃO
• Vimos que a moda, a mediana e a média podem ser usadas para resumir, num único número, aquilo que é “médio” ou “típico”
numa distribuição. Quando empregada sozinha, entretanto, qualquer medida de
tendência central fornece apenas uma visão incompleta de um conjunto de dados, portanto, pode distorcer tanto quanto
esclarecer.
4251
0011 0010 1010 1101 0001 0100 1011
ILUSTRANDO A SITUAÇÃO COLOCADA:
• Admita que em Honolulu (Havaí) e Houston (Texas) tenham quase a mesma temperatura média diária de 75º F. Será
que, por isso, podemos admitir que a temperatura é basicamente a mesma em
ambas as localidades?
4251
0011 0010 1010 1101 0001 0100 1011
• A temperatura em Honolulu varia muito pouco ao longo do ano, oscilando, em geral,
entre 70º F e 80º F. Por outro lado, a temperatura em Houston pode diferir
estacionalmente, isto é, apresentar-se baixa em janeiro – cerca de 40º F – e alta em julho e agosto – próxima dos 100º F. Desnecessário dizer, que as praias de
Houston não estão cheias de gente o ano todo.
4251
0011 0010 1010 1101 0001 0100 1011
• Tal fato demonstra que necessitamos, além de uma medida de tendência central, de um índice que indique o grau de dispersão dos valores em torno do centro da distribuição. Desta forma, precisamos de uma medida indicativa que costumeiramente é chamada variabilidade, variação ou ainda dispersão.
• Voltando ao exemplo, podemos dizer que a distribuição de temperaturas em Houston tem maior variabilidade (é mais dispersa) do que a distribuição de temperaturas em Honolulu.
4251
0011 0010 1010 1101 0001 0100 1011AMPLITUDE TOTAL
• Pode-se obter uma medida de variabilidade rápida, embora não muito exata, pelo cálculo da amplitude total, que é a
diferença entre o maior e o menor valor da distribuição.
4251
0011 0010 1010 1101 0001 0100 1011
EXEMPLO:• Se a temperatura anual mais alta em
Honolulu foi de 88º F e a mais baixa, 62º F, a amplitude total da temperatura foi de 26º F (isto é, 88º F – 62º F = 26º F).
• Se o dia mais quente em Houston apresenta 102º F e o mais frio, 33º F, a amplitude total da temperatura anual em Houston foi de 69º F (isto é, 102º F – 33º F = 69º F).
4251
0011 0010 1010 1101 0001 0100 1011
DESVANTAGEM DA UTILIZAÇÃO DA AMPLITUDE COMO MEDIDA DE DISPERSÃO
• A amplitude é inteiramente dependente de apenas dois valores: o maior e o menor num dado conjunto de valores. Como resultado, a amplitude fornece, via de regra, um mero
índice grosseiro da variabilidade de uma distribuição.
4251
0011 0010 1010 1101 0001 0100 1011DESVIO PADRÃO
• É a medida de dispersão que leva em consideração a totalidade dos valores
da variável em estudo. É um indicador de variabilidade bastante estável.
4251
0011 0010 1010 1101 0001 0100 1011
• DESVIO:
• VARIÂNCIA:
• DESVIO PADRÃO:
xxd ii
ndddd n
223
22
212 ...
ndddd n
223
22
21 ...
4251
0011 0010 1010 1101 0001 0100 1011
Exercício: A distribuição das freqüências das alturas dos jogadores de futebol está mostrada na tabela a seguir:
Altura (m) Número de jogadores
1,65 |----- 1,75 2
1,75 |----- 1,85 6
1,85 |----- 1,95 8
1,95 |----- 2,05 4
4251
0011 0010 1010 1101 0001 0100 1011
b) Calcule a média e o desvio padrão dessa distribuição de freqüência.
Cálculo da média aritmética:Primeiro devemos calcular o ponto médio de cada
intervalo de classe e em seguida fazemos uso desses valores para calcular a média aritmética.
87,120
2,00 . 41,90 . 81,80 . 61,70 . 2 x
4251
0011 0010 1010 1101 0001 0100 1011
Cálculo dos desvios:
17,087,170,11 d
07,087,180,12 d
03,087,190,13 d
13,087,100,24 d
4251
0011 0010 1010 1101 0001 0100 1011
Cálculo da variância:
Cálculo do desvio padrão:
0,09 0,0081
0081,020
4.(0,13)(0,03) 8..(-0,07)6) (-017 2. 2222
2
4251
0011 0010 1010 1101 0001 0100 1011SIGNIFICADO DO DESVIO PADRÃO
• Após calcular o desvio padrão de uma de uma série o sujeito pode ficar com uma desagradável sensação relacionada com o significado do resultado.
• O que indica esse número? O que, exatamente, podemos dizer agora a respeito dessa distribuição que não poderíamos ter dito antes?
4251
0011 0010 1010 1101 0001 0100 1011
Tornando a noção de desvio padrão mais clara: uma ilustração.
• Uma importante característica da curva normal é auxiliar na
interpretação e compreensão do desvio padrão.
4251
0011 0010 1010 1101 0001 0100 1011Curva normal
• A curva normal é um tipo de curva simétrica, suave, cuja forma lembra um sino.
• O aspecto mais marcante dessa curva é a simetria.
• O ponto de freqüência máxima dessa curva está situado no meio da distribuição, em que a média, a mediana e a moda coincidem.
4251
0011 0010 1010 1101 0001 0100 1011Curva normal
4251
0011 0010 1010 1101 0001 0100 1011Área sob a curva normal
4251
0011 0010 1010 1101 0001 0100 1011Área sob a curva normal
4251
0011 0010 1010 1101 0001 0100 1011Área sob a curva normal
4251
0011 0010 1010 1101 0001 0100 1011
• Podemos concluir, então, que a área total sob a curva normal compreendida entre e , inclui para efeitos
práticos, a totalidade dos dados sob qualquer curva normal (mais de 99%).
3 3
4251
0011 0010 1010 1101 0001 0100 1011
SITUAÇÃO: Para entendermos melhor essa característica, vamos examinar o que alguns antropólogos dizem a respeito da diferença
de QIs ligadas ao sexo.
• Alguns pesquisadores afirmam que homens e mulheres têm QI médio igual a 100.
Entretanto, esses QIs diferem acentuadamente em termos de variabilidade
em torno da média.
4251
0011 0010 1010 1101 0001 0100 1011
• A distribuição do QIs masculinos contém uma porcentagem maior de
valores extremos – representativos de sujeitos brilhantes e de sujeitos
medíocres – enquanto que a distribuição de QIs femininos contém
uma porcentagem maior de valores localizados próximos à média.
4251
0011 0010 1010 1101 0001 0100 1011• Em virtude do desvio padrão ser uma medida de variabilidade, essas diferenças ligadas ao sexo deveriam refletir no valor do desvio padrão de cada distribuição de
QIs. Poderíamos, assim, verificar, por exemplo, que para os indivíduos do
sexo masculino e que para os indivíduos do sexo feminino.
105
4251
0011 0010 1010 1101 0001 0100 1011
• Se conhecêssemos o desvio de cada conjunto de valores de QI e
admitíssemos que cada conjunto tivesse distribuição normal,
poderíamos estimar e, em seguida, comparar as porcentagens de
indivíduos do sexo masculino e indivíduos do sexo feminino
localizadas numa dada amplitude de QIs.
4251
0011 0010 1010 1101 0001 0100 1011
Distribuição de QIs masculinos
4251
0011 0010 1010 1101 0001 0100 1011
Distribuição de QIs femininos
4251
0011 0010 1010 1101 0001 0100 1011CONCLUSÕES
• O desvio padrão e a curva normal nos permite comparar os QIs femininos e
masculinos ao longo de toda a distribuição.
4251
0011 0010 1010 1101 0001 0100 1011
• Por exemplo: se medirmos a linha base da distribuição de QIs masculinos em unidades de desvio padrão, ficaremos sabendo que 68,25% dos valores caem entre -1sigma e + 1sigma. Desse modo, 68,25% dos representantes do sexo masculino terão, nas condições propostas QIs entre 90 e 110.
4251
0011 0010 1010 1101 0001 0100 1011
RESOLUÇÃO DOS EXERCÍCIOS DA APOSTILA DO ANGLO
AULAS 18 E 19 - ESTATÍSTICA
SETOR 1102
PÁGINA 19
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 1: Uma prova de matemática constou de 20 testes apresentando a seguinte distribuição por assunto:
ASSUNTO FREQUÊNCIA PORCENTAGEM
Geometria 6
Álgebra 8
Aritmética 4
Cálculo 2
TOTAL 20
a) Complete a coluna de porcentagem.b) Represente estes dados num gráfico de barras verticais.
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 1: Resolução (item a)
%101,0202
:Cálculo
%202,0204
:Aritmética
%404,0208 :Álgebra
%303,0206
:Geometria
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 1: Resolução (item a – continuação)
ASSUNTO FREQUÊNCIA PORCENTAGEM
Geometria 6 30%
Álgebra 8 40%
Aritmética 4 20%
Cálculo 2 10%
TOTAL 20 100%
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 1: Resolução (item b)
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 2: Nas aulas de Educação Física de um colégio são praticados três esportes: vôlei, futebol e basquete. Cada um dos 300 alunos opta por um único esporte. Sabendo que 75 alunos escolheram futebol, responda:
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 2: a) Quanto mede em graus o ângulo do setor circular
que corresponde ao número de alunos que optaram por futebol?
90 x 300360 . 75
x
75 360300
oo
o
x
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 2: b) Quantos alunos optaram por basquete, se o
ângulo do setor circular correspondente aos alunos que escolheram vôlei mede 120º.
125 Assim,
150
360300
150 36012090
360 basquetevôleifutebol
o
o
oooo
o
x
x
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 3: Foram perguntadas as idades dos 10 primeiros alunos matriculados num determinado curso noturno e obteve-se a seguinte seqüência de idades:
17, 20, 19, 18, 21, 16, 18, 21, 21, 19
Pede-se, obter:
a) Idade médiab) Mediana (Md)c) Moda (Mo)d) Variância (σ2)e) Desvio padrão (σ)
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 3a) Idade média: Resposta
19
1021.32019.218.21716
x
21) 21, 21, 20, 19, 19, 18, 18, 17, (16, : temosOrdenando,
x
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 3b) Mediana: Resposta
19
21919
:centrais termosdos Média
21) 21, 21, 20, 19, 19, 18, 18, 17, (16, : temosOrdenando,
Md
Md
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 3c) Moda: Resposta
21
:frequênciamaior com aparece quevalor
21) 21, 21, 20, 19, 19, 18, 18, 17, (16, : temosOrdenando,
Mo
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 3d) Variância: Resposta
8,2
1028
10)1921.(3)1920()1919.(2)1918.(2)1917()1916(
2
2
2222222
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 3e) Desvio padrão: Resposta
67,1
8,2
8,22
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 4: Dois estudantes, A e B, obtiveram as notas abaixo relativas aos quatro bimestres escolares.
A 6 4 5 5B 6 6 4 4
a) Calcule a média das notas de cada aluno.
b) Qual aluno teve uma atuação mais regular?
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 4a) Resposta
54
4466
54
5546
B
A
x
x
4251
0011 0010 1010 1101 0001 0100 1011
Exercício 4 b) Resposta
regular. mais atuação A teve estudante o , Como
1 44
4)54()54()56()56(
22
42
4)55()55()54()56(
A
2
22222
2
22222
B
BB
B
AA
A
4251
0011 0010 1010 1101 0001 0100 1011REFERÊNCIAS BIBLIOGRÁFICAS
• LEVIN, J. Estatística Aplicada a Ciências Humanas, 2ª edição. Trad. Sérgio Francisco Costa. USA: Editora Harbra, 1987.
• NAZARETH, H. Curso Básico de Estatística. São Paulo: Ática, 1994.