Upload
docong
View
214
Download
0
Embed Size (px)
Citation preview
ESTATÍSTICA
Trazem informações que expressam a tendência central e adispersão dos dados.
Tendência Central: Média ( x ), Mediana ( Md ), Moda ( Mo )
Medidas de Dispersão: Desvio Padrão, Variância, Amplitude,
Coeficiente de Variação,
Valor Máximo, Valor Mínimo
DESCRIÇÃO DOS DADOS CONTÍNUOS
ESTATÍSTICA
EXERCÍCIO No 2
Em uma pesquisa sobre infrações de trânsito foram coletados as seguintes quantidades de multas/dia em uma determinada rodovia: 65 66 62 66 63 61 67 63 64 62 68 67 65 64 65 66 63 64 65 66 64 63 64 66 65 63 64 65 64 63 64 63 64 68 69 70
a) Qual foi o tamanho da amostra (n)?
b) Qual é o maior e o menor volume de multas/dia?
c) Faça o agrupamento de dados por valores distintos.
d) Faça o agrupamento em 3 classes.
ESTATÍSTICA
3) Cálculo para agrupamentos em classes
Classes f x fx
39 50 4 44,5 178
50 61 5 55,5 277,5
61 72 5 66,5 332,5
72 83 6 77,5 465
83 94 5 88,5 442,5
Total 25 - 1695,5
MÉDIA
x = S fx / n
S fx = Soma dos produtos
dos valores distintos
com a frequência
n = tamanho da amostra
x = 1695,5 x = 67,8225
EXERCÍCIO No 1
Determine a média, a mediana e a moda para o seguinte conjunto de dados
ESTATÍSTICA
6 5 8 4 7 6 9 7 3
EXERCÍCIO No 2
Determine o menor valor, o maior valor, a média, a mediana e a moda para o seguinte conjunto de dados
ESTATÍSTICA
12 32 54 17 82 99 51 11 44 22
22 33 44 52 76 41 37 10 5 87
EXERCÍCIO No 3
Dado o seguinte agrupamento em classes determine:
ESTATÍSTICA
Classes f
1,60 1,65 10
1,65 1,70 15
1,70 1,75 22
1,75 1,80 18
1,80 1,85 3
Total 68
a) os pontos médios de cada classe
b) a classe modal
c) a moda bruta
d) a classe mediana
e) a mediana por agrupamento de classes
f) a média por agrupamento de classes
ESTATÍSTICA
1) Dado o conjunto de dados:
a) apresente a disposição em rol;
b) o Percentil 50,
c) o Primeiro Quartil,
d) a Média,
e) a Moda e
f) a Mediana
EXERCíCIOS
10 13 24
45 66 77 11
14 26 33 65
21 57
ESTATÍSTICA
2) Em uma amostra com 2789 valores qual é a posição do oitavo decil, da mediana, do segundo decil, do terceiro quartil e do segundo quartil?
ESTATÍSTICA
É frequentemente chamada de variabilidade.Medidas mais comuns: Variância, Desvio Padrão, Amplitude
e Coeficiente de Variação
DISPERSÃO DOS DADOS
f
x
Dispersão dos dados
na população
Dispersão dos dados
na amostra
ESTATÍSTICA
É uma forma de se ver o quanto os dados se afastam da média.Exemplo: Vilarejo com apenas 11 pessoas
135cm 152cm136cm 152cm138cm 157cm141cm 163cm143cm 170cm
152cm
Dispersão na População
Média = 149cm
Mediana e Moda = 152cm
Valor Máximo = 170cm
Valor Mínimo = 135cm
Amplitude = 35cm
Alturas de 11 pessoas
ESTATÍSTICA
Alturas (N=11) x - x (x - x)2
135cm 135-149 -14 196136cm 136-149 -13 169138cm 138-149 -11 121141cm 141-149 -8 64143cm 143-149 -6 36152cm 152-149 3 9152cm 152-149 3 9152cm 152-149 3 9157cm 157-149 8 64163cm 163-149 14 196170cm 170-149 21 441Total 1314
Dispersão na População
s2 Variância
= 1314 / 11
= 119,454 cm2
s Desvio Padrão
= 119,454
= 10,92 cm
Soma dos desvios quadráticos
s2 = S ( x - x )2 / N
ESTATÍSTICA
VARIÂNCIA E DESVIO PADRÃO NA POPULAÇÃO
Variância da população
Desvio Padrão da população = Raiz quadrada da variância
s s2
Como a dispersão nas amostras é menor do que na população, se faz um ajuste matemático.
ESTATÍSTICA
Variância da Amostra ( s2 ou v )
s2 = S ( x - x )2 / ( n -1 )
Desvio Padrão da amostra ( s ou DP ) = Raiz quadrada da variância
s s2
A dispersão nas amostras é menor do que na população, por isso é que se faz este ajuste matemático
VARIÂNCIA E DESVIO PADRÃO NA AMOSTRA
Definição: Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim,
para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e
obtemos o desvio padrão. Assim, o desvio padrão de uma variável X cujos valores são x1, x2, ..., xn, é dada por
O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for seu valor maior será a dispersão dos dados
da amostra.Exemplo:
2 2 21 2( ) ( ) ... ( )nx MA x MA x MA
DP Vn
Desvio-padrão
ESTATÍSTICA
SIGNIFICADO:
É um modo de representar a dispersão dos dados ao redor da média.
DESVIO PADRÃO
f
xMédia
ESTATÍSTICA
A curva A mostra uma dispersão dos dados maior do que a curva B, logo o desvio padrão de A é maior do que o de B.
DESVIO PADRÃO
f
xMédia
Curva A Curva B
x
f
Média
ESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
O desvio padrão depende da unidade de medida usada,assim um desvio medido em dias será maior do que um medidoem meses.
O coeficiente de variação expressa o desvio-padrão comoporcentagem do valor da média.
COEF. VARIAÇÃO = 100 . DESVIO PADRÃO
MÉDIA
Quanto menor for este coeficiente mais homogênea é a amostra.
Variância
Definição: Define-se a variância(V) como sendo a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra. Assim, se as n observações de uma variável X são x1, x2, ..., xn, a variância é
22 2 2
1 1 2
( )( ) ( ) ... ( )
n
ii n
x MAx MA x MA x MA
Vn n
1 2 ... nx x xM A
n
onde é a média aritmética das
observações
Observação: A variância de uma amostra é mais comumente definida como acima, mas substituindo o denominador por n-1 (isto é feito para que ela seja um estimador não enviesado da verdadeira variância da população). Para amostras grandes, ambas as expressões dão praticamente o mesmo resultado.
Desvio-padrão
Definição: Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão. Assim, o desvio padrão de uma variável X cujos valores são x1, x2, ..., xn, é dada por
2 2 21 2( ) ( ) ... ( )nx MA x MA x MA
DP Vn
O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for seu valor maior será a dispersão dos dados da amostra.Exemplo:
ESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
Classificação da proporção que o desvio padrão apresenta sobre a média.
GRAU DE HOMOGENEIDADE DOS DADOS
até 10% ÓTIMO
de 10% a 20% BOM
de 20% a 30% REGULAR
acima de 30% RUIM
ESTATÍSTICA
EXERCÍCIOS
1) Determine a média, a amplitude, a variância, o desvio padrão e o coeficiente de variação da seguinte amostra de dados:
4 5 5 6
6 7 7 8
ESTATÍSTICA
Pesquisa Mercadológica (Índice de satisfação na população)Pesquisa Epidemiológica (Prevalência de uma doença na população)Pesquisa Eleitoral (Percentagem de votos para cada candidato)Perfil Socioeconômico da População (Grau de escolaridade, Renda)
APLICAÇÕES DE AMOSTRAGEM
População
Amostra
Na População Parâmetros
Na Amostra Estatísticas
Inferência Estatística
ESTATÍSTICA
Economia (É mais barato levantar dados de uma parcela da população)
Tempo (É mais rápido)
Quando a população for pequena (n > 0,8.N)
Quando a característica for de fácil mensuração (Sim ou Não)
Quando houver a necessidade de alta precisão (Censo IBGE)
POR QUE USAR A AMOSTRAGEM?
QUANDO NÃO USAR A AMOSTRAGEM?
ESTATÍSTICA
AMOSTRAGEM ALEATÓRIA SIMPLES
(Tem que obedecer a propriedade de qualquer elemento da populaçãoter a mesma chance de pertencer à amostra. Pode-se utilizar uma tabelade números aleatórios ou sorteios)
AMOSTRAGEM ALEATÓRIA SISTEMÁTICA
(Após obter-se a lista dos elementos da população, sorteia-se a entrada esegue-se a relação N/n.)
AMOSTRAGEM ALEATÓRIA ESTRATIFICADA
(Elabora-se a amostra através do perfil conhecido da população.Exemplo: Se na UFSC 70% são alunos e 30% Funcionários, a amostra éconfeccionada obedecendo-se estes parâmetros.)
TIPOS DE AMOSTRAGEM
ESTATÍSTICA
AMOSTRAGEM NÃO ALEATÓRIA
(De fácil obtenção.)
AMOSTRAGEM PARA ESTUDOS COMPARATIVOS
(Não visa a descrição de uma população, mas a comparação entregrupos diferentes. Exemplos: Comparar as taxas de tabagismo emindivíduos com câncer de pulmão e sadios.)
OUTROS TIPOS DE AMOSTRAGEM
Procure respeitar o Plano de Amostragem para que seja alcançada uma amostra representativa da população.
ESTATÍSTICA
Fórmula Genérica
Sejam: n0 = Primeira aproximação para o tamanho da amostrae = Erro Amostral Tolerável (exemplo: 0,05)
n = Tamanho da AmostraN = Tamanho da População
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
n0 = 1 / e2 n = (N . n0) / (N + no)
ESTATÍSTICA
Fórmula para variável quantitativa, desvio conhecido e população infinita
Sejam: n = Tamanho da Amostraz = Nível de confiança expresso em desvio padrão (95%) = 1,96s = Desvio padrão da populaçãoe = Erro do estudo expresso na mesma unidade do desvio padrão
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
n = (z . s /e)2
ESTATÍSTICA
Fórmula para variável quantitativa, desvio desconhecido e população infinita
Sejam: n = Tamanho da Amostraz = Nível de confiança expresso em desvio padrão (95%) = 1,96s = Desvio padrão de uma amostra previamente selecionadae = Erro do estudo expresso na mesma unidade do desvio padrão
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
n = (z . s/e)2
ESTATÍSTICA
Fórmula para variável quantitativa, desvio conhecido e população finita
Sejam: n = Tamanho da Amostraz = Nível de confiança expresso em desvio padrão (95%) = 1,96s = Desvio padrão populaçãoe = Erro do estudo expresso na mesma unidade do desvio padrãoN = Tamanho da População
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
n = z2 . s 2 . N
z2 . s 2 + e2 . (N-1)
ESTATÍSTICA
Fórmula para variável quantitativa, desvio desconhecido e população finita
Sejam: n = Tamanho da Amostraz = Nível de confiança expresso em desvio padrão (95%) = 1,96s = Desvio padrão uma amostra previamente selecionadae = Erro do estudo expresso na mesma unidade do desvio padrãoN = Tamanho da população
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
n = z2 . s2 . N
z2 . s2 + e2 . (N-1)
ESTATÍSTICA
Populações infinitas com proporção conhecida
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
z2 . p . (1-p))
e2
Onde: n= Tamanho da Amostra
z = Nível de confiança expresso em desvio padrão (95%) = 1,96
e = Erro Amostral Tolerável expresso em proporção (exemplo: 0,05)
p = Proporção do evento na População (prevalência de um evento)
n =
ESTATÍSTICA
Populações finitas com proporção conhecida
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
(N . z2 . p . (1-p))
(e2 . (N-1) + z2 . p . (1-p))
Onde: n = Tamanho da amostraN = Tamanho da População
z = Nível de confiança expresso em desvio padrão (95%) = 1,96
e = Erro Amostral Tolerável expresso em proporção (exemplo: 0,05)
p = Proporção do evento na População (prevalência de um evento)
n =
ESTATÍSTICA
Relação entre o tamanho da população e o tamanho da amostra
RELAÇÃO ENTRE (n) E (N)
n
N
600
500
400
300
200
100
0
0 500 1000 1500 2000 2500 3000 3500
ESTATÍSTICA
EXERCÍCIOS
1) Determine o tamanho da amostra para uma pesquisa eleitoralem uma cidade com 200.000 eleitores, adotando uma margem deerro de 2 pontos percentuais. Utilize a fórmula genérica.
ESTATÍSTICA
Tabela é a forma não discursiva de apresentar informações, das
quais o dado numérico se destaca como informação central.
Uma tabela estatística conterá necessariamente uma série ou
uma distribuição de frequência.
Vantagens:- Permitem a síntese dos resultados;
- Auxiliam o pesquisador na análise dos dados e
- Facilitam a compreensão das conclusões do autor.
TABELAS
ESTATÍSTICA
NORMAS PARA A CONFECÇÃO DE TABELAS
São numeradas consecutivamente com algarismos arábicos;
Os números são precedidos da palavra “Tabela”;
No topo deve estar o título que indica a natureza e as abrangênciasgeográficas e temporal dos dados numéricos;
O centro da tabela é representado por uma série de colunas esubcolunas onde são alocados os dados;
No rodapé deve-se colocar a fonte (o responsável pelos dados) eopcionalmente uma nota geral ou uma nota específica;
A moldura deve conter no mínimo 3 traços horizontais;
Não se deve fechar uma tabela com traços verticais em suasextremidades.
ESTATÍSTICA
Séries Cronológicas (Temporais ou Históricas)
Anos Percentual (%)
1999 25,74
2000 26,85
2001 27,94
2002 32,45
Fonte: Hipotética
Tabela 1: Prevalência da Doença X na Cidade Y
ESTATÍSTICA
Séries Geográficas (Territoriais)
Cidades Percentual
Itajaí 10,44
Lages 29,45
Florianópolis 8,66
Blumenau 9,82
Fonte: Hipotética
Tabela 2: Prevalência da Doença X no Ano de 2003
ESTATÍSTICA
Séries Especificativas
Segmento populacional Percentual
Crianças 60,25
Jovens 20,72
Adulto 2,75
3a Idade 5,82
Fonte: Hipotética
Tabela 3: Prevalência da Doença X no Ano de 2003 em Florianópolis
ESTATÍSTICA
Séries Mistas (Ex: Especificativa-Cronológica-Geográfica)
Produtos 2001 2002
Fpolis Lages Fpolis Lages
Cosméticos 24,24 9,34 25,95 9.98
Vestuário 112,72 27,45 111,75 29,48
Audio 86,75 18,45 79,37 19,57
Video 1,95 0,85 2,01 0,84
Fonte: Hipotética
Tabela 4: Vendas de alguns produtos por ano e cidade (milhares)
ESTATÍSTICA
Distribuições de Frequência
Pesos Frequência Frequência Acumulada
64 51 51
65 100 151
66 22 173
67 14 187
Total 187 -
Fonte: Hipotética
Tabela 5: Distribuição de frequência dos pesos corporais de uma amostra (valores em quilogramas)
ESTATÍSTICA
Gráfico é a forma geométrica de apresentação dos dados e
respectivos resultados de sua análise.
A escolha do modelo ideal de representação gráfica depende das
preferências e do senso estético do elaborador.
Vantagens:- Permitem a síntese dos resultados;
- Auxiliam o pesquisador na análise dos dados e
- Facilitam a compreensão das conclusões do autor.
GRÁFICOS
ESTATÍSTICA
NORMAS PARA A CONFECÇÃO DE GRÁFICOS
Deve facilitar a interpretação dos dados para um leigo;
Não há a necessidade de se colocar título se estiver na mesma páginada tabela correspondente;
Há a necessidade de se colocar o título se a tabela correspondentenão estiver na mesma página.
O senso estético individual determina o espaço do gráfico (L x A);
As colunas, barras, linhas e áreas gráficas devem ser ordenadas demodo crescente ou decrescente, mas a ordem cronológica prevalece;
ESTATÍSTICA
ORIGEM DOS GRÁFICOS
O diagrama cartesiano é a figura geométrica que deu origem à
técnica de construção de gráficos estatísticos.
Utiliza-se o primeiro quadrante do sistema de eixos coordenados
cartesianos ortogonais.
1o QuadranteAbscissas (eixo x)
Ordenadas (eixo y)
Eixo y Frequências
Eixo x Valores da Variável