25
Prof. Luciana [email protected]

Cepp5 aula 01 - fundamentos de estatística

Embed Size (px)

Citation preview

Page 1: Cepp5   aula 01 - fundamentos de estatística

Prof. [email protected]

Page 2: Cepp5   aula 01 - fundamentos de estatística

Originou-se com a coleta e construção de tabelas de dados para o governo. A situação evoluiu e esta coleta de dados representa somente um dos aspectos da Estatística.

Hoje em dia podemos adotar a seguinte definição para a Estatística:

A Estatística é uma ciência (ou método) baseada na Teoria das Probabilidades, cujo objetivo principal é nos auxiliar a tomar decisões ou tirar conclusões em situações de incerteza, a partir de informações numéricas (dados).

Page 3: Cepp5   aula 01 - fundamentos de estatística

Abrange a coleção, organização e interpretação de dados de acordo com procedimentos bem definidos

É o coração de toda disciplina científica, onde necessitamos tirar conclusões sobre os assuntos que estamos estudando .

Page 4: Cepp5   aula 01 - fundamentos de estatística

São obtidos pela percepção através dos sentidos (observação) ou resultantes de um processo de medição usando p.ex. relógios, balanças, réguas, operações de contagem ou qualquer outro procedimento ou instrumento de medição objetivamente definido.

Essas observações respondem questões tais como :◦ Qual tipo◦ Quanto◦ Quantas vezes◦ Quanto distante◦ Quanto frequente◦ Etc...

Podem serrepresentadas

pornúmeros

Page 5: Cepp5   aula 01 - fundamentos de estatística

Números sempre apresentam menos duvida quanto a seu significado:◦ Sem números:

A maioria dos pacientes sobrevive à determinada cirurgia.

◦ Com números: 99 em cada 100 sobrevivem à cirurgia 52 em cada 100 sobrevivem à cirurgia

Page 6: Cepp5   aula 01 - fundamentos de estatística
Page 7: Cepp5   aula 01 - fundamentos de estatística

Observações do mundo são convertidas em números.

Os números são manipulados e organizados e então os resultados são interpretados e reaplicados no mundo, que agora está mais explicado e previsível que antes da análise de dados.

Page 8: Cepp5   aula 01 - fundamentos de estatística

A manipulação , organização e interpretação de dados tem três principais aspectos :A. Redução de Dados: Significa “sintetizar os dados“. De

uma grande quantidade de números desorganizados, não conseguiremos tirar nenhuma conclusão. Usaremos técnicas que reduzirão essa grande massa de dados em um pequeno grupo de números capazes de representar a essência de todo o conjunto. É a chamada ESTATÍSTICA DESCRITIVA.

Page 9: Cepp5   aula 01 - fundamentos de estatística

B. Inferência: Significa admitir que provavelmente algo é verdadeiro, em função de informações já disponíveis. Dificilmente conseguiremos estudar todos os elementos de uma população. Ex.: A renda dos eleitores da cidade de Santos.

A população à ser entrevistada é muito grande:

Entrevistar cada um dos 150.000 eleitores: caro, lento e pode ser até pouco preciso.

Page 10: Cepp5   aula 01 - fundamentos de estatística

Podemos escolher aleatoriamente (conceito de sorteio com olhos vendados) uma certa quantidade de eleitores (por exemplo 1000 eleitores) e com base nessa “amostra” , tirar conclusões sobre a renda de todos os eleitores “população”.

Obviamente, nunca a amostra será exatamente igual a população, pois é somente uma parte dela, estando associado sempre ao uso da inferência, um erro chamado de erro amostral. Esse erro no entanto é conhecido e fará parte da apresentação dos resultados.

Ex.:Pesquisa Eleitoral: O candidato A terá 40 % ± 3%. Esses 3% estão relacionados ao erro amostral, porém é um valor conhecido e considerado por todos na análise do eleitorado.

Page 11: Cepp5   aula 01 - fundamentos de estatística

C. Identificação de Relações: Significa saber se há e no caso de existir, descobrir qual é a relação entre dois grupos de observações. Em outras palavras, o conhecimento de um grupo de dados, permite-nos saber sobre o outro grupo de dados?

Ex.: Há ligação entre a pressão sanguínea e as doenças cardíacas? Se houver, como é essa relação?

Há dois tipos de associações descobertas pela análise estatística:

I. Não controlamos as variáveis. Simplesmente coletamos os dados e descobrimos se há ou não associação.

II. Controlamos pelo menos uma das variáveis e acompanhamos o resultado da outra variável.

Page 12: Cepp5   aula 01 - fundamentos de estatística

Na maioria das vezes uma técnica é complemento da outra.

Descobriu–se há um tempo atrás, que em um grupo de pessoas com pressão arterial elevada, a percentagem de pessoas com problemas cardíacos era elevada. Hoje em dia controla–se a pressão em determinados níveis para diminuir a chance de um infarto.

Page 13: Cepp5   aula 01 - fundamentos de estatística

Introdução:

◦ Números por si só não representam nada. É necessário construir um sistema para unir o mundo dos nossos sensos com o mundo dos números ⇒ correspondência entre os dois.

Objetos:

◦ Qualquer fonte de dados: indivíduos, coisas físicas, biológicas, localizações geográficas, períodos de tempo, eventos, etc... Qualquer coisa onde observações possam ser feitas.

Ex.: No mundo dos negócios: Indivíduos: empregados ou consumidores Coisas físicas: produtos Localização geográfica: locais de venda ou de estocagem Período de tempo: dias de trabalho ou período de vendas Eventos: liquidações

Page 14: Cepp5   aula 01 - fundamentos de estatística

Variáveis:

◦ Sendo os objetos nossa fonte de dados, o que iremos medir é(são) alguma(s) característica(s) desse objeto. Um objeto nada mais é que um grupo de características.

◦ Ex.: Estamos vendo uma criança brincando com uma bola vermelha. A bola é na realidade um objeto com uma variedade de características:

As características de um objeto que podem assumir dois ou mais valores são chamadas variáveis.

O que estamos vendo?

Alternativas

Formato Esférico Elíptico

Cor Vermelha Azul, amarela

Composição Borracha Plástico

Diâmetro 30cm 10cm

Peso 500g 200g

Page 15: Cepp5   aula 01 - fundamentos de estatística

Escalas:◦ Uma escala é um esquema para a representação numérica dos

valores de uma variável. Existem 4 tipos:

Page 16: Cepp5   aula 01 - fundamentos de estatística

Escalas:

Page 17: Cepp5   aula 01 - fundamentos de estatística

Escalas:

  Variáveis

Propriedades  Nominais

Ordinais Intervalares

Razão

Classificação + + + +

Hierarquização - + + +

Distância - - + +

Zero Absoluto - - - +

Page 18: Cepp5   aula 01 - fundamentos de estatística

Escala Operações Empíricas Básicas

Estrutura Matemática do Grupo

Estatísticas Aplicáveis (Invariantes)

Exemplos Típicos

Nominal Determinação da Similitude

Grupo de permutações x' = f (x) onde f (x) significa qualquer 

substituição de um elemento por outro

Número de casos, modo, 

correlação.

Numeração de jogadores de futebol, atribuição de número de classes.

Ordinal Determinação de maior ou menor.

Grupo isotônico x' = f (x) onde f (x) significa qualquer função monotônica crescente

Mediana, percentil, correlação de ordem (Tipo 0).

Dureza de minerais, qualidade do couro, madeira, etc.

De Intervalos Determinação da igualdade ou das diferenças de intervalos.

Grupo linear geral x'= ax+b Média, desvio-padrão correlação de ordem (tipo I) correlação de produto momento.

Temperatura em centígrados ou Farenheit, energia, datas do calendário, escores padronizados em testes de aptidões.

De Razão Determinação da igualdade de razões

Grupo da semelhança x' = ax

Média geométrica, coeficiente de variação. 

Transformação de decibéis.

Longitude, peso, resistência etc., escala de altura dos sons, graus de inclinação.

Page 19: Cepp5   aula 01 - fundamentos de estatística

Qualitativas × Quantitativas:

◦ Uma variável é quantitativa quando o resultado da observação é numérica (representando uma quantidade) e qualitativa quando resulta em uma qualidade ou atributo.

Page 20: Cepp5   aula 01 - fundamentos de estatística

Discretas × Contínuas:◦ Variáveis discretas são aquelas que assumem valores que podem ser associados aos

números naturais. O conjunto de valores pode ser finito ou infinito enumerável. Surge naturalmente de contagens. Inclui–se nessa escala as variáveis em que a escala de medidas consiste de um conjunto de categorias como p.ex. o tipo sanguíneo. Em alguns casos são chamadas de variáveis categóricas.

◦ Um pequeno dado de seis lados, muito comum em jogos de tabuleiros, ele é o melhor exemplo para uma Variável Aleatória Discreta Finita. Pois todas as vezes em que lançarmos o dado, ele sempre nos dará um "valor" inteiro. Não existe a possibilidade que ele caia de "lado" nos dando um valor surpreendente como 2,5555.

◦ O seu Espaço Amostral é {1,2,3,4,5,6} não havendo nenhum valor intermediário.

◦ Outro exemplo de Variável Aleatória Discreta Infinita, seria o número de carros que chegam no pedágio, sabemos que virá infinitamente carros, no entanto, nunca chegará a metade de um carro, não haverá "frações" no numero de carros. O resultado a princípio não é completamente conhecido, mas sempre Descritível com facilidade.

Page 21: Cepp5   aula 01 - fundamentos de estatística

Discretas × Contínuas:◦ Variáveis contínuas têm conceitualmente um número ilimitado de valores. Basta que o

instrumento de medição tivesse precisão para tal. Na realidade os instrumentos tem precisão limitada ( discreta ) porém o modelo contínuo é útil na prática.

◦ Uma Variável Aleatória que pode assumir QUALQUER VALOR NUMÉRICO em um DETERMINADO intervalo ou coleção de intervalos é chamada de variável aleatória contínua.

◦ Imagine nas olimpíadas o lançamento do martelo (podendo ser o disco, lança ou outro), sabemos de antemão que os valores do lançamento de martelo atingem no máximo a distancia de 60 metros e a distancia mínima classificatória de 30. Ou seja, todos os lançamentos serão dentro desse intervalo podendo assumir uma infinidade de possibilidades, pois sempre existirá uma fração para medir as menor diferença possível entre um lançamento a outro, como 59 metros, 25 centímetros, 12milimetros e assim por diante.

◦ Neste caso x seria uma variável aleatória contínua que assume qualquer valor no intervalo 30 (maior igual a) x (menor ou igual a) 60

Page 22: Cepp5   aula 01 - fundamentos de estatística

◦ Exemplos de Variáveis Quantitativas Altura em cm Renda em R$ Peso em kg Temperatura em ºC Idade em dias Tamanho da família em nº pessoas

◦ Exemplos de Variáveis Qualitativas Temperatura : quente/morno/frio Velocidade do vento : forte/médio/ fraco Tipo de clima : quente/temperado/ frio Notas: A/B/C/D/E

◦ Exemplos de Variáveis Qualitativas Nominais Cidade de origem Cor do cabelo CEP Partido político

Page 23: Cepp5   aula 01 - fundamentos de estatística

Constantes : Quando uma característica de um objeto pode assumir um único valor, ela é

chamada constante (não variável). Ex.: Número de horas de um dia , etc...

Notação: Frequentemente, usam–se letras para indicar variáveis. As letras mais usadas

são as últimas do alfabeto: (u, v, x, y e z). Usamos índices para distinguir os valores obtidos dos vários objetos em

estudo. Ex.: Os objetos estudados (1, 2, 3 e 4) apresentaram os seguintes valores nas

variáveis X e Y : X1 , X2 , X3 , X4 , Y1 , Y2 , Y3 e Y4 X1 : valor que o objeto 1 apresenta na variável X X2 : valor que o objeto 2 apresenta na variável X Y4 : valor que o objeto 4 apresenta na variável Y

Page 24: Cepp5   aula 01 - fundamentos de estatística

1. Identifique cada dado abaixo como discreto ou contínuo:a) Cada cigarro tem 16 ou13 mg de alcatrão

b) O altímetro do avião da TAM indica uma altitude de 21459 pés.

c) Uma pesquisa efetuada com 1015 pessoas indica que 40 delas são assinantes da revista Terra.

d) O radar indica que Rivaldo bateu a ultima falta a 98,5 km / hora.

e) De 1000 consumidores pesquisados , 930 reconheceram a marca de massas Adria.

f) O tempo total gasto no trânsito por um motorista de São Paulo é de 325 horas.

g) Ao completar um dia de treinamento, Ronaldinho pesava 2,5 Kg à menos que no início do treino.

h) Preço de um litro de leite .

i) O tipo sanguíneo classificado como 1 para as pessoas que tenham sangue do tipo A.

j) O numero de pessoas da classe que nasceram em Santos.

Page 25: Cepp5   aula 01 - fundamentos de estatística

2. Determine a escala de mensuração mais adequada para cada uma das variáveis (nominal, ordinal, de intervalo, de relação).

a) Conteúdo de nicotina (em mg) de um cigarro.

b) Numero do CPF dos contribuintes.

c) Temperatura ( em ºC ) de uma amostra de crianças com febre.

d) Graus finais {A, B, C, D, E} para estudantes do 1º grau.

e) Código de Endereçamento Postal de uma rua.

f) Rendas anuais das enfermeiras.

g) Carros classificados como pequeno, médio e grande.

h) Numero de sua conta corrente como um nome para a sua conta.

i) Saldo de sua conta corrente como uma medida da quantidade de dinheiro que você tem.

j) Saldo de sua conta corrente como uma medida de sua riqueza.

k) O numero que você pegou no balcão de uma loja (..., 25, 26, 27, ...) como uma medida do instante que você chegou, com o propósito de atendimento em uma fila.