Estat Descrit Anal Explorat de Dados

Embed Size (px)

Citation preview

1Ministrio da Educao Universidade Tecnolgica Federal do Paran/Campus Curitiba Departamento Acadmico de Matemtica (DAMAT) Probabilidade e Estatstica Prof: Silvana Heidemann Rocha Aluno(a): ___________________________________ Data: ___/___/____

INTRODUO ESTATSTICA - Aula 01 - Vocabulrio e viso geral da disciplina Fenmenos, experimentos e modelos *Determinsticos *Aleatrios ou probabilsticos1*Caticos

Variabilidade, incerteza, acaso, aleatoriedade, possibilidade, probabilidade Problema: Como medir a incerteza presente numa situao? Histrico, objetivos e principais ramos da Estatstica Populao, censo, recenseamento Amostra, amostragem, amostras representativas, amostras viciadas Tcnicas de amostragemo Amostragem com reposio ou sem reposio Amostragem aleatria simples Amostragem sistemtica Amostragem proporcional estratificada Amostragem por conglomerados Amostragem por convenincia Amostras aleatrias tericas ou matematicamente idealizadas Amostras aleatrias experimentalmente possveis

Amostras aleatriaso o

Atributo, varivel, varivel aleatria Classificao das variveis*Qualitativas (nominais, ordinais) * Quantitativas (discretas, contnuas)

Parmetro, estatstica, estimador, estimao, tendenciosidade (vcio, vis) Diferena entre Estatstica, estatstica e estatsticas. Fases de um levantamento estatstico:o o o o o o o o Definio do problema, Planejamento Coleta de dados Crtica dos dados Apurao ou organizao dos dados Apresentao dos dados Anlise e interpretao dos resultados Tomada de deciso

Pesquisa piloto Diferena entre dados, informao e propaganda Cdigo de tica para pesquisadores cientficos e cdigo de tica para estatsticos O uso de ferramentas estatsticas por engenheiros

Um experimento aleatrio um experimento com as seguintes caractersticas: i) Reprodutibilidade, isto , o experimento pode ser reproduzido inmeras vezes sob condies inalteradas em sua essncia, ou seja, mantidas constantes as variveis de maior influncia no experimento. ii) Casualidade dos resultados individuais, isto , os resultados individuais so imprevistos, dependem do acaso. iii) possvel descrever um conjunto contendo todos os resultados possveis para o experimento. iv) Regularidade, isto , quando o experimento reproduzido um nmero muito grande de vezes, aparece uma configurao definida ou regularidade do comportamento do experimento. Essa regularidade permite determinar um modelo matemtico para se analisar o experimento. (Cf. MEYER, cap. 1 p. 9, 15, 285 a 287; GNEDENKO, B. V., The theory of probability. Moscow: Mir Publishers, 1969, p. 40).

1

2 EXERCCIOS: Os exerccios a seguir devem ser feitos mediante pesquisa (livros, dicionrios, internet citar as fontes de referncias): 1) Leia com ateno o captulo 1 (p. 1 a 25), a introduo do captulo 4 (p. 66 a 72), a introduo do captulo 6 (p. 110 e 111), a introduo do captulo 12 (p. 284 a 287), a introduo do captulo 13 (p. 308 a 314) e a introduo do captulo 14 (p. 329 a 331) do livro MEYER, Paul L., Probabilidade: aplicaes estatstica. 2 ed. Rio de Janeiro: LTC, 1983. Leia tambm o prlogo e os captulos 1, 2 e 3 do livro STEWART, Ian, Ser que Deus joga dados?: a nova matemtica do caos. Rio de Janeiro: Jorge Zahar, 1991. Neste primeiro contato com a disciplina de Estatstica, no necessrio entender tudo o que for lido nas pginas indicadas, mas a leitura atenta lhe auxiliar em alguns dos exerccios abaixo. 2) Cite pelo menos dois experimentos de cada tipo: a) Determinstico b) Aleatrio c) Catico

3) Quais so as caractersticas de um experimento aleatrio? 4) H ou no variabilidade nos fenmenos classificados como determinsticos? Justifique. 5) Qual a diferena entre variabilidade, incerteza, acaso e probabilidade? 6) Conceitue ou defina: a) Estatstica (com maisculo) e) Amostra h) Parmetro l) Tendenciosidade b) Populao f) Amostragem i) estatstica (com minsculo) m) Varivel c) Censo d) Recenseamento g) Amostra aleatria j) Estimador n) Varivel aleatria

7) Apresente pelo menos 3 problemas relacionados ao seu curso que so resolvidos atravs de tcnicas estatsticas. 8) Pesquise num site de busca (Google, Altavista, etc) artigos relacionados com cdigo de tica e pesquisa cientfica cdigo de tica para pesquisadores cientficos (engenheiros, mdicos, dentistas, economistas, bilogos, assistentes sociais, estatsticos, etc) cdigo de tica e sua futura profisso.[...] A cincia totalmente amoral e completamente irresponsvel [...].

9) O fsico belga David Ruelle, no seu livro Acaso e caos (So Paulo: UNESP, 1993, p. 222), afirma: Voc concorda com ele? Justifique sua opinio. Procure ler o contexto em que ele afirma isso. 10) Procure em jornais, revistas, internet, etc propaganda. uma matria que esteja usando dados estatsticos como

3 APRESENTAO DE DADOS - Aula 02 Requisitos de uma boa apresentao de dados o Clareza (at os leigos compreendem o que est sendo apresentado) o Objetividade (atinge o fim que se quer atingir) o Conciso ( resumido, mas tambm preciso, exato) Formas de apresentao dos dados o Rols ou listas o Tabelas ou quadros Partes de uma tabela Ttulo (O qu? Quando? Onde?) Cabealho Coluna indicadora Corpo Casa ou clula Rodap o Fonte o Notas o Chamadas Tipos de tabelas Sries estatsticas o Sries temporais, histricas ou cronolgicas o Sries geogrficas, espaciais, territoriais ou de localizao o Sries categricas ou especficas o Sries mistas, conjugadas ou tabelas de dupla entrada Tabelas de distribuio de freqncias o Tabela primitiva (dados brutos) o Tabela sem intervalos de classe (dados no agrupados) o Tabela com intervalos de classe (dados agrupados)o

Tabela de distribuio conjunta ou tabela de freqncia conjunta (paravariveis multidimensionais)

Normas de apresentao de tabelas

4 o Grficos ou diagramas Partes de um grfico Ttulo (O qu? Quando? Onde?) Corpo Rodap (Fonte, notas, chamadas)

Principais tipos de grficos

Barras (simples ou mltiplas) Colunas (simples ou mltiplas) Setores circulares (ou pizza) Linha Cartogramas Polares Diagrama de pontos Diagrama de ramo e folhas Diagrama de caixa (Box plot) Diagrama de Pareto Pictogramas Histogramas (Ex.: histogramas de freqncias, de densidade, de probabilidade) o Histogramas sem intervalo de classe o Histogramas com intervalos de classe Polgonos de freqncias o Polgonos de freqncias simples ou absolutas o Ogivas ou polgonos de freqncias acumuladas Curvas de densidades (para variveis aleatrias contnuas) Diagramas de disperso (para variveis quantitativas bidimensionais)

Normas de apresentao de grficos Alguns erros comuns cometidos na apresentao dos dados o Falta de informaes no ttulo ou no rodap o Falta de identificao nos eixos (em grficos) o Escalas inapropriadas (em grficos) o Recursos pictogrficos desproporcionais o Valorizao de aspectos secundrios em detrimento das informaes principais ________REFERNCIAS: Utilize as referncias indicadas no plano de aulas (ver: http://pessoal.utfpr.edu.br/heidemann) UTFPR. Normas para elaborao de trabalhos acadmicos. Curitiba: Editora UTFPR, 2009.

5 Slides:

APRESENTAO DE DADOSFORMAS DE APRESENTAO: Rols ou listas Tabelas ou quadros Grficos ou diagramas

Exemplo de um rolConsumo de gua mensal, em m3, correspondente a uma amostra de 40 contas da SANEPAR Curitiba - Paran __________________________________________ 14 15 16 19 20 26 31 35 14 15 16 20 22 29 31 35 14 15 18 20 22 30 32 35 15 15 18 20 24 31 33 38 15 15 18 20 25 31 33 41 __________________________________________Fonte: Dados fictcios.

Partes de uma tabelaTaxa de analfabetismo, segundo o ano - Brasil Ano 1970 1980 1991 (1) 1995 (1) 1996 Porcentagem (%) 33,6 25,4 20,1 15,6 14,7

}

ttulo

cabealho corpo casa ou clula

Fonte: IBGE/Pnad (1996). Nota: Faixa etria de 15 anos ou mais. (1) Em 1995 e 1996, exclui a populao rural de Rondnia, Acre, Amazonas, Roraima, Par e Amap.

}

rodap

Sries EstatsticasPopulao mundial, em milhes, segundo o continente 2000 Continente frica Amrica sia Europa Oceania Total Populao (em milhes) 783,7 823,2 3.678,2 745,5 30,0 6.060,6

Sries EstatsticasSistema Penitencirio Perfil do preso Brasil - 1999 Categorias Reincidentes Jovens (entre 18 e 30 anos) Ensino fundamental incompleto Pobres Homens Porcentagem (%) 53(1) 58(1) 74,5 95 96

Fonte: Almanaque Abril Mundo 2001.

Fonte: Ilanud (1996) e Censo Penitencirio (1994 e 1997). (1) Dados referentes populao carcerria do Estado de So Paulo.

Classificao: localizao

Srie geogrfica ou espacial ou de

Classificao: Srie categrica ou especfica

Sries EstatsticasTaxa de analfabetismo, segundo o ano - BrasilAno 1970 1980 1991 (1) 1995 (1) 1996 Porcentagem (%) 33,6 25,4 20,1 15,6 14,7

Sries EstatsticasTaxa de famlias chefiadas por mulheres, em porcentagem, segundo o ano e a regio geogrfica Brasil Regies Norte Nordeste Sudeste Sul Centro-Oeste BrasilFonte: IBGE (1996).

Fonte: IBGE/Pnad (1996). Nota: Faixa etria de 15 anos ou mais. (1) Em 1995 e 1996, exclui a populao rural de Rondnia, Acre, Amazonas, Roraima, Par e Amap.

1980 12,25 16,58 14,89 12,05 13,17 14,65

Ano 1991 15,52 19,46 18,60 16,03 16,95 18,12

1996 18,61 21,92 21,40 18,55 19,98 20,81

Classificao: Srie temporal ou cronolgica ou histrica

Classificao: Srie geogrfico-temporal ou espacial-temporal

6

Tabelas de distribuio de freqnciasExemplo de tabela primitiva:Tabela 1 Estatura, em centmetros, de 30 alunos do colgio X - Curitiba Fevereiro/2002 155 162 155 160 161 162 161 168 163 163 163 160 162 168 155 160 173 155 155 160 167 167 155 167 164 164 168 160 168 168

Tabelas de distribuio de freqnciasEx. de tabela de distrib. de freq. sem intervalo de classe:Tabela 2 - Estatura, em centmetros, de 30 alunos do colgio X Curitiba - Fevereiro/2002 Estatura(cm) Freqncia 155 6 160 5 161 2 162 3 163 3 164 2 167 3 168 5 173 1 Total 30

Fonte: Dados fictcios.

Fonte: Dados fictcios.

Tabelas de distribuio de freqnciasEx. de tabela de distrib. de freq. com intervalo de classe:Tabela 3 - Estatura, em centmetros, de 30 alunos do colgio X Curitiba - Fevereiro/2002 Estatura (cm) 155 | 160 160 | 165 165 | 170 170 | 175 TotalFonte: Dados fictcios.

Tabelas de distribuio de freqnciasEx. de tabela de distribuio de freqncias conjuntas:Pacientes HIV positivos, segundo o nmero de internaes (X) e o nmero de crises com infeces oportunistas (Y) Y X 0 1 2 3 4 Total 0 1 2 Total 84 20 6 110 21 59 11 91 8 35 43 86 2 14 28 44 0 2 12 14 115 130 100 345

Freqncia 6 15 8 1 30

Fonte: Baseado em MAGALHES, M. N.; LIMA, A. C. P. Noes de probabilidade e estatstica. 6 ed. So Paulo: Edusp, 2008, p. 127

Observao: a | b um intervalo fechado esquerda e aberto direita, tal como

a x