24

Princípios de Bioestatística

Embed Size (px)

DESCRIPTION

Autores: Marcelo Pagano & Kimberlee Gauvreau

Citation preview

Page 1: Princípios de Bioestatística

Este livro é uma introdução aos procedimentos estatísticos

baseada em conceitos que preparam os estudantes para conduzir

e avaliar pesquisas. Os autores enfatizam conceitos, e não

somente fórmulas ou memorizações mecânicas, e usam exemplos

práticos e interessantes com dados reais para tornar o material

ainda mais atrativo.

Com capítulos didáticos, Princípios de Bioestatística utiliza

também dados extraídos de estudos publicados para exemplificar

conceitos bioestatísticos, discussões revisadas e expandidas de

muitos tópicos e questões adicionais para auxiliar a clarear

conceitos. Esta obra procura mostrar a bioestatística de uma

maneira fácil de entender, sem minimizar, no entanto, a

importância do assunto.

Aplicações

Livro-texto para a disciplina estatística aplicada às ciências

biológicas e leitura complementar para a disciplina introdução à

estatística nos cursos de Medicina, Saúde Pública e Biologia.

Para suas soluções de curso e aprendizado, visite www.cengage.com.br

Outras obras

Estatística Geral e

Aplicada

Giuseppe Milone

O Método

Fenomenológico

na Pesquisa

Daniel Augusto Moreira

Método nas Ciências

Naturais Sociais

Alda Judith Alves-Mazzotti e

Fernando Gewandsznajder

Pesquisa Médica: A Ética

e a Metodologia

Sonia Vieira e

William Saad Hossne

ISBN 13 978-85-221-0920-3ISBN 10 85-221-0920-6

9 7 8 8 5 2 2 1 0 9 2 0 3

Page 2: Princípios de Bioestatística
Page 3: Princípios de Bioestatística

Princípios de BioestatísticaTradução da 2a edição norte-americana

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página I

Page 4: Princípios de Bioestatística

Pagano, Marcello, 1945–

Princípios de bioestatística / Marcello Pagano, Kim-

berlee Gauvreau ; tradução Luiz Sérgio de Castro Paiva ;

revisão técnica Lúcia Pereira Barroso. — São Paulo :

Cengage Learning, 2004.

Título original : Principles of bioestatistics.

Bibliografia.

ISBN: 978-85-221-0 -

1. Bioestatística 2. Biometria I. Gauvreau, Kimberlee,

1963—. II. Título.

03-5627 CDD-574.015195

Dados Internacionais de Catalogação na Publicação (CIP)

(Câmara Brasileira do Livro, SP, Brasil)

Índice para catálogo sistemático:

1. Bioestatística 574.015195

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página II

Page 5: Princípios de Bioestatística

Princípios de BioestatísticaTradução da 2a edição norte-americana

Marcello PaganoKimberlee Gauvreau

TraduçãoLuiz Sérgio de Castro Paiva

Revisão TécnicaLúcia Pereira Barroso

Bacharel, mestre e doutora em Estatística peloInstituto de Matemática e Estatística da USP

Austrália • Brasil • Japão • Coréia • México • Cingapura • Espanha • Reino Unido • Estados Unidos

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página III

Page 6: Princípios de Bioestatística

Princípios de Bioestatística

Marcello Pagano & Kimberlee Gauvreau

Gerente Editorial: Adilson Pereira

Editora de Desenvolvimento: Eugênia Pessotti

Produtora Editorial: Tatiana Pavanelli Valsi

Produtora Gráfica: Patricia La Rosa

Título Original em Inglês: Principles of Bioestatistics – Second edition ISBN: 0-534-22902-6

Tradução: Luiz Sérgio de Castro Paiva

Revisão Técnica: Lúcia Pereira Barroso

Copidesque: Iná Lúcia Carvalho dos Santos

Revisão: Peterso Rissatti e Regina Elisabete Barbosa

Diagramação: Macquete Produções Gráficas

Capa: Ana Lima

© 2000 de Brooks/Cole, parte da Cengage Learning© 2004 Cengage Learning Edições Ltda.

Todos os direitos reservados. Nenhuma parte deste livro poderá ser reproduzida, sejam quais forem os meios empregados, sem a permissão, por escrito, da Editora.Aos infratores aplicam-se as sanções previstas nos artigos 102, 104, 106 e 107 da Lei no 9.610, de 19 de fevereiro de 1998.

© 2004 Cengage Learning. Todos os direitos reservados.

ISBN 13: 978-85-221-0920-3ISBN 10: 85-221-0920-6

Cengage LearningCondomínio E-Business Park Rua Werner Siemens, 111 – Prédio 20 – Espaço 04 Lapa de Baixo – CEP 05069-900 – São Paulo – SP Tel.: (11) 3665-9900 – Fax: (11) 3665-9901SAC: 0800 11 19 39

Para suas soluções de curso e aprendizado, visitewww.cengage.com.br

Para informações sobre nossos produtos, entre em contato pelo telefone 0800 11 19 39

Para permissão de uso de material desta obra, envie seu pedido para [email protected]

Impresso no Brasil.Printed in Brazil.1 2 3 4 08 07 06 05 04

Page 7: Princípios de Bioestatística

Este livro é dedicado com amor a

Phyllis, John-Paul, Marisa,

Loris, Alice e Lilian.

Neil e Eliza

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página V

Page 8: Princípios de Bioestatística

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página VI

Page 9: Princípios de Bioestatística

Prefácio ................................................................................................................ XIII

1 Introdução ........................................................................................................ 11.1 Resumo do Texto............................................................................................... 21.2 Exercícios de Revisão ....................................................................................... 5Bibliografia............................................................................................................... 5

2 Apresentação de Dados ......................................................................... 62.1 Tipos de Dados Numéricos ............................................................................... 6

2.1.1 Dados Nominais...................................................................................... 62.1.2 Dados Ordinais ....................................................................................... 82.1.3 Dados Substituídos por Postos................................................................ 82.1.4 Dados Discretos ...................................................................................... 92.1.5 Dados Contínuos..................................................................................... 10

2.2 Tabelas ............................................................................................................... 102.2.1 Distribuições de Freqüências .................................................................. 102.2.2 Freqüência Relativa................................................................................. 12

2.3 Gráficos ............................................................................................................. 142.3.1 Gráficos de Barras................................................................................... 142.3.2 Histogramas ............................................................................................ 152.3.3 Polígonos de Freqüência ......................................................................... 162.3.4 Gráficos de Dispersão Unidimensionais ................................................. 192.3.5 Box Plots................................................................................................. 192.3.6 Gráficos de Dispersão Bidimensionais ................................................... 202.3.7 Gráficos de Linha.................................................................................... 21

2.4 Aplicações Adicionais....................................................................................... 222.5 Exercícios de Revisão ....................................................................................... 28Bibliografia............................................................................................................... 33

3 Medidas-Resumo Numéricas .............................................................. 353.1 Medidas de Tendência Central .......................................................................... 35

3.1.1 Média ...................................................................................................... 353.1.2 Mediana .................................................................................................. 373.1.3 Moda ....................................................................................................... 38

Sumário

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página VII

Page 10: Princípios de Bioestatística

3.2 Medidas de Dispersão ....................................................................................... 393.2.1 Amplitude ............................................................................................... 393.2.2 Intervalo Interquartil ............................................................................... 403.2.3 Variância e Desvio-Padrão...................................................................... 423.2.4 Coeficiente de Variação........................................................................... 44

3.3 Dados Agrupados .............................................................................................. 443.3.1 Média de Dados Agrupados.................................................................... 453.3.2 Variância de Dados Agrupados ............................................................... 47

3.4 Desigualdade de Chebychev ............................................................................. 473.5 Aplicações Adicionais....................................................................................... 493.6 Exercícios de Revisão ....................................................................................... 54Bibliografia............................................................................................................... 59

4 Taxas e Padronização ............................................................................. 604.1 Taxas ................................................................................................................ 604.2 Padronização de Taxas ...................................................................................... 64

4.2.1 Método Direto de Padronização.............................................................. 664.2.2 Método Indireto de Padronização ........................................................... 674.2.3 Uso de Taxas Padronizadas..................................................................... 68

4.3 Aplicações Adicionais....................................................................................... 774.3.1 Método Direto de Padronização.............................................................. 784.3.2 Método Indireto de Padronização ........................................................... 80

4.4 Exercícios de Revisão ....................................................................................... 81Bibliografia............................................................................................................... 87

5 Tábuas de Vida............................................................................................. 885.1 Cálculo da Tábua de Vida ................................................................................. 88

5.1.1 Coluna 1.................................................................................................. 885.1.2 Coluna 2.................................................................................................. 905.1.3 Colunas 3 e 4........................................................................................... 915.1.4 Coluna 5.................................................................................................. 935.1.5 Coluna 6.................................................................................................. 935.1.6 Coluna 7.................................................................................................. 93

5.2 Aplicações da Tábua de Vida ............................................................................ 945.3 Anos Potenciais de Vida Perdidos..................................................................... 965.4 Aplicações Adicionais....................................................................................... 1005.5 Exercícios de Revisão ....................................................................................... 104Bibliografia............................................................................................................... 112

6 Probabilidade ................................................................................................ 1136.1 Operações sobre Eventos e Probabilidade ........................................................ 1136.2 Probabilidade Condicional................................................................................ 1176.3 Teorema de Bayes ............................................................................................. 1186.4 Testes de Diagnósticos ...................................................................................... 123

6.4.1 Sensibilidade e Especificidade................................................................ 1236.4.2 Aplicações do Teorema de Bayes ........................................................... 124

VIII Princípios de Bioestatística

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página VIII

Page 11: Princípios de Bioestatística

6.4.3 Curvas ROC ............................................................................................ 1276.4.4 Cálculos de Prevalência .......................................................................... 129

6.5 O Risco Relativo e a Razão de Chances ........................................................... 1316.6 Aplicações Adicionais....................................................................................... 1366.7 Exercícios de Revisão ....................................................................................... 141Bibliografia............................................................................................................... 145

7 Distribuições Teóricas de Probabilidade..................................... 1477.1 Distribuições de Probabilidade ......................................................................... 1477.2 A Distribuição Binomial ................................................................................... 1497.3 A Distribuição de Poisson................................................................................. 1557.4 A Distribuição Normal...................................................................................... 1597.5 Aplicações Adicionais....................................................................................... 1677.6 Exercícios de Revisão ....................................................................................... 172Bibliografia............................................................................................................... 175

8 Distribuição Amostral da Média ...................................................... 1778.1 Distribuições Amostrais .................................................................................... 1778.2 O Teorema Central do Limite ........................................................................... 1788.3 Aplicações do Teorema Central do Limite........................................................ 1798.4 Aplicações Adicionais....................................................................................... 1848.5 Exercícios de Revisão ....................................................................................... 190Bibliografia............................................................................................................... 192

9 Intervalos de Confiança ......................................................................... 1939.1 Intervalos de Confiança Bilaterais .................................................................... 1939.2 Intervalos de Confiança Unilaterais .................................................................. 1989.3 Distribuição t de Student................................................................................... 1999.4 Aplicações Adicionais....................................................................................... 2029.5 Exercícios de Revisão ....................................................................................... 205Bibliografia............................................................................................................... 207

10 Testes de Hipóteses .................................................................................... 20910.1 Conceitos Gerais ............................................................................................. 20910.2 Testes de Hipóteses Bilaterais......................................................................... 21110.3 Testes de Hipóteses Unilaterais ...................................................................... 21410.4 Tipos de Erro................................................................................................... 21510.5 Poder ............................................................................................................... 21810.6 Estimação do Tamanho da Amostra................................................................ 22110.7 Aplicações Adicionais..................................................................................... 22310.8 Exercícios de Revisão ..................................................................................... 228Bibliografia............................................................................................................... 230

Sumário IX

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página IX

Page 12: Princípios de Bioestatística

11 Comparação de Duas Médias ............................................................ 23211.1 Amostras Pareadas .......................................................................................... 23311.2 Amostras Independentes ................................................................................. 237

11.2.1 Variâncias Iguais ................................................................................. 23811.2.2 Variâncias Desiguais ........................................................................... 242

11.3 Aplicações Adicionais..................................................................................... 24411.4 Exercícios de Revisão ..................................................................................... 248Bibliografia............................................................................................................... 252

12 Análise de Variância................................................................................. 25412.1 Análise de Variância com um Fator ................................................................ 254

12.1.1 O Problema ......................................................................................... 25412.1.2 Fontes de Variação ............................................................................... 257

12.2 Procedimentos de Comparações Múltiplas..................................................... 26012.3 Aplicações Adicionais..................................................................................... 26212.4 Exercícios de Revisão ..................................................................................... 266Bibliografia............................................................................................................... 268

13 Métodos Não-paramétricos................................................................. 26913.1 O Teste do Sinal .............................................................................................. 26913.2 O Teste de Postos Sinalizados de Wilcoxon ................................................... 27113.3 O Teste da Soma de Postos de Wilcoxon........................................................ 27413.4 Vantagens e Desvantagens dos Métodos Não-paramétricos ........................... 27713.5 Aplicações Adicionais..................................................................................... 27813.6 Exercícios de Revisão ..................................................................................... 282Bibliografia............................................................................................................... 286

14 Inferência sobre Proporções ............................................................... 28714.1 Aproximação Normal para a Distribuição Binomial ...................................... 28714.2 Distribuição Amostral de uma Proporção ....................................................... 28914.3 Intervalos de Confiança .................................................................................. 29014.4 Testes de Hipóteses ......................................................................................... 29214.5 Estimação do Tamanho da Amostra................................................................ 29314.6 Comparação de Duas Proporções ................................................................... 29414.7 Aplicações Adicionais..................................................................................... 29714.8 Exercícios de Revisão ..................................................................................... 299Bibliografia............................................................................................................... 302

15 Tabelas de Contingência ........................................................................ 30415.1 O Teste Qui-Quadrado .................................................................................... 304

15.1.1 Tabelas 2 3 2 ....................................................................................... 30415.1.2 Tabelas r 3 c ........................................................................................ 309

15.2 Teste de McNemar .......................................................................................... 31015.3 A Razão de Chances ....................................................................................... 31215.4 Falácia de Berkson.......................................................................................... 31715.5 Aplicações Adicionais..................................................................................... 31915.6 Exercícios de Revisão ..................................................................................... 324Bibliografia............................................................................................................... 330

X Princípios de Bioestatística

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página X

Page 13: Princípios de Bioestatística

16 Tabelas de Contingência 2 X 2 Múltiplas................................... 33216.1 Paradoxo de Simpson...................................................................................... 33216.2 O Método de Mantel-Haenszel ....................................................................... 333

16.2.1 Teste de Homogeneidade .................................................................... 33516.2.2 Razão de Chances Resumo ................................................................. 33816.2.3 Teste de Associação ............................................................................ 341

16.3 Aplicações Adicionais..................................................................................... 34316.4 Exercícios de Revisão ..................................................................................... 348Bibliografia............................................................................................................... 351

17 Correlação ........................................................................................................ 35217.1 O Gráfico de Dispersão Bidimensional .......................................................... 35217.2 Coeficiente de Correlação de Pearson ............................................................ 35417.3 Coeficiente de Correlação de Postos de Spearman......................................... 35717.4 Aplicações Adicionais..................................................................................... 36017.5 Exercícios de Revisão ..................................................................................... 364Bibliografia............................................................................................................... 366

18 Regressão Linear Simples ..................................................................... 36718.1 Conceitos da Regressão .................................................................................. 36718.2 O Modelo ........................................................................................................ 371

18.2.1 A Linha de Regressão da População................................................... 37118.2.2 O Método dos Mínimos Quadrados.................................................... 37318.2.3 Inferência para os Coeficientes da Regressão..................................... 37618.2.4 Inferência para Valores Previstos ........................................................ 379

18.3 Avaliação do Modelo ...................................................................................... 38118.3.1 O Coeficiente de Determinação .......................................................... 38118.3.2 Gráficos de Resíduos ......................................................................... 38218.3.3 Transformações................................................................................... 384

18.4 Aplicações Adicionais..................................................................................... 38618.5 Exercícios de Revisão ..................................................................................... 391Bibliografia............................................................................................................... 395

19 Regressão Múltipla .................................................................................... 39619.1 O Modelo ........................................................................................................ 396

19.1.1 A Equação da Regressão de Mínimos Quadrados .............................. 39719.1.2 Inferência para os Coeficientes da Regressão..................................... 39819.1.3 Avaliação do Modelo .......................................................................... 40019.1.4 Variáveis Indicadoras .......................................................................... 40119.1.5 Termos de Interação............................................................................ 403

19.2 Seleção do Modelo.......................................................................................... 40419.3 Aplicações Adicionais..................................................................................... 40619.4 Exercícios de Revisão ..................................................................................... 410Bibliografia............................................................................................................... 414

Sumário XI

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página XI

Page 14: Princípios de Bioestatística

20 Regressão Logística ................................................................................... 41520.1 O Modelo ........................................................................................................ 415

20.1.1 A Função Logística ............................................................................. 41620.1.2 A Equação Ajustada ............................................................................ 418

20.2 Regressão Logística Múltipla ......................................................................... 41920.3 Variáveis Indicadoras ...................................................................................... 42220.4 Aplicações Adicionais..................................................................................... 42420.5 Exercícios de Revisão ..................................................................................... 427Bibliografia............................................................................................................... 430

21 Análise de Sobrevivência ...................................................................... 43121.1 O Método da Tábua de Vida ........................................................................... 43221.2 O Método do Produto-Limite ......................................................................... 43721.3 O Teste Log-Rank ........................................................................................... 44021.4 Aplicações Adicionais..................................................................................... 44421.5 Exercícios de Revisão ..................................................................................... 451Bibliografia............................................................................................................... 453

22 Teoria da Amostragem ........................................................................... 45422.1 Esquemas de Amostragem.............................................................................. 454

22.1.1 AmostragemAleatória Simples .......................................................... 45522.1.2 Amostragem Sistemática..................................................................... 45522.1.3 Amostragem Estratificada................................................................... 45622.1.4 Amostragem por Conglomerados ....................................................... 45722.1.5 Amostragem Não-Probabilística ......................................................... 457

22.2 Fontes de Tendência........................................................................................ 45722.3 Aplicações Adicionais..................................................................................... 45922.4 Exercícios de Revisão ..................................................................................... 463Bibliografia............................................................................................................... 464

Apêndice A Tabelas....................................................................................... 465

Apêndice B..................................................................................................... 491

Índice .......................................................................................................... 503

XII Princípios de Bioestatística

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página XII

Page 15: Princípios de Bioestatística

Este livro foi escrito para estudantes das ciências da saúde e serve como introdução ao estu-do da bioestatística e ao uso das técnicas numéricas para se obter informações de dados e fa-tos. Por serem mais precisos do que as palavras, os números são particularmente mais ade-quados para transmitir as conclusões científicas.

No entanto, tal como se pode mentir com palavras, pode-se fazer o mesmo com núme-ros. De fato, números e mentiras têm estado juntos há bastante tempo; existe até um livro inti-tulado Como mentir com a Estatística. A origem dessa associação, ou pelo menos sua afirma-ção, é atribuída ao primeiro-ministro britânico Benjamin Dissaeli. Mark Twain atribuiu aDissaeli a seguinte frase: “Existem três tipos de mentiras: mentiras, mentiras condenáveis e es-tatísticas”. Basta observar qualquer campanha política moderna para ficarmos convencidos doabuso da estatística. Entretanto, chega de mentiras; este livro adota a posição do professor Fre-derick Mosteller, que disse: “É fácil mentir com a estatística, mas é mais fácil mentir sem ela”.

AntecedentesPrincípios de Bioestatística é dirigido aos estudantes das ciências biológicas e de saúde quequeiram aprender métodos modernos de pesquisa. É fundamentado em um curso obrigató-rio, oferecido pela Harvard School of Public Health.Além dos estudantes de pós-graduação,um grande número de profissionais da saúde da área médica de Harvard assiste ao curso, queé tão antigo quanto a própria escola, e isso atesta sua importância. Estende-se por 16 sema-nas e divide-se em aulas e sessões de laboratório. Cada semana inclui duas aulas de 50 mi-nutos e uma sessão de laboratório de duas horas. Os alunos são reunidos para as aulas, masdivididos em grupos menores supervisionados por assistentes de ensino para as sessões delaboratório, cuja função é reforçar a matéria ministrada nas aulas teóricas, revisar as liçõesde casa e introduzir o computador no curso. Incluímos os materiais de laboratório — exce-to os que tratam das lições de casa e comandos específicos de computador — nas seções de-nominadas Aplicações Adicionais, que apresentam exemplos adicionais ou diferentes pers-pectivas da matéria dada em um determinado capítulo. Essas seções são concebidas parasuscitar discussões, embora sejam suficientemente completas para que o leitor que não o es-teja usando como livro-texto de um curso possa ter o mesmo benefício ao lê-las.

Este livro foi ampliado para incluir tópicos que acreditamos poderem ser explicitados comcerta profundidade emum semestre norte-americano.Obviamente, algumas escolhas tiveramdeser feitas e esperamos que as tenhamos feito bem. Em nosso curso, temos tempo suficiente pa-ra esclarecer a maioria dos tópicos nos primeiros 20 capítulos. No entanto, o material apresen-

Prefácio

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página XIII

Page 16: Princípios de Bioestatística

tado é suficiente para permitir certa flexibilidade ao instrutor. Por exemplo, alguns instrutorespodem escolher omitir seções que explicam os dados agrupados (Seção 3.3), a desigualdade deChebychev (Seção 3.4) e a distribuição de Poisson (Seção 7.3) ou o capítulo sobre a análise devariância (Capítulo 12), se considerarem esses conceitos menos importantes que outros.

EstruturaDizem alguns que a estatística é o estudo da variabilidade e da incerteza. Acreditamos queexista verdade nesse adágio e o usamos como guia ao dividirmos o livro em três partes. Osprimeiros cinco capítulos tratam das coleções de números e dos modos de resumi-los, ana-lisá-los e explicá-los. Os dois capítulos seguintes focalizam a probabilidade e servem comointrodução às ferramentas necessárias para a subseqüente investigação da incerteza. Somen-te no oitavo capítulo e nos posteriores fazemos distinção entre populações e amostras e co-meçamos a investigar a variabilidade inerente introduzida pela amostragem, caminhando pa-ra a inferência. Essa introdução modular à quantificação da incerteza é justificada pelosucesso obtido por nossos estudantes. Protelar os conceitos um pouco mais difíceis até queum sólido fundamento tenha sido estabelecido facilita sua compreensão pelo leitor.

Conjunto de Dados e ExemplosPor todo o texto usamos dados extraídos de estudos publicados para exemplificar os concei-tos bioestatísticos. Os dados reais não são apenas mais significativos, como também são emgeral mais interessantes. Naturalmente, não queremos usar exemplos nos quais os assuntossejammuito herméticos ou muito complexos. Para esse fim, fomos guiados pelos anteceden-tes e interesses de nossos estudantes— fundamentalmente tópicos de saúde pública e da pes-quisa clínica — para escolher exemplos que ilustram melhor os conceitos abordados.

Existe algum risco em se usar dados publicados. Não podemos garantir que todos osexemplos sejam honestos e que os dados foram apropriadamente coletados; por isso preci-samos confiar na reputação de nossas fontes. Não depreciamos a importância dessa conside-ração. O valor de nossa inferência depende essencialmente do valor dos dados e recomenda-mos enfaticamente que um esforço expressivo seja despendido na avaliação da qualidade dainformação. Assumimos que esse aspecto seja entendido pelo leitor.

Mais de uma vez usamos exemplos em que a população dos Estados Unidos foi divi-dida em suas linhas raciais.Ao registrarmos essas estatísticas oficiais seguimos a diretriz dasagências governamentais que as liberaram. Não queremos ratificar essa categorização racial,pois de fato as diferenças observadas podem ser devidas aos fatores socioeconômicos, emvez dos fatores raciais envolvidos. Uma opção seria ignorar essas estatísticas; no entanto, es-sa atitude esconderia as injustiças que existem em nosso sistema de saúde— que necessitamser eliminadas. Focalizamos a atenção no problema, na esperança de estimularmos o interes-se de promover soluções.

Minimizamos o uso de notação matemática por causa de sua bem-merecida reputaçãode ser o jargão supremo. Se usada excessivamente, pode intimidar mesmo o mais ardente es-tudante. No entanto, não queremos eliminá-la inteiramente; ela tem sido desenvolvida no de-correr do tempo para ser útil na transmissão de resultados. Esperamos que a esse respeito te-nhamos escrito um texto sucinto e claro.

Além da sua precisão, existe algo mais nos números — talvez um pouco de magia —que os tornam divertidos de serem estudados. A diversão está mais na conceituação do quenos cálculos e somos afortunados em termos o computador para fazer o trabalho pesado, oque permite ao estudante se concentrar nas idéias. Em outras palavras, o computador possi-bilita ao instrutor ensinar a poesia da estatística e não seu trabalho pesado.

XIV Princípios de Bioestatística

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página XIV

Page 17: Princípios de Bioestatística

ComputaçãoPara aproveitarmos o computador, necessitamos de um bom pacote estatístico. Usamos oStata, disponível no Stata Corporation no College Station, Texas. Consideramos esse paco-te estatístico um dos melhores no mercado atualmente; ele é descomplicado para o usuário,preciso, potente, tem um preço razoável e trabalha em várias e diferentes plataformas, in-clusive Windows, Unix e Macintosh. Além disso, a saída desse pacote é aceita pela FederalDrug Administration nas apreciações de Aprovação de Novos Medicamentos. Outros paco-tes estão disponíveis e este livro pode ser suplementado por qualquer um deles. Nesta edi-ção, apresentamos também a saída a partir do SAS e do Minitab, na seção Aplicações Adi-cionais de cada capítulo. Recomendamos enfaticamente que seja utilizado algum pacoteestatístico.

Alguns exercícios de revisão do texto exigem o uso do computador. Para ajudar o lei-tor, incluímos o conjunto de dados usado nesses exercícios, no Apêndice B. Existem tam-bém muitos exercícios que não exigem o uso do computador. Como sempre, o aprendizadoativo produz melhor resultado do que uma observação passiva. Para esse fim, realçamos en-faticamente a importância dos exercícios de revisão e encorajamos o leitor a fazê-los tantasvezes quantas o seu tempo permitir.

O Que Há de Novo Nesta EdiçãoEsta edição é toda permeada de discussões revisadas e expandidas de muitos tópicos e ques-tões adicionais para auxiliar a esclarecer os conceitos. Sempre que possível, os conjuntos dedados usados na edição anterior, especialmente as estatísticas oficiais registradas pelas agên-cias governamentais, foram atualizados. Tabelas que contêm probabilidades exatas para asdistribuições binomial e de Poisson (geradas pelo Stata) foram adicionadas no Apêndice A.Como foi anteriormente mencionado, incorporamos a saída de computador do SAS, do Mi-nitab e também do Stata, nas seções Aplicações Adicionais. Incorporamos também váriosnovos exercícios, incluindo questões que revêem os conceitos básicos expostos em cada ca-pítulo.

AgradecimentosAgradecemos a várias pessoas: ao presidente da Harvard University, Derek Bok, por forne-cer o suporte que impulsionou este livro, ao Dr. Michael K. Martin, por calcular as TabelasdeA.3 atéA.8 noApêndiceA, e John-Paul Pagano, por ajudar na realização da primeira edi-ção. Agradecemos às seguintes pessoas que revisaram os manuscritos: Rick Chappell, Uni-versity of Wisconsin; Dr. Todd G. Nick, University of Mississipi Medical Center; Al Barto-lucci, University ofAlabama emBirmingham; Bruce E. Trumbo, California State University,Hayward; James Godbold, The Mount Sinai School of Medicine of NewYork University eMaureen Lahiff, University of California, Berkeley. Nossos agradecimentos aos assistentesde ensino que nos auxiliaram a ministrar o curso e que fizeram muitas sugestões valiosas.Provavelmente o mais merecido dos agradecimentos seja aos estudantes que fizeram o cur-so no decorrer dos anos e que nos toleraram enquanto aprendíamos a ensiná-los. Ainda es-tamos aprendendo.

Marcello PaganoKimberlee GauvreauBoston, Massachusetts

Prefácio XV

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página XV

Page 18: Princípios de Bioestatística

PRE-TEXTUAIS:PRE-TEXTUAIS 04.05.12 08:58 Página XVI

Page 19: Princípios de Bioestatística

Em 1903, H. G. Wells conjeturou que, um dia, o pensamento estatístico seria tão necessáriopara os bons cidadãos quanto o ler e o escrever. A estatística desempenha o papel importan-te em muitos processos de tomada de decisão. Antes que um novo remédio possa ser colo-cado no mercado, por exemplo, a Food and Drug Administration dos Estados Unidos exigeque seja submetido a um ensaio clínico — estudo experimental envolvendo indivíduos hu-manos. Os dados desse estudo precisam ser compilados e analisados para que seja determi-nado se o remédio é efetivo e seguro. Além disso, as decisões do governo norte-americanocom relação aos programas de Previdência Social e da Saúde Pública fiam-se, em parte, emprevisões sobre a longevidade da população da nação. Conseqüentemente, deveríamos sercapazes de prever o número de anos que cada indivíduo viverá. Muitas outras questões tam-bém necessitam ser abordadas. Onde o governo deve investir seus recursos, se deseja redu-zir a mortalidade infantil? O uso do cinto de segurança ou de um air bag diminui a chancede morte em um acidente de veículo a motor? A mastectomia sempre deve ser recomendadapara uma paciente com câncer de mama? Que fatores aumentam o risco de um indivíduo de-senvolver uma doença cardíaca coronariana? Para responder a essas e outras questões, con-tamos com os métodos de bioestatística.

O estudo da estatística explora a coleta, a organização, a análise e a interpretação dosdados numéricos. Seus conceitos podem ser aplicados aos diversos campos que incluem ne-gócios, psicologia e agricultura. Quando o foco está nas ciências biológicas e da saúde, usa-mos o termo bioestatística.

Através dos tempos, a estatística tem sido usada para contar a história com números,posto que, freqüentemente, transmitem idéias mais sucintamente do que as palavras. Porexemplo, a mensagem transmitida pelos seguintes dados é bastante clara: “Em 1979, 48 pes-soas no Japão, 34 na Suíça, 52 no Canadá, 58 em Israel, 21 na Suécia, 42 naAlemanha, 8 naInglaterra e 10.728 nos Estados Unidos foram mortas por armas de fogo” [1]. O poder des-ses números é óbvio; a questão poderia ser formulada mesmo se corrigíssemos para diferen-ças no tamanho da população.

Como um segundo exemplo, considere a seguinte citação, tomada de um editorial noThe Boston Globe [2]:

A falta de anticoncepcionais está ligada a uma taxa de abortos excepcionalmente al-ta na União Soviética — 120 abortos para cada 100 nascimentos, comparados com20 abortos por 100 nascimentos na Grã-Bretanha, onde o acesso aos anticoncepcio-nais está garantido. O suporte inadequado para o planejamento familiar nos Esta-

Introdução1

CAP01:CAP01 26.04.12 09:58 Página 1

Page 20: Princípios de Bioestatística

dos Unidos resultou em 40 abortos para cada 100 nascimentos— taxa menor do quea da União Soviética, mas duas vezes mais alta que a da maioria das nações indus-trializadas.

Nesse caso, muita informação está contida em somente três números: 120, 20 e 40. Aestatística fornece o entendimento das conseqüências de diferentes atitudes com relação aoplanejamento familiar.

Nesses dois exemplos, os números fornecem um resumo conciso de certos aspectos dasituação que está sendo estudada. Certamente a explanação numérica dos dados de armas defogo é mais clara do que se tivéssemos falado: algumas pessoas forammortas no Japão, pou-cas na Suíça, mais pessoas no Canadá e ainda mais em Israel, mas muito poucas na Suéciae assim por diante. Ambos os exemplos tratam de situações muito complexas, ainda que osnúmeros transmitam a informação essencial. Por mais potente que seja, é natural que nenhu-ma estatística vai convencer alguém de que uma determinada conclusão seja verdadeira. Osdados relativos a armas de fogo freqüentemente são varridos para longe, com o aforismo deque “as armas não matam as pessoas, são as pessoas que o fazem”. O objetivo de um estudobioestatístico é fornecer números que contenham informações sobre certa situação e apre-sentá-los de tal modo que sejam possíveis interpretações válidas.

1.1 Resumo do Texto

Se desejarmos estudar os efeitos de uma nova dieta, poderemos inicialmente medir as varia-ções na massa corporal de todos os indivíduos que foram a ela submetidos, no decorrer dotempo. Analogamente, se quisermos investigar o sucesso de uma terapia para tratar o câncerde próstata, poderemos registrar as durações de tempo que os homens por ela tratados sobre-vivem depois de diagnosticada a doença. Essas coleções de números, no entanto, podem exi-bir uma grande variabilidade e geralmente não são muito informativas, até que comecemosa combiná-las de algum modo. As estatísticas descritivas são métodos para organizar e resu-mir um conjunto de dados que nos auxilie a descrever os atributos de um grupo ou de umapopulação. No Capítulo 2, examinamos as técnicas descritivas tabulares e gráficas. As capa-cidades gráficas dos computadores tornam esse tipo de resumo mais viável do que era nopassado e um novo modo de apresentação global está disponível, mesmo para a mais modes-ta análise.

O Capítulo 3 vai adiante das técnicas gráficas apresentadas no Capítulo 2 e introduz asmedidas-resumo numéricas. Por definição, um resumo captura somente um aspecto particu-lar dos dados que estão sendo estudados; conseqüentemente, é importante ter-se uma idéiade como o conjunto de medidas é bem representado pelo resumo. Poderíamos, por exemplo,desejar conhecer quanto tempo os pacientes de Aids sobrevivem depois do diagnóstico deuma das infecções oportunistas que caracterizam a doença. Se calcularmos um tempo médiode sobrevivência, ele será representativo de todos os pacientes? Quanto essa medida seriaútil no planejamento das necessidades futuras dos serviços de saúde? O Capítulo 3 investi-ga as técnicas descritivas que ajudam a responder a questões como essas.

Dados que assumem somente dois valores distintos exigem atenção especial. Nas ciên-cias da saúde, um dos exemplos mais comuns desse tipo de dado é a categorização de estarvivo ou morto. Se designarmos o primeiro estado 0 e o último 1, seremos capazes de classi-ficar um grupo de indivíduos ao usarmos esses números e tirar a média do resultado. Dessemodo, podemos resumir a mortalidade associada com o grupo. O Capítulo 4 trata exclusiva-mente sobre medidas que assumem somente dois valores. A noção de se dividir um grupoem subgrupos ou em classes menores com base em uma característica como a idade ou o gê-

2 Princípios de Bioestatística

CAP01:CAP01 26.04.12 09:58 Página 2

Page 21: Princípios de Bioestatística

nero é também introduzida. Poderíamos querer estudar a mortalidade das mulheres separa-damente da dos homens, por exemplo. Finalmente, esse capítulo investiga as técnicas quepermitem fazer comparações válidas entre grupos que podem diferir substancialmente emsua composição.

O Capítulo 5 introduz a tábua de vida, uma das mais importantes técnicas disponíveispara o estudo das ciências da saúde usadas pelos profissionais da saúde pública para carac-terizar o bem-estar de uma população e também pelas companhias de seguro para prever aduração de vida de um indivíduo em particular. Neste capítulo, foi estendido o estudo damor-talidade iniciado no Capítulo 4, para incorporar a duração real até a morte para cada indiví-duo, o que requer uma análise mais refinada. Conhecer suas durações até a morte fornecesubsídios para calcular a curva de sobrevivência de uma população. Essa medida de longe-vidade é usada freqüentemente em ensaios clínicos planejados para estudar os efeitos dos vá-rios remédios e tratamentos cirúrgicos durante o tempo de sobrevivência.

Em suma, os primeiros cinco capítulos do texto demonstram que a obtenção de infor-mações importantes de uma coleção de números não é obstruída por sua variabilidade, poisos dados freqüentemente exibem certa regularidade. Se olharmos, por exemplo, as taxasanuais de mortalidade de adolescentes dos Estados Unidos em cada um dos últimos dezanos, não veremos muita variação nos números. Seria coincidência ou um indicativo de umaestabilidade natural, subjacente na taxa de mortalidade? Para responder a questões comoessa, é necessário estudar os princípios da probabilidade.

A teoria da probabilidade está dentro do que é conhecido como um sistema axiomáti-co: começamos com algumas verdades básicas e construímos um sistema lógico ao seu re-dor. Em sua forma mais pura, o sistema não tem valor prático. Sua praticidade vem do co-nhecimento de como usar a teoria para produzir aproximações práticas. Uma analogia podeser extraída da geometria, assunto frente ao qual a maioria dos estudantes é exposta relativa-mente cedo, em sua vida escolar. A impossibilidade de uma linha reta ideal existir fora denossa imaginação não tem impedido a construção de prédios maravilhosos baseada nos cál-culos geométricos. O mesmo se dá para a teoria da probabilidade: embora não seja práticaem sua forma pura, seus princípios básicos — que investigaremos no Capítulo 6 — podemser aplicados para fornecer um meio de se quantificar a incerteza.

Uma aplicação importante da teoria da probabilidade é feita nos testes de diagnósticos.A incerteza está presente porque, apesar das alegações dos fabricantes, nenhum teste dispo-nível é perfeito. Conseqüentemente, há um número considerável de questões importantes queprecisam ser respondidas. Podemos, por exemplo, concluir que cada amostra de sangue cu-jo resultado seja positivo para o HIV abrigue realmente o vírus? Todas as unidades de for-necimento de sangue da Cruz Vermelha apresentam resultados negativos para o HIV; issosignifica que não existem amostras contaminadas? Se existirem, quantas poderiam haver?Para responder questões como essas, precisamos confiar no comportamento de médio e lon-go prazo dos testes de diagnósticos. A teoria da probabilidade nos permite quantificar essecomportamento.

O Capítulo 7 estende a noção de probabilidade e introduz algumas distribuições co-muns a ela. Esses modelos matemáticos são uma base útil para os métodos estudados no res-tante do texto.

Os primeiros capítulos deste livro focalizam a variabilidade existente em uma coleçãode números. Os capítulos subseqüentes movem-se para uma outra forma de variabilidade —a que surge quando extraímos uma amostra de observações de uma população muito maior.Suponha que gostaríamos de saber se um novo remédio é eficaz para tratar altas pressõessangüíneas. Como a população de todos os pacientes que têm hipertensão sangüínea nomun-do é muito grande, é extremamente implausível que tenhamos tempo ou recursos necessá-rios para examinar cada pessoa. Em outras situações, a população pode incluir futuros pa-

Cap. 1 — Introdução 3

CAP01:CAP01 26.04.12 09:58 Página 3

Page 22: Princípios de Bioestatística

cientes; poderíamos querer saber como os indivíduos que desenvolverão derradeiramentecerta doença, assim como os que atualmente a têm, reagirão a um novo tratamento. Para res-ponder a esse tipo de questão, é comum selecionar uma amostra da população de interessee, tendo-a por base, inferir o que aconteceria a todo o grupo.

Se escolhermos duas amostras diferentes, é improvável que terminemos precisamentecom os mesmos conjuntos de números. Analogamente, se estudássemos um grupo de crian-ças com doença congênita do coração, em Boston, obteríamos resultados diferentes dos es-tudos sobre um grupo de crianças em Roma. Apesar dessa diversidade, gostaríamos de po-der usar uma ou ambas as amostras para extrair conclusões sobre a população inteira dessascrianças. O restante do texto preocupa-se com o tópico da inferência estatística.

O Capítulo 8 investiga as propriedades da média amostral quando amostras repetidassão extraídas da população, introduzindo, assim, um importante conceito conhecido como oteorema central do limite, que fornece uma base para se quantificar a incerteza associada àsinferências que estão sendo usadas.

Para que um estudo tenha algum valor prático, precisamos ser capazes de extrapolar asdescobertas para um grupo ou população maior. Para esse fim, os intervalos de confiança eos testes de hipóteses são introduzidos nos Capítulos 9 e 10. São métodos essenciais para seobter uma conclusão relativa à população que amostramos, enquanto se tem algum conheci-mento sobre a probabilidade de que a conclusão esteja incorreta. Primeiramente, essas idéiassão aplicadas à média de uma população simples. Poderíamos, por exemplo, querer estimara concentração média de certo poluente em um reservatório de água que abastece as áreascircundantes e determinar se o nível da média verdadeira é maior do que a concentração má-xima permitida pela Environmental Protection Agency. No Capítulo 11, a teoria é estendidapara a comparação das médias de duas populações; depois, ela é generalizada para a compa-ração de três ou mais médias, no Capítulo 12. O Capítulo 13 continua a desenvolver concei-tos de testes de hipóteses, mas apresenta técnicas que permitem a redução de algumas supo-sições necessárias para realizar os testes. Os Capítulos 14, 15 e 16 desenvolvem métodosinferenciais que podem ser aplicados aos dados enumerados ou contagens — tais como osnúmeros de casos de síndrome de morte súbita de bebês dentre os colocados para dormir emvárias posições — em vez de medidas contínuas.

A inferência pode também ser usada para explorar a relação entre diversos atributos di-ferentes. Se um bebê completamente desenvolvido, cuja idade gestacional é de 39 semanas,nasceu pesando 4 quilos, ou 8,8 libras, ninguém ficará surpreso. Entretanto, se sua idade ges-tacional for somente de 22 semanas, então o peso será causa de alarme. Por quê? Sabemosque o peso ao nascer tende a crescer com a idade gestacional e, embora seja extremamente ra-ro encontrar um bebê pesando 4 quilos na 22a semana, não é incomum na 39a semana. O es-tudo da extensão no qual dois fatores estão relacionados é conhecido como análise de corre-lação; esse é o tópico do Capítulo 17. Se desejarmos prever o resultado de um fator com baseno valor de outro, a regressão é a técnica apropriada. A regressão linear simples é investiga-da no Capítulo 18 e é estendida para o cenário de regressão múltipla — na qual dois ou maisfatores são usados para predizer um resultado simples — no Capítulo 19. Se o resultado deinteresse pode assumir somente dois valores possíveis, tal como vivo ou morto, uma técnicaalternativa precisa ser aplicada; a regressão logística é explorada no Capítulo 20.

No Capítulo 21, são introduzidos os métodos inferenciais apropriados para as tábuasde vida. Essas técnicas nos possibilitam extrair conclusões relativas à mortalidade de umapopulação com base em uma amostra de indivíduos extraídos do grupo.

Finalmente, o Capítulo 22 examina uma questão que é fundamental na inferência — oconceito da representatividade de uma amostra. Em qualquer estudo, precisamos estar con-fiantes de que a amostra escolhida nos fornece um quadro preciso da população da qual é ex-traída. Diversos métodos estão descritos para selecionar amostras representativas. A noção

4 Princípios de Bioestatística

CAP01:CAP01 26.04.12 09:58 Página 4

Page 23: Princípios de Bioestatística

Cap. 1 — Introdução 5

de viés e os vários problemas que podem surgir quando se escolhe uma amostra também sãodiscutidos. O senso comum desempenha importante papel na amostragem, como é feito portodo o livro.

1.2 Exercícios de Revisão

1. Planeje um estudo visando investigar uma questão que você acredita influenciar a saúdedo mundo. Descreva brevemente os dados de que precisará, como irá obtê-los, como pre-tende analisá-los e o método que usará para apresentar os resultados. Guarde esse estudode planejamento e releia-o depois que completar a leitura deste livro-texto.

2. Considere a seguinte citação com relação ao rápido crescimento da população [3]:

512 milhões de pessoas foram malnutridas em 1986-1987, mais de 460 milhões em1979-1981.

(a) Suponha que você concorde com a afirmação feita. Justifique o uso desses números.(b) Você está certo de que os números estão corretos? Pensa ser possível que 513 milhões

de pessoas foram malnutridas em 1986-987, em vez de 512 milhões?3. Em adição à afirmação de que “os chineses têm comido macarrão desde 1100 a.C.”, o ró-tulo em uma caixa de macarrão alega que “os americanos comem 11 libras de macarrãopor ano”, enquanto “os italianos comem 60 libras por ano”. Você acredita que essas esta-tísticas são precisas? Usaria esses números como base para um estudo nutricional?

Bibliografia[1] MCGERVEY, J. D., Probabilities in everyday life. Chicago: Nelson-Hall, 1986.

[2] “The Pill’s Easterm Europe Debut”. The Boston Globe, 19 de jan. de 1990, 10.

[3] United Nations Population Fund, “Family Planning: Sawing Children, Improving Lives”. NovaYork: Jones & Janello.

CAP01:CAP01 26.04.12 09:58 Página 5

Page 24: Princípios de Bioestatística

Este livro é uma introdução aos procedimentos estatísticos

baseada em conceitos que preparam os estudantes para conduzir

e avaliar pesquisas. Os autores enfatizam conceitos, e não

somente fórmulas ou memorizações mecânicas, e usam exemplos

práticos e interessantes com dados reais para tornar o material

ainda mais atrativo.

Com capítulos didáticos, Princípios de Bioestatística utiliza

também dados extraídos de estudos publicados para exemplificar

conceitos bioestatísticos, discussões revisadas e expandidas de

muitos tópicos e questões adicionais para auxiliar a clarear

conceitos. Esta obra procura mostrar a bioestatística de uma

maneira fácil de entender, sem minimizar, no entanto, a

importância do assunto.

Aplicações

Livro-texto para a disciplina estatística aplicada às ciências

biológicas e leitura complementar para a disciplina introdução à

estatística nos cursos de Medicina, Saúde Pública e Biologia.

Para suas soluções de curso e aprendizado, visite www.cengage.com.br

Outras obras

Estatística Geral e

Aplicada

Giuseppe Milone

O Método

Fenomenológico

na Pesquisa

Daniel Augusto Moreira

Método nas Ciências

Naturais Sociais

Alda Judith Alves-Mazzotti e

Fernando Gewandsznajder

Pesquisa Médica: A Ética

e a Metodologia

Sonia Vieira e

William Saad Hossne

ISBN 13 978-85-221-0920-3ISBN 10 85-221-0920-6

9 7 8 8 5 2 2 1 0 9 2 0 3