81
Princípios de Análise Estatística para a graduação de Odontologia FORP

Princípios de Análise Estatística para a graduação de ...mdsaraiv/Apostila-2017/Planejamento... · Esta série de slides traz algumas dicas sobre análise estatística. O aluno

Embed Size (px)

Citation preview

Princípios de Análise Estatística para a graduação de Odontologia

FORP

Esta série de slides traz algumas dicas sobre análise estatística. O aluno não precisa saber profundamente de estatística, mas precisa de noções para entender um texto científico, e ser capaz de realizar estatísticas básicas e simples como ensinado nas aulas de Epidemiologia e Bioestatística. Utilize o material das aulas do primeiro ano para relembrar detalhes da matéria! Se não tiver mais o material, recorra aos livros recomendados como o Moretin e Bussab.

Planejamento da análise começa no protocolo de pesquisa O número de indivíduos (animais, humanos e corpos de prova) a serem utilizados na pesquisa depende da estatística que será realizada. Sem saber a estatística dá para calcular quantos indivíduos vou precisar no meu estudo? Resposta: NÃO!

Revistas científica sempre pedem para descrever como foi feito o planejamento amostral. Se você não planejar antes terá problemas em explicar porque resolveu usar X ratinhos.

Análise estatística

1- Diagrama causal Comece pelo diagrama causal pois serve para especificar todas as variáveis que serão controladas ou não no estudo. Vai servir também posteriormente escrever a discussão. 2 – Classificação de todas as variáveis do diagrama causal que não serão controladas na aleatorização quantitativa ou qualitativa 3- Identificação de dependência dos dados em geral 4- Planejamento a priori da análise a ser realizada se houver necessidade a posteriori alguma ajuste pode ser feito

Planejamento da Análise Estatística

Serve para estabelecer as relações supostamente causais que serão avaliadas no estudo

Identificar variáveis de :

Exposição

Desfecho

Fatores de confusão

Fatores modificadores

Primeiro Passo Diagrama Causal

Hipótese :

Nível de bactéria (medido por checkerboard) semelhante para 4 tipos diferentes de ligaduras ortodônticas

Estudo será realizado sorteando caninos para instalação de 4 tipos de ligaduras no mesmo indivíduo. Contaminação medida após 30 dias.

Exemplo de Diagrama

Diagrama Causal

Ligaduras Contaminação

Sexo

Idade

Nível de cárie inicial

Higiene Bucal

Nível de Doenças Gengivais Medicamentos q alterem saliva

Consumo de açúcar

Enxaguatórios bucais

Desfecho :

contaminação de bactéria medido pelo checkerboard

Leitura em escores de 0 a 5 (seis níveis)

Variável qualitativa ordinal

Exposição

4 tipos de ligaduras

Variável qualitativa categórica

Operacionalização e Idenficação das Variáveis

Tipos de Estatísticas

Determinados pela distribuição do desfecho

Paramétrica

Existem parâmetros estabelecidos na distribuição da variável desfecho

Não paramétrica

Não se consegue reconhecer um tipo exato de distribuição

Relembrando um pouco de estatística

Como reconhecer um tipo de distribuição do nosso desfecho?

Primeiro deve-se reconhecer o tipo de variável e depois a distribuição.

Características das variáveis : Quantitativa

Contínua: infinito número de possíveis valores (Ex: altura, peso)

Discreta : números inteiros ou conjunto finito de valores

(Ex: CPOD, número de acidentes de carro)

Qualitativa Categórica: cor de pele, tipos de resinas

Ordinal : escores, escala de likert

Tipos de distribuições e Tipos de Variáveis

Se o desfecho for variável quantitativa contínua ou discreta:

Faça:

Histograma ou seja “empilhando” os dados que coletamos – observando o formato do empilhamento. Além disso, fazer um box-plot.

Combine as informações visuais do Histograma e Box-plot com o que você conhece sobre a variável.

Reconhecendo a Distribuição

Use histograma + box-plot para avaliar uma distribuição. O gráfico quantil- quartil (quantile-quartile ou chamado de QQ plot) fornece idéia de adequação a distribuição normal.

Reconhecendo a Distribuição

Histograma Box-plot

Quantil-quartil

Use histograma e box-plot para avaliar uma distribuição.

À esquerda distribuição razoavelmente normal com um outlier.

Já a distribuição á direita é bem exponencial

Avaliando a distribuição

Ter formato de normal , não quer dizer que realmente seja normal. A distribuição normal, assume

variável contínua, e com extremos ao infinito.

Ok, nem tudo realmente chega ao infinito, mas a distribuição não pode ser limitada. Exemplo, CPOD em comunidades com alta incidência de cárie tem distribuição com jeito de norma. Porém, CPOD não é continua e tem limites definidos, jamais pode ser menos que zero, e jamais vai além de 28 ou 32 (se contar os terceiros molares). Logo, CPOD não é normal, se assemelha mais a beta-binomial. Porém se for com formato de sino bem delineado, pode-se assumir normalidade, dado que a média e mediana estejam bem próximas ou coincidentes.

Se tiver em dúvida assuma que não conhece a distribuição e utilize uma estatística não-paramétrica, ou procure seu orientador ou um estatístico.

Faça estatística até onde sabe, se não souber peça ajuda a seu orientador

Lembre-se, na graduação você aprendeu apenas estatísticas simples paramétricas baseadas em distribuição normal, para qual a média serve de parâmetro.

Teste t, Anova, Análise de regressão são estatísticas

paramétricas que assumem distribuição normal. Qualquer desvio dos pressupostos destas estatísticas (que você já aprendeu), procure alguém para resolver.

É a mesma conduta que vc tem que ter na clínica! Se aparecer um canal difícil que não tem habilidade para fazer, envie para um especialista.

Alerta!

Se você reconheceu a distribuição como normal, ainda não pode começar, tem que verificar o pressuposto de dependência de dados!

Embora o gráfico de retenção descrito anteriormente tenha

distribuição aproximadamente normal, os dados se referem a medidas realizadas em quatro momentos no mesmo indivíduo! Além disso, os indivíduos receberam dois tratamentos um após o outro. Logo o pressuposto de dependência dos dados foi violado e não posso resolver com análise de variância comum! PROCURE SEU ORIENTADOR OU UM ESTATÍSTICO! Existem maneiras de se analisar, mas por um especialista.

Sendo a distribuição normal..... Passo 2- Verifique se os dados são dependentes

Se a distribuição é normal, e não tem dependência dos dados..

Passo 3 - verificar se as variâncias

são iguais!

Como? Você vai ter que efetivamente fazer os testes e “pedir” ao computador que avalie se as variâncias são iguais para o teste t e ANOVA. Para a análise de regressão analisar os resíduos. Você também pode usar a análise de resíduos na Anova que seria equivalente ao teste para verificar se as variâncias são iguais.

Resíduo razoável (aleatoriamente ao redor do zero)

Resíduo Horrível (não aleatório, converge etc)

O que fazer com o resíduo horrível? Procure ajuda! Não publique seu trabalho com resíduos ruim! Os estimadores estarão errados! Você pode encontrar associação que não existe e deixar passar associações existentes e os valores podem estar completamente enviesados. É como se estivesse diagnosticando uma radiografia com ângulo errado!

Nota: Os gráficos mostrados aqui, são exemplos gerais de resíduos apenas para ilustração.

Escolha Geral do Teste Desfecho: variável quantitativa contínua ou discreta

Identificar Distribuição

Indentificada

Normal Não Normal

Testes paramétricos

Testes específicos para a distribuição identificada

Teste-t Anova e família Regressão linear

Não Indentificada

Testes não-paramétricos

Wilcoxon Kruskal-Wallis Friedman (dependentes)

Ex: poisson, exponencial, Beta-binomial, weilbull etc

Verificar sempre pressupostos, pressupostos, pressupostos e pressupostos!

Sem dependência de dados

Testes paramétricos Dist. normal

Testes não-paramétricos

Teste-t ou Anova Wilcoxon

Desfecho: variável quantitativa contínua ou discreta Exposição: variável categórica

Duas médias Duas medianas

Três medias + ANOVA Duas medianas + Kruskal-Wallis

Sem dependência de dados

Não esqueça de olhar os resíduos nos testes paramétricos!

Testes paramétricos Dist. normal

Testes não-paramétricos

Desfecho: variável quantitativa contínua Exposição: variável categórica Desfecho: variável quantitativa contínua ou discreta

Com dependência de dados SITUAÇÕES SIMPLES!

Com dependência de dados há necessidade de testes específicos Com o conhecimento de graduação você vai resolver problemas simples como dependência de antes e depois de tratamento. Detectando problemas mais Complexos, procure seu orientador ou um estatístico!

Somente duas médias dependentes antes depois test-t pareado

Qualquer outra dependência sem ser antes e depois ou com mais grupos procure ajuda!

Duas medianas ou mais dependentes: Teste de Friedman

Qualquer outra dependência complicada procure ajuda!

Lembre-se que testes de comparação de mais de duas médias ou medianas, apenas fornecem informação se as médias ou medianas são semelhantes e não qual dos pares de estimadores são diferentes.

Para saber qual o grupo é diferente de qual há necessidade de pedir

ao pacote estatístico um pós-test. Há necessidade de se saber qual usar. Exemplos de nomes comuns são Tukey para a ANOVA e teste de Dunn para testes não paramétricos.

Existem vários pós-testes é necessário buscar ajuda se precisar usar um pós-teste diferente do Tukey e Dunn. Cada área é diferente e por vezes usa pós-testes diferentes. Consulte seu orientador!

Pós-testes!

Sem dependência de dados use regressão linear

A correlação fornecida será de correlação de Pearson (r)

Não se esqueça de análise de resíduos

Desfecho: variável quantitativa contínua Exposição: variável quantitativa contínua Sem dependência de dados

Desfecho com distribuição normal

Desfecho sem distribuição normal

Se for apenas uma exposição, use correlação de Spearman (rsp)

Algo mais complicado procure seu orientador ou estatístico!

Em odontologia o erro mais comum é ignorar a dependência de dados em diversas situações

Ex 1: correlação de instrumento para medir raiz tradicional e novo num mesmo conjunto de raízes (logo duas medidas por raiz com instrumento tradicional e novo) não pode ser apenas calcular coeficiente de correlação de Pearson, precisa calcular Há necessidade de calcular correlação intraclasse!

Temos vários trabalhos de odonto errados e publicados!

Ex 2: Se testar dois aparelhos novos como microct com medidas normais de histologia, de novo, vai estar completamente errado se usar o r , precisa usar correlação intraclasse.

Correlações com dependência de dados

Apresentação de sua pesquisa em gráficos

Erros inaceitáveis

http://dx.doi.org/10.1016/j.vph.2016.09.008

Theyler et all 2016. J Vascular Pharmacology

O gráfico ao lado representa um erro comum. A medida é quantitativa contínua (mg/g ) não Pode ser representado por barras ou colunas. Colunas e barras servem apenas para proporções O gráfico correto deveria ser como o abaixo, com médias e intervalos de confiança.

Figure 1: Bar chart of the mean proportion (±standard error of the mean) of colony-forming units resistant to six concentrations of doxycycline and amoxicillin in subgingival plaque samples from Mexican subjects (n=20). *p<0.05; Wilcoxon signed ranks test.

Erros num só lugar

Journal Of Clinical Periodontology 33(10):743-8 · October 2006

Teste não paramétrico, Com Erro da média E gráfico de barras!

COMBO de Erros!

Como representar os resultados

Médias ou Medianas

Variáveis quantitativas contínuas

Distribuição normal: média e medida de variabilidade

Distribuição não normal: mediana e quartis (box-plot)

Desvio padrão: para apenas descrever os resultados, sem concluir que médias são diferentes. Erro padrão: enfatizar que as médias são diferentes para se fazer inferência estatística. Com o erro padrão o leitor é capaz de calcular rapidamente (mentalmente) o intervalo de confiança. Intervalo de Confiança: melhor medida para inferência estatística. É pouco utilizado em estudos de laboratório, pois poucos pesquisadores de laboratório sabem seu significado.

Desvio Padrão ou Erro Padrão ou Intervalo de Confiança ?

Nota: lembre-se que erro padrão e IC podem ser calculados para proporção, mas jamais pode-se calcular desvio padrão para proporção.

Embora box plot sejam mais recomendados representar testes não paramétricos, por vezes mesmo com uma distribuição normal, queremos mostrar outliers e a distribuição verdadeira. Assim, podemos representar os resultados com box-plot como no exemplo abaixo. No entanto , jamais representar uma distribuição não normal com média e desvio padrão.

Box-plot para representar distribuição normal?

Neste exemplo, embora tenha se utilizado ANOVA, a representação Foi realizada por meio de box-plot, especialmente para evidenciar os Outliers.

Preste atenção no que está lendo

Fig. 1 The distribution of standard errors for prespow1 and prespow2 Note: The thick white lines within each box represent the median. The outside edges of the boxes represent the 25 and 75 per cent quantiles. The whiskers report outliers. The hollow circles represent data points 1.5 times outside of the interquartile range.

Este é um gráfico correto. São box-plots de distribuição de erros padrão. O que o autor avaliou foi a distribuição de erros (variável continua) entre construtos diferentes poder do presidente (presidential power) entre América, Europa, Ásia e África. Como a distribuição dos erros não era normal, o autor representou por box-plots!

Ligar ou não estimadores?

Médias ou estimadores podem ser ligadas como no gráfico A se, e somente se tiver sentido, no caso as medidas de média se referem a evolução ao longo do tempo.

A figura B representa médias de resistência de 4 diferentes materiais, logo não tem o porque de ligar

Figura A

Figura B

Duas variáveis contínuas representar por gráfico de dispersão

Correlações

Gráfico de Dispersão com IC.

Gráfico de dispersão simples

Nos dois gráficos a apresentam correlações lineares

Preste atenção nas escalas de gráficos

Se for comparar vários gráficos preste atenção se estão todos na mesma escala, se não estiverem ajuste!

Pacote estatístico não pensa, o pesquisador é que tem que pensar!

Ao pedir uma ANOVA no Statistica 13 (antigo StatSoft) para a diferença de dureza de três materiais, o programa solta um gráfico ligando as médias por linhas. Está errado, e é o pesquisador quem tem que saber que tem que remover as linhas!

Cuidado com alguns pacotes estatísticos

Ao clicar sobre a linha para removê-la, o pacote diz que é um box-plot, mas não é, o que aparece é media e 95%IC

Box plot no Statistica 13

Ao pedir gráficos no Statistica , com a opção Summary, ele nos da um box plot

Note que o aluno pode se confundir. Ao lado do box-plot o pacote fornece informações de média e desvio padrão. Para que eu não sei! Você pode achar que O gráfico mostra media e desvio padrão, Mas o box-plot é feito com MEDIANA E QUARTIS E DISTÂNCIAS INTERQUARTIS

Mediana

Q1

Q2

Limite inferior : mediana menos a distância interquartil

Limite superior: mediana + distância interquartil

A internet está cheia de páginas de pesquisadores com exemplos de erros. Divirtam-se!

Este é um site do Broman com exemplos muito interessantes e começa com uma boa frase inclusive tem um exemplo de gráfico ruim dele próprio. “With apologies to the authors, we provide the following list of the top ten worst graphs in the scientific literature. As these examples indicate, good scientists can make mistakes.” https://www.biostat.wisc.edu/~kbroman/topten_worstgraphs/

Vamos aprendendo com os erros dos outros e tentando não repeti-los.!

O que não fazer!

De preferência a tabelas

Use gráficos apenas para representar algo que seria muito, muito interessante!

Não abuse de gráficos

Utilize o gráfico certo, e tome cuidado com gráficos 2D ou 3D que podem distorcer as informações.

Gráficos ou Tabelas?

Tabelas devem ser claras, e fáceis de ler.

Tabelas devem ter enunciado detalhado para que a tabelas seja fonte única de informação. O leitor não deve ter que recorrer a informações no texto para entender a tabela.

Fazer boas tabelas é uma arte e melhora com a experiência

Uma boa tabela é aquela que se consegue ler em menos de 30 segundos. Se um estranho não conseguir a tabela não deve estar boa, refaça!

Tabelas

Características gerais de uma tabela

Tabela 1. Características da coorte de nascidos vivos de Ribeirão Preto, 1978 (n = 2400).

Sexo

Feminino 1200 (50.0)

Masculino 1200 (50.0)

Escolaridade (anos)

< 13 1800 (76.6)

13 + 600 (33.6)

n ( % )

Emaus et al. Am J Epidemiol 2005;633-43

Se necessário use e abuse de notas de rodapé. Mas somente o necessário

Exemplo do site do Bromam de tabela ruim

A tabela tem muitos casas decimais. Isso dificulta a visualização.

Como escrever monografia Parte I

Formatação e questões técnicas

Com inclusão de algumas normas da ABNT – Associação Brasileira de Normas Técnicas

Tipos de Publicações

Monografia – item não seriado, isto é item completo, constituído de uma só parte, ou que se pretende completar em um número pré-estabelecido de partes separadas.

Publicação periódica – publicação de qualquer

tipo de suporte, editada em unidades físicas sucessivas, com designações numéricas/e ou cronológicas destinada a ser continuada indefinidamente.

Segundo ABNT

TCC (trabalho de conclusão de curso): documento que apresenta resultado de um estudo, devendo expressar conhecimento do assunto escolhido, que deve ser obrigatoriamente emanado da disciplina, módulo, estudo independente, curso, programa ou outros ministrados. Deve ser feito sob a coordenação de um orientador.

Partes de uma Monografia

Elementos pré-textuais Capa, folha de rosto, listas de ilustrações, abreviaturas e

siglas, e listas de símbolos

Elementos textuais texto introdução, material e métodos,

Elementos pós textuais referências, glossários, apêndice, anexo, índice

Capa (primeira e segunda)

Folha de rosto (ou ficha de identificação do relatório)

Ficha catalográfica

Dedicatória

Agradecimentos

Epigrafe

Resumo (língua vernácula

Resumo (língua estrangeira)

Lista de símbolos, unidades, abreviaturas, etc.

Lista de ilustrações

Sumário.

Elementos Preliminares ou Pré-textuais

Introdução

Desenvolvimento

Conclusão

Elementos Textuais

Referências bibliográficas

Glossário

Apêndices

Anexos

Índice(s)

Elementos Pós-textuais

Margens esquerda e superior de 3cm e direita e inferior de 2cm.

Tamanho de Letra : 12 – exceto tabelas, notas e citações e títulos de páginas que podem ser maiores

Tipo de Letra: usar um único tipo ao longo do trabalho, tanto para títulos como texto.

Espaços entre linhas: 1,5 exceto em citações diretas Númeração de página: algarismos arábicos no canto superior da

página. Embora todas as paginas sejam contadas, o número impresso começa somente a partir da primeira página da introdução.

Formatação

Elementos Pré-textuais

Capa Elementos Pré-textuais

Elementos: • Nome da Instituição (opcional)

• Nome do autor completo

• Titulo e subtítulo: • - letras minúsculas exceto primeira letra

• Local (cidade)

• Ano de depósito

É como se fosse uma capa interna onde se adiciona nome de orientador, e finalidade da monografia

Folha de Rosto Elementos Pré-textuais

No verso da Folha de Rosto Copiado do manual da USP “Nota: Os descritores ou palavras-chave (termos representativos do trabalho) devem ser definidos pelo autor, em conjunto com o bibliotecário, preferencialmente de acordo com o Vocabulário Controlado do SIBi/USP3 (UNIVERSIDADE DE SÃO PAULO, 2006). “

Ficha Catalográfica Elementos Pré-textuais

Se houver errata deve ser introduzida neste momento em folha separada antes da folha de pareceres

Errata Elementos Pré-textuais

ERRATA Folha Linha Onde se lê Leia-se 37 8 “ gramas” “microgramas”

Elementos obrigatórios • nome completo do autor; • título e, se houver, subtítulo • natureza do trabalho (dissertação ou tese); • nome da instituição a que é submetido o trabalho; • grau pretendido • área de concentração • data de aprovação • nome, titulação, instituição a que pertence e assinatura dos componentes da banca examinadora.

Folha de Pareceres Elementos Pré-textuais

Folha de dedicatória é opcional e livre.

Folha de Dedicatória Elementos Pré-textuais

Folha para agradecimentos

Pode-se adicionar uma ou mais folhas para agradecimentos (não uma folha para cada agradecimento).

Folha para Epígrafe

Pode-se adicionar uma folha denominada Epígrafe para citar algo que se deseja.

Agradecimentos e Epígrafe Elementos Pré-textuais

Resumo em português

Máximo de 500 palavras

Conter palavras-chaves.

Resumo na Língua Vernácula Elementos Pré-textuais

O resumo em língua estrangeira em geral é em inglês, mas pode ser em outro idioma ou mesmo pode-se adicionar vários resumos em outros línguas.

Resumo em Língua Estrangeira Elementos Pré-textuais

Se necessário, quando forem muitas, apenas se necessário adicionar listas de abreviaturas, tabelas e figuras.

Note que não é índice e sim Lista.

Listas de Tabelas e Figuras Elementos Pré-textuais

Note: Sumário em letra maiúscula, centralizado. Não contém elementos pré –textuais Começa pela introdução com a página 14. Páginas anteriores não são numeradas e nem entram no sumário!

Sumário (último elemento pré-textual)

Elementos Obrigatórios

Introdução

Desenvolvimento

Conclusão

Dependendo do tipo de trabalho, cada um vai ser diferente.

Ex: introdução, justificativa, material e métodos ou somente métodos, resultados, e discussão.

Elementos Textuais

Elementos Textuais Exemplo.....

Introdução

Primeira página a receber numeração é a página de texto da introdução. Separador de página não leva número, mas conta como página.

Justificativa deve existir, mas não necessariamente tem que ser numa página separada.

Justificativa

Pode ser descrito em hipóteses a serem testadas ou em termos de proposição.

Neste caso era regra do programa de pós-graduação estabelecer proposição e teste de hipóteses.

Hipóteses a serem testadas ou Proposição

Material e Métodos é o usual, mas as vezes não existe material, pode ser apenas descrição de métodos.

Neste exemplo de estudo observacional usou-se apenas métodos.

Material e Métodos

Exemplo.....

Considerações Éticas e Riscos

Use e abuse de tabelas. O texto, é apenas para relatar o que não está nas tabelas, e ressaltar principais achados gerais das tabelas. Não leia a tabela para o leitor. Ele não é analfabeto! Pelo menos não deve ser.

Resultados

Em geral a discussão é realizada em uma parte separada. Mas nada impede de se apresentar os resultados e discussão ao mesmo tempo. Não é usual em nossa área de saúde, mas é o habitual em estudos de química e física.

Discussão

A conclusão deve responder a proposição do trabalho. Pode ser apresentado em um tópico separado ou apenas um paragrafo ao final da discussão.

Conclusão

Referências

Glossário

Apêndices

Anexos

Índices

Elementos Pós-textuais

Referências podem seguir regras da ABNT ou Vancouver

Referências

Elementos Pós-textuais

Glossário

lista alfabética das palavras ou expressões técnicas de uso restrito, ou pouco conhecidas, utilizadas no texto, acompanhadas das respectivas definições, conforme a ABNT NBR 14724 (ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS, 2005).

Glossário

Elementos Pós-textuais

Considera-se apêndice todo produto desenvolvido pelo autor E que pertenca a pesquisa: termos de consentimento, detalhes de análises, questionários etc. Note apenas produtos desenvolvidos especificamente para a pesquisa, ou fruto dela. Se o autor desenvolveu um meio de cultura em um estudo anterior, a formula do mesmo deve entrar em anexos e não apêndices. Os apêndices devem ser identificados com letras: APÊNDICE A APÊNDICE B....

Apêndice

Elementos Pós-textuais

Nos anexos devem entrar informações, meios ou técnicas utilizadas ou referenciadas no estudo que o autor considere importante disponibilizar para o leitor e que não tenham sido fruto direto do estudo. Os ANEXOS devem ser identificados com letras: ANEXO A ANEXO B....

Anexos

Elementos Pós-textuais

Lista de palavras ou frases ordenadas alfabeticamente (autor, título ou assunto) ou sistematicamente (ordenação por classes, numérica ou cronológica); localiza e remete para as informações contidas no texto. A paginação deve ser contínua, dando seguimento ao texto principal.

Índices

Elementos Pós-textuais