Testes de Hipótese

Preview:

DESCRIPTION

Testes de Hipótese. Dr Hermano Alexandre Doutorando em Saúde Coletiva Mestre em Saúde Pública Especialista em auditoria de sistemas de saúde Faculdade de Medicina Universidade Federal do Ceará. Tópicos essenciais da aula. Significância estatística Intervalos de confiança - PowerPoint PPT Presentation

Citation preview

Dr Hermano Alexandre

Doutorando em Saúde Coletiva

Mestre em Saúde Pública

Especial ista em auditor ia de sistemas de saúde

Faculdade de Medicina

Universidade Federal do Ceará

Testes de Hipótese

Significância estatística

Intervalos de confiança

Inferência estatística

Tópicos essenciais da aula

Testes de hipótese

Teste t de student

Teste F

Teste chi quadrado

Intervalos de confiança

Inferência estatística

Tópicos

Visa testar qual a probabilidade de que um determinado resultado encontrado em uma determinada amostra seja somente devido ao acaso.

Teste de hipótese

Em inglês, hypothesis

Em alemão, Hypothese

Em latim, hypothesis

...

Vem de: base(hipo) de uma proposição(thesis).

O que é hipótese?

O que é hipótese?

População

Amostr

a

100 Obesos

100 Não obesos

Obesos –

120, 113, 167, 100, 98, 76, 129, ...

Média - 122

37 Pré diabéticos

Não obesos –

98, 90, 100, 73, 200, 103, 78, ...

Média – 98

13 Pré diabéticos

O que é hipótese?

O acaso (erro tipo I)

Por que testar a hipótese

Hipóteses de um Teste

Ho - Hipótese Nula

H1 - Hipótese Alternativa

Hipóteses de um Teste

Ho - Hipótese Nula - hipótese que será

suposta inicialmente como verdadeira.

É, basicamente, a negação do que o pesquisador deseja provar.

Hipóteses de um Teste

H1 - Hipótese Alternativa - hipótese que será aceita, se os dados mostrarem evidências suficientes para a rejeição da hipótese nula.

Geralmente, é a própria hipótese da pesquisa.

Exemplo

Ho: Em média, as vendas não aumentam com a introdução da

propaganda.

H1: Em média, as vendas aumentam com a introdução da propaganda.

Ho: Em média, o IAM não diminui com uso de aspirina.

H1: Em média, o IAM diminui com o uso de aspirina.

Exemplo

Suspeita-se que uma moeda, utilizada em jogo de azar, seja viciada, isto é, que a probabilidade de sair “cara” seja diferente de 50%.

Hipóteses

Ho: p = 0,5 (a probabilidade é 50%)

H1: p = 0,5 (a probabilidade não é 50%)

p - probabilidade de cara.

Amostra

Para se tomar a decisão de se aceitar, ou não, que a moeda seja honesta, tomou-se uma amostra com 10 lançamentos e observou-se o número de caras.

(variável X - estatística do teste).

ValorEsperado

Qual é o valor esperado para o número de caras (variável X - estatística do teste) se a probabilidade for realmente 50%?

5 caras

Resultado da amostra

Valor esperado se a probabilidade for realmente 50%: 5 caras.

Situação 1: Valor obtido: X = 10 caras. Qual seria a conclusão?

Situação 2: Valor obtido: X = 7 caras. Qual seria a conclusão?

Desvio Observado

Valor esperado seHo for verdadeira

Valor observadona amostra

Desvioocorreu porque Ho é falsa ?

ocorreu por acaso? (Ho verdadeira)

Cada um para uma finalidade específica

Tipo de variável

Distribuição da variável

Paramétricos

Não paramétricos

Quantidade de amostras

Amostras relacionadas ou não

Tipos de testes estatísticos

Numéricas?

T de student

Teste F

ANOVA

Mann Whitney

Categóricas?

Chi quadrado

Análise de verossimilhança

Kendall`s Tau B

Tipos de variáveis

Paramétricas

Teste T

Anova

Não paramétricas

Mann Whitney

Chi quadrado

*Kolmogorov Smirnov

Distribuição de variáveis

Duas?

Mann Whitney

Teste T

Chi quadrado

K?

Kruskall Wallis

Chi quadrado

ANOVA

Quantidade de amostras

Com controle?

McNemar

Wilcoxon

Sem controle?

Teste T

Chi quadrado

Relação entre amostras

Fórmula matemática

Valor lançado em uma curva

Como funciona um teste?

Valor de p

Como funciona um teste?

Utilizado para comparar duas médias, variáveis paramétricas, não relacionadas, duas amostras

Obesos –

120, 113, 167, 100, 98, 76, 129, ...

Média - 122

37 Pré diabéticos

Não obesos –

98, 90, 100, 73, 200, 103, 78, ...

Média – 98

13 Pré diabéticos

Teste T

T(Médias)

Utilizado para comparar duas variâncias, variáveis paramétricas ou não, não relacionadas, K amostras

Obesos –

120, 113, 167, 100, 98, 76, 129, ...

Média - 122

37 Pré diabéticos

Não obesos –

98, 90, 100, 73, 200, 103, 78, ...

Média – 98

13 Pré diabéticos

Teste F (ANOVA)

F(Variâncias)

Utilizado para comparar duas categorias, variáveis paramétricas, não relacionadas, duas amostras

Vários tipo de chi quadrado

Ideia ->

Teste chi quadrado

Obesos Não Obesos

Pré diabéticos 37(50) 13(50)

Não Pré diabéticos

63(50) 87(50)

Utilizado para comparar duas categorias, variáveis paramétricas, não relacionadas, duas amostras

Obesos –

120, 113, 167, 100, 98, 76, 129, ...

Média - 122

37 Pré diabéticos

Não obesos –

98, 90, 100, 73, 200, 103, 78, ...

Média – 98

13 Pré diabéticos

Teste chi quadrado

X2(Categorias)

As medidas de tendência central apresentam valores que podem assumir até um certo limite com uma certa confiança

O limite mais utilizado é o de 95%

Médias 122 (IC 95% 110 – 134)

Médias 98 (IC 95% 86 – 110)

Intervalo de confiança

Generalizar uma proposição retirada de uma amostra para uma população.

Critérios de causalidade;

Viéses.

Inferência estatística

Inferência estatística

PopulaçãoConjectura (hipótese) sobre o comportamento de variáveis

AmostraResultados reais obtidos

Decisão sobre a admissibilidade da hipótese

Probabilidade de Significância (ps) – Valor de p

Probabilidade da estatística do teste acusar um resultado tão (ou mais) distante do esperado quanto o resultado ocorrido na amostra observada.

Pode ser compreendida como a probabili-dade do desvio observado ter ocorrido por acaso se a hipótese nula for verdadeira.

Desvio Observado

Valor esperado seHo for verdadeira

Valor observadona amostra

Desvio

ocorreu porque Ho é falsa ?

ocorreu por acaso? (Ho verdadeira)

Situação 1

A amostra apresentou 10 caras.

Se p = 0,5, a probabilidade da amostra apresentar X = 10 (ou X=0) caras é:

Situação 1

ps = 0,002 ou 0,2%

X0.0010.01

0.044

0.117

0.205

0.246

0.205

0.117

0.044

0.010.001

0 1 2 3 4 5 6 7 8 9 10

Conclusão...

ps = 0,2% (probabilidade do desvio ter ocorrido por acaso)

Qual seria a conclusão?

Rejeita-se Ho, ou seja, não se admite que o desvio tenha ocorrido por acaso.

Situação 2

A amostra apresentou 7 caras.

Se p = 0,5, a probabilidade da amostra apresentar X = 7 ou mais (ou X=3 ou menos) caras é:

Situação 2

ps = 0,344 ou 34,4%

X0.0010.01

0.044

0.117

0.205

0.246

0.205

0.117

0.044

0.0060.001

0 1 2 3 4 5 6 7 8 9 10

Conclusão...

ps = 34,4% (probabilidade do desvio ter ocorrido por acaso)

Qual seria a conclusão?

Aceita-se Ho,ou seja, não se pode afirmar que o desvio não tenha ocorrido por acaso.

Decisão

Se a probabilidade do desvio ter ocorrido por acaso for considerável (ps alta), não há evidências para se rejeitar Ho. Aceita-se Ho.

Quando a probabilidade do desvio ter ocorrido por acaso for considerada pequena (ps baixa), há evidências para a rejeição de Ho. Rejeita-se Ho.

VALOR DE P

O nível de significância () é o limite para a probabilidade de significância a partir do qual se passa a rejeitar a hipótese nula do teste.

Representa a probabilidade tolerável de se rejeitar Ho quando esta for verdadeira.

Os valores mais comuns para o nível de significância são 5%, 10% e 1%.

Força de associação (maior proporção de imc elevado e pré-diabetes)

Consistência ( Se repetido o estudo, encontra-se o mesmo resultado)

Especificidade (todos os imc elevados teriam pré-diabetes)

Temporalidade (primeiro vem o imc alto, depois a pré-diabetes)

Critérios de causalidade

Gradiente biológico (Maior imc, maior glicemia de jejum)

Plausibilidade (Faz sentido relacionar imc e pré-diabetes?)

Coerência (Existe teoria que contradiz?)

Evidência experimental (Se engordarmos uma pessoa ela adquire pré-diabetes?)

Critérios de causalidade

Decorre do fato de não se utilizar a população inteira

Viés de seleção

Viés de estimativa

Viés de financiamento

Viéses

Obrigado!

Dúvidas ou sugestões?

hermanoalexandre@gmail.com

Recommended