16
Wilcoxon - Amostras Independentes Seminário de Bioestatística Fernando de Carvalho Baião Lauro Martins Neto Luis Guilherme Piereti Miguel Pitta

Wilcoxon amostras independentes

Embed Size (px)

Citation preview

Page 1: Wilcoxon amostras independentes

Wilcoxon - Amostras Independentes

Seminário de Bioestatística

Fernando de Carvalho BaiãoLauro Martins NetoLuis Guilherme PieretiMiguel Pitta

Page 2: Wilcoxon amostras independentes

Definição

O teste da soma de Wilcoxon é um teste não-paramétrico que usa postos de dados amostrais de duas populações independentes. É usado para testar a hipótese nula de que duas amostras independentes provêm de populações com medianas iguais. A hipótese alternativa é a afirmativa de que as duas populações têm medianas diferentes.

H0: As duas amostras provêm de populações com medianas iguais.

H1: As duas amostras provêm de populações com medianas diferentes.

Page 3: Wilcoxon amostras independentes

Conceito de Mediana A Mediana é uma medida de tendência central, um

número que caracteriza as observações de uma determinada variável de tal forma que este número (a mediana) de um grupo de dados ordenados separa a metade inferior da amostra, população ou distribuição de probabilidade, da metade superior.

Mais concretamente, 1/2 da população terá valores inferiores ou iguais à mediana e 1/2 da população terá valores superiores ou iguais à mediana.

Exemplos:Para a seguinte população:

(1, 3, 5, 7, 9) ->A mediana é 5 (igual à média)No entanto, para a população:

(1, 2, 4, 10, 13) ->A mediana é 4 (enquanto a média é 6)Para populações pares:

(1, 2, 4, 7, 9, 10) ->A mediana é (4+7)/2, que é 5.5

Page 4: Wilcoxon amostras independentes

Definição de teste não paramétrico

Quando um pesquisador utiliza testes não-paramétricos, supõe-se que a distribuição de seus dados experimentais não seja normal, ou que ele não tenha elementos suficientes para poder afirmar que seja. Na dúvida quanto a essa informação, nada impede que ele opte pelo uso da estatística não-paramétrica.

É necessário, apenas, que os dados sejam ordenáveis.

O que ele não pode fazer, de modo algum, é argumentar em termos de desvios ou erros padrões, embora possa perfeitamente fazê-lo pura e simplesmente em termos de médias.

Page 5: Wilcoxon amostras independentes

Conceitos Básicos (Wilcoxon)

O teste de soma de postos é equivalente ao teste U de Mann-Whitney.

A idéia que fundamenta o teste da soma de postos de Wilcoxon é a seguinte: Se duas amostras são extraídas de populações com mesma mediana e se associam em postos a todos os valores individuais combinados em uma única coleção de valores, então os postos altos e baixos devem se distribuir igualmente entre as duas amostras.

Se os postos baixos se concentrarem predominantemente em uma amostra e os altos se concentrarem em outra, suspeitamos de que as duas populações tenham medianas diferentes.

Page 6: Wilcoxon amostras independentes

Requisitos

Há duas amostras independentes de dados selecionados aleatoriamente.

Se ambos os tamanhos amostrais forem maiores que 10, então a distribuição amostral (R) será aproximadamente normal, com média μ e desvio padrão σ..

Não há qualquer exigência de que as duas populações tenham uma distribuição normal ou qualquer outra distribuição.

Page 7: Wilcoxon amostras independentes
Page 8: Wilcoxon amostras independentes

Considerações Como já foi dito, o teste da soma de postos de

Wilcoxon não exige populações normalmente distribuídas. Também, o teste da soma dos postos de Wilcoxon pode ser usado com dados no nível ordinal de medição, tais como os dados que consistem em postos. Em contraste, os métodos paramétricos não pode ser usados com dados no nível ordinal de medição.

O teste de soma de postos de Wilcoxon tem classificação de eficiência de 0,95 quando comparado aos métodos paramétricos t ou z. Como esse teste tem uma alta classificação de eficiência e envolve cálculos mais simples, ele é mais preferido do que testes paramétricos, mesmo quando é satisfeita a exigência de normalidade.

Page 9: Wilcoxon amostras independentes

Exemplo de exercício

Com base nos dados amostrais e usando nível de significância de 0,05, teste a afirmativa de que a mediana dos IMC’s (índice de massa corpórea) dos homens é igual à mediana dos IMC’s das mulheres.

N1 e N2 referem-se ao tamanho da amostra 1 e 2 respectivamente

R1 e R2 referem-se a soma dos postos da amostra 1 e 2 respectivamente

Page 10: Wilcoxon amostras independentes

Exemplo de exercício

Segundo passo:

Calcular R1 e R2 colocando os valores dos IMC`s de homens e mulheres em uma tabela.

Os dados em azul claro correspondem aos

valores para os homens e a soma desses respectivos postos serão R1 (que será 187)

Os dados em azul escuro correspondem aos valores para as mulheres e a soma desses respectivos postos serão R2 (que será 138)

Page 11: Wilcoxon amostras independentes
Page 12: Wilcoxon amostras independentes

Exemplo de exercício

Terceiro Passo:

Aplicar os valores nas fórmulas:

13 (13 + 12 + 1) = 169

(13) (12) (13 + 12 + 1) = 18,38512

2

187 – 169 = 0,9818,385* Esse R refere-se a R1 de modo que se trocarmos os

valores amostrais um pelo outro (n1 nos locais de n2 e vice – versa) , z valeria = – 0,98

Page 13: Wilcoxon amostras independentes

Exemplo de exercício

Quarto passo:Achar o z crítico dado que α = 0,05. Portanto, z crítico vale 1,96.

Enquanto isso, Z teste vale 0,98.

Portanto, rejeita-se H1. Parece que as medianas dos valores de IMC para homens e mulheres são basicamente iguais

P valor é 0,3032. Como P valor > α = Rejeita-se H1

Page 14: Wilcoxon amostras independentes

Exercícios Para Sala

Para que o teste de “Wilcoxon Para Amostras Independentes” é utilizado? Ele é um teste paramétrico ou não paramétrico?

R: É usado para testar a hipótese nula de que duas amostras independentes provêm de populações com medianas iguais. Ele é um teste não paramétrico e, portanto, não depende de parâmetros específicos como média, desvio padrão e proporção “p” e, além disso, não é necessário que a população seja normalmente distribuída.

Page 15: Wilcoxon amostras independentes

Exercícios Para Sala

Formule a hipótese nula e a hipótese alternativa para um teste básico sobre a “Soma de Postos de Wilcoxon Para Amostras Independentes”.

R: H0: As duas amostras provêm de populações com medianas iguais. H1: As duas amostras provêm de populações com medianas diferentes.

Page 16: Wilcoxon amostras independentes

Exercícios Para Sala

Na fórmula : o que significa o R da equação?

R: O “R” na fórmula corresponde a somatória dos postos de R1. Nesse caso, consideramos a amostra de homens como sendo a amostra 1 e a de mulheres sendo a amostra 2. Portanto, no exemplo dado, R1 se refere a somatória dos valores dos postos da amostra de homens.

* Se invertessemos (amostra 1 sendo as mulheres e refizéssemos todos os cáculos novamente os valores dariam exatamente iguais porém com o sinal invertido – como para homens sendo amostra 1 o Z teste foi +0,98, então, se as mulheres forem amostra 1 o Z teste será -0,98).