Metodologia de Pesquisa · Dois professores, João e Maria, acham que têm o melhor método de...

Preview:

Citation preview

Metodologia de PesquisaMétodos quantitativos: teste de hipótese

Agenda● Estatística descritiva● Medidas de disopersão● Universo e Amostra● Testes paramétricos● Testes não paramétricos

Estatística descritiva

● Média aritmética● Moda● Mediana● Valor máximo e mínimo ● Amplitude

Estatística descritiva● Média aritmética

○ Soma de todos os elementos da amostra dividido pelo numero de elementos■ Ex.: 5,3,6,8,4,5,7,5,9■ (5 + 3 + 6 + 8 + 4 + 5 + 7 + 5 + 9) / 9 = 5,77

Estatística descritiva

● Média aritmética● Moda

○ Valor que ocorre mais vezes○ Ex.: 5,3,6,8,4,5,7,5,9○ Moda=5

Estatística descritiva● Média aritmética● Moda● Mediana

○ A mediana é determinada ordenando-se os dados de forma crescente ou decrescente e determinando o valor central da série

○ Ex.5,3,6,8,4,5,7,5,9○ 9,8,7,6,5,5,5,4,3○ Mediana será 5

Estatística descritiva

Média aritmética

ModaMedianaValor máximo e mínimo Amplitude

Estatística descritiva● Média aritmética● Moda● Mediana● Valor máximo e mínimo ● Amplitude

○ Valor entre máximo e mínimo○ Ex.5,3,6,8,4,5,7,5,9○ máximo= 9; mínimo=3○ Amplitude será 6

Exercício● Calcular média, moda, mediana, valor máximo, valor mínimo, amplitude, desvio

em relação à média, variância, desvio padrão e coeficiente de variação○ idade média da turma, ○ peso médio da turma, ○ altura média da turma, ○ número de filhos médio da turma,○ número de alunos por orientador na turma,○ período,○ distância até aqui (onde mora até UNIRIO)○ ocupação (estudante, profissional liberal, servidor público, servidor

privado)

Estatística: medidas de dispersão

● Desvio em relação à média○ Diferença entre valor observado e a média

○ Fornece uma noção da variabilidade dos dados em torno da média

○ DM= xi-x

Estatística: medidas de dispersão

● Desvio em relação à média

Estatística: medidas de dispersão

● Desvio em relação à média● Variância da amostra

○ Somatória do quadrado do desvio em relação à média, dividida pela quantidade de elementos da série menos 1

Estatística: medidas de dispersão

● Desvio em relação à média● Variância

da amostra

Estatística: medidas de dispersão

● Desvio em relação à média● Variância da amostra● Desvio padrão

○ Raiza da variância○ Grau de dispersão dos dados em

relação à média

Estatística: medidas de dispersão

● Desvio em relação à média● Variância da amostra● Desvio padrão● Coeficiente de variação

○ Permite comparar variáveis diferentes

Comparando variáveis

Hipótese

Uma hipótese é uma afirmativa sobre uma propriedade da população

Um teste de hipótese (ou teste de significância) é um procedimento padrão para testar uma afirmativa sobre uma propriedade da população.

Exemplo

Médicos afirmam que a temperatura normal do corpo humano é de 37oC

A afirmativa é que a temperatura = 37oC

Se temperatura temperatura = 37oC for falso

Então temperatura = 37oC é verdadeiro

Exemplo

A proporção de motoristas que afirmam ultrapassar o sinal vermelho é >50%

A afirmativa é que a proporção é p > 50%

Se p>50% for falso, Então p=50% é verdadeiro

Tomaremos p=50% coo hipótese nula e p>50% como hipótese alternativa (que queremos mostrar)

Exemplo

Hum,, estou desconfiada da balança do supermercado X. Comprei um pacote de tomates que dizia 227g e só tinha 225g

A diferença se deve ao acaso ou a máquina está com problemas

Tópico: aferição de balanças

Passo 1: Determinação da hipótese

Minha hipótese é de que “A balança do supermercado X está mal aferida”

Se “A balança do supermercado X está mal aferida” for falso

Então “A balança do supermercado X está bem aferida”

ExemploDois professores, João e Maria, acham que têm o melhor método de ensino para ensinar alunos de MBA sobre conceitos de teste de hipótese. Maria requer que os alunos assistam a 1 aula teórica e participem de 1 apresentação por semana. João acha que 1 aula basta. Este é o primeiro semestre que Maria vai aplicar o método. Como dá muito trabalho, ela quer ter certeza que funciona.

Tópico: eficácia de métodos de ensino

Passo 1: Determinação da hipótese

H1: Quando alunos participam de um seminário, além das classes convencionais, sua performance aumenta.

Hipótese alternativa: Não faz diferença

Exemplo

1- Qual o melhor algoritmo disponível para classificação de clientes em relação a serem bons pagadores

2- Desempenho de um novo algoritmo

Foco em alguma(s) medida(s) que capturem a capacidade do algoritmo em solucionar o problema.

Exemplo

A altura média dos brasileiros é no máximo 1,80 m

�brasileiro < 1,80 m

Se �brasileiro < 1,80 m for falso

Então �brasileiro > 1,80 m

Tomamos �brasileiro > 1,80 m como hipótese alternativa e

�brasileiro = 1,80 m como hipótese nula

Conceitos: Identificação das hipóteses

● Hipótese nula (Representada por Ho) ○ Afirmativa de que o valor do parâmetro populacional é

igual a algum valor especificado.

● Hipótese alternativa (Representada por H1 ou Ha) ○ Afirmativa de que o parâmetro tem um valor que, de

alguma forma, difere da hipótese nula.

Conceitos: Identificação das hipóteses

1. Identifique a afirmativa ou hipótese específica a ser testada e expresse-a em forma simbólica.

2. Dê a forma simbólica que tem que ser verdadeira quando a afirmativa original é falsa

3. Hipótese alternativa é a que não contém a igualdade, e a hipótese nula iguala o parâmetro ao valor fixo sendo considerado

Estatística de teste

Calculado a partir dos dados amostrais

Usada para mostrar a rejeição da hipótese nula

Conceitos importantes

Valor crítico

Qualquer valor que separa a região crítica (onde rejeitamos a hipótese nula) dos valores da estatística de teste que não levam a rejeição da hipótese nula.

Valor P

O valor P (ou valor de Probabilidade) é a probabilidade de se obter um valor da estatística de teste que seja no mínimo tão extremo quanto o que representa os dados amostrais, supondo que a hipótese nula seja verdadeira.

Em geral 5%, 1% 0.5%

Região crítica

Conjunto de todos os valores da estatística de teste que nos faz rejeitar a hipótese nula

Nível de Significância

O nível de significância (representado por α) é probabilidade de que a estatística de teste cairá na região crítica quando a hipótese nula for realmente verdadeira.

Intervalo de Confiança

Como uma estatística de intervalo de confiança de um parâmetro populacional contém os valores prováveis do parâmetro, rejeite uma afirmativa de que o parâmetro populacional tenha um valor que não esteja incluído no intervalo de confiança

Região crítica

Considerando exemplo da balança e peso do tomate, isto é , H1:= ̸227 g, espera-se que a média amostral seja inferior ou superior a 227 gSuponha que equipe técnica tenha decidido adotar a seguinte regra:rejeitar Ho se X for maior que 235 g e ou menor que 220 g.

Rc ={ x > 235g ou x < 220g} Região de rejeição de Ho.

Rc = Ra = { 220 g< x >235g} Região de aceitação de Ho.

x�=227

Rejeitar H0Rejeitar H0Aceitar H0

Erros tipo I e tipoII

Exemplo:

H0: Aceitar o lote

H1: Não aceitar o lote

Erro tipo I: Rejeitar a hipótese nula quando ela é, de fato, verdadeira. O símbolo α (alfa) é usado para representar a probabilidade de um erro do tipo I.

Erro tipo II: O erro de deixar de rejeitar a hipótese nula quando ela é falsa. O símbolo β (Beta) é usado para representar a probabilidade de um erro tipo II.

Testes bilaterais e unilateraisSe a hipótese nula e alternativa de um teste de hipóteses são:

H0 :�=�0

H1 :�≄�0 (diferente)

onde �0 é constante conhecida, o teste é chamada de teste bilateral.

teste unilateral esquerdo.

H0 :�=�0

H1 : �<�0

teste unilateral esquerdo.

H0 :�=�0

H1 : �>�0

Método

1. Dada uma afirmativa, identificar a hipótese nula e a hipótese alternativa, e expressá-las, em forma simbólica.

2. Dados uma afirmativa e dados amostrais, calcular o valor da estatística de teste.

3. Dado um nível de significância, identificar o(s) valor(es) crítico(s).4. Dado um nível da estatística de teste, identificar o valor P.5. Estabelecer a conclusão de um teste de hipótese em termos simples.6. Identificar os erros tipo I e tipo II que podem ser cometidos ao se testar uma

dada afirmativa.7. Critério de Decisão: a decisão de rejeitar ou deixar de rejeitar a hipótese nula

é feita, em geral, usando o de teste de hipótese, o método do valor P, ou às vezes a decisão se baseia em intervalos de confiança.

Estatísticas de teste

A estatística de teste é um valor calculado a partir dos dados amostrais e é usada para se tomar uma decisão sobre a rejeição da hipótese nula.

Testes usualmente empregados

● Paramétricos● Não -paramétricos

Testes paramétricos

Requisitos para aplicação do teste

● a amostra ter sido extraída de uma população distribuída de acordo com distribuição normal (de Gauss);

● da escala de medida da variável aleatória ser contínua; e ● do tamanho da amostra ser maior do que 30 observações.

Métodos

● Teste Z● Teste T● Teste F (análise de variância)

Teste de hipotese para media populacional

Considere uma amostra aleatória de tamanho n de uma população normal com média (desconhecida) e variância �(conhecida) Inicialmente, considera-se o caso do teste unilateral esquerdo. Suponha que tem-se interesse em verificar as seguintes hipóteses:

A estatística do teste é a média amostral X . Se população é normal (ou se amostra é grande n 30, mesmo que a população não é normal) a distribuição de X é N e a variável aleatória sob H0

Teste Z para comparação de médias

AMOSTRAS GRANDES (N1 E N2>30)

Não é necessária qualquer suposição sobre os desvios padrão das amostras

S1 e s2 são as variâncias

X1 e X2 são as médias

Para pvalue=0.05 → Z=1,96

Teste Z (usando Excel)

Teste Z (usando Excel)

Teste Z (usando Excel)

Testes não paramétricos

Permitem trabalhar com pequenas amostras ou amostras das quais não se tenha certeza de que sejam provenientes de população com distribuição normal, assumindo poucas hipóteses sobre a distribuição de probabilidade da população.

Adequados para apoiar a tomada de decisão dentro das organizações em situações nas quais não seja atendido algum dos requisitos para a aplicação dos testes estatísticos paramétricos.

Testes não paramétricos

Teste dos sinais (Wilcoxon)

Teste de proporções

Testes do Qui-quadrado

Testes do Kolmogorovp-Smirnov

Testes de Mann-Witney

Teste de McNemar

Teste dos sinais (Wilcoxon pareado)

O teste de Wilcoxon pareado é utilizado para comparar se as medidas de posição de duas amostras são iguais no caso em que as amostras são dependentes.

Para isto, consideramos duas amostras dependentes de tamanho n vindas deduas populações P1 e P2, isto é, X1, ..., Xn e Y1, ..., Yn. Como neste caso asamostras são dependentes não podemos aplicar o Teste de Wilcoxon-Mann-Whitney.

Para realizar o Teste de Wilcoxon Pareado devemos primeiramente estabelecer as hipóteses:

TESTE se as populações diferem em localização ou não utilizando a seguinte idéia: se aceitarmos a hipótese nula, temos que a mediana da diferença é nula, ou seja, as populações não diferem em localização. Já, se a hipótese nula for rejeitada, ou seja, se a mediana da diferença não for nula, temos que as populações diferem em localização.

Exemplo

Consideremos duas amostras dependentes cujos dados estão na Tabela abaixo. Existem evidências de diferença entre as duas amostras?

TEMOS QUE A ESTATISTICA T+ QUE ´E A SOMA DOS POSTOS POSITIVOS

T+ = 2+3_4+5+6+7+8+9+10+11+12=77

Utilizando a distribuição exata da estatística de Wilcoxon para uma única amostra, temos que, para α = 5%, os valores críticos são t1 = 14 e t2= 64.

TEMOS QUE A ESTAT´ISTICA T+ QUE ´E A SOMA DOS POSTOS POSITIVOS

T+ = 2+3+4+5+6+7+8+9+10+11+12=77

Utilizando a distribuição exata da estatística de Wilcoxon para uma única amostra, temos que, para α = 5%, os valores críticos são t1 = 13 e t2= 65.

Exercício5 grupos (15 minutos cada)--Explicar o teste e apresentar resultado base de teste

● Ho= 2 distribuições são semelhantes● H1= Distribuição T (com medicamento) melhor distribuição N

Testes paramétricos

● Teste t● ANOVA

Testes não paramétricos

● Testes do Qui-quadrado● Testes do Kolmogorovp-Smirnov● Testes de Mann-Witney

Incluir a estatística descritivaExplicar o processo

1 a 2 páginas

Visão Geral

Teste para duas amostras

Teste para duas amostras-populações independentes

Teste duas amostras- populações independentes

Teste para duas amostras-populações independentes

Teste para duas amostras-populações independentes

Teste para duas amostras-populações independentes

Teste para duas amostras-populações independentes

Teste para duas amostras-populações independentes

Teste para duas amostras-populações independentes

Teste para duas amostras-populações independentes

Teste para duas amostras-populações independentes

Teste para duas amostras-populações independentes

Teste para duas amostras-populações independentes

Teste para duas amostras-populações independentes

Teste para duas amostras-populações independentes

Teste para duas amostras-populações independentes

Teste para duas amostras-populações relacionadas

Teste para duas amostras-populações relacionadas

Teste para duas amostras-populações relacionadas

Teste para duas amostras-populações relacionadas

Teste para duas amostras-populações relacionadas

Teste para duas amostras-populações relacionadas

Teste para duas amostras-populações relacionadas

Teste para duas amostras-populações relacionadas

Teste t

Teste z

Teste para duas amostras-populações relacionadas

Recommended