20
Resumão de ESTATÍSTICA p/ Polícia Federal www.estrategiaconcursos.com.br 1 20 RESUMÃO DE ESTATÍSTICA POLÍCIA FEDERAL Fala pessoal, tudo bem? Neste arquivo disponibilizo as principais fórmulas e conceitos de Estatística que você deve saber para a prova da Polícia Federal 2018. Procure memorizar o máximo que conseguir e, claro, procure ENTENDER como utilizar cada fórmula e cada conceito. Aproveito para deixar o link para a revisão completa em vídeo que fiz no Youtube do Estratégia Concursos: https://www.youtube.com/watch?v=gNeoP-H7RPI Saudações, Prof. Arthur Lima Siga meu instagram e acompanhe dicas diariamente: @ProfArthurLima

Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

  • Upload
    others

  • View
    21

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Resumão de ESTATÍSTICA p/ Polícia Federal www.estrategiaconcursos.com.br

1 20

RESUMÃO DE ESTATÍSTICA – POLÍCIA FEDERAL

Fala pessoal, tudo bem? Neste arquivo disponibilizo as principais fórmulas e conceitos de Estatística que você deve saber para a prova da Polícia Federal 2018. Procure memorizar o máximo que conseguir e, claro, procure ENTENDER como utilizar cada fórmula e cada conceito.

Aproveito para deixar o link para a revisão completa em vídeo que fiz no Youtube do Estratégia Concursos:

https://www.youtube.com/watch?v=gNeoP-H7RPI

Saudações,

Prof. Arthur Lima

Siga meu instagram e acompanhe dicas diariamente: @ProfArthurLima

Page 2: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

2 20

RESUMÃO DE ESTATÍSTICA – POLÍCIA FEDERAL .................................................................. 1

Conceitos básicos .............................................................................................................................. 3

Medidas de posição ........................................................................................................................... 4

Média aritmética .............................................................................................................................................................. 4

Mediana ............................................................................................................................................................................ 5

Moda: ............................................................................................................................................................................... 6

Simetria:............................................................................................................................................................................ 6

Medidas de dispersão ....................................................................................................................... 6

Variância populacional ..................................................................................................................................................... 6

Variância amostral ............................................................................................................................................................ 7

Desvio padrão ................................................................................................................................................................... 7

Coeficiente de variação .................................................................................................................................................... 8

Medidas separatrizes ........................................................................................................................................................ 8

Medidas de assimetria ...................................................................................................................... 9

Medidas de curtose ......................................................................................................................... 10

Probabilidade .................................................................................................................................. 11

Leis dos grandes números ............................................................................................................... 11

Teorema central do limite. Distribuições amostrais. ...................................................................... 12

Distribuições de Probabilidade ........................................................................................................ 12

Distribuições Discretas ................................................................................................................................................... 12

Distribuições Contínuas .................................................................................................................................................. 13

Estimação pontual: métodos, propriedades, suficiência ................................................................ 13

Estimação intervalar ....................................................................................................................... 14

Intervalo de confiança para a Média .............................................................................................................................. 14

Intervalo de confiança para Proporções ......................................................................................................................... 14

Testes de hipóteses ......................................................................................................................... 14

Teste de hipóteses para a média .................................................................................................................................... 14

Teste t de Student .......................................................................................................................................................... 16

Testes de hipóteses para proporções ............................................................................................................................. 16

Modelos de regressão linear ........................................................................................................... 16

Análise de variância ........................................................................................................................ 17

Técnicas de amostragem ................................................................................................................ 19

Amostragens Probabilísticas (ou causais) ....................................................................................................................... 19

Amostragens não Probabilísticas (ou não causais) ......................................................................................................... 19

Tamanho amostral .......................................................................................................................................................... 20

Page 3: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

3 20

CONCEITOS BÁSICOS

População: total de indivíduos que apresentam determinada característica (ex.: total de funcionários do Estratégia).

Amostra: subconjunto da população (ex.: funcionários do Estratégia que trabalham no setor de jornalismo).

Censo: consiste em analisar uma característica de interesse (ex.: salário) em todos os indivíduos da população.

Amostragem: consiste em analisar uma característica de interesse (ex.: salário) em um subconjunto ou amostra da população. Normalmente opta-se pela amostragem ao invés do censo por ser mais barata, rápida e porque, em algumas situações, é impossível analisar todos os indivíduos da população (ex.: medir o comprimento de todas as moscas do mundo).

Variável: é a característica que pretendemos analisar (ex.: idade, altura, sexo, peso, salário etc).

Observação: é o valor que a variável assume para um determinado indivíduo. Ex.: a variável “idade” assume o valor 35 anos para o professor Arthur Lima.

Classificações das variáveis:

- quantitativas: são expressas em quantidades (idade, peso, salário etc).

- discretas: podem assumir apenas alguns valores (ex.: número de filhos por funcionário pode ser 0, 1, 2, 3 etc, mas não é possível ter um número de filhos entre 1 e 2, ou entre 2 e 3).

- contínuas: podem assumir infinitos valores entre dois quaisquer (ex.: existem infinitas alturas possíveis entre 1,70m e 1,71m).

- qualitativas: são qualidades, categorias, classificações (ex.: sexo, cor dos olhos etc).

- ordinais: podem ser ordenadas (ex.: faixa etária, que pode ser ordenada assim: criança – adolescente – jovem – adulto – idoso).

Page 4: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

4 20

- nominais: não há uma ordem entre as categorias (ex.: não há ordem entre sexo masculino e feminino).

MEDIDAS DE POSIÇÃO

Média aritmética

𝑀é𝑑𝑖𝑎 =𝑆𝑜𝑚𝑎 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠

𝑞𝑢𝑎𝑛𝑡𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠

Se os dados estão em lista (rol):

n é a quantidade de valores

Se os dados estão em uma tabela de frequências:

fi representa a frequência de cada valor Xi

Se os dados estão em uma tabela com intervalos de classes:

PMi é o ponto médio de cada intervalo de classe

Page 5: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

5 20

Propriedades da média: - a média é afetada pela inclusão/exclusão de valores extremos; - a média é um valor único; - a média é afetada pela soma e pela multiplicação dos valores da distribuição.

Mediana

Passos para calcular a mediana de uma lista (rol) de dados: 1. Colocar os dados em ordem crescente; 2. Encontrar a posição que divida os dados em duas metades: (n+1)/2; 3. A mediana será o valor que está nesta posição.

* se o número de dados for par, (n+1)/2 será um número fracionário. Basta calcular a média entre os termos anterior e posterior a esta posição encontrada.

* se for dada uma tabela de frequências, inclua a coluna das frequências acumuladas para ver em qual linha chega-se a (n+1)/2 frequências.

Passos para calcular a mediana via interpolação linear (tabela com intervalos de classes): 1. Incluir coluna das frequências acumuladas; 2. Encontrar a classe mediana (a que contiver a frequência n/2); 3. Fazer a proporcionalidade entre os limites (valores) da classe mediana e as

frequências acumuladas correspondentes, lembrando que a mediana corresponde à frequência acumulada n/2.

Exemplo de interpolação linear:

Freq. Acum.: 26 40 45

|-----------------------------|----------------|

Valores: 1,60 X 1,70

|-----------------------------|----------------|

Page 6: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

6 20

𝑠𝑒𝑔𝑚𝑒𝑛𝑡𝑜 𝑣𝑒𝑟𝑚𝑒𝑙ℎ𝑜 𝑑𝑎𝑠 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎𝑠

𝑠𝑒𝑔𝑚𝑒𝑛𝑡𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑎𝑠 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎𝑠=

𝑠𝑒𝑔𝑚𝑒𝑛𝑡𝑜 𝑣𝑒𝑟𝑚𝑒𝑙ℎ𝑜 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠

𝑠𝑒𝑔𝑚𝑒𝑛𝑡𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠

Propriedades da mediana: 1. É um único valor para a distribuição; 2. Não é afetada por valores extremos; 3. É afetada pela soma e pela multiplicação.

Moda:

- é o valor que está na moda (ou seja, que tem maior número de frequências.

- classe modal é a classe que possui maior número de frequências na tabela.

- uma distribuição pode ter uma moda (unimodal), duas modas (bimodal), mais do que duas, ou mesmo nenhuma moda (amodal).

- a moda não é afetada por valores extremos na distribuição.

Simetria:

Simetria Média, Mediana e Moda

Simétrica Média = Mediana = Moda

Assimétrica positiva (à direita) Média > Mediana > Moda

Assimétrica negativa (à esquerda) Média < Mediana < Moda

MEDIDAS DE DISPERSÃO

Variância populacional

𝑉𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 =(𝑠𝑜𝑚𝑎 𝑑𝑜𝑠 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠) −

1𝑛

. (𝑠𝑜𝑚𝑎 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠)

𝑛

Isto é, para uma lista (rol) de valores:

Page 7: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

7 20

𝜎 =∑ 𝑋 −

1𝑛

. (∑ 𝑋 )

𝑛

Para uma tabela de frequências:

𝜎 =

∑ 𝑋 . 𝑓 −1

∑ 𝑓. (∑ 𝑋 . 𝑓 )

∑ 𝑓

Para uma tabela com intervalos de classes:

𝜎 =

∑ 𝑃𝑀 . 𝑓 −1

∑ 𝑓. (∑ 𝑃𝑀 . 𝑓 )

∑ 𝑓

*PMi são os pontos médios de cada classe (some os dois extremos do intervalo e divida por 2).

Variância amostral

- basta subtrair 1 unidade no DENOMINADOR de cada fórmula acima;

- usamos s2 para designar a variância amostral.

Desvio padrão

Desvio padrão Variância

Propriedades do Desvio Padrão e da Variância: - somar ou subtrair um mesmo número a toda a distribuição NÃO afeta essas medidas; - multiplicar/dividir todos os números da distribuição por um valor constante (a) faz com que o desvio padrão seja multiplicado/dividido pela constante (a), e a variância seja multiplicada/dividida pelo quadrado da constante (a2); - desvio padrão é expresso na mesma unidade da variável (ex.: anos), variância é expressa com o quadrado da unidade da variável (ex.: anos2).

Page 8: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

8 20

Coeficiente de variação

𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎çã𝑜 =𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜

𝑚é𝑑𝑖𝑎

Isto é:

CV

- é uma medida de dispersão relativa (desvio padrão e variância são medidas de dispersão absolutas);

- não tem unidade (é expresso na forma percentual ou decimal apenas);

- é útil para comparar distribuições diferentes. Menor CV significa que a distribuição é mais homogênea (os valores são mais próximos entre si).

Medidas separatrizes

Quartil Posição

Q1 (n+1)/4

Q2 2(n+1)/4

Q3 3(n+1)/4

Diagrama de Box Plot:

Page 9: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

9 20

Onde:

a) Limite inferior: é o maior valor entre os dois abaixo:

Valor mínimo da distribuição

ou

Q1 – 1,5 x (Q3 – Q1)

b) Limite superior: é o menor valor entre os dois abaixo:

Valor máximo da distribuição

ou

Q3 + 1,5 x (Q3 – Q1)

- Amplitude Interquartílica: AI = Q3 – Q1.

MEDIDAS DE ASSIMETRIA

- Coeficiente de assimetria de Pearson:

𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 =𝑀é𝑑𝑖𝑎 − 𝑀𝑜𝑑𝑎

𝑑𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜

Isto é:

Page 10: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

10 20

- Coeficiente quartílico de assimetria:

𝐴𝑞 =𝑄3 + 𝑄1 − 2. 𝑚𝑑

𝑄3 − 𝑄1

(Q3 é o terceiro quartil, Q1 o primeiro quartil, md a mediana)

MEDIDAS DE CURTOSE

Curtose: grau de achatamento em relação à distribuição normal padrão

- Leptocúrtica: curtose > normal

- Mesocúrtica: curtose = normal

- Platicúrtica: curtose < normal

- distribuições com maior curtose são aquelas que possuem picos mais altos (são “mais leptocúrticas”):

Coeficiente percentílico de curtose:

(P90 e P10 são os percentis 90 e 10)

- Leptocúrtica: Cp > 0,263

Page 11: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

11 20

- Mesocúrtica: Cp = 0,263

- Platicúrtica: Cp < 0,263

Coeficiente momento de curtose (não se preocupe com a fórmula):

- Leptocúrtica: Cp > 3

- Mesocúrtica: Cp = 3

- Platicúrtica: Cp < 3

PROBABILIDADE

Definição:

Eventos independentes:

Probabilidade da união de eventos:

Eventos mutuamente

excludentes:

Eventos complementares:

CProbabilidade(E) = 1 - Probabilidade(E )

Probabilidade condicional:

LEIS DOS GRANDES NÚMEROS

Conforme o tamanho de uma amostra aumenta, o valor da média amostral converge para a média populacional”.

- lei FORTE – convergência CERTA

- lei FRACA – convergência em PROBABILIDADE

número de resultados favoráveisProbabilidade do Evento=

número total de resultadosP(A B)=P(A) P(B)

( ) ( ) ( ) ( )P A B P A P B P A B

( ) 0P A B

( )( / )

( )

P A BP A B

P B

Page 12: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

12 20

TEOREMA CENTRAL DO LIMITE. DISTRIBUIÇÕES AMOSTRAIS.

A distribuição das médias amostrais de uma determinada população:

- é uma distribuição NORMAL;

- possui média igual à média populacional (𝜇);

- possui desvio padrão √

, onde n é o tamanho das amostras.

DISTRIBUIÇÕES DE PROBABILIDADE

Distribuições Discretas

Page 13: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

13 20

Distribuições Contínuas

ESTIMAÇÃO PONTUAL: MÉTODOS, PROPRIEDADES, SUFICIÊNCIA

*lembre que o estimador não viesado para a variância é aquele em que subtraímos 1 unidade no denominador.

Page 14: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

14 20

ESTIMAÇÃO INTERVALAR

Intervalo de confiança para a Média

- o principal caso é quando o desvio padrão populacional é CONHECIDO e a população é considerada INFINITA. O intervalo é dado por:

* o valor 𝑍 / é obtido conforme o grau de confiança (1 − 𝛼) determinado pelo examinador.

Intervalo de confiança para Proporções

- sendo “p” a proporção obtida em uma amostra, temos:

TESTES DE HIPÓTESES

Teste de hipóteses para a média

- hipótese nula (H0): é aquela que se pretende testar. Geralmente tem a forma de uma igualdade (ex.: 𝜇 = 500);

- hipótese alternativa (H1): é aquela que será aceita caso H0 seja rejeitada. Geralmente tem a forma de uma desigualdade (ex.: 𝜇 > 500, ou então 𝜇 < 500, ou então 𝜇 ≠ 500).

- nível de significância (𝛼) é a probabilidade de se rejeitar a hipótese nula quando ela é verdadeira.

- caso H1 seja do tipo “menor que”: área de rejeição na cauda esquerda (teste unilateral / unicaudal esquerdo) toda a probabilidade 𝛼 na extremidade esquerda.

- caso H1 seja do tipo “maior que”: área de rejeição na cauda direita (teste unilateral / unicaudal direito) toda a probabilidade 𝛼 na extremidade direita.

Page 15: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

15 20

- caso H1 seja do tipo “diferente de”: área de rejeição nas duas extremidades (teste bilateral ou bicaudal) metade da probabilidade 𝛼 (isto é, 𝛼/2) em cada extremidade.

Etapas do teste de hipóteses:

1. Identificar H0 e H1; 2. Definir tipo do teste (unilateral esquerdo/direito, bilateral) conforme H1; 3. Esboçar curva normal e marcar regiões de rejeição e aceitação de H0; 4. Encontrar o valor Z que delimita a região de rejeição (conforme 𝛼); 5. Encontrar a estatística do teste:

𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 =𝑋 − 𝜇

𝜎

√𝑛

6. Posicionar Zcalculado no esboço da curva normal e concluir: a. Se Zcalculado dentro da região de aceitação: aceitar H0; b. Se Zcalculado dentro da região de rejeição: aceitar H1.

Tipos de erro em um teste de hipóteses:

- Erro tipo I: hipótese nula VERDADEIRA sendo REJEITADA

- probabilidade deste erro = 𝛼 (nível de significância escolhido pelo pesquisador)

- Erro tipo II: hipótese nula FALSA sendo ACEITA

- probabilidade deste erro: 𝛽.

O poder do teste (ou potência do teste) é a probabilidade de se rejeitar a hipótese nula corretamente, ou seja, rejeitar a hipótese nula quando ela é falsa. É dado pelo complemento do erro tipo II, ou seja,

Potência do teste = 1 − 𝛽

O p-valor de uma amostra (ou valor p, nível descritivo, probabilidade de significância) é probabilidade de se obter, em outras amostras, valores MAIS EXTREMOS do que o daquela. Grave:

𝑆𝑒 𝑝 𝑣𝑎𝑙𝑜𝑟 ≤ 𝛼 , 𝑑𝑒𝑣𝑒𝑚𝑜𝑠 𝑟𝑒𝑗𝑒𝑖𝑡𝑎𝑟 𝐻

- se tentamos reduzir a probabilidade do erro tipo I (𝛼), aumentamos a probabilidade do erro tipo II (𝛽). Para minimizar os dois erros simultaneamente, devemos aumentar o tamanho da amostra.

Page 16: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

16 20

Teste t de Student

O teste t de Student é similar ao que vimos acima (a curva t de Student é uma aproximação teórica da curva normal). Devemos fazê-lo quando duas condições ocorrem simultaneamente:

- o desvio padrão populacional é DESCONHECIDO, e

- o tamanho da amostra é menor do que 30.

Neste caso, basta substituir Zcalculado por:

𝑡 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 𝑋 − 𝜇

𝑠

√𝑛

(onde s é o desvio padrão amostral)

Para obter a estatística tabelada (que delimita a região de rejeição), deve-se levar em conta o nível de significância e o número de graus de liberdade do teste, que é dado por:

GL = n – 1

(n é o tamanho da amostra)

Testes de hipóteses para proporções

Similar ao primeiro teste que fizemos, substituindo a estatística do teste por:

0

0 0(1 )

calculado

p pZ

p p

n

(p é a proporção obtida na amostra e p0 é a proporção que queremos provar em H0)

MODELOS DE REGRESSÃO LINEAR

Regressão linear simples

Y = a + b.X + e

- X é a variável independente ou explicativa;

- Y é a variável dependente ou explicada;

Page 17: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

17 20

- a e b são os coeficientes da reta de regressão;

- e é o erro aleatório.

O coeficiente angular (b) da reta de regressão é obtido por:

b =Cov(X, Y)

Var(X)

ou

b =𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 . ∑ 𝑌

𝑛 ∑ 𝑋 − (∑ 𝑋)

Feito isso, o coeficiente linear (a) é obtido pela relação entre as médias das variáveis:

𝑌 = 𝑎 + 𝑏. 𝑋

R2 é o coeficiente de determinação da reta de regressão, sendo o quadrado do coeficiente de correlação R:

cov( , )( , )

X Y

X YR correlação X Y

R2 mede quanto da variabilidade de Y é explicada pelo modelo de regressão (quanto mais próximo de 1, ou de 100%, melhor).

ANÁLISE DE VARIÂNCIA

Teste utilizado para comparação das médias entre grupos. Nele:

H0 = não há diferença entre as médias dos grupos

H1 = a média de pelo menos um grupo difere das demais

No modelo de Análise de Variância (ANOVA) temos:

SQT = SQE + SQR

- SQT = soma dos quadrados totais

Page 18: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

18 20

- SQE = soma dos quadrados entre os grupos / explicado

- SQR = soma dos quadrados dos resíduos

𝑅 =𝑆𝑄𝐸

𝑆𝑄𝑇= 1 −

𝑆𝑄𝑅

𝑆𝑄𝑇

Etapas da construção da tabela da ANOVA

- cálculo dos quadrados médios:

Quadrados médios explicados:

𝑄𝑀𝐸 =𝑆𝑄𝐸

𝑘

(k é o número de variáveis ou grupos)

Quadrados médios dos resíduos:

𝑄𝑀𝑅 =𝑆𝑄𝑅

𝑛 − 𝑘 − 1

( n é o número de observações)

Quadrados médios totais:

𝑄𝑀𝑇 =𝑆𝑄𝑇

𝑛 − 1

- realizar o teste F, no qual a estatística do teste é dada por:

𝐹 =𝑄𝑀𝐸

𝑄𝑀𝑅

Trata-se de um teste F com k graus de liberdade no numerador e n-k-1 graus de liberdade no denominador. Deve-se posicionar a estatística obtida na curva F visando identificar se ela se encontra na região de aceitação ou rejeição da hipótese nula.

Page 19: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

19 20

TÉCNICAS DE AMOSTRAGEM

Amostragens Probabilísticas (ou causais)

Amostragem aleatória simples

- a partir de uma lista contendo todos os elementos da população, extrai-se um subconjunto de forma aleatória (todos os membros da população tem a mesma chance de serem escolhidos).

Amostragem estratificada

- divide-se a população em estratos, que são segmentos da população que possuem uma característica em comum (ex.: estratos por faixa etária). Em seguida, extraem-se elementos de todos os estratos para compor a amostra, obedecendo a proporção que cada estrato representa em relação à população completa.

Amostragem por conglomerados

- a população é dividida em conglomerados, que são grupos quaisquer (ex.: dividir um bairro em quadras). Alguns conglomerados são escolhidos para a amostra e, dentro deles, todos os indivíduos são analisados.

Amostragem sistemática

- cria-se um sistema objetivo para selecionar os elementos da população. Ex.: a partir da lista de membros da população, pode-se ir selecionando o primeiro a cada grupo de 10 nomes.

Amostragens não Probabilísticas (ou não causais)

- envolvem um componente subjetivo na escolha dos elementos da amostra.

Amostragem por voluntários:

- membros da amostra apresentam-se voluntariamente, como em testes médicos.

Amostragem intencional:

- pesquisador escolhe intencionalmente as pessoas que vai entrevistar ou os elementos que irá analisar.

Amostragem acidental:

Page 20: Z ^hD K ^d d1^d/ tWK>1 / & Z > · Z ^hD K ^d d1^d/ tWK>1 / & Z > ... x

Prof. Arthur Lima

Resumão de Estatística p/ POLÍCIA FEDERAL www.estrategiaconcursos.com.br

20 20

- pesquisador tenta escolher “acidentalmente” os elementos da amostra, embora sempre haja algum viés.

Tamanho amostral

Principal fórmula para se definir o tamanho mínimo (n) de uma amostra:

𝑛 = 𝑍 .𝜎

𝑑

- 𝑍 é o valor na curva normal padrão correspondente ao nível de confiança estabelecido;

- 𝜎 é o desvio padrão populacional;

- d é o erro máximo tolerado pelo pesquisador.

FIM DE RESUMO! FAÇA UMA EXCELENTE PROVA!!! E CONTINUE CONTANDO COMIGO.

Instagram: @ProfArthurLima

Facebook: ProfArthurLima

YouTube: Professor Arthur Lima